有没有办法查找相似数据来判断用户是否在发布重复的内容
資深大佬 : kaiki 7
为了防止无意义的灌水做反垃圾,但是现在灌垃圾的手段升级了,他会爬取正常的用户发言,然后灌进来。
目的只是为了给我的服务器增压好让我每天能多支付一些服务器费用。
目的只是为了给我的服务器增压好让我每天能多支付一些服务器费用。
特征大概是连续发布、复制已存在的内容、无法访问则自动换代理 IP 发布。
不从账号入手,因为低门槛,想从用户行为来判断是否为灌垃圾。
数据库是 mysql 。
大佬有話說 (6)