为什么老是有一些百度爬虫的 ip 访问公司的网站,但是没有 referer 请求头
host:xxx.cn connection:close remoteip:111.206.36.10 x-forwarded-for:111.206.36.10 user-agent:Mozilla/5.0 (Windows NT 6.1; WOW64; rv:43.0) Gecko/20100101 Firefox/43.0 accept:text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 referer: http://www.baidu.com/s?wd=TQ7U accept-encoding:gzip accept-language:en-US,*
这是其中一个请求的请求头信息,host 是我们公司的网址我给抹掉了。
referer 中搜索关键词是“TQ7U”,不可能通过这个关键词搜索到我们公司的网站吧,而且基本每个请求都是这样的,关键词都是随机字母加数字。
现在公司要做访问人数统计,这样的 ip 请求头又没包含百度蜘蛛信息,但是 ip 拿去“ip138.com”这个网站查却能查到是百度蜘蛛的 ip,百度蜘蛛相关文档根本没有提到这个东西,而且还没有客服或技术可以询问的入口。