ziyounb 大佬有话说 : 2020-1-18 10:17:11
优Python大佬在吗?请教个问题
目前有几百个url需要用requests请求并把返回的数据保存到数据库里。
循环这些地址的时候需要来一个time.sleep吗?
cherbim 大佬有话说 : 2020-1-18 10:21:20
你要明白time.sleep什么意思,要是网站没限制,就不需要,要是频繁访问网站会限制,就随机加个睡眠时间,伪装人工访问……其实这伪装和脱了裤子放屁没啥区别
PS:这些url是同一个网站吧?
ApkB 大佬有话说 : 2020-1-18 10:22:17
服务器没什么限制的话,尽量多线程呗
如果有限制特定时间内的连接数,那就随机time.sleep秒数好了
ziyounb 大佬有话说 : 2020-1-18 10:29:13
cherbim 大佬有话说 : 2020-1-18 10:21
你要明白time.sleep什么意思,要是网站没限制,就不需要,要是频繁访问网站会限制,就随机加个睡眠时间,伪 …
是的,明白了。
风在吹屌在飞 大佬有话说 : 2020-1-18 11:00:07
别爬的太快可能会导致封了ip
soeur 大佬有话说 : 2020-1-18 11:26:07
如果不是同一个网站,那不会有限制呀,相当于同一个网站只是访问了一次。
seobaikewang 大佬有话说 : 2020-1-18 11:26:50
走proxy 不用任何Sleep
soeur 大佬有话说 : 2020-1-18 11:27:15
爬虫的话建议上异步哦,这种io阻塞最适合async了,效率杠杠的