想请教大家一个关于 web 请求或者说爬虫方面的问题
資深大佬 : lic2zac 6
小弟是做 python 爬虫的,用的是大家很熟悉的库 requests, 今天遇到一个很神奇的现象,在爬取一个国外网站的过程中, 它有 xx.cn 和 xx.com 这两个域名, 然后我在并发的请求 AB 两个商品数据时发生了以下状况(这几个情况我试了很多遍, 都是这样)
-
用同一个 session 并发请求 xx.com/A 和 xx.com/B 的时候没有问题
-
用同一个 session 并发请求 xx.cn/A 和 xx.cn/B 的时候发现出现了 A 的响应数据给了 B 的请求, B 的响应数据给了 A 的请求(但是大部分时候都是正确的,应该也和反爬无关)
-
每个请求单独生成一个 session, 并发请求 xx.com/A 和 xx.com/B 的时候没有问题, 并发请求 xx.cn/A 和 xx.cn/B 也没有问题
我想问的是:
-
会不会是他们.cn 和.com 用的技术不一样, 导致.cn 的有这个问题?
-
web 服务会有 bug 导致出现这个问题么?
感谢大家 0.0
大佬有話說 (4)