请教个关于爬虫的二级页面的问题
資深大佬 : Colorful 7
数据库用的是 mongo
在保存数据的时候,发现,假如说保存的格式是 ‘aaa’ 就类似这种 html 格式的时候,会报错 如果说报名的是文字则不会 假如说我想保存 html 的话,应该怎么写啊?
大佬有話說 (17)
数据库用的是 mongo
在保存数据的时候,发现,假如说保存的格式是 ‘aaa’ 就类似这种 html 格式的时候,会报错 如果说报名的是文字则不会 假如说我想保存 html 的话,应该怎么写啊?
诸位 F12 查看源代码就知道主原意是什么了。
但这和数据库也没有关系吧,应该是你后端过滤了 HTML 字符吧。
但是有可能你爬的第某个字节是 bytes 类型,(具体原因我也不太明白)
记得有一次爬什么网站遇到过,打死存不进去..直接数据库报错.. 你在存入之前,手动加 str()
你最好把错误码贴出来.
〈 a href=’aaaa.html’〉 aaa 〈/a 〉 就是这样的
然后爬虫是用的 python
不过看了评论,大概有思路了