[ad_1]
#每日一技
【一键爬虫全部微博】(含被消失的账号)
食用方法:
1.在github下载“稳部落”
http://t.cn/AiBq5ion
2.登录微博(被消失的号也可以登录)
3.点击系统设置,输入个人主页的url(中间带id数字的那个)
4.点击同步用户信息,可以看到用户名,微博总数,待抓取页数,粉丝数,预计时间等信息。
5.按要求设置时间范围等系列参数,点击开始备份。
6.从运行日志里就可以看到爬虫进度啦,防爬虫机制设定了20s/页,用时较久。
用这个软件可以爬被消失的账号,一键保存自己的全部微博。最后会自动弹出四个文件夹,css, html, image,pdf,生成你的“微博书”。
还能下载微博图片。但只适用于自己的微博(用账密登录的微博),不能爬别人的微博,不能生成词云,不能爬微博评论。
频道 @blog4563
[ad_2]