[ad_1]
#GitHub情报 #Python
? InfoSpider:一个集众多数据源于一身的爬虫工具箱
? Features:
– 数据源相互独立,可移植性高
– 支持多达 24+ 个数据源,数据源丰富
– 数据统一存储为 JSON 格式
– 针对部分个人数据,提供可视化分析
– 爬取遵守严格鉴权,源码公开
? 支持的网站(源):
GitHub、QQ邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail 邮箱、Outlook 邮箱、京东、淘宝、支付宝、中国移动、中国联通、中国电信、知乎、哔哩哔哩、网易云音乐、QQ 好友、QQ 群、生成朋友圈相册、浏览器浏览历史、12306、博客园、CSDN 博客、开源中国博客、简书
? 项目开发者的初衷是通过这个爬虫工具帮助大家快速获取自己在各平台的信息,便于进一步分析或者存档。目前可视化分析还有待进一步完善,且输出格式为 JSON,我认为对于绝大多数人来讲不够直观,不知道后续是否会考虑其他格式
? 关联阅读:
1️⃣ 是时候说再见 – 使用人人网备份工具存档你的过去
2️⃣ YouTube 观看历史与数据分析
频道:@blog4563
[ad_2]