请问一下各位,有针对 Github 本身的爬虫吗?
資深大佬 : Humbert 64
最近需要做一个 Github 的软件(毕业设计),需要大量爬各种 issue、pull request 等的信息,5000 次每小时的 Github API 频率完全不够用。
想问下有没有封装好的有关 Github 的爬虫?谷歌上搜到的都是 Github 上的爬虫库项目
没有的话就去自己写了..
大佬有話說 (18)
最近需要做一个 Github 的软件(毕业设计),需要大量爬各种 issue、pull request 等的信息,5000 次每小时的 Github API 频率完全不够用。
想问下有没有封装好的有关 Github 的爬虫?谷歌上搜到的都是 Github 上的爬虫库项目
没有的话就去自己写了..
另,我记得如果不登录(没 token )访问 api 的话有次数限制,有 token 还会有限制吗?
https://github.com/github-tools/github
https://github.com/piotrmurach/github
GHTorrent: http://ghtorrent.org/downloads.html
GH Archive: https://www.gharchive.org/
他们提供了丰富的数据信息,较为方便的查询方式,以及简单的归档下载功能。不用自己爬……