未分類 2 1 月 2020 GeneralNewsExtractor:一个新闻网页正文通用抽取器 GeneralNewsExtractor:一个新闻网页正文通用抽取器 Github | Demo | Wiki ? Features: – 输出正文内容、标题、作者、发布时间、正文图片地址等 – 支持今日头条、网易新闻、游民星空、 观察者网、凤凰网、腾讯新闻、ReadHub、新浪新闻等主流中文新闻网站 – 支持 pip 安装,安装步骤简单 ? 安装:pip install --upgrade gne 具体的使用和配置文件书写见 Wiki