跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • general-news-extractor-js:一个基于 Node.js 的新闻网页正文通用抽取工具,包含标题、作者、正文图片和发布日期,今日更新至 v0.04
未分類
26 11 月 2019

general-news-extractor-js:一个基于 Node.js 的新闻网页正文通用抽取工具,包含标题、作者、正文图片和发布日期,今日更新至 v0.04

general-news-extractor-js:一个基于 Node.js 的新闻网页正文通用抽取工具,包含标题、作者、正文图片和发布日期,今日更新至 v0.04

Github (https://github.com/zenghongtu/general-news-extractor-js) |

Demo (https://general-news-extractor-demo.stayin.cn/)

该项目启发自 kingname/GeneralNewsExtractor (https://github.com/kingname/GeneralNewsExtractor),由 Python 迁移到 Node.js ,并做了一些改动,提高提取准确度

? 更新内容:开放了正文图片与返回正黑五黑五促销软文源代码功能

部署方法详见 Readme,目前只支持一次抓取一个网页

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具