跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 有没有开源爬虫能提取到标题跟页面的 url 实现入库
未分類
21 7 月 2020

有没有开源爬虫能提取到标题跟页面的 url 实现入库

有没有开源爬虫能提取到标题跟页面的 url 实现入库

資深大佬 : leihongjiang 8

可以自己写规则 每天要浏览大量的页面 确实太累了啊。 希望可以找到一款工具可以聚合浏览。 因为每天都需要浏览好多个网站的最新文章 所以希望能找个工具代替一下 也希望能够通过自己搜索关键字 来展现爬取到的内容。 不需要爬取内容,只需要 url 跟标题就可以了,然后根据自己的需求浏览

大佬有話說 (9)

  • 資深大佬 : tangtaorong

    其实你要的就是 gg 或者百度

  • 資深大佬 : nightwitch

    开源的框架不太清楚,商业的实现我知道一个,八爪鱼,鼠标点点点设立规则就行。

  • 資深大佬 : iamverylovely

    你蛮懒耶。

  • 資深大佬 : renmu123

    你需要 rss

  • 主 資深大佬 : leihongjiang

    @renmu123 找了很久都没有

  • 主 資深大佬 : leihongjiang

    @iamverylovely 不是懒 是工作量太大了啊

  • 主 資深大佬 : leihongjiang

    @renmu123 有些站点没有 rss 啊

  • 資深大佬 : iamverylovely

    @leihongjiang 看你的描述,感觉自己写出来不难啊

  • 資深大佬 : lemonEssence

    Web Scraper

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具