跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 一年内写了两个数据提取的轮子
未分類
20 6 月 2020

一年内写了两个数据提取的轮子

一年内写了两个数据提取的轮子

資深大佬 : linw1995 8

平时写爬虫时突然冒出来的想法,让我写了这两个轮子。主要是为了方便自己的爬虫提取来自不同文本格式的数据。

data_extractor

支持 XPath, CSS-Selectors 及 JSONPath 。

jsonpath_extractor

在用 python-jsonpath-rw 这个库时,觉得用起来很变扭。所以就自己写了个轮子,用来提取 JSON 格式的文本数据。

发这个帖子的目的主要是求 star ;二是因为自己用的感觉很不错,想安利一下大家。

大佬有話說 (3)

  • 資深大佬 : arrow8899

    jq 了解一下 https://stedolan.github.io/jq

  • 資深大佬 : crs0910

    二连送上

  • 主 資深大佬 : linw1995

    @arrow8899 自从 jsonpath-extractor 实现了 CLI 后,我就用 jq 来 highlighting 提取的结果。以后可能会参考 jq 来做复杂的提取

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具