跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 跪问,关于字体反爬的一个问题。
未分類
21 6 月 2020

跪问,关于字体反爬的一个问题。

跪问,关于字体反爬的一个问题。

資深大佬 : Mnzz0785 5

语言:python
现在已经使用 fonttools 将 ttf 文件保存成了 xml 。字体的对应字典也已经提取完成。

经过 request 包抓取,lxml.etree xpath 提取后有如下信息:
[‘ue700’, ‘满意’, ‘ue684’, ‘就是它的外’, ‘ue9c2’, ‘设计’, ‘ue71f’, ‘的非常的漂’, ‘ueeae’, ‘,最抢眼的地方我觉得是’, ‘uef66’, ‘头的’, ‘ue020’, ‘型,’, ‘ue75e’, ‘常凌厉动感。大灯’, ‘uee5f’, ‘是非常的好’, ‘ue70b’, ‘。内’, ‘ue970’, ‘方面’, ‘ue75e’, ‘常的’, ‘uee0d’, ‘错’]
[‘ue700’, ‘不满意的就’, ‘ue62f’, ‘它的音质方’, ‘ue762’, ‘。听起来并’, ‘uee0d’, ‘是那么的舒’, ‘ue002’, ‘,还有座椅方面我’, ‘ue11f’, ‘觉并’, ‘uee0d’, ‘是那么的舒服行驶’, ‘ue684’, ‘时间长了坐’, ‘ue728’, ‘上面会感觉’, ‘ue170’, ‘酸背痛’]

因为字体字典中键值对的属性是 16 进制:unicode 编码

现在我遍历这个 list 里面的uxxx 无法进行操作,打印为乱码,type 之后发现是 lxml.etree._ElementUnicodeResult.

我需要对uxxx 进行替换或者切片变为字体字典中对应的键来进行替换。但是试了很多种办法都没用。

请问是我的思路错了还是技术太差,希望有大佬能指点一下。查阅了很多资料,也没有找到答案。

如有大佬愿意有偿教学也可私

大佬有話說 (3)

  • 資深大佬 : favourstreet

    Naïve !当然是思路错了而且技术太差两个都有!我猜主完全没有明白如何应对这种字体映射。提示:你需要的不是 Unicode→GlyphID 的映射,而是 Unicode→Unicode 的映射

  • 資深大佬 : aeshfawre

    就是你说的u 替换, 我这边也替换过,

  • 資深大佬 : no1xsyzy

    我估计你 len 一下就知道什么情况了。

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具