跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 关于爬虫爬取网站音频的问题
未分類
23 11 月 2020

关于爬虫爬取网站音频的问题

关于爬虫爬取网站音频的问题

資深大佬 : apley 4

http://www.2uxs.com/youshengxiaoshuo/12999/ 直接给出例子,我在测试的时候发现他调用的.m4a 文件后面跟了一个 get 参数,每次不一样,但是每次访问都给出是不存在的页面,jplayer 大佬们有么有研究的

大佬有話說 (6)

  • 資深大佬 : siknet

    防盗链的

  • 資深大佬 : imdong

    没啥特别的,他会加载一个 /player/12999/121/37272.html 页面,这个页面里面有对应的 m4a 文件地址,包含这个 key 。

    但是是一段经过随机变量名处理过的,而且每次格式还不太一样。

    但是总归还是好弄,最后得到的 m4a 带上 这个页面的来路即可获取到。

  • 主 資深大佬 : apley

    @imdong 页面的来路?你指的是 xff ?

  • 資深大佬 : ybnsjl

    charles 抓包搜索 key 的值,原来的 html 页面(如 http://www.2uxs.com/player/12999/122/37272.html ) 51 行附近有一个`mp3:”+PlayxC1Hrynp+’/都市言情 /我的老千江湖 /0001.m4a?key=5995691b59f6a222c5e7373e627b30e0_1606871504’`的值,正则提出来就好了

  • 資深大佬 : zzz686970

    @apley 你的请求 header 带上 Referer 就可以了,这个表示你是从这个页面访问过来的。

  • 主 資深大佬 : apley

    感谢老哥们,总结一下,就是在跳转页面抓取到随机的 key 然后加 Refere 去请求就行

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具