跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 爬虫怎么下载图片,拿到 Document 后怎么存图片
未分類
19 7 月 2020

爬虫怎么下载图片,拿到 Document 后怎么存图片

爬虫怎么下载图片,拿到 Document 后怎么存图片

資深大佬 : autoname 15

爬虫怎么下载图片,jsoup 拿到 Document 后怎么存图片

是解析 Document 里面的 src 路径 再请求一次吗,

请求一次 Document 不能保存里面的图片吗

要是几十张图片, 莫不是要再请求几十次,才能下载下来啊

有没有办法拿到 Document 里面的图片 src 直接可以下载的

只 get 一次

大佬有話說 (6)

  • 資深大佬 : M003

    这你不是想多了么,浏览器访问,还都是根据 src 再次请求图片资源的.

  • 資深大佬 : l4ever

    想什么呢, 你以为浏览器打开一个页面就请求了一次吗?
    js/css/img 还不都是根据内容再去加载的?

  • 主 資深大佬 : autoname

    @l4ever
    @M003
    太残忍了,一下就打醒我了

  • 主 資深大佬 : autoname

    其实我是想,爬 dz 的验证码

    这是图片直链,misc.php?mod=seccode&update=49424&idhash=cS0

    但是不能这么直接访问是没效果的,虽然带上 cookie 啥的,验证码也会变,

    但是回帖校验的时候还是提示错误, 得先请求一次这个地址,
    misc.php?mod=seccode&action=update&idhash=cS0&0.0423275371233075&modid=undefined
    然后去校验,才是正确的

    问题是,这里面只能发送一次 get 请求, 到这个地址去更新验证
    misc.php?mod=seccode&action=update&idhash=cS0&0.0423275371233075&modid=undefined

    但 这个页面又不是验证码直链,得不到直链。就没办法解码了

    不知道怎么弄了,求 dz 爬虫大佬指点

  • 資深大佬 : Wait845

    dz 是什么敏感词

  • 主 資深大佬 : autoname

    @Wait845 https://www.v2ex.com/t/689068

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具