跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 女票想批量保存微博猫咪图片,就写了个微博图片爬虫下载器~
未分類
30 12 月 2020

女票想批量保存微博猫咪图片,就写了个微博图片爬虫下载器~

女票想批量保存微博猫咪图片,就写了个微博图片爬虫下载器~

資深大佬 : jasonkayzk 11

Github 地址:

https://github.com/JasonkayZK/weiboPicDownloader

输入微博用户 ID,选择下载日期即可:

女票想批量保存微博猫咪图片,就写了个微博图片爬虫下载器~

大佬有話說 (66)

  • 資深大佬 : wushigejiajia01

    可以爬小姐姐吧?
    那真是好东西了

  • 主 資深大佬 : jasonkayzk

    @wushigejiajia01 只要是微博能看到的图片都是可以爬的。但是不能去水印;

  • 資深大佬 : Tyuans

    批量搬运小姐姐图片到外网

  • 主 資深大佬 : jasonkayzk

    @Tyuans 哈哈,可以可以~

  • 資深大佬 : anxn

    Linux 能不能也给一份 release,我编译会报错

  • 資深大佬 : whatalittleboy

    体积有点大,解压后 160 MB,但启动速度挺快的

  • 資深大佬 : s1th

    别光说,小姐姐图片多的微博是哪个

  • 主 資深大佬 : jasonkayzk

    @whatalittleboy 体积大是因为 Electron 编译之后本身就太大,项目挺简单的也没用啥东西。= =

  • 資深大佬 : liyiecho

    @anxn #5 我用这个爬 https://github.com/dataabc/weiboSpider

  • 資深大佬 : hfJ433

    @s1th 6032474791 爬起来

  • 資深大佬 : wangdefu

    @liyiecho 这个可以定时 比如每天下载某个固定用户的微博吗

    我关注了一个博主 经常几天就清空

  • 主 資深大佬 : jasonkayzk

    @anxn 我试着编译一下看看= =

  • 主 資深大佬 : jasonkayzk

    @wangdefu 如果是 py 脚本的话,设置个 crontab 丢到服务器上跑呗;

  • 資深大佬 : shgdym

    py 写的 很简单的一个微博爬虫: https://github.com/shgdym/weiboSpider

  • 資深大佬 : shgdym

    @wangdefu

  • 資深大佬 : qxsd

    有可以爬评论图片的吗

  • 資深大佬 : wangdefu

    @shgdym 有点意思
    会不会喝茶啊

  • 主 資深大佬 : jasonkayzk

    @qxsd 这个也可以爬,只是稍微麻烦一些了;你可以直接 Fork 这个仓库,然后修改鸭!

  • 資深大佬 : crab

    时间范围判断不只要大于等于开始时间,也还要判断一个小于等于结束时间吧。

  • 資深大佬 : renyiqiu

    不错,用起来

  • 資深大佬 : kingcos

    如果是已编辑是不是就爬不到了?

  • 主 資深大佬 : jasonkayzk

    @kingcos 这个…,我也不玩微博= =,我也不知道啊!你试试 /呆滞

  • 資深大佬 : justfun

    杀鸡焉用宰牛刀

  • 資深大佬 : limuyan44

    几年前的一个深夜为了爬微博搞笑排行榜的下面的表情包写了个,微博展示的图片算是又压了一遍,记得路径改成 large 就好了,后来倒是爬了不少小姐姐。。

  • 資深大佬 : loading

    @s1th 对对对,一般这种里面最有价值的就是 list,这居然没有…

  • 資深大佬 : Raynard

    给你推荐给插件

    https://chrome.google.com/webstore/detail/egdicppgkfpnjlfgohljcaomjohileoj

  • 主 資深大佬 : jasonkayzk

    @justfun hhhh~ 正好前段时间粗略看了下 Electron,就写了一个呗;

  • 資深大佬 : JCZ2MkKb5S8ZX9pq

    我也造过这个轮子,我记得获取微博的时候是需要登陆过的 cookie 。然后下载图片没问题,但下载视频的地址没搞(入口用的 wap 版)。

    另外借问一下,之前搞的时候发现过被夹的图片(会变成灰色图),获得 id 之后也能看到原图。但过太久了,忘了怎么搞了。有大神知道嘛?

  • 主 資深大佬 : jasonkayzk

    @JCZ2MkKb5S8ZX9pq 我的这个是不需要 cookie 的,用微博移动版: https://m.weibo.cn/ ,可以看看这个能不能实现= =

  • 資深大佬 : luhe

    https://chrome.google.com/webstore/detail/octo%E5%BE%AE%E5%8D%9A%E7%9B%B8%E5%86%8C%E6%89%B9%E9%87%8F%E4%B8%8B%E8%BD%BD/cdimdlckbkfelaogjhfbkjcfncbpngkn

  • 資深大佬 : PbCopy111

    @wangdefu #11 必须可以定时。。。我一直在用,哈哈哈,你看看说明

  • 資深大佬 : 5966

    不错,问问,我就想找一个命名规则是根据微博(首句)内容命名的!

  • 資深大佬 : YouLMAO

    你确定 pussy 是猫咪,还是对你意有所指

  • 主 資深大佬 : jasonkayzk

    @5966 这个改一下源码就好了,在寻找图片链接的时候,同时判断一下微博的内容是否符合你的要求就行了!

  • 資深大佬 : someonedeng

    @YouLMAO 老蛇皮了

  • 資深大佬 : liumxz

    没下载地址啊

  • 資深大佬 : liumxz

    看到了 我的

  • 資深大佬 : lwlizhe

    呵,一看就是假的,试都不用试

    会写程序的会有女朋友?[手动狗头]

  • 主 資深大佬 : jasonkayzk

    @lwlizhe 啪的一下,很快啊!

  • 資深大佬 : akaayy

    @justfun 能分享学习一下吗

  • 資深大佬 : skygee

    这个不怕封 ip 吗

  • 資深大佬 : shgdym

    @wangdefu 在我自己服务器上跑了一年多了

  • 主 資深大佬 : jasonkayzk

    @skygee 如果不是深度使用,以 JS 单线程和设置的延时来看,这点爬虫流量应该算不了什么吧= =;

  • 資深大佬 : night98

    能爬原图吗?还是普通大图?原图大小一般 3-5Mb 大小

  • 主 資深大佬 : jasonkayzk

    @night98 应该是原图,是请求返回 json 的”large”字段;

  • 資深大佬 : JCZ2MkKb5S8ZX9pq

    @jasonkayzk
    试了下倒真是,这个个人首页需要登录,全部微博反而不需要权限了。
    这个你试下来有频度限制嘛,访问多了会出 418 错误什么的嘛。

  • 主 資深大佬 : jasonkayzk

    @JCZ2MkKb5S8ZX9pq 暂时没发现频度限制,本来想嵌入一个 go 并发下载的,后来想了想,万一太猛被封 IP 了呢,所以还是用 JS 吧;

  • 資深大佬 : JCZ2MkKb5S8ZX9pq

    @jasonkayzk

    我看了看 log,这个 mobile 版的我也抓过。不过去年请求参数限制过一阵子。所以改用 wap+有效 cookie 了。

    # 20190717 已失效 改用 token 验证 尚未破解 目前只能获得前 10 条

    但是现在请求参数反而简化了。感觉说不定啥时候微博又会变。

  • 資深大佬 : adm7n

    微博有个好友圈功能,只有互相关注了才能看到好友圈内的微博,请问这种情况是否可以下载图片(我的账号有好友圈权限)。

  • 資深大佬 : fl2d

    她可能只是想让你买只猫

  • 主 資深大佬 : jasonkayzk

    @JCZ2MkKb5S8ZX9pq 哈哈,这个倒是有可能;爬虫这种一直都不稳定;= =

  • 主 資深大佬 : jasonkayzk

    @adm7n 这个估计不行,得用 cookie 的方式;可以参考其他人发的解决方案;

  • 主 資深大佬 : jasonkayzk

    @fl2d 养了的,哈哈

  • 資深大佬 : justfun

    @akaayy 极其的简陋

  • 資深大佬 : nspih

    年轻人不讲武德,居然来爬、来偷袭我 69 岁老同志的微博。这好吗?这不好。希望你耗子尾汁

  • 資深大佬 : ab

    有点意思啊

  • 資深大佬 : justfun

    @adm7n 可以的 有 cookie 就行。参考我上发的 可以爬到

  • 主 資深大佬 : jasonkayzk

    @ab 谢谢夸奖,哈哈

  • 主 資深大佬 : jasonkayzk

    @nspih 二百多公斤的英国大理石都爬不动我的一个微博;

  • 資深大佬 : JCZ2MkKb5S8ZX9pq

    @justfun

    请问这个接口的来源是哪一端?
    因为微博入口太多,你提到了取 header,可以考虑附上参考地址,因为各个入口的 header 可能不大一样。

  • 資深大佬 : justfun

    @JCZ2MkKb5S8ZX9pq PC Web 端 。https://weibo.com/ 到这里登录 。如果是旧版界面的话 右上角头像偏下的位置有一个立即体验新版微博的入口

  • 資深大佬 : jackrebel

    这个是个好玩的东西。

  • 主 資深大佬 : jasonkayzk

    @jackrebel 哈哈,谢谢夸奖~

  • 資深大佬 : terrywater

    @wushigejiajia01 爬妹子? 好有画面感。上攀双峰,下探双叶。

  • 資深大佬 : terrywater

    @jasonkayzk 你闪了吗?你没有闪!

  • 資深大佬 : qzhai

    MD, 有女票又有猫

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具