跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 现在的公众号还能爬到信息吗
未分類
1 10 月 2020

现在的公众号还能爬到信息吗

现在的公众号还能爬到信息吗

資深大佬 : gongfuxiongmao 0

想学习一下爬虫,爬点公众号的文章,大佬们有什么建议吗,只需要大概的可行的方向就行,剩下的自己去研究。

网上搜到的方法都是比较老的信息,一般都不能用了

大佬有話說 (13)

  • 資深大佬 : kof21411

    爬虫写得好,坐牢坐得早,别惹南山必胜客!

  • 資深大佬 : pandait

    搜狗的微信搜索,有入口。

  • 資深大佬 : crclz

    几个月之前爬过,方法是用 pc 微信客户端,打开某个公众号,然后人工用鼠标往下滚动,然后右键-查看源代码,然后保存为文件,用 python 解析 dom,就可以找出地址列表。有时候请求多了,会封禁那个入口 24 小时,换个号就行了。

    搜狗的微信搜索能够搜索到的极其有限。

  • 資深大佬 : mlhadoop

    @crclz

    “`
    try {
    const maxScroll = Number.MAX_SAFE_INTEGER;
    let lastScroll = 0;
    const interval = setInterval(() => {
    window.scrollBy(0, 100);
    const scrollTop = document.documentElement.scrollTop;
    if (scrollTop === maxScroll || scrollTop === lastScroll) {
    clearInterval(interval);
    //resolve();
    } else {
    lastScroll = scrollTop;
    }
    }, 1000);
    } catch (err) {
    console.log(err);
    //reject(err.toString());
    }
    “`

    不用手滑

  • 資深大佬 : wangyzj

    最好的办法是逆向
    其次用 appium

  • 資深大佬 : 0o0O0o0O0o

    /t/708599

    逆向微信违法,所以只提供一个方法,你可以提交需要爬的公众号,然后爬我的(

  • 資深大佬 : locoz

    要么自动化测试,要么逆向。如果只是玩玩,那就自动化测试一把梭就行,最多十分钟就完事了。

  • 資深大佬 : sweat89

    @pandait 村里刚通网?

  • 資深大佬 : zsdroid

    公众号都凉透了。。。

  • 資深大佬 : pandait

    @sweat89 差不多,刚出来。

  • 資深大佬 : Achiii

    曾经想分析一个公众号里面的投票数据,先在 pc 上面滚轮加载完他的页面,保存 html 再正则。算是比较低效的方法吧

  • 資深大佬 : qsnow6

    @0o0O0o0O0o #6 牛逼,真手动扒

  • 主 資深大佬 : gongfuxiongmao

    看了大家的回复,我估计要放弃了

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具