跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 建立一个自己的种子/磁力链接搜索网站
未分類
2 9 月 2020

建立一个自己的种子/磁力链接搜索网站

建立一个自己的种子/磁力链接搜索网站

資深大佬 : Olament 31

项目动机

疫情期间在家隔离闲着没事干

项目介绍

项目分两部分: 收集种子信息的 DHT 网络爬虫和展示信息的 Web interface 。Golang DHT 爬虫会监听 DHT 网络的并且收集种子的 metadata 。种子的信息会随后传输给服务器并且录入到 Elastic Search 当中。由于 DHT 爬虫的瓶颈是网络 I/O,你可以在多个服务器上建立多个 DHT 爬虫来加速信息收集的效率。Web interface 是用 React 写的一个简单的页面,主要展示种子的名称,大小和链接。支持用户对输入的自动补全。

链接

项目地址:gDHT

Demo:guo.sh 服务器架设在美国并且用的是 Cloudflare 加速。国内访问速度可能不太理想。

大佬有話說 (36)

  • 資深大佬 : lmoon

    谢谢主,我好了

  • 資深大佬 : ddup

    厉害了 主

  • 資深大佬 : love

    为什么有些网站可以显示链接的当前 seeder/leecher 数呢?加入这个功能挺重要的,防止下了半天才发现是死链接。

  • 主 資深大佬 : Olament

    @love 据我的理解来说,在 DHT 网络中是没有 seeder 和 leecher 这个概念的。因为 seeder 和 leecher 是由 tracker 服务器返回的,而 DHT 网络中不存在一个中心化的 tracker 服务器。但是有另外一种方法来反应一个种子的热度,就是通过拥有该种子 infohash 的节点个数 (peers)。我应该会在随后的更新里加上这个指标。

  • 資深大佬 : yuan0808

    这个是违法的,身边一兄弟已经进去两年了,除非你能完全屏蔽不良内容

  • 資深大佬 : love

    @Olament 比如这 https://nyaa.si/ 全站种子都几乎是实时反映这二个数值,这网站是开源的,可以看看是怎么实现的 https://github.com/nyaadevs/nyaa/

  • 主 資深大佬 : Olament

    @yuan0808 感谢提醒 🙂

  • 主 資深大佬 : Olament

    @love 这个网站的种子来源似乎都是用户自己上传。我有时间仔细阅读一下他的源码是怎么实现的

  • 資深大佬 : Aleaf

  • 資深大佬 : yanshenxian

    @love nayy 有自己的 tracker 地址..
    https://wiki.theory.org/index.php/BitTorrentSpecification
    https://www.bittorrent.org/beps/bep_0003.html

  • 資深大佬 : yjd

    之前国外好像出了啥法律,然后一堆磁力搜索站倒闭,某个我用了 6,7 年也关了

  • 資深大佬 : qq316107934

    感谢分享,有办法爬到每个 torrent 里面的文件列表吗?看了下貌似是不支持的

  • 資深大佬 : kios

    感觉里面全是种子 我搜索一个 Swift 出来好多 NSFW 的内容

  • 資深大佬 : wuxianliang

    除了小姐姐,电影音乐都是禁区,不过还是支持一下主

  • 資深大佬 : LifStge

    种子站 怎么做向来不是讨论的问题啊 内容才是关键啊 还有 BT 是否允许才是问题啊
    现在的哪个种子站内容 不是盗版资源 破解资源 大小姐姐 各种各种…
    可以认真想想 自己做种子站 要放啥内容呢 如果是类似上面那种 那就不多说了 抛开上面哪种 还有啥资源需要放种子站的么..

  • 主 資深大佬 : Olament

    @qq316107934 后端其实已经传了每个种子的文件列表,只不过前段没有展示出来而已,之后会添加上去的

  • 資深大佬 : hideokuze

    这种东西一个是法律风险,一个似乎是防 DDoS,,,

  • 資深大佬 : okjb

    @Aleaf 撸多了

  • 主 資深大佬 : Olament

    @hideokuze 这个项目的主要定位还是建立一个局域网内个人的搜索引擎,不是一个商业站点

  • 資深大佬 : lhx2008

    http://x0.ifengimg.com/res/2019/FE2A6FDBC0E15D20A91A23582DDED0CD1B593FC7_size110_w737_h443.png

    仅供主参考

  • 資深大佬 : lhx2008

    当然开源项目还是很棒的

  • 資深大佬 : raaaaaar

    从技术上来说是很棒的东西,但是大多数人用这个来搞那些违法的东西,有啥办法。

  • 資深大佬 : EvilCult

    不是~~我不是泼冷水……
    咱说,这个搜索能稍微精准一点儿么,
    我就顺手输了个“周杰伦”,然后…..不止一个相关的都没…还出了一堆……
    要不您看看??

  • 資深大佬 : jinliming2

    @lhx2008 #20 我一直在想,这个牟利……
    如果不牟利的话,是不是就……

  • 主 資深大佬 : Olament

    @EvilCult 搜索用的是 elastic search 默认的设置,没有添加中文的分析器,所以对于非英语语言来说结果的确不太精准。

  • 資深大佬 : EvilCult

    @Olament
    果然果然~~
    输个“taylor swift”果然几乎全是相关的内容了.

  • 資深大佬 : Whalko

    @love #6 nyaa 有自己的 tracker 的,你一个 peer 只要 announce 了,tracker 就知道你是 leecher 还是 seeder 了,lz 这种不一样…

  • 資深大佬 : wjm2038

    @yjd 倒闭了只是自己不做了吧。。你要说是版权法一直有的吧。。。

  • 資深大佬 : PepperEgg

    收藏夹里面的磁力搜索站没有多少撑的过一两年的,大部分是半年就无效了

  • 資深大佬 : soho176

    为啥 不论我搜啥 出来的都是色情那,比如我搜了易经 搜了 曾仕强

  • 主 資深大佬 : Olament

    @soho176 因为对中文的分词支持的不好,所以搜索结果不准,你可以试试英文的搜索词

  • 資深大佬 : firefox12

    其实我也想做这个的,后来想想不行,国内做基本就是死。 这个就是实现一个客户端,然后不断的去爬各种种子,把种子信息集合起来,放到 es 里面 然后你就能搜到了吧。 V2EX 里面原来有人写过 bt dht 实现的,没仔细看,总之就是不断和各个客户端交互,拿种子资源把。

  • 資深大佬 : strugglexiang

    主请搜索 第一滴血 5

  • 資深大佬 : zhangsimon

    @yuan0808 我靠,是因为能搜出 ghs 的内容吗?

  • 資深大佬 : lostc

    @EvilCult 为什么要搜周杰伦 心里没点 13 数吗

  • 資深大佬 : qwertyzzz

    @lostc 周杰伦咋了???

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具