关于那个简单的小说源码的一点探索

woniu 大佬有话说 :

关于那个简单的小说源码的一点探索

本帖最后由 woniu 于 2020-2-26 14:23 编辑

大佬分享这源码，我看很多人都搭建
https://www.hostloc.com/thread-648572-1-1.html

大家都关心到底能不能把小说内容存下来，

后台设置有个地方说采集的时候可以存内容，那到底存没存呢？

（如果嫌下面内容啰嗦，直接看最后的结论即可）

后台有个表 ky_novel_chapter 有个字段chapter是章节内容

这个字段存了一串字符串，但已经被压缩和加密了，

开始以为是存的小说章节内容，但是一想不对劲啊，一个小说那么多章节，怎么可能是一条记录

于是找了找源码，研究了下是怎么加密解密压缩的，其实代码很简单

加密是这个

      $content = "我是mjj";
      $content=base64_encode(gzcompress($content,2));
      echo $content;

解密是这个

      $content = "我是mjj";
      $content=@gzuncompress(base64_decode($content));
      echo $content;

这样就可以看下到底存的啥内容，一看才知道，根本没有直接存小说内容，存的是json格式的字符串

给大家看几行数据

"03965c27e5d85": {
"title": "罪红尘第一章.人生就是如此",
"intro": "",
"update_time": 1582605246,
"issued": 1,
"word": 2000,
"reurl": "http://www.biquge.info/79_79408/16166958.html",
"auto": 2,
"path": "3472/03965c27e5d85.txt"
},
"2e5cd234e4780": {
"title": "罪红尘第二章.遣返者",
"intro": "",
"update_time": 1582605246,
"issued": 1,
"word": 2000,
"reurl": "http://www.biquge.info/79_79408/16166959.html",
"auto": 2,
"path": "3472/2e5cd234e4780.txt"
},

这里还有个path ，难道是存在本地了，去搜了几个文件名都没找到

于是直接搜.txt结果发现很多！

最后的结论：

那就是有人访问某篇小说就去请求源站，把这篇访问到的小说下载成txt存在本地，

如果没人看的小说，那数据就不会在本地！

源站挂，则用此程序搭建的站点就挂，好了，大家可以散了！

自用的话还是挺好

本地存储的路径是：网站根目录runtimetxt

an99 大佬有话说 :

看天书一样

savior 大佬有话说 :

yc010t源站挂，换一个站继续采集就是了，小硬盘鸡的春天

bianco 大佬有话说 :

已自备n个采集规则，随时补上，这个本来就是只是采集链接地址的，采集小说内容得多大的盘

woniu 大佬有话说 :

savior 大佬有话说 : 2020-2-26 14:20
源站挂，换一个站继续采集就是了，小硬盘鸡的春天

大佬说的很对哈哈

采集个全站也就两天时间换一个接着干

woniu 大佬有话说 :

bianco 大佬有话说 : 2020-2-26 14:23
已自备n个采集规则，随时补上，这个本来就是只是采集链接地址的，采集小说内容得多大的盘 …

他其实还是采集了小说内容，

有人看就采集，没人看就不管哈哈

savior 大佬有话说 :

woniu 大佬有话说 : 2020-2-26 14:24
大佬说的很对哈哈

采集个全站也就两天时间换一个接着干

我还在摸索怎么写采集规则yc014t，很懵逼，虽然论坛老哥分享了几个，以防万一

woniu 大佬有话说 :

savior 大佬有话说 : 2020-2-26 14:32
我还在摸索怎么写采集规则，很懵逼，虽然论坛老哥分享了几个，以防万一 …

这个很好写打开目标站的，按F12比葫芦画瓢:lol