woniu 大佬有话说 :
关于那个简单的小说源码的一点探索
本帖最后由 woniu 于 2020-2-26 14:23 编辑
大佬分享这源码,我看很多人都搭建
https://www.hostloc.com/thread-648572-1-1.html
大家都关心到底能不能把小说内容存下来,
后台设置有个地方说采集的时候可以存内容,那到底存没存呢?
(如果嫌下面内容啰嗦,直接看最后的结论即可)
后台有个表 ky_novel_chapter 有个字段chapter是章节内容
这个字段存了一串字符串,但已经被压缩和加密了,
开始以为是存的小说章节内容,但是一想不对劲啊,一个小说那么多章节,怎么可能是一条记录
于是找了找源码,研究了下是怎么加密解密压缩的,其实代码很简单
加密是这个
$content = "我是mjj";
$content=base64_encode(gzcompress($content,2));
echo $content;
解密是这个
$content = "我是mjj";
$content=@gzuncompress(base64_decode($content));
echo $content;
这样就可以看下到底存的啥内容,一看才知道,根本没有直接存小说内容,存的是json格式的字符串
给大家看几行数据
"03965c27e5d85": {
"title": "罪红尘 第一章.人生就是如此",
"intro": "",
"update_time": 1582605246,
"issued": 1,
"word": 2000,
"reurl": "http://www.biquge.info/79_79408/16166958.html",
"auto": 2,
"path": "3472/03965c27e5d85.txt"
},
"2e5cd234e4780": {
"title": "罪红尘 第二章.遣返者",
"intro": "",
"update_time": 1582605246,
"issued": 1,
"word": 2000,
"reurl": "http://www.biquge.info/79_79408/16166959.html",
"auto": 2,
"path": "3472/2e5cd234e4780.txt"
},
这里还有个path ,难道是存在本地了,去搜了几个文件名都没找到
于是直接搜.txt结果发现很多!
最后的结论:
那就是有人访问某篇小说就去请求源站,把这篇访问到的小说下载成txt存在本地,
如果没人看的小说,那数据就不会在本地!
源站挂,则用此程序搭建的站点就挂,好了,大家可以散了!
自用的话还是挺好
本地存储的路径是 :网站根目录runtimetxt
an99 大佬有话说 :
看天书一样
savior 大佬有话说 :
yc010t源站挂,换一个站继续采集就是了,小硬盘鸡的春天
bianco 大佬有话说 :
已自备n个采集规则,随时补上,这个本来就是只是采集链接地址的,采集小说内容得多大的盘
woniu 大佬有话说 :
savior 大佬有话说 : 2020-2-26 14:20
源站挂,换一个站继续采集就是了,小硬盘鸡的春天
大佬说的很对 哈哈
采集个全站也就两天时间换一个接着干
woniu 大佬有话说 :
bianco 大佬有话说 : 2020-2-26 14:23
已自备n个采集规则,随时补上,这个本来就是只是采集链接地址的,采集小说内容得多大的盘 …
他其实还是采集了小说内容,
有人看就采集,没人看就不管 哈哈
savior 大佬有话说 :
woniu 大佬有话说 : 2020-2-26 14:24
大佬说的很对 哈哈
采集个全站也就两天时间换一个接着干
我还在摸索怎么写采集规则yc014t,很懵逼,虽然论坛老哥分享了几个,以防万一
woniu 大佬有话说 :
savior 大佬有话说 : 2020-2-26 14:32
我还在摸索怎么写采集规则,很懵逼,虽然论坛老哥分享了几个,以防万一 …
这个很好写 打开目标站的,按F12比葫芦画瓢:lol