看了之前老哥做的那个「不明肺炎在线地图」,我也撸了一个地图,数据爬虫可以自动采集
仓库: https://github.com/ZhangMingZhao1/2019nCoV-Virus-MapMonitor
目前就采集丁香园的数据,明天部署线上 =-=
本来打算做个热力图的,发现热力图的坐标数据有点难造。。。
demo: 
仓库: https://github.com/ZhangMingZhao1/2019nCoV-Virus-MapMonitor
目前就采集丁香园的数据,明天部署线上 =-=
本来打算做个热力图的,发现热力图的坐标数据有点难造。。。
demo: 
网站最下面有句话: “创意工作者的社区”。
整个项目可以说就是把丁香医生的数据抄过来,放到自己的页面上,然后就没啥别的了。如果这不叫重复造轮子的话,请问什么叫重复造轮子?
我的观点与 @mara1 #7 的差不多,写点东西练练手没啥问题,但是做出来的这个东西本身没啥特色,也没有啥意义的话,那做来干嘛呢?
丁香医生的那个页面如果不是完全人工处理的话,那么至少存在:
1、对新闻源(新浪微博)进行高频率采集,实现实时的监控;
2、对采集到的新闻进行自动归类,找出其中与疫情状况相关的内容;
3、智能提取关键内容(这个目测是有部分人工处理的);
4、结构化病例数据,并提供一个接口,按照指定的时间渲染出一个对应时间的疫情地图并返回;
5、处理微信分享所需的一些东西
这哪怕拿出其中一两个作为练手,也比爬一下别人现成的数据、调用个 Echart 要更有练手的效果吧?
(以上言论对其他 V2 上最近出来的疫情地图也同样有效,都是大同小异)
发在分享创造当然没问题,这是你的权利。但你发出来不就是想要让别人看的吗?别人看了之后的评价和其他交互不正是发出来之后能给你带来的东西吗?
既然你发出来了,那有负面评价不是很正常的事情吗?还是说你只想看到满屏的夸赞、疯涨的收藏和感谢以及 GitHub 上的 Star ?如果是那样的话我建议你发到百度贴吧、天涯、虎扑之类的技术人员相对少的地方,包装一下之后绝对火。
以下内容你看不到没关系,主要给别人看。
请问我发的帖子 /文章中,是否有对内容细讲?是否有把原理拿出来说?是否有能切实有效地解决新手会碰到的问题?
请问你发的这个帖子中,是否有对内容细讲?是否有把原理拿出来说?是否有能切实有效地解决新手会碰到的问题?
这就是你所谓的“对一些其他新手有用”?
请问我公众号是有抄袭?还是有洗稿?还是有发垃圾广告?或者是有搞烦人的互推?又或者是有搞个收智商税的垃圾课程出来骗新手钱?
这就是你所谓的“吃相难看”?
我初学爬虫是找工作的时候,之前完全没有接触过。当时投简历投得烦了,写了个自动投简历的工具。基于此我学会了爬虫领域的抓包、简单的 JS 逆向、模拟 HTTP 请求以及数据库的 CRUD、生产环境的爬虫部署。
这就是你所谓的“装 13”的需求驱动。
当然你对我的这些莫名其妙的观点多半也是 [看到负面评价的不爽] 和 [看到那些营销号推广的后遗症] 造成的,我不怪你,见多了。
懒得跟你多逼逼,不标红了,直接 Block 再见 @Cielsky #30 我并没有说过这不是新手的练习手段啊?不过主其实也并不是新手了,翻代码的时候我顺便翻了一下其他仓库和博客,内容都并不是新手写得出来的,所以我才说这是重复造轮子,而且还是个没有什么特色和意义的轮子。
@aabbcc112233 #31 多样性没错啊,但指出这东西是重复造轮子就有错了?请往前好好看看最开始是谁在说“无意义的吐槽”,又是谁在说“并不算重复造轮子”。
我在拆解了 [为什么这是重复造轮子] 和 [这种做法没啥用] 两个问题之后,后面都只是在有理有据(划重点,觉得哪里没理没据可以指出来)地对主的回复进行回复而已。反倒是#19 开始,主和后面的某两位就有点污蔑和人身攻击的意思了。
话说现在的人是咋了?连字都不会好好看了?上来就先习惯性地站个队?