做数据分析的时候你用的是 Python ?还是 pandas 和 numpy 以及其他三方库?
最近概览了一些 python 有关的书籍和视频。对于数据分析和数据挖掘人员来说,感觉更多的时候是在使用 pandas 和 numpy 这些三方包。而 python 更多的时候像个操作系统。而 pandas 和 numpy 更像是跑在这个操作系统上的应用。就好比你要对十组数据批量求和,你当然可以用 windows 的计算器去一个一个计算求和。但是用 excel 显然更快。虽然 excel 也是透过 windows 去调用 cpu 的运算能力。但是对用户来说 excel 显然比用 windows 计算器更高效,更友好。
如果以上认识没有大的偏差。对于想以 python 为工具(意思是不用 R 、matlab 、spass,sas )的数据从业人员,如果有一定的编程基础(例如学过 c 语言)是否只需简单的学一下 python 基础知识(大概知道前包后不包,循环控制语句和 c 语言不同)。而将更多的时间用在 pandas 、numpy 、以及其他用得着的三方库的学习上!这样是不是更高效?类似于《流畅的 python 》这样的书,一时半会用不上吧?
以 python 为工具的数据大神,请多多分享,多多指教。