零基础学习Python数据挖掘
作者:聊聊数据分析和挖掘
https://www.zhuanlan.zhihu.com/p/25575805
Python已经稳坐机器学习的语言(机器学习编程语言之争,Python夺魁),尤其是深度学习框架Torch宣布支持Python之后。所以学习Python进行数据挖掘是性价比是高的(本人也放弃了使用了3年多的R语言)。而使用Python进行数据挖掘是近几年才开始火起来的,之前网上很多的资料都是关于Python网页开发等。但使用Python进行数据挖掘的侧重点已经完全不一样了。本人就是浪费了很多时间来筛选这些博客、书籍。所以就有了本文,希望能帮大家少走一点弯路。
本文章主要从数据挖掘的角度出发,谈谈如何入门数据挖掘。本文不能保证你能成为大神,但是如果能踏踏实实地学习完,找一份年薪15w+的工作还是不太难的,考虑到市场上人才的稀缺。本人也是非计算机专业,所以希望给非计算机的人一点参考。现在市场上数据挖掘的人才非常缺少,现在大一点的企业都需要数据分析、数据挖掘的人才,但是国目前只有3所大学开设了相关的本科专业,计算机专业的人也不会抢这饭碗,因而,造成了数据挖掘市场上人才的供给不足,所以给了一大堆非科班出身人很多的机会。
一、Python 基础语法学习
如果只推荐一本书,强烈推荐《跟老齐学Python》,Python中的核心概念做了非常棒的讲解,深刻而不失幽默。
如果想系统的学习推荐密歇根大学的《学习使用Python编程并分析数据》系列课程。
廖雪峰Python教程 简单易上手的Python基础语法教程,值得学习, Python 2和Python 3版本都有。
二、 机器学习理论
基本经典的机器学习书籍
机器学习入门(中/英)(谷歌大牛的课程)
机器学习(乔治亚理工大学计算机课程)
周志华的西瓜书《机器学习》
深入一些的可以考虑李航的《统计学习方法》
还有偏统计的斯坦福的教授写的《统计学习导论》,深入版本的《The Elements of Statistical Learning》(英文影印版)
上面推荐的都是非常不错机器学习的入门书籍,都是经典了。
三、Python机器学习代码学习
掌握Python语法的基础上学习《Python for data analysis》是比较不错的选择,涵盖了ipython notebook、Numpy、Scipy和Pandas包的使用。
《Python数据分析与挖掘实战》介绍了使用Python进行数据挖掘的详细案例,数据和代码都可以下载,作为机器学习的进阶学习是不错的选择(这本书也用对应的R语言和Matlab 版本)。
还有Udacity机器学习纳米学位项目代码(Github上有)
再推荐2本国外网站的书籍,还在early release阶段《Python Data Science Handbook》和《Hands On Machine Learning with Scikit-Learn and TensorFlow》,非常好的代码示范。注册Safari Online,可以免费看10天。
四、博客和微信公众号
我推荐的网站和微信公众号都是我平时天天看的,那些水货大多被我取消关注了,养成每周清理公众号的好习惯。
1. 数据挖掘入门与实战 全是干货,代码质量非常高。
2. 机器学习研究会 我校老师组织的学习平台,代码加行业信息齐飞,质量非常高。尤其是我校的AI公开课(有直播),中国人工智能大腕云集。
3. 新智元 人工智能方向行业观点,对于自己把握技术方向非常重要,比如说自动驾驶这个坑能不能入?
4. 机器之心 技术前沿与重量级新闻。
还有一些其他的,下次再继续补充。
还有几个博客:
iPhone上可以使用Reeder阅读器,Instapaper用来保存后稍后阅读,因为信息量比较大。
No free Hunch Kaggle竞赛平台的官方博客,包括一些的代码解读以及高分选手的采访,十分有用的经验(来自不同背景,不同年龄层次,不同职业的选手)
Analytics Community | Analytics Discussions | Big Data Discussion 干货技术文章
新浪微博-爱可可 (北邮PRIS模式识别实验室陈老师)
五、计算机书籍下载网站
再添加几个外文书籍下载网址:
1. All IT eBooks 全,可能需要使用翻*墙下载,翻*墙方法见文末
2. Library Genesis 各种书籍,不局限于编程书籍
3. Fox eBook - eBooks Free Download Site
4. Development / Programming / AvaxHome
如果需要更多的技术文章,可以访问:
相关文章