零基础学习Python数据分析
使用Python进行数据挖掘是近几年才开始火起来的,之前网上很多的资料都是关于Python网页开发等。但使用Python进行数据挖掘的侧重点已经完成不一样了。本人就是浪费了很多时间来筛选这些博客、书籍。所以就有了本文,希望能帮大家少走一点弯路。
----------我是分割线--------
本文章主要从数据挖掘的角度出发, 讲讲如何零基础学习Python语法、数据清洗、以及数据建模。本文不能保证你能成为大神,但是如果能踏踏实实地学习完,找一份年薪15w+的工作还是不太难的。本人也是非计算机专业,所以希望给非计算机的人一点参考,大神请绕道。
熟练掌握任何一门语言,几乎都需要经过以下过程:
- 良师--学习Python课程+入门书籍+浏览技术博客
- 社区帮助--善于使用搜索引擎、Mail List
- 益友 -- 寻找学习伙伴
- Learn by Code --项目实践
一、Python学习课程推荐
这两个学习课程从基础的Python语法开始,介绍了Python数据分析、统计模型以及机器学习的各个方面,内容十分充足。之所以建议使用老外的课程是因为,老外上课假定你什么都不会,讲解深入浅出,尤其是对于华盛顿大学的机器学习课程,把复杂的概念讲解得十分简单。
1. 密歇根大学的《学习使用Python编程并分析数据》主要包括以下课程(讲解十分详细,深入浅出,非常适合入门学习,视频都是有字幕的):
-
《大家的编程 (Python 入门》:课程涵盖了如何使用Python的基本指令编写程序. 课程对学生没有先设要求, 我们只涉及到基本的数学, 有一定使用电脑经验的人都可以完全掌握这门课的内容.
-
《Python 数据结构》:本课程将介绍Python编程语言的核心数据结构。我们将学习编程语言的基础概念,探索如何使用Python的内置数据结构,如列表、字典、元组,进行更为复杂的数据分析。
- 《使用 Python 访问网络数据》:使用Python爬取和解析网络数据
- 《Python 数据库开发》:使用Python和数据库进行交互
- 《使用 Python 获取并处理数据,并用可视化方式展现数据》
2. 华盛顿大学的《机器学习》专项课程
在专项课程页面无法选择旁听,必须点击进入单独课程页面才可,这个课程专题旁听是有限制的,无法提交作业;如有需求,可以申请奖学金,回答三个问题即可,系统自动通过申请。
-
《机器学习基础:案例研究》:你是否好奇数据可以告诉你什么?你是否想在关于机器学习促进商业的核心方式上有深层次的理解?你是否想能同专家们讨论关于回归,分类,深度学习以及推荐系统的一切?在这门课上,你将会通过一系列实际案例学习来获取实践经历。
- 《机器学习:回归》
- 《机器学习:分类》
- 《机器学习:聚类和检索》
- 《机器学习:推荐系统和降维》
- 《机器学习:应用深度学习创建智能运用》
二、网上打码教程
Learn by doing!!! 学习编程有效的方式就是敲代码!
-
Codecademy 围绕Python 的基础语法,内容非常丰富。
- Datacamp Python基本语法(他家的R语言课程十分不错!)
三、Python技术博客
简单介绍一些非常棒的Python技术学习的博客
1. 廖雪峰Python教程 简单易上手的Python基础语法教程,值得学习, Python 2和Python 3版本都有。
2. 非常棒的pandas练习Github Repo
3. 很详细的Python 爬虫教程
4. 国外Data Science博客大全
四、Python入门书籍推荐
常用书籍下载网址,几乎囊括了网上能找得到的所有Python相关的书籍(PDF、Epub和mo bi格式),且提供云盘下载链接。你值得拥有!
python | 搜索结果
1. 掌握Python语法的基础上学习《Python for data analysis》是比较不错的选择,涵盖了ipython notebook、Numpy、Scipy和Pandas包的使用。
2.《Python数据分析与挖掘实战》介绍了使用Python进行数据挖掘的详细案例,数据和代码都可以下载,作为机器学习的进阶学习是不错的选择(这本书也用对应的R语言和Matlab 版本)。
3. 《Python Cookbook》很厚的一本书,可以作为Python语法查询手册。
再添加几个外文书籍下载网址:
1. All IT eBooks 全,可能需要使用翻*墙下载,翻*墙方法见文末
2. Library Genesis 各种书籍,不局限于编程书籍
3. Fox eBook - eBooks Free Download Site
4. Development / Programming / AvaxHome
五、推荐订阅博客(更细频率较高)
iPhone上可以使用Reeder阅读器,Instapaper用来保存后稍后阅读,因为信息量比较大。
- No free Hunch Kaggle竞赛平台的官方博客,包括一些的代码解读以及高分选手的采访,十分有用的经验(来自不同背景,不同年龄层次,不同职业的选手)
- Flowing Data 十分有用的数据分析的案例
- Python日报 内容十分精彩的集锦(中文)
六、FAQ (待续)
- Python 2.x还是Python 3.x?
- 如何安装Python包? 强烈推荐Anaconda包,你值得拥有!尤其是Windows系统。
- 网络速度慢,请翻*墙,安利一款免费好用Google开发的防屏蔽的梯子Lantern,速度不错。
- 是否需要很强的统计和数学背景? 有良好的数学和统计背景固然很好,但是现在很多岗位对数学和统计背景要求并不很多,都是简单的算法,Python编程已经能够很方便地实现,更多的是对业务的深入理解。如有需要建议,边学习Python边学习数学统计。
七、实践项目
- Kaggle竞赛项目,里面不仅仅有很多竞赛项目,而且有很多可供学习的代码、博客以及论坛,都是实战项目,有很强的实践价值。
----------------------
中文的Python数据分析的教程较少,而且质量良莠不齐,所以推荐多为英文资料。而且随着学习的深入,有时候只有英文资料可以借鉴。学习数据分析和机器学习,英文再好也不为过。并不是说中国没有的人才,而是为了便于国际交流学习,中国人也多用英语。
P.S.: 衷心感谢大家的赞赏,这是对我大的肯定(网费有着落了)。
相关文章