Python机器学习·微教程
Python目前是机器学习领域增长快速的编程语言之一。
该教程共分为11小节。在这个教程里,你将学会:
- 如何处理数据集,并构建的预测模型
- 使用Python完成真实的机器学习项目
这是一个非常简洁且实用的教程,希望你能收藏,以备后面复习!
接下来进入正题~
这个微课程适合谁学习?
开始之前,要搞清楚该教程是否属于你的菜。
如果你不符合以下几点,也没关系,只要花点额外时间搞清楚知识盲点就能跟上。
- 熟悉python语法,会写简单脚本。这意味着你在此之前接触过python,或者懂得其它编程语言,类C语言都是可以的。
- 了解机器学习的基本概念。基本概念包括知道什么是监督学习、非监督学习、分类和预测的区别、交叉验证、简单算法。不要被这些吓到了,并非要求你是个机器学习专家,只是你要知道如何查找并学习使用。
所以这个教程既不是python入门,也不是机器学习入门。而是引导你从一个机器学习初级开发者,到能够基于python生态开展机器学习项目的专业开发者。
教程目录
该教程分为12节
第1节:下载并安装python及Scipy生态
第2节:熟悉使用python、numpy、matplotlib和pandas
第3节:加载CSV数据
第4节:对数据进行描述性统计分析
第5节:对数据进行可视化分析
第6节:数据预处理
第7节:通过重采样进行算法评估
第8节:模型比较和选择
第9节:通过算法调整提高模型精度
第10节:通过集合预测提高模型精度
第11节:完善并保存模型
希望大家在学习的过程中能够自主寻找解决困难的办法,网上资源很丰富,这也是自我提升很关键的一步。当然也可以在评论区留言哦!
第1节:下载并安装python及Scipy生态
这一节内容比较简单,你需要下载python3.6并安装在你的系统里,我用的win10系统。
接着要安装Scipy生态和scikit-learn库,这里推荐使用pip安装。
简单介绍一下Scipy,Scipy是一个基于python的数学、科学和工程软件开源生态系统。包含一些核心库:numpy、scipy、pandas、matplotlib、ipython、sympy
如果你不想这么麻烦,那么也可以使用傻瓜式一条龙安装-Anaconda,这里面预装了python及一百多个库。
安装好后,就可以在命令行键入“python”,就可以运行python了。
看一下python及各个库的版本:
# Python version
import sys
print('Python: {}'.format(sys.version))
# scipy
import scipy
print('scipy: {}'.format(scipy.__version__))
# numpy
import numpy
print('numpy: {}'.format(numpy.__version__))
# matplotlib
import matplotlib
print('matplotlib: {}'.format(matplotlib.__version__))
# pandas
import pandas
print('pandas: {}'.format(pandas.__version__))
# scikit-learn
import sklearn
print('sklearn: {}'.format(sklearn.__version__))
相关文章