Python机器学习·微教程

2020-06-19 00:00:00 数据模型学习验证评估

Python目前是机器学习领域增长快速的编程语言之一。

该教程共分为11小节。在这个教程里，你将学会：

如何处理数据集，并构建的预测模型
使用Python完成真实的机器学习项目

这是一个非常简洁且实用的教程，希望你能收藏，以备后面复习！

接下来进入正题~

这个微课程适合谁学习？

开始之前，要搞清楚该教程是否属于你的菜。

如果你不符合以下几点，也没关系，只要花点额外时间搞清楚知识盲点就能跟上。

熟悉python语法，会写简单脚本。这意味着你在此之前接触过python，或者懂得其它编程语言，类C语言都是可以的。
了解机器学习的基本概念。基本概念包括知道什么是监督学习、非监督学习、分类和预测的区别、交叉验证、简单算法。不要被这些吓到了，并非要求你是个机器学习专家，只是你要知道如何查找并学习使用。

所以这个教程既不是python入门，也不是机器学习入门。而是引导你从一个机器学习初级开发者，到能够基于python生态开展机器学习项目的专业开发者。

教程目录

该教程分为12节

第1节：下载并安装python及Scipy生态

第2节：熟悉使用python、numpy、matplotlib和pandas

第3节：加载CSV数据

第4节：对数据进行描述性统计分析

第5节：对数据进行可视化分析

第6节：数据预处理

第7节：通过重采样进行算法评估

第8节：模型比较和选择

第9节：通过算法调整提高模型精度

第10节：通过集合预测提高模型精度

第11节：完善并保存模型

希望大家在学习的过程中能够自主寻找解决困难的办法，网上资源很丰富，这也是自我提升很关键的一步。当然也可以在评论区留言哦！

第1节：下载并安装python及Scipy生态

这一节内容比较简单，你需要下载python3.6并安装在你的系统里，我用的win10系统。

接着要安装Scipy生态和scikit-learn库，这里推荐使用pip安装。

简单介绍一下Scipy，Scipy是一个基于python的数学、科学和工程软件开源生态系统。包含一些核心库：numpy、scipy、pandas、matplotlib、ipython、sympy

如果你不想这么麻烦，那么也可以使用傻瓜式一条龙安装-Anaconda，这里面预装了python及一百多个库。

安装好后，就可以在命令行键入“python”，就可以运行python了。

看一下python及各个库的版本：

# Python version
import sys
print('Python: {}'.format(sys.version))
# scipy
import scipy
print('scipy: {}'.format(scipy.__version__))
# numpy
import numpy
print('numpy: {}'.format(numpy.__version__))
# matplotlib
import matplotlib
print('matplotlib: {}'.format(matplotlib.__version__))
# pandas
import pandas
print('pandas: {}'.format(pandas.__version__))
# scikit-learn
import sklearn
print('sklearn: {}'.format(sklearn.__version__))

相关文章