想用 Python 做数据分析?先玩玩这个再说
数据分析是 Python 的一大应用领域。据我所知,本教室的读者中有不少学习 Python 就是为了在工作中能用它分析数据。这其中,又有相当一部分人是涉及金融相关行业,有从业人员,有学生,还有对此具有兴趣的爱好者。
那么,想要学习用 Python 做数据分析该从何入手?
既然是数据分析,首先,你得有数据。
今天就来介绍一个很好用的财经数据包:TuShare
直接摘录 TuShare 官网上的介绍:
TuShare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,能够为金融分析人员提供快速、整洁、和多样的便于分析的数据,为他们在数据获取方面极大地减轻工作量,使他们更加专注于策略和模型的研究与实现上。
TuShare 数据格式使用 pandas DataFrame 类型,也可保存至 Excel 和 数据库。兼容 Python 2 和 3。
看起来很好很强大,关键还是免费且开源的。再来试下好不好用。
安装
TuShare 基于 Python,有两个主要依赖:pandas 和 lxml。可以先分别安装这两个库,但我更推荐的是直接安装 Anaconda。对于要做数据分析和科学计算相关的同学来说,Anaconda 帮你一次性解决了几乎所有你可能用到的依赖库的安装,避免了某些库在不同平台上编译的问题。真的是谁用谁知道。
Anaconda 的下载安装这里就不多说了,本身不复杂,网上搜一下就出来了。
装好之后就可以直接通过 pip 安装 TuShare:
pip install tushare
相关文章