常用的Python数据科学库

2020-06-19 00:00:00 学习 工具 机器 可视化 科学

科学技术和数据分析

用来进行科学计算和数据分析的库。

astropy – 一个天文学 Python 库。
bcbio-nextgen – 这个工具箱为全自动高通量测序分析提供符合佳实践的处理流程。
bccb – 生物分析相关代码集合
Biopython – Biopython 是一组可以免费使用的用来进行生物计算的工具。
blaze – NumPy 和 Pandas 的大数据接口。
cclib – 一个用来解析和解释计算化学软件包输出结果的库。
NetworkX – 一个为复杂网络设计的高性能软件。
Neupy – 执行和测试各种不同的人工神经网络算法。
Numba – Python JIT (just in time) 编译器,针对科学用的 Python ,由Cython 和 NumPy 的开发者开发。
NumPy – 使用 Python 进行科学计算的基础包。
Open Babel – 一个化学工具箱,用来描述多种化学数据。
Open Mining – 使用 Python 挖掘商业情报 (BI) (Pandas web 接口)。
orange – 通过可视化编程或 Python 脚本进行数据挖掘,数据可视化,分析和机器学习。
Pandas – 提供高性能,易用的数据结构和数据分析工具。
PyDy – PyDy 是 Python Dynamics 的缩写,用来为动力学运动建模工作流程提供帮助, 基于 NumPy, SciPy, IPython 和 matplotlib。
PyMC – 马尔科夫链蒙特卡洛采样工具。
RDKit – 化学信息学和机器学习软件。
SciPy – 由一些基于 Python ,用于数学,科学和工程的开源软件构成的生态系统。
statsmodels – 统计建模和计量经济学。
SymPy – 一个用于符号数学的 Python 库。
zipline – 一个 Python 算法交易库。
数据可视化

进行数据可视化的库。 参见: awesome-javascript。

matplotlib – 一个 Python 2D 绘图库。
bokeh – 用 Python 进行交互式 web 绘图。
ggplot – ggplot2 给 R 提供的 API 的 Python 版本。
plotly – 协同 Python 和 matplotlib 工作的 web 绘图库。
pygal – 一个 Python SVG 图表创建工具。
pygraphviz – Graphviz 的 Python 接口。
PyQtGraph – 交互式实时2D/3D/图像绘制及科学/工程学组件。
SnakeViz – 一个基于浏览器的 Python’s cProfile 模块输出结果查看工具。
vincent – 把 Python 转换为 Vega 语法的转换工具。
VisPy – 基于 OpenGL 的高性能科学可视化工具。
计算机视觉

计算机视觉库。

OpenCV – 开源计算机视觉库。
SimpleCV – 一个用来创建计算机视觉应用的开源框架。
机器学习

机器学习库。 参见: awesome-machine-learning.

Crab – 灵活、快速的推荐引擎。
gensim – 人性化的话题建模库。
hebel – GPU 加速的深度学习库。
NuPIC – 智能计算 Numenta 平台。
pattern – Python 网络挖掘模块。
PyBrain – 另一个 Python 机器学习库。
Pylearn2 – 一个基于 Theano 的机器学习库。
python-recsys – 一个用来实现推荐系统的 Python 库。
scikit-learn – 基于 SciPy 构建的机器学习 Python 模块。
pydeep – Python 深度学习库。
vowpalporpoise – 轻量级 Vowpal Wabbit 的 Python 封装。
skflow – 一个 TensorFlow 的简化接口(模仿 scikit-learn)。

节选自博客

相关文章