使用DolphinDB进行机器学习

2022-03-29 00:00:00 数据 函数 模型 训练 数据源

DolphinDB实现了一系列常用的机器学习算法,例如小二乘回归、随机森林、K-平均等,使用户能够方便地完成回归、分类、聚类等任务。这篇教程会通过具体的例子,介绍用DolphinDB脚本语言进行机器学习的流程。本文的所有例子都基于DolphinDB 1.10.9。

1. 第一个例子:对小样本数据进行分类

我们用UCI Machine Learning Repository上的wine数据,用来完成个随机森林分类模型的训练。

1.1 加载数据

将数据下载到本地后,在DolphinDB中用loadText导入:

wineSchema = table(    
    `Label`Alcohol`MalicAcid`Ash`AlcalinityOfAsh`Magnesium`TotalPhenols`Flavanoids`NonflavanoidPhenols`Proanthocyanins`ColorIntensity`Hue`OD280_OD315`Proline as name,    
    `INT`DOUBLE`DOUBLE`DOUBLE`DOUBLE`DOUBLE`DOUBLE`DOUBLE`DOUBLE`DOUBLE`DOUBLE`DOUBLE`DOUBLE`DOUBLE as type
)
wine = loadText("D:/dataset/wine.data", schema=wineSchema)

相关文章