spark mllib分类之如何支持向量机
spark mllib分类之如何支持向量机
spark mllib支持多种分类算法,其中之一就是向量机(support vector machine, SVM)。向量机的基本原理是:通过构建一个向量空间,并在该空间中定义一条或多条分类超平面,使得待分类项目可以根据其所处的位置关系来被正确分类。
spark mllib中的SVM算法实现了基于libsvm的一个支持向量机库,并提供了一个简单的接口。使用spark mllib中的SVM算法需要以下步骤:
1.首先,需要准备好训练数据,并将其转换成libsvm格式,该格式为
2.然后,使用spark mllib的SVM算法训练模型,该算法需要两个参数:一个是训练数据集,一个是迭代次数;
3.最后,对新的数据进行预测,预测结果为0或1,分别表示属于或不属于某一类。
相关文章