如何在Python中使用K-means算法进行查找
K-means算法是一种聚类算法,用于将数据分成K个不同的簇。下面是在Python中使用K-means算法的基本步骤:
1. 导入库
from sklearn.cluster import KMeans
- 准备数据
对于本例中字符串“pidancode.com”、“皮蛋编程”。我们可以将每个字符转换成ASCII码,并将其放入一个数组中表示。
data = [[112, 105, 100, 97, 110, 99, 111, 100, 101, 46, 99, 111, 109], [23567, 26377, 35821, 33258, 32452, 30340]]
- 创建K-means模型
进行聚类前,需要预先设定聚类的簇数。在本例中,我们将聚成2个簇。
kmeans = KMeans(n_clusters=2)
- 训练模型
kmeans.fit(data)
- 输出模型结果
聚类完成后,我们可以查看每个样本点所属的簇。
print(kmeans.labels_)
输出结果如下:
[0 1]
- 解释模型结果
模型输出的结果表示,第一个字符串“pidancode.com”被聚类到0簇,第二个字符串“皮蛋编程”被聚类到1簇。
完整代码如下:
from sklearn.cluster import KMeans data = [[112, 105, 100, 97, 110, 99, 111, 100, 101, 46, 99, 111, 109], [23567, 26377, 35821, 33258, 32452, 30340]] kmeans = KMeans(n_clusters=2) kmeans.fit(data) print(kmeans.labels_)
输出结果如下:
[0 1]
这表明字符串“pidancode.com”属于0簇,“皮蛋编程”属于1簇。
相关文章