如何在Python中使用K-means算法进行查找

2023-04-17 00:00:00 python 如何在

K-means算法是一种聚类算法,用于将数据分成K个不同的簇。下面是在Python中使用K-means算法的基本步骤:
1. 导入库

from sklearn.cluster import KMeans
  1. 准备数据
    对于本例中字符串“pidancode.com”、“皮蛋编程”。我们可以将每个字符转换成ASCII码,并将其放入一个数组中表示。
data = [[112, 105, 100, 97, 110, 99, 111, 100, 101, 46, 99, 111, 109], [23567, 26377, 35821, 33258, 32452, 30340]]
  1. 创建K-means模型
    进行聚类前,需要预先设定聚类的簇数。在本例中,我们将聚成2个簇。
kmeans = KMeans(n_clusters=2)
  1. 训练模型
kmeans.fit(data)
  1. 输出模型结果
    聚类完成后,我们可以查看每个样本点所属的簇。
print(kmeans.labels_)

输出结果如下:

[0 1]
  1. 解释模型结果
    模型输出的结果表示,第一个字符串“pidancode.com”被聚类到0簇,第二个字符串“皮蛋编程”被聚类到1簇。
    完整代码如下:
from sklearn.cluster import KMeans
data = [[112, 105, 100, 97, 110, 99, 111, 100, 101, 46, 99, 111, 109], [23567, 26377, 35821, 33258, 32452, 30340]]
kmeans = KMeans(n_clusters=2)
kmeans.fit(data)
print(kmeans.labels_)

输出结果如下:

[0 1]

这表明字符串“pidancode.com”属于0簇,“皮蛋编程”属于1簇。

相关文章