基于边权重的图聚类

2022-03-22 00:00:00 python cluster-analysis networkx graph

问题描述

我使用networkx构建了一个图,这是一个以人为节点、消息频率为边权重的社交网络。我想把这个网络分成不同的人群。经常互相发信息的人往往是同一群人。我该怎么做呢?我应该使用哪种群集算法?另外,我如何将分组可视化为树状图树?

提前感谢!:d 附言:我曾尝试使用python-Louvain进行分区,但结果不准确,例如它将两个用户划分为不同的组,即使他们的消息传递频率相当高


解决方案

我曾尝试使用python-Louvain进行分区,但结果不准确[.]

Louvain方法并不完美,也没有完美的方法,它们始终取决于您要实现的目标(请参阅this paper的结论)。

[.]就像它将两个用户划分到不同的组中一样,即使他们的消息传递频率相当高。

似乎此用户可能属于多个社区.也许可以尝试一种允许社区重叠的分区方法,例如K-Clique。这种分区方法允许节点属于多个社区。

算法:

以下是我找到的一些替代算法:

  1. networkX包中已包含许多算法(here)。我建议girvan_newman,但它需要很大的计算能力.

  2. CDLib包还有许多针对networkX(here)的算法,包括一些允许重叠社区的算法。另外,检查leiden algorithm,你可能更喜欢它而不是Louvain,它应该更好(根据他们的paper)

  3. 我仍然推荐使用python-louvain,以获得清晰的社区

祝你好运!

相关文章