TigerGraph开源十大图数据库算法库
12月 24日 消息,企业级图分析平台TigerGraph宣布,正式开源 TigerGraph GSQL 图数据库算法库,发布三大类共十大核心算法。通过开放这些算法库,用户能以更加简单易用的方式支持更广泛场景的业务分析。目前,用户可以从github下载该算法库。
TigerGraph GSQL图算法库包含了一系列性能卓越的GSQL查询,所以GSQL的图形算法本质上是GSQL查询。每种算法都可以作为一个独立的查询使用,而每个查询都可以实现某种标准的图算法。
在算法运行中,用户可以选择三种不同格式的输出结果,包括 JSON格式流输出、 输出值写入表格类文件,以及保存为顶点属性值。
目前,GSQL的图形算法库中开源的核心算法可分为三类:路径搜寻的算法、衡量中心度的算法以及衡量群体度的算法。
路径搜寻的算法,用于帮助用户找到短路径或评估某条路径的可行性或质量。其中主要包括:
·无权重单起点短路径算法(Single-Source Shortest Path)。这种算法在大量应用中都有广泛运用,例如估计事件影响、评估知识传播,或者用于调查犯罪的方法等。
·含权重单起点短路径算法(Single-Source Shortest Path)。 这种算法在寻找更优路线的应用中非常普遍,例如在GPS导航的路径规划中寻找两个地点之间的短路径。
衡量中心度的算法,用于帮助确定网络中某个顶点对于总体的重要性,可以用来解释“位置有多靠中心”这样的问题。其中主要包括:
·页面排名算法(PageRank)。这种算法主要用于测量每个顶点对于其他顶点的影响力,例如能够揭示个人在社交网络中的社会影响力大小、寻找复杂网络分析中的源头和权威性等。
·接近中心度算法(Closeness Centrality)。这种算法可以帮助地衡量某一个顶点到底“多靠近中心”,例如在复杂的社交网络中,确定出中心度越高的个体,越有可能是网络中的一个中心。
衡量群体度的算法,主要用于评估一个网络结构中个体组合或分裂的程度,同时也能够获得网络的组织程度正在加强或削弱的趋势。其中主要包括:
·连通分量算法(Connected Components)。这种算法能够帮助确定互相连通的一组顶点和边的大范围,例如在社会网络分析领域用于寻找网络中的有联系的小团体或个体。
·标签传播算法(Label Propagation)。这种算法是一种启发性算法,利用顶点间的关系建立关系完全图模型,用于确定社群内部关系,例如广泛地应用到多媒体信息分类、虚拟社区挖掘等领域。
图:TigerGraph算法库总览
原文作者:新闻投稿;链接:http://blog.itpub.net/31545814/viewspace-2286208/,如需转载,请注明出处,否则将追究法律责任。
相关文章