图数据库 | TuGraph和Neo4j等图数据库产品同台竞技

2022-04-20 00:00:00 查询 数据 产品 导入 查询结果

以下文章来源于费马科技 ,作者费马科技  

八月下旬,在杭州举办的第十三届知识科学,工程与管理国际会议(KSEM 2020)上,华东师范大学和澳大利亚新威尔士大学的学者们联合发布了一篇《近的图数据库系统的实证研究》的论文。

费马科技的图数据库产品TuGraph(曾用名LightGraph,或简写为Light)被研究者选中,和Neo4j,AgensGraph,TigerGraph的产品基于LDBC SNB进行了实证研究(Empirical Study)。实证研究重视直接的实验和观察,其结论更具备客观性。

       
本次研究就是在一台机器上,根据LDBC SNB的规范,生成了SF1,SF10和SF100三个规模的数据集。比较数据导入时间,数据存储空间。运行了四类LDBC SNB定义的任务,复杂只读查询任务(IC),简单只读查询任务(IS),事务类更新查询任务(IU)和商务智能任务(BI)。 

表一,三个规模数据集的顶点数,边数和文件大小

 

数据批量导入和数据存储空间,两枚银牌

数据批量导入的表现,TuGraph仅落后Neo4j,排名第二。数据存储空间占用的表现,TuGraph仅落后TigerGraph,再添一枚银牌。 


图一,数据批量导入时间和数据存储空间的结果

 

交互查询任务

LDBC SNB的三类交互查询任务,其中IU和IS是简单的微操作,IC是相对复杂的场景操作。处理这三类任务,TuGraph的表现都非常不错。

   表二,IU查询结果,TuGraph(Light)和Agens平分秋色

 表三,IS查询结果,TuGraph(Light)领先优势明显

表四,IC查询结果,TuGraph(Light)和TigerGraph各有所长

 

BI查询任务

BI查询任务,需要更高的性能来执行更复杂的商业应用。这对每一款产品都是不小的考验。除了TuGraph,其他三款产品都出现了超时(TO)或内存溢出(OOM)的情况。从结果上看,TuGraph也是和TigerGraph各有所长。

表五,BI查询结果,TuGraph(light)是没用TO和OOM的产品

 

总结

研究者在论文中给出的评价TuGraph(LightGraph)是更加平衡的产品,可在所有类型的查询上实现良好的性能。在管理大数据集和处理复杂查询中性能表现卓越!

       
当然,报告中用到的TuGraph版本,暂时还不能完全支持Cypher语法,是通过存储过程来实现复杂的查询。费马科技的研发团队一直在紧锣密鼓地丰富着Cypher语法支持的范围。



相关文章