图数据库 | TuGraph和Neo4j等图数据库产品同台竞技
以下文章来源于费马科技 ,作者费马科技
八月下旬,在杭州举办的第十三届知识科学,工程与管理国际会议(KSEM 2020)上,华东师范大学和澳大利亚新威尔士大学的学者们联合发布了一篇《近的图数据库系统的实证研究》的论文。
费马科技的图数据库产品TuGraph(曾用名LightGraph,或简写为Light)被研究者选中,和Neo4j,AgensGraph,TigerGraph的产品基于LDBC SNB进行了实证研究(Empirical Study)。实证研究重视直接的实验和观察,其结论更具备客观性。
本次研究就是在一台机器上,根据LDBC SNB的规范,生成了SF1,SF10和SF100三个规模的数据集。比较数据导入时间,数据存储空间。运行了四类LDBC SNB定义的任务,复杂只读查询任务(IC),简单只读查询任务(IS),事务类更新查询任务(IU)和商务智能任务(BI)。
表一,三个规模数据集的顶点数,边数和文件大小
数据批量导入和数据存储空间,两枚银牌
数据批量导入的表现,TuGraph仅落后Neo4j,排名第二。数据存储空间占用的表现,TuGraph仅落后TigerGraph,再添一枚银牌。
图一,数据批量导入时间和数据存储空间的结果
交互查询任务
LDBC SNB的三类交互查询任务,其中IU和IS是简单的微操作,IC是相对复杂的场景操作。处理这三类任务,TuGraph的表现都非常不错。
表二,IU查询结果,TuGraph(Light)和Agens平分秋色
表三,IS查询结果,TuGraph(Light)领先优势明显
表四,IC查询结果,TuGraph(Light)和TigerGraph各有所长
BI查询任务
BI查询任务,需要更高的性能来执行更复杂的商业应用。这对每一款产品都是不小的考验。除了TuGraph,其他三款产品都出现了超时(TO)或内存溢出(OOM)的情况。从结果上看,TuGraph也是和TigerGraph各有所长。
表五,BI查询结果,TuGraph(light)是没用TO和OOM的产品
总结
研究者在论文中给出的评价,TuGraph(LightGraph)是更加平衡的产品,可在所有类型的查询上实现良好的性能。在管理大数据集和处理复杂查询中性能表现卓越!
当然,报告中用到的TuGraph版本,暂时还不能完全支持Cypher语法,是通过存储过程来实现复杂的查询。费马科技的研发团队一直在紧锣密鼓地丰富着Cypher语法支持的范围。
相关文章