2021 DTCC 专场5-图数据技术与应用创新

2021-10-23 00:00:00 数据库 架构 开源 业务 计算

百度图数据库实践3.0:HugeGraph大规模并行图计算实践与架构

演讲简介:

为了解决海量复杂关联关系数据的存储及分析问题,我们自研了HugeGraph图数据库,目前已支持百度内部15+业务线。并于2018年开源,是国内开源图数据库,至今已发布了11个Release版本,社区用户超过100家。HugeGraph是功能完备且性能的分布式图数据库,在互联网、金融、保险、证券等领域具备多年实践应用。在千亿规模(点边)图场景下,OLTP延迟在毫秒级、OLAP全图离线分析耗时在小时级。

本次分享,聚焦于大规模并行图计算的实践与架构。分享内容包括:离线图计算能解决哪些场景问题、如何在千亿规模图上进行并行计算、面临哪些挑战、如何应对这些挑战,以及如何来提升图计算性能等。同时,也基于个人多年图数据库内核研发&业务实践的角度,分享以下内容:HugeGraph图计算的技术架构,以及图计算业界对比、图计算与传统计算区别、实践经验与思考等内容。

演讲内容重点提纲:

1. 图计算是什么,能解决什么业务问题,图算法应⽤场景举例

(⽐如环路检测、中介中⼼性、社区发现等)

2. 图计算与传统计算的区别,为什么需要图计算

(⽐如与MR区别)

3. 业界现状如何,⼤规模图计算所⾯临的挑战是什么

(⽐如 spark graphx 现状),(图算法复杂度⾼,可达O(n^3)量级,突出的2个问题是:超过⼗亿规模图时,性能差、OOM严重)

4. 如何应对挑战 -- ⾃研图计算

(怎么解决的这些问题,有什么区别,终能达到⼀个什么程度)

5. HugeGraph图计算的架构与优势

(重点,优势是什么,是怎么做的)

6. 未来规划与思考


章炎 知名外企 Java业务架构师

嘉宾介绍:

章炎,hugegraph图计算贡献者之一,前baidu研发,目前在一家外企担任Java业务架构师。


开源分布式图数据库的思考和实践经验

演讲简介:

我在与众多企业接触的过程中, 发现越来越多的业务方开始对数据之间、实体之间的关联关系感兴趣,并且可以从中挖掘出非常大的业务价值,这些关联关系就是图数据库要解决的问题。本次talk,我将基于自身经历和实践经验分享一些我对于开源分布式图数据库的思考。主要内容有以下几点:1. 图数据库市场的现状;2. 图数据库的优势;3. 为什么要开源;4、图数据库的未来等等。


吴敏 杭州欧若数网科技有限公司 PD & CR

嘉宾介绍:

吴敏,Dr. min.wu,杭州欧若数网科技有限公司 PD & CR,曾在 2010-2015 年期间,在阿里云担任飞天 RD,随后在 2015-2018 年期间,任职蚂蚁金服图平台 RD,对图数据库、图计算等图相关领域有丰富的产品思考、架构设计沉淀。


相关文章