2022 DTCC 专场1- 数据库内核技术(PPT)
大纲:
1 什么是一致性?
什么是数据的多副本一致性?(什么是强一致性?)
什么是事务一致性?
什么是分布式一致性?
2 事务一致性技术的问题和挑战
什么是可串行化一致性?(理想化的事务强一致性)
什么是冲突可串行化一致性?(工程实践中的事务强一致性)
什么是无异常一致性?数据异常和一致性的关系是什么?
3 数据库和分布式数据库的事务强一致性实现技术
内容介绍:
各个领域,都在谈一致性。在数据库领域,一致性也是被常常提及,经常可以看到,许多数据库都在讲自己是强一致的数据库,可是,这里的强一致性该怎么理解怎么解读呢?
我们经常谈论的一致性,日常生活中变成了数据库厂商的宣传话术,用来标识技术之高深。但现实是,很多人又不理解一致,不明确一致性的含义。
更为严重的是,在数据库领域所说的事务相关的一致,却一直没有被所有人认同的定义。这使得ACID的C的含义有了不同的解释。
而在现代存算分离的分布式数据库中,一致性的内涵和外延变得更为复杂,该知识概念和知识体系变得更为扑朔迷离。
本分享,就分布式数据库范围为的各种一致性做深度剖析,并对他们之间的关系做深度探索,后还分享业界新的一致性技术、也是真正的一致性技术—无异常一致性,并就该技术做深度分析和解读。
李海翔,网名“那海蓝蓝”,腾讯金融云数据库研究员、腾讯TDSQL分布式数据库首席架构师。中国人民大学信息学院工程硕士企业导师,北京林业大学信息学院硕士企业导师,CCF数据库专委会执行委员,CCF大数据专委会执行委员,DTCC(中国数据库技术大会)专家委员会委员。获北京市科技进步一等奖。出版有《数据库查询优化器的艺术:原理解析与SQL性能优化》、《数据库事务处理的艺术:事务管理和并发访问控制》、《大数据管理》、《分布式数据库原理、架构和实践》。申请与授权专利90+,SIGMOD、VLDB、TKDE等数据库顶会/刊收录论文数十篇。参与包括国家863重大专项、核高基、工信部、科技部等多项目。
Oracle是严格一致性的数据库吗?
只需几条命令,不需要复杂的测试代码、不需要复杂的分布式环境,就一台单库,让你复现一个“读未提交”异常,意不意外!不是的可重复读、幻读……,不涉及说不清道不明的“当前读”,就是基础的“读未提交数据”,这是事务的基本法则,几个步骤,我们来让Oracle违反这个基本法则。
OLTP数据库是高度成熟的,要想提升OLTP数据库核心源码的性能,需要改多少行程序、写多少代码?
答案是:不到五十行代码吧,提升PostgreSQL MVCC核心代码性能,惊不惊喜!而且一些情况下性能可以提升20%. 听完分享,还不赶快动手试试,不过几十行代码而已。
本次分享,将从此Oracle“读未提交”异常入手,颠覆以往对主流数据库“一致性”架构设计的认知。结合Oracle/MySQL/PostgreSQL三个主流数据库关键点核心代码的横向对比,为我们寻找优化方向,终对PostgreSQL MVCC核心机制进行优化。希望借此分享,抛砖引玉,为国内数据库开发者提供另一种视角。
IT老兵,25年IT软件领域从业经历,十数年数据库经验,惯看IT江湖风起云涌。曾在多家巨头型互联网公司(阿里巴巴、京东、ebay)从事数据库管理与研究工作。
曾多次在DTCC数据库大会、系统架构师大会以个人、独立身份发表演讲,演讲内容涉及分布式数据库、云数据库与内核研究等方面内容。
在2019 DTCC 达梦8数据库发布会中,作为国内企业级杰出数据库专家代表,与中国工程院院士倪光南、方滨兴共话中国数据库技术的自主可控话题。
出版技术书籍《Oracle内核技术揭密》,被誉为国内深度解密Oracle算法原理的技术书籍。
现就职于美创科技,从事国产数据库、数据库内核与云数据库、数据安全方面的研究工作。
PolarDB产品系列都是从云上生长出来的数据库产品,为更好的服务企业级数据库市场,PolarDB在云原生和分布式技术上进一步深潜,通过计算、内存、存储三层解耦充分利用资源池化的能力,构建实时弹性,无缝伸缩的数据库服务;我们构建了透明分布式技术,使用动态分区,数据自动分布与均衡,加上全局索引以及在线元数据变更,缩小了分布式系统与集中式系统之间的差异,用户可以保留原来的使用模式即可获得分布式系统的强大能力。本次讲座将涵盖PolarDB系列的三款产品PolarDB-M(MySQL共享存储版), PolarDB-X(分布式版),PolarDB-PG(PG兼容共享存储版)近的技术进展。
在阿里一直从事分布式系统,分布式数据库内核的研发工作,技术专长和研究兴趣在分布式系统设计,分布式一致性协议,数据库内核实现等领域,曾在国际会议(SIGMOD/FAST/VLDB)发表多篇学术论文。
相关文章