Azure Synapse Analytics Serverless

2022-03-30 00:00:00 查询 数据 数据库 组合 关系

数据湖仓

自从Databricks提出Lakehouse后,同时Snowflake的上市,湖仓一体成为数据领域火热的话题。

https://databricks.com/blog/2020/01/30/what-is-a-data-lakehouse.html

核心的理念是Delta Lake使Hadoop有了ACID事务能力,使用Spark内存做实时,批,AI计算层。

这样就可以用分布式文件存储颠覆关系数据库存储。

数据仓库

数仓一直有3种类型,概念上和物理上:

一体机

Oracle Exadata,Teradata

价格,软硬件无法解耦

MPP

Greenplum

数据分片始终会遇到数据倾斜问题

数据库

Oracle,SQL Server

100T以下容量数仓,使用列存储索引

相关文章