Azure Synapse Analytics Serverless
数据湖仓
自从Databricks提出Lakehouse后,同时Snowflake的上市,湖仓一体成为数据领域火热的话题。
https://databricks.com/blog/2020/01/30/what-is-a-data-lakehouse.html
核心的理念是Delta Lake使Hadoop有了ACID事务能力,使用Spark内存做实时,批,AI计算层。
这样就可以用分布式文件存储颠覆关系数据库存储。
数据仓库
数仓一直有3种类型,概念上和物理上:
一体机 | Oracle Exadata,Teradata | 价格,软硬件无法解耦 |
MPP | Greenplum | 数据分片始终会遇到数据倾斜问题 |
数据库 | Oracle,SQL Server | 100T以下容量数仓,使用列存储索引 |
相关文章