列式数据库之infobright
年前听过Sybase中国区副总裁的关于列式数据库的讲座之后就一直被列式数据库强大的性能吸引。近邂逅了infobright,列式数据库的学习展开了。
Sysbase可以说是列式数据库的先驱,Sysbase IQ 15 就是Sybase 目前新的列式数据库。它具有强大的功能,包括数据的快速加载、超高速的分析
性能、强大的业务智能分析、领先的数据建模能力等等。 infobright是一个基于MySQL的数据仓库系统,共工的不周山的blog上有挺详细的介绍。同样
是列式数据库,但是infobright和Sybase IQ系列还是有很大的不同。infobright采用的Knowledge Grid来组织数据,infobright内部是没有索引,就这点就
节省了不少的空间。而Sybase IQ系列还是使用了索引,而这些索引我个人的理解就是位图索引的改进版。白皮书上说,infobright的数据压缩比可以是10:1到40:1,
个人拿庞大的日志数据库做了个小小实验,感觉压缩也没那么夸张。如果依据位图索引的思想,每列数据的相似度越高就会具有越高的压缩比。infobright应该也是满足这
一点的,但是具体Knowledge Grid内部如何实现还不清楚,有待继续考究。
infobright的优点有很多,简单列举如下:
Infobright的优点:
(1)高压缩比率
(2)快速响应复杂的分析查询语句
(3)随着数据库的逐渐增大,查询和装载性能基本保持稳定
(4)没有特殊的数据仓库模型(比如星状模型、雪花模型)要求
(5)无需要物化视图、复杂的数据分区策略、索引
(6)实施和管理简单,需要极少的管理
(7)和众多的BI套件相容,比如Pentaho、Cognos、Jaspersoft。
infobright有两个版本ICE和IEE,目前ICE的版本是3.3.1,支持64位Linux和32位windows。ICE不支持DML,也就是不支持insert、update等操作。
至于infobright的框架待改天分析。
相关文章