大数据存储技术选型(一)——数据库介绍

2020-05-22 00:00:00 数据库 专区 都是 是一个 搭载

作为一个专业音乐人,业余数据架构攻城狮,啊呜~~,每天都感到鸭梨山大啊。新技术更新太快了,总是赶不上啊。一个技术还没学明白,就有新技术取代它,哎,生活如此艰难啊!感觉随时都会被淘汰啊。由于天真烂漫,年少无知选择这条路,现在每天都在为当初的傻*行为买单。


好吧,不废话了,说说技术吧,对于数据库选型,其实就是一点,需要注意的。你需要有一个牛*的DBA和数据库架构师,重要的是你要有一个懂技术的teamleader。


好了现在说说我用过的数据库吧,DB2,Mysql,Sql Server,Oracle,Hadoop,PostgreSQL,Teradata


1、DB2

ibm.com/analytics/us/en


基本现在除了老资格的银行在用,基本没有几个公司用,主要是这个数据库是收费的,一般都是跟随AIX销售而赠送的。不过DB2在处理千万级数据的性能还是很值得称赞的。基本上几千万的数据,就一分多钟。而且调度方式很直接,跟服务器用户绑定,在执行时是不用键入用户和密码的。总体感觉跟Oracle很像。但是在管理方面就比Oracle逊色太多了。


2、Mysql(开源)

mysql.com/


Mysql被Oracle收购之后的5.7版本,确实比之前的5.6版本要好dooooor了!!!安装上少了一些大坑,对初学者很友善。不过在性能优化上,还是很纠结,因为配置文件上的一些参数是不能在数据库启动时更改的,所以更改系统参数时,就要对系统文件进行修改,再对数据库进行重载或重启。

不过,Mysql在锁的机制上很突出,插入锁,更新锁,行锁,表锁等,反正锁机制是非常强大的,而且研究起来是门大学问。



3、sqlserver

microsoft.com/en-us/sql


微软出得强大(la ji)数据库,基本都是搭载在Windows server上的,server的性能,不用我多少了吧,牛*(la ji)。总体感觉占用系统资源很大,但是里面能够提供的服务很多,大部分都是面向企业的。


4、PostgreSQL (开源)


postgresql.org/


管理上像oracle,用起来像mysql,比mysql费劲一点。总体上来说集合了mysql和oracle的特点。


5、Oracle

oracle.com/index.html


专业!专业!专业!无论是性能,还是存储,还是管理,还是优化等等各个方面都是做得非常到位。包括还有回收站机制,优化器也是一个特别突出的亮点,事务管理等等。感觉欠缺的东西,就是各个方面都太到位了,以至于不利于没有数据库经验的人玩弄。必须要经过专业的学习。而且安装复杂,需要用root用户。而且,吃内存特别严重,基本一般搭载Oracle库的,都是一台物理机,一个实例。


6、Teradata

info.teradata.com/brows


这个是一个非常超前的产品,在我们都在研究怎么把数据库实现集群化的时候,他们已经做到了。而且有一整套的解决方案,包括服务器集群,模型,调度,都非常出色。提供专业级驻场专家。就是太贵了,太贵了!


7、Hadoop(开源)

hadoop.apache.org/


核心干货就是hdfs和mapreduce,其他的都是搭载在这上面的工具。不说了,这个生态圈太大了。心累啊!心累啊!


今天就说到这里,可能有些东西说的有问题,欢迎大家来怼!

相关文章