如今,全球90%的数据都是在近两年时间内产生的,企业和个人不仅需要存储和分析这些大量的数据,包括不同的数据源产生的结构化和非结构化的数据。这些数据因为数据量太大,所以使用传统的关系型数据库,很难有效的进行管理和存储。Hadoop是一款很好的处理任务的工具,SequoiaDB则是适合Hadoop的数据库。SequoiaDB通过将Hadoop作为架构中的一个部分处理操作和分析负载,是的Hadoop更能发挥他的潜力。这样不仅提升了数据控制管理能力,降低了ETL的负载终让数据存储机制释放了这些数据大的价值。Hadoop如今之所以会流行,是因为其提供了简单便宜的数据存储HDFS同时还有适用于大量批处理分析的MapReduce机制。HDFS是一个基于Java的文件系统,这一系统扩展性强,同时能基于普通的服务器提供可靠的集群数据存储服务。生产环境中,HDFS多可以扩展至存储200PB的数据在4500台服务器上,存储攻击10亿以上的数据。MapReduce是一个使用了“分治法(Divide and Conquer)”的处理架构,Map是将一个大的任务分割为多个小的任务进行分布处理,Reduce则是将这些分布处理的结果聚合并且输出。所以理论上任何可以切分的任务都是十分适合Hadoop的。Hadoop可以存储和分析数据,但还是需要数据库提供更好的支持。Hadoop设计之初就不是为了即时事务功能以及实时交互应用,也不能满足企业级的需求如政府级别的安全保证。高可用特性以及容灾备份等等数据库擅长的功能。虽然Hadoop生态在不断扩充缝补,但是Hadoop想要真正的发挥其大的效用,仍然需要依赖一款企业级的数据库。SequoiaDB就是适合Hadoop的数据库。SequoiaDB可以完美的融入Hadoop的生态系统当中,作为一款支持实时、事务应用的数据库向Hadoop提供数据。此外,SequoiaDB还能利用HDFS构建层次化的存储模型,在GDFS、S3、SSD、SAN、NAS等之间无缝的移动,此外也能在无需调整下游程序的代码情况下使本地磁盘支持特定的SLAs和成本目标。使用SequoiaDB与Hadoop结合,Hadoop提供了计算的支持,而SequoiaDB提供了存储同时补充了许多企业级的功能,包括事务、高可用、容灾、数据安全性等等。
点击【阅读原文】了解更多SequoiaDB结合Hadoop的实例