还在忍痛做出各种妥协?Vertica让分析前所未见!
说到当下火的词,莫过于大数据了。不过,大数据并非仅仅止于“大”,速度飞快、种类各异也是主要特征。
解读这些数据并非易事,你还在忍痛做出各种妥协吗?通过数据形成洞察力,并转化成竞争优势,才能激发数据变现、实现价值大化。
让分析前所未见,只差一个适合你的大数据分析解决方案。
三大技术要求
大数据分析平台
那么,您希望数据分析解决方案提供哪些功能特性来克服当下及未来的数据挑战呢?这里列出了以下几点:
以统一的方式分析海量数据
在分析数据时您可能希望不受规模限制,同时还需要在恰当的时机将数据存储在恰当的位置。今天的数据规模可能是TB或PB规模。但明天,您可能就要考虑如何处理EB规模的数据了。
满足业务预期
用户不希望被动等待结果。您的解决方案必须具有强大的可扩展性,才能满足服务级别协议(SLA)和业务需求,同时获得佳的总体拥有成本(TCO)和快速的投资回报(ROI)。
兼容主流工具
如果您的大数据分析依赖提取、转换、加载(ETL)工具或基于SQL的可视化技术,您的分析平台就必须提供稳定而强大的SQL工具,还要获得与您所有工具(而不仅仅是来自主要供应商的工具或仅限于单一基础设施平台的工具)配合使用所需的认证。
无限制,不妥协
Vertica分析平台
Vertica分析平台的设计思路由堪称传奇的数据库专家Michael Stonebraker提出,而且从编写行代码开始便确定了打造一款大数据分析专用平台的目标。为什么要这么做呢?原因很简单,数据仓储、未经证实的开源解决方案和习惯性做法,都会给技术带来限制,致使企业不得不做出妥协。
Vertica分析平台在设计时便明确将速度、可扩展性、简便性和开放性确定为核心要求,而且使用了通过分布式压缩列架构来处理分析工作负载的构建方法。
Vertica分析平台具有速度极快(查询运行速度提高50到1000倍)、EB规模(每台服务器多存储10到30倍的数据)、开放性和简便性(可使用任何商业智能[BI]/ETL工具、Hadoop等)等特点,而且成本比传统数据仓储解决方案低得多,而上市速度也快于未经证实的开源解决方案。
广泛的部署和使用模式
云+内部+Hadoop
Vertica具有内部部署、Hadoop上和云中等多种部署和使用模式,是统一的单一分析引擎,而且经实践证明,其大数据分析能力在速度和规模方面都无与伦比,永远不受底层基础设施的影响。
云中
Vertica软件经过优化和预配置,可在Amazon、Azure、Google和VMware云上运行。Vertica为用户提供强大的敏捷性和可扩展性,可实现快速部署、自配置,还可与各种BI和ETL软件工具相集成。
Vertica具有很强的灵活性,可随着业务增长由小到大逐渐扩容,从而方便您将数据仓储过渡到云、过渡到内部部署,再无缝过渡回去。如此水平的敏捷性,自然不必做出妥协。
内部部署
Vertica分析平台是一个“完全无共享”的分布式数据库,可在经济高效的商用服务器群集上运行,而且只需向群集中添加新服务器即可扩展其性能。传统数据库需要含有大量CPU和SAN的“大型机”服务器,相比之下,Vertica的网格架构大幅降低了硬件和扩展成本(可降低70%到90%)。
群集化架构还有助于在群集中的节点上并行处理查询和加载,提供更高的吞吐量,从而提升性能。
在Hadoop上
与Hadoop配合使用时,Vertica for SQL on Apache Hadoop会直接安装在Hadoop群集中,从而为组织提供一组强大的数据分析功能,且作用比前两种平台都要强大得多。因为它在查询时不依赖辅助节点,所以不会出现单点故障。
它甚至可以读取ORC、Parquet、Avro和其他本地Hadoop文件格式并将其写入Parquet。通过在Hadoop群集中安装Vertica SQL引擎,您可以充分挖掘全部SQL on Hadoop功能,在无需修改的情况下完成完整的TPC-DS查询,而且可在任意Hadoop分销版上运行。
操作简单,Vertica将是一个颇具吸引力的方案!
来源 https://mp.weixin.qq.com/s/IitjejG481tp1qNYJ1_f1A
相关文章