Vertica酷的20个关键功能

2022-02-16 00:00:00 功能 数据 数据库 架构 提供

大数据时代,速度至上,大数据分析软件Vertica提供了独立于底层基础设施的,快速、可扩展的分析平台。Vertica 的 SQL 数据仓库获得了包括Cerner, Etsy, Intuit, Uber在内的许多全球领先的数据驱动公司的信任,为他们的关键任务分析提供了速度、规模以及可靠性。Vertica将高性能、大规模并行处理SQL查询引擎与先进的分析和机器学习相结合,用户可以不受限制,不必妥协,大程度上激发数据潜力。

Vertica 为当今数据驱动世界的规模和复杂性而生。


分析所有数据

不再移动数据或满足于孤立的视图,而是建立一个探索现代化数据库和数据湖的单一平台。

同时实现规模和性能

对数据以及用户数量不断增长的担忧已经成为过去,现在复杂的问题也可以得到快速的响应,同时对数据和用户进行线性的缩放。

产品与时俱进

Vertica产品正在随着需求和技术的革新而不断演进,今天选择了Vertica,即代表选择未来。


Vertica酷的20个关键功能

Technical Enablement lead Vertica Mark Whalley介绍了Vertica的20个关键功能,这些功能使Vertica成为数据分析领域的游戏规则改变者。

01

查询优化的存储

       列式存储架构是Vertica的核心,事实上Vertica是早的商业化MPP列式架构数据库,这是Vertica在2005年建立的基础。不必刷新视图,也不必更新索引,优化器会自动选择佳方案进行查询。在不同类型的查询中获得归并链接和管道聚合。

02

自动化的数据库设计

       可以视为一种根据工作负载自动建议行存储的索引工具,将数据从原数据库中加载到Vertica中,并准备需要优化的示例查询。当工作负载改变时,它也可以增量运行。

03

自动化数据集市

       客户需要从不同的地方读取数据并将它们连接在一起,这会耗费大量的时间。数据集市在出现数据更改时进行刷新,除非仅刷新已更改的部分,否则会产生很多被浪费的计算。Vertica几年前就拥有了杀手级功能,它使大多数数据集市变得非常简单。

04

多维数据集的预聚合

       客户每天会获得TB级的明细数据,处理这些数据变得非常复杂。在Vertica的帮助下,客户无需增加逻辑的复杂性,也无需增加用于内存聚合的硬件和其他软件的成本。这一切都是开箱即用,无缝集成的。


05

摆脱底层存储的束缚

       Vertica以与基础设施无关而闻名,供应商的品牌机器盒子里装满了FPGA、CPU、RAM。Vertica不需要这些,Vertica甚至可以将一个表的不同分区存储在不同的位置。可以将上个月的数据放入本地磁盘,然后将其余的数据转存到SAN或HDFS上。灵活性是实现目标的关键,这只是众多示例之一。


06

既支持本地部署,也支持多云环境

       Vertica从2005年开始,就被设计和实现为在本地的商用标准硬件上运行。这种模式遵循无共享架构,其中集群的每个节点都是独立且自给自足的。更具体地说,没有节点间共享内存或者磁盘存储。同时,Vertica是商业标准硬件上运行快的,开放架构的分析SQL数据库。这之后,现在客户也可以在云上运行Vertica数据库,初使用AWS,不久之后也可以使用Google Cloud Platform和Microsoft Azure。Vertica还加入了EON模式,初在AWS上可用,现在在GCP上也可用。与企业模式不同,EON将计算与存储分开。Vertica也成为云上运行快的,开放架构的分析SQL数据库。在云中运行能够快速拓展和收缩以满足组织不断变化的工作负载能力。Vertica成为了目前世界上支持本地部署计算存储分离模式的SQL数据库。新的架构并不是为了替代原来的架构,而是对其进行补充。Vertica是一个一体化的产品,可以在企业模式或EON模式下部署在多个云或者内部数据中心中,为客户提供各种分析服务。Vertica为自由而生。


07

丰富的技术合作伙伴生态

       客户一直以来需要大量的工具完成日常工作,包括数据转换、消息传递、ETL、BI和可视化。Vertica开始与各行各业中的主要技术和解决方案提供商合作,以构建完整的分析生态系统,便于客户对大数据进行高效的管理。但是如果您的产品名称以G、N、U、W或者X开头,则会有一些空白需要填补。


08

为IoT与Clickstream提供全面支持

       Vertica在早期的时候,提供完整的OLAP功能兼容性以满足具挑战性的客户需求。当下,越来越多的公司需要可执行的即时洞察,而诸如预测性维护和物联网之类的新趋势正在推动分析工具的发展。Vertica一直处于领先位置,还为OLAP提供地理空间、时间序列和近的机器学习拓展提供全面支持。


09

超多类型的内置函数

       Vertica的内置函数类型非常多,在这里更关注内置函数,开箱即用的功能随时可用,其中的一些技术使客户可以编写自己的用户自定义函数或拓展,但这样做需要大量的时间和精力,并且很难像内置函数那样具有高性能或功能,被设计为核心产品的一部分。所以,仅关注内置功能,那些开箱即用的。尽管有一些接近的竞争对手,但毫无疑问Vertica仍是。

 

10

无与伦比的开发框架

       以防超过600个内置功能还不够用,Vertica还提供高度可拓展的用户自定义框架。UDx提供了要安装到Vertica服务器上的外部用户定义函数、新数据类型、解析器和数据加载器。UDx以C++、R、Java或Python编写,作为Vertica SQL函数在数据库中运行。当前有五种不同类型的UDx,因此通过在大型数据集上跨节点并行执行算法,可以提高过程代码的功能和灵活性。


11

复杂的数据类型支持

       与大多数数据库技术一样,Vertica支持所有常规ANSI SQL数据类型。Vertica还支持空间(几何和地理)和UUID数据类型。尽管很多其他数据库技术并不支持空间和UUID数据类型,仅凭这些并不能让Vertica脱颖而出。这里谈到的是复杂的数据类型,许多客户需要查询ORC或Parquet文件或其他内部类型比较复杂的数据。Vertica支持其中的一些复杂类型,并致力于在将来的版本中添加对所有复杂类型的全面支持。


12

端到端ML工作流支持

       如果想要学习数据分析,并期望用SQL解决问题,原生的SQL可以帮助客户不需要数据不一致或计算有瓶颈的Spark,在我们拥有的集群中分布式执行,无需额外的软件,也没有定制代码,所有这些都是开箱即用且无缝集成的。

 

13

JSON,Log format ORC和Parquet

        Vertica不仅与基础设施架构无关,与存储无关,而且在很大程度上与格式无关。利用Vertica根据列名而不是列顺序进行加载。比任何基于Hadoop的解决方案更快地使用Parquet和ORC,Vertica的原生Parquet和ORC解析器用C语言编写,快如闪电。不论数据是否在Hadoop中,执行所有操作而不必将任何数据导入数据库等过于繁琐的过程,外部表格可以即时快速扫描数据同时满足上述要求。如果先加载数据速度会更快。再次,不需要添加硬件,也无需添加软件,没有定制代码,全部开箱即用,全都无缝集成。


14

几乎适应任何分析项目的灵活架构

       很多客户正在完成他们从未想过的工作,几年前他们还会花一整夜时间从Oracle或Microsoft复制准备好的数据集市以加快其数据仓库的速度。那时从未想过的事可能发生,他们可以在从成机架的服务器到数据位于S3的服务器集群的任何基础设施架构上执行此操作,从通宵加载到近乎实时的传输。他们准备数据,但是以数据库内转换的形式,或带有指向Vertica的MPP链接的Spark的流转换形式。并且将数据存储在他们希望的任何地方,这归功于它们的灵活性。


15

保护敏感数据

       与大多数数据管理系统一样,Vertica完全具备所有标准的安全性和身份验证功能。包括客户端身份验证、节点间通信和加密TLS/SSL服务器身份验证,LDAP,联邦信息处理标准(简称FIPS)数据库审计以及系统表限制和访问,都不是真正脱颖而出的功能。由于与Voltage Secure Data的紧密联系,保护敏感数据是Vertica独特的解决方案,凭借其全面的数据保护框架,可在捕捉、处理和存储数据时保护其安全。借助格式保留加密(FPE)和令牌化技术,在企业的IT基础设施架构中提供端到端的敏感信息私密性,提供保护,从本质上讲,PEE为大数据分析提供了巨大的好处,从维护参照完整性和确保查询的佳性。是数据科学家能够在提供业务见解的同时,不暴露自己的信息。


16

成熟的产品

        早在1970年代,Micheal Stonebraker开发了世界上个行式关系数据库Ingres。图灵奖以表彰其对于现代数据库系统基础概念和实施的根本贡献,随着这些传统的行式存储技术开始与数据库使用方式不断的变化作斗争。这之后他继续开发C-store数据库,并将该数据库商品化为我们爱的Vertica——一种高性能的列存储数据库,他从一开始就是为了应对这种挑战。从2016年起Vertica增加了许多的新功能,Vertica工程师们马不停蹄,使Vertica达到了今天的水平,其丰富的功能,成熟的产品,是其他产品无法比拟的。2020年之后会有什么变化,让我们拭目以待。


17

Vertica经验证的投资回报

        Vertica在各种服务和行业中均提供了可靠的投资回报率,六家企业,所获得的投资回报率是惊人的。不仅每年节省数百万美元,而且在极短的时间内实现了投资回报,许多情况下只有几个月。Vertica每花费1美元就能获得4美元回报。


18

高客户满意度 

        当今行业中受推崇和研究支持的指标之一是NetPromotor得分(NPS)。通过对客户进行季度调查,Vertica获得了非常令人印象深刻的NPS得分—58分。该得分高于包括IBM在内的所有友商。


19

高活跃度和受欢迎的社区

        无论是从数百个Vertica Blog帖子中寻找想法和灵感,在Vertica论坛提出或回答问题,还是加入全世界范围的大数据与机器学习Vertica Meetup,你不会孤单。这是一个囊括了Vertica的方方面面且异常活跃的社区。

 

20

Vertica一站式学院

        2019年9月,Vertica学院成立,这是一个提供一站式Vertica培训的机构。经过了6个月的快速发展,已经拥有了成千上万的用户或学生。2020年3月,Vertica学院第二阶段上线了。所有课程都是免费的,所花费的只有您的时间。



来源 https://mp.weixin.qq.com/s?src=11×tamp=1644996471&ver=3623&signature=moGE9Tpapl7a43joFGauQNO1EIUozkGqLCucYoQL9KAJ-ydFLm*MJvon*qN4WevfJcwSxrmWA*o2CL4mbN1kGDfFi0529rJIed0FzB769gfzSg2V*SEmRMFUaR5*7sVS&new=1

相关文章