多维度可扩展性(二)| 一键详解八个可扩展维度中的五个等级阶段
从技术角度讲,查询所关联的表会越来越多,查询所使用的分析函数会越来越复杂,查询的嵌套层次会越来越深。平台对查询复杂度的支撑,不会因用户所提交的查询的复杂性而有任何妥协。查询的反馈时间会随着查询的复杂度的增加而适当延长,但不会造成得不到查询结果,或者造成系统崩溃的情况。
查询的复杂度从计算引擎角度看,包括简单的SQL语句到复杂的SQL语句,再到支持R/Python/SAS等语言在数据库内执行,调用机器学习和人工智能算法等。在数据分析中使用更加复杂的算法需要平台能够无妥协地支持,所需要的只是在系统计算能力不足时,通过线性扩展的方式提升系统的物理算力。
因此,如下图所示,Teradata使客户能够同时扩展查询并发度和查询复杂度,而不会影响两者的功能或拖累系统性能.
▲图1:借助 Teradata Vantage,企业可以同时在所有八个关键分析维度上进行扩展,从而避免影响任何领域性能。
1. 高效的数据存储和可超过10PB的数据处理能力
8. 针对不同的工作负载提供一致的查询响应时间
数据分析技术的需求在特定的阶段需要满足特定的条件。按照不同的阶段和等级,我们划分了数据分析平台的5个能力扩展阶段,如下图所示,实现多维可扩展性需要明确的规范,数据分析平台需要支持下面所列出的所有8个可扩展维度中的5个等级阶段:
▲ 图2:该矩阵对八个关键分析需求维度中的每个维度的可扩展性程度进行划分,其中1弱,5强。
创建这个矩阵表明多维可扩展性是可以实现的。Teradata Vantage已经证明了这一点。Vantage作为企业级智能数据分析平台提供了上图中列出的8个维度的所有5个等级功能:
◎ 数据量
◎ 查询并发性
借助虚拟化并行的数据库引擎和BYNET网络协议以及复杂的混合工作负载管理,Vantage可确保别的并行性。用户能够将更多的应用程序、用户和查询整合到一个平台,单个查询的成本极低。Vantage支持的系统每天运行100多万次查询。
◎ 查询复杂度
凭借业界领先的基于成本的成熟优化器、基于哈希的索引、聚合连接索引以及对广泛连接计划的支持,Vantage用户可以高效且高性能地执行复杂查询,且无需手动调整。
◎ 模式复杂度
◎ 查询数据量
通过充分利用索引和分区,Vantage的结构易于部署和自动维护。Vantage还使用多种自动内存缓存。用户还可以使用Vantage的压缩选项、具有可变长度块的高效行存储、柱面读取和同步扫描等技术。
◎ 查询响应时间
Vantage基于哈希的文件系统确保数据均匀分布,无需额外成本即可提供主索引(PI)机制,直接提供战-术查询能力。基于成本的成熟优化器可确保生成优化的查询计划,而不管底层数据模式如何。Vantage还支持自动维护的索引,这进一步提高了查询性能。Vantage的工作负载管理提供控制,可提供一致的查询响应时间。
◎ 数据延迟度
Vantage的加载程序支持高性能批量和流式加载数据,同时提供负载隔离、锁定控制、多值压缩等功能,支持以极低的延迟同时查询和加载数据。多个加载作业可以同时将数据加载到同一个表中,同时保持彼此分离。
◎ 混合工作负载
相关文章