KunlunBase查询优化(三)排序下推

2022-01-12 00:00:00 数据库 执行 节点 下推 排序

前言


前面2篇文章我们介绍KunlunBase的查询优化原理和Project和Filter下推演示(KunlunBase 查询优化(一)KunlunBase查询优化(二)Project和Filter下推),本节讲述排序查询优化之排序下推。


 

一、order by下推


一条含有order的SQL的执行计划在如下生成过程中,Sort被下推到RemoteScan算子里面。


Sort下推的操作是异步方式,指令在各个数据节点并行执行,过滤数据后,将排序后的结果反馈给计算节点,降低了计算节点的负载。

 

 

下面我们来测试查看查询下推的执行计划

 

为支持排序下推,需要在 KunlunBase  设置如下如下参数为true:

set enable_remote_orderby_pushdown=true;

  

测试语句:

select c_zip from customer1 order byc_zip;

 

查看执行计划: 

explain select c_zip fromcustomer1 order by c_zip;


 

根据上面的执行计划,RemoteScan在传达了远程排序操作到每一个相关的存储节点,存储节点将结果反馈给计算节点再做Merge Append。

 

如果关闭排序下推的特性,执行计划会发生变化,排序操作将在计算节点执行。


演示如下:

set enable_remote_orderby_pushdown=false;


排序操作将在计算节点执行:

 

 

语句的执行过程:语句在计算节点改写后,下发到2个数据节点执行,从计算节点拉取符合条件的值到计算节点排序,排序后反馈给客户端。

 


二、性能比对

 

性能比对环境:

 

复制下方链接登录 KunlunBase  在线体验系统:

zettatech.tpddns.cn:8000/ci/index.php/Main/PGList

 

在SQL框中输入排序操作的语句,按执行键执行。

 

左边窗口是 KunlunBase  社区版本的执行信息(社区版不支持排序下推操作),右边窗口是 KunlunBase  企业版有下推操作的执行信息。

 


对比可以发现,order by下推后,执行效率提高了(执行时间由4毫秒下降到3毫秒)


点击阅读原文

推荐阅读

KunlunBase架构介绍
KunlunBase技术优势介绍
KunlunBase技术特点介绍
KunlunBase集群基本概念介绍

END

昆仑数据库是一个HTAP NewSQL分布式数据库管理系统,可以满足用户对海量关系数据的存储管理和利用的全方位需求。
应用开发者和DBA的使用昆仑数据库的体验与单机MySQL和单机PostgreSQL几乎完全相同,因为首先昆仑数据库支持PostgreSQL和MySQL双协议,支持标准SQL:2011的 DML 语法和功能以及PostgreSQL和MySQL对标准 SQL的扩展。同时,昆仑数据库集群支持水平弹性扩容,数据自动拆分,分布式事务处理和分布式查询处理,健壮的容错容灾能力,完善直观的监测分析告警能力,集群数据备份和恢复等 常用的DBA 数据管理和操作。所有这些功能无需任何应用系统侧的编码工作,也无需DBA人工介入,不停服不影响业务正常运行。
昆仑数据库具备全面的OLAP 数据分析能力,通过了TPC-H和TPC-DS标准测试集,可以实时分析新的业务数据,帮助用户发掘出数据的价值。昆仑数据库支持公有云和私有云环境的部署,可以与docker,k8s等云基础设施无缝协作,可以轻松搭建云数据库服务。
请访问 http://www.kunlunbase.com/ 获取更多信息并且下载昆仑数据库软件、文档和资料。
KunlunBase项目已开源
【GitHub:】
https://github.com/zettadb
【Gitee:】
https://gitee.com/zettadb

相关文章