盘点 Sql 中几个比较实用的小 Tips!

2021-12-28 00:00:00 查询 数据 字段 过滤 分组

来源 | AirPython(ID:AirPython)

作者 | 星安果

1. 前言

工作中,我们经常需要编写 SQL 脚本,对数据库进行增、删、改、查,很少会考虑到 Sql 性能优化

实际上,从性能角度考虑,有很多 Sql 关键字都有它们各自的使用场景;如果使用恰当,能大大地提升后端服务的响应效率

下面以 Mysql 为例,罗列出几个比较实用的小 Tips

2. union、union all、or

union [all] 代表联合查询,即:将多个查询结果合并起来成一个结果并返回

PS:union 联合查询针对每一个查询结果,必须保证列数量、列数据类型及查询顺序一致

语法如下:

# 以两张表的联合查询为例
# table_one:表一
# table_two:表二
# 表一中的查询字段:table_one_field1,table_one_fileld2...
# 表二种的查询字段:table_two_field1,table_two_field2...
# 注意:表一、表二查询字段数目、字段类型、字段顺序应该保持一致
select table_one_field1,table_one_fileld2...
from table_one
union [all]
select table_two_field1,table_two_field2...
from table_two;

其中,union、union all、or 三者的区别如下:

  • union

    表链接后会利用字段的顺序进行排序,以此筛选掉重复的数据行,后再返回结果

    因此,当数据量很大时效率很低

  • union all

    相比 union,union all 在表链接时不会删除重复的数据行,直接返回表联合后的结果

    因此,union all 执行效率要高很多,在不需要去重和排序时,更推荐使用 union all

  • or

    or 用于 SQL  where 子句中,SQL 脚本可读性更高,但是它会引起全表扫描,根本不走索引查询

    所以通常情况下,union [all] 查询会利用索引进行查询,执行效率要高于 or;但是当 or 条件中查询列相同,or 的执行效率要高于 union

3. group by + having、where

group by 分组查询,根据一个或多个列对结果集进行分组,一般配合聚合函数使用

语法如下:

# 查询字段:多个查询字段
select 查询字段...,聚合函数...
from table_one where 条件语句 group by 分组字段...having 分组条件;

# 比如
select red_num1,count(red_num1)
from dlt where create_at>='2021-11-01' group by red_num1;

其中,having 和 where 使用上有下面区别:

  • where

    在 group by 分组前执行,将查询结果按照条件过滤数据

    需要注意的是,where 无法与聚合函数一起使用

  • having

    只能配合 group by 使用,在分组之后执行,用于过滤满足条件的组

    需要注意的是,分组是一个耗时的操作,建议在分组前使用 where 对数据进行一次过滤,然后再进行分组

比如,where 搭配 having 一起使用

# 查询表dlt
# 首先,使用where通过时间过滤数据
# 然后,使用字段red_num1+group by对数据进行分组
# 后,使用having对分组后的数据再进行一次过滤
select red_num1,count(red_num1)
from dlt where create_at>='2021-10-01' group by red_num1 having count(red_num1)>=2;

4. exists、in

exists 用于 where 子句中,一般用于判断子查询中是否会返回数据,如果返回的数据不为空,则为 True,否则为 False

PS:exists 也可以搭配 not 使用,查询出不满足子查询语句的数据

语法如下:

-- exists使用
select *
from 表一 where exists(select * from 表二 where 条件判断语句);

-- not exists使用
select *
from 表一 where not exists(select * from 表二 where 条件判断语句);

in 同样用于 where 子句中,筛选出某个表字段存在于多个值中的所有数据

关键字 in 常见的 2 种使用方式如下:

-- in 使用
-- 方式一
select *
from 表名 where 字段 in(过滤字段1,过滤字段2,过滤字段3...);

-- 方式二
select *
from  表名1
where  字段1 in (select 字段2 from 表名2 where condition)

由于 SQL 做子查询优方案是小表驱动大表,对于 in 来说是子查询表驱动外表,当子查询表数据少于主表数据时推荐使用

而 exists 是外表驱动子查询表,因此当外表数据少于子查询表时更推荐使用

来源:https://mp.weixin.qq.com/s/674B4LXbMD394vOvuzZwYw


相关文章