Greenplum分区表操作汇总

2023-03-20 00:00:00 拆分创建数据分区分区表

1.Greenplum分区表简介
在数据库中，分区表，有时候我们也叫分库分表，底层的逻辑基本都是一样的，就是将一个大表在物理上分布在不同数据库上，数据也拆分开，方便查询时进行分区裁剪以减少查询数据量。GPDB中的分区表功能在开发时，参考了Oracle的分区表语法，在GPDB中，可以直接向父表插入数据，也可以直接向子表插入数据，当直接向父表插入数据时，GPDB会自动检测并将数据定位到子表中。

2.如何创建分区表
GPDB中，支持两种分区表，范围分区（range）和列表分区（list），下面展开介绍一下具体的创建语法。

2.1 范围分区（range）
根据分区字段的值范围区间来分区，每一个分区就是一个子表

create table t_partition_range
(
id int,
name varchar(64),
fdate varchar(64)
) distributed by (id)
partition by range(fdate)
(
partition p1 start ('2022-01-01') inclusive end ('2022-02-01') exclusive,
partition p2 start ('2022-02-01') inclusive end ('2022-03-01') exclusive,
default partition default_p
);
注意上面分区表我定义的日期，前后是有衔接关系的，如果不衔接起来，可能发生缺少分区的情况：

inclusive ：指定包含，例如上面的 start ('2022-01-01') inclusive 则是包含'2022-01-01'
exclusive ：指定不包含，例如上面的 end ('2022-02-01') exclusive 则是不包含'2022-02-01'
2.2 快速范围分区（every）
根据选定的范围，跨越基数，快速分区每一个子表

create table t_partition_every_1
(
id int,
name varchar(64),
fdate date
)
distributed by (id)
partition by range (fdate)
(
partition pn_ start ('2022-01-01'::date) end ('2022-12-31'::date) every ('1 day'::interval),
default partition default_p
);
every：指定跨越基数

2.3 列表分区（list）
根据值的分组，相同的数据归类到一组，也就一个分区中

create table t_partition_list
(
id int,
name varchar(64),
fdate varchar(10)
)
distributed by (id)
partition by list (fdate)
(
partition p1 values ('2022-01-01', '2017-01-02'),
partition p2 values ('2022-01-03'),
default partition default_p
);
3.分区相关操作
3.1 分区拆分
拆分普通分区：

将分区p2在 '2022-02-20' 左右切分成两块
alter table t_partition_range split partition p2 at ('2022-02-20') into (partition p2, partition p3);
切割默认分区：

alter table t_partition_range split default partition start ('2022-03-01') end ('2022-03-31') into (partition p4, default partition);
3.2 新增分区
如果存在默认分区（default partition），则不能新增（add）分区，只能拆分默认分区（split default partition）

alter table t_partition_range_1 add partition p2 start ('2022-02-01') end ('2022-02-31');
3.3 删除分区
alter table t_partition_range_1 DROP partition p2;
3.4 清空分区数据
清空分区表数据，相当于删除分区，然后再新建一个

alter table t_partition_range_1 truncate partition p1;
或根据rank号去删除对应分区，如下：

alter table sales truncate partition for(rank(1));
4.子分区创建与操作
4.1 子分区创建
在GPDB中，分区是可以嵌套增加的，分区下面可以有子分区，如下：

create table t_partition_range_2
(
id int,
name varchar(64),
fdate varchar(10)
)
distributed by (id)
partition by range(fdate)
subpartition by list(name)
subpartition template
(
subpartition c1 values ('abcd'),
subpartition c2 values ('efgh')
)
(
partition p1 start ('2022-01-01') end ('2022-01-31')
)

上面的分区中，p1会再分两个c1/c2子分区

4.2 truncate 子分区
alter table t_partition_range_2 alter partition p1 truncate partition c2;
4.3 drop 子分区
alter table t_partition_range_2 alter partition p1 drop partition c2;

本文来源：https://blog.csdn.net/chrisy521/article/details/122272524

相关文章