GreenPlumn数据库体系结构

2023-03-09 00:00:00 数据 用户 节点 镜像 发到

  GreenPlumn 数据库是基于 PostgreSQL 基础上开发,具有巨大的并行处理能力的数据仓库,MPP( massively parallel processing )是 GreenPlumn的主要特性, MPP是指服务器上拥有两个或者以上的处理节点,并且多个处理节点可以并行,协同的工作来完成一个计算, 这些处理节点拥有独自的内存,操作系统和硬盘, 处理节点可以理解成为一台物理主机。GreenPlumn 会分发 TB 及以上的数据到所有的子节点,并且当在GreenPlumn上执行查询时,所有的子节点能够利用各自的资源来并发地执行这个查询。

        GreenPlumn 实际上是由一组 PostgreSQL 数据库组合而成的强大数据仓库, GreenPlumn 基于PostgreSQL 8.2.14 开发, 并且在多数据情况下和 PostgreSQL 非常相似,以至于用户可以像是在使用PostgreSQL 一样来使用GreenPlumn。

2 GreenPlumn 体系结构
       GreenPlumn可以将数据按一定算法全部分发到所有 segment Host上,因而能够处理大量的数据请求。GreenPlumn的系统结构实际上是多台 PostgreSQL 数据库服务器组成的矩阵,GreenPlumn分两部分, Master 主机和 Segments 主机,master主机是GreenPlumn的入口,客户端,终端用户连接Master来执行 sql。当用户在 Master 节点上执行查询SQL时,MASTER会将 SQL,以及SQL PLAN分发到所有 segments 节点, segments 处理好后,将数据发回 Master 节点, 如下图。

  

相关文章