Greeplum 系列(一) Greenplum 架构分析

阿里 阅读:194 2020-02-20 19:10:23 评论:0

Greeplum 系列(一) Greenplum 架构

Greenplum 可进行海量并行处理 (Massively Parallel Processing)

一、Greenplum 体系架构

1-1 Greenplum体系架构

Greenplum 由三部分组成:Master Host、Segment、Interconnect。

1.1 Master Host

  1. 访问系统的入口
  2. 数据库侦听进程 (postgres)
  3. 处理所有用户连接
  4. 建立查询计划
  5. 协调工作处理过程
  6. 管理工具
  7. 系统目录表和元数据(数据字典)
  8. 不存放任何用户数据

1.2 Segment

  1. 每段(Segment)存放一部分用户数据
  2. 一个系统可以有多段
  3. 用户不能直接存取访问
  4. 所有对段的访问都经过 Master
  5. 数据库监听进程(postgres)监听来自 Master 的连接

1.3 Interconnect

  1. Greenplum 数据库之间的连接层
  2. 进程间协调和管理
  3. 基于千兆以太网架构
  4. 属于系统内部私网配置
  5. 支持两种协议:TCP or UDP

Greenplum网络配置示例

图1-2 Greenplum网络配置示例

说明:

(1) Master Host 和 StandBy Master 用广域网连接起来,满足用户网络提交的需求(对外)。

(2) 每个 Segment 主机上可以有多个 Segment 实例,每个 Segment 对应一个 CPU/网上,主要是避免资源争夺。本实例中有 4 个网口连接到 4 个虚拟的局域网,每个虚拟的局域网对应一个网段 172.16.0、172.16.1、172.16.2。

(3) ILOM 这个网口主要是控制台的控制,提供给管理员来访问每一台主机的接口。

二、Greenplum 高可用性体系架构

图1-3 Greenplum高可用性体系架构

  1. Master Host 实时同步到 StandBy Master 节点上。

2.1 Master/Standby 镜像保护

图1-4 Master-Standby镜像保护

  • Standby 节点用于当 Master 节点损坏时提供 Master 服务
  • Standby 实时与 Master 节点的 Catalog 和事务日志保持同步

2.2 数据冗余-Segment 镜像保护

图1-5 数据冗余-Segment镜像保护

  • 每个 Segment 的数据冗余存放在另一个 Segment 上,数据实时同步
  • 当 Primary Segment 失败时,Mirror Segment 将自动提供服务
  • Primary Segment 恢复正常后,使用 gprecoverseg –F 同步数据。

Segment 主机硬件配置示例

图1-6 Segment主机硬件配置示例

2.3 网络冗余

图1-7 网络冗余


每天用心记录一点点。内容也许不重要,但习惯很重要!

标签:大数据
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

发表评论
搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容