分享HotDB特色功能——智能逻辑拓扑

2022-05-09 00:00:00 节点 配置 信息 机房 拓扑

智能逻辑拓扑

智能逻辑拓扑不仅提供当前主机房的拓扑图(称之为主拓扑),还提供监控两个机房的组件状态、容灾状态和容灾时延等信息的容灾拓扑。

## (1) 主拓扑与2.5D主拓扑:

1、增加配置库的可视化监控
配置库组件始终显示在主拓扑的左侧。

2.5D主拓扑同样增加配置库组件,功能与主拓扑一致。

与存储节点类似,配置库图标为红色代表存在故障,鼠标移入红色图标可显示故障原因;橙色代表存在复制状态异常,鼠标移入橙色图标可显示复制异常原因。

配置库上显示"复制时延"的监控信息。与存储节点类似,复制时延可以在"设置 —> 拓扑图报警设置"中的配置库模块下设置复制时延的报警阈值。若当前复制时延超过报警阈值,则"复制时延"悬浮信息会标黄并用向上箭头表示。

  1. 历史信息面板增加配置库监控信息

  2. 增加warning级别监控信息:配置库复制状态异常和配置库复制时延超过阈值

  3. 历史信息面板增加机房切换信息
    若发生机房切换,主拓扑的历史信息面板中,info、warning和error三种信息级别下都会出现一条历史信息,报告机房发生切换。
    例如发生中心机房切换至容灾机房时,报告机房切换信息为:2019-11-22 122332 机房发生切换,以下历史信息为中心机房信息。
    机房切换的信息可以作为历史信息的分割线。此例中,在机房切换信息以前的历史信息都为中心机房历史信息,切换信息以后的为容灾机房历史信息。


(2) 容灾拓扑:


若中心机房故障,容灾机房切换为当前主机房,则主拓扑此时显示为容灾机房拓扑图,容灾拓扑的角标仍会显示容灾机房当前error数。

容灾拓扑中从左到右共有六层组件,从左到右1-3层依次表示中心机房的计算节点、数据节点(配置库)和存储节点(配置库);4-6层依次表示容灾机房的存储节点(配置库)、数据节点(配置库)和计算节点

一个机房内部的连线代表含义与主拓扑一致。若容灾机房主配置库或主存储节点服务异常,则容灾机房的对应数据节点下的所有存储节点也置为红色不可用状态且连线为灰色。


W图为容灾机房配置库服务异常

W两个机房之间的连线,即中心机房当前主存储节点和容灾机房当前主存储节点之间的连线表示容灾状态。若容灾机房状态异常,则机房之间连线为灰色

图为容灾机房配置库容灾关系复制异常

中心机房和容灾机房中存在复制时延的存储节点会显示复制时延的监控信息,若复制时延为0,则不显示。复制时延与主拓扑一样,都在"设置 —> 拓扑图报警设置"中的配置库或存储节点模块下设置报警阈值。


配置库和存储节点显示顺序从上到下依次为:配置库始终显示在上方、存储节点故障(红色)、存储节点预警(黄色)、复制时延或容灾时延出现预警的存储节点,正常节点显示下方。

若中心机房故障,容灾机房切换为当前主机房,则容灾拓扑中,中心机房的组件(计算节点、配置库和存储节点)都为红色不可用状态,连线为灰色;容灾机房组件按实际运行状态显示。

此时不再检测中心机房主存储节点到容灾机房主存储节点之间的容灾状态,故不显示容灾状态的连线。

若为多计算节点集群模式下的容灾架构,则界面显示示例图如下,其功能同主备模式类同:(3) 容灾拓扑的历史信息面板:

无论机房是否发生故障,历史信息面板都会监控两个机房的状态信息。若中心机房故障且容灾机房切换为当前主机房,则除了不再监控两个机房之间的容灾关系,仍会检测其他监控信息。

info监控信息
同时为两个机房添加存储节点和数据节点;
仅添加单个机房下的存储节点;
仅删除单个机房下的存储节点;
同时删除两个机房下的存储节点和数据节点。
warning监控信息
单个机房下的存储节点或配置库复制状态异常;
单个机房下的存储节点或配置库复制时延超过阈值;
两个机房存储节点之间或配置库之间的容灾时延超过阈值。
error监控信息
单个机房下存储节点、配置库或计算节点故障;
单个机房下存储节点、配置库或计算节点发生切换;
中心机房后一个可用存储节点异常;
两个机房的存储节点之间或配置库之间复制状态异常;
机房发生切换。

来源 https://www.modb.pro/db/77578

相关文章