排查红灯亮Redis 集群连接失败(redis 集群连接不上)

2023-05-15 14:21:20 集群 排查 红灯

架构中整合了基于缓存的Redis集群(cluster)时,可能会出现连接失败的异常情况,这可能是由于Redis集群连接出现异常或出现了网络故障、连接处理出现错误导致的。这时就要尽快做出判断,确定可能的问题类型,用便捷的方式找出该问题的原因。

针对Redis红灯亮的情况,下面介绍一些具体方案可以更有效地确定问题类型。

1.确定Redis集群服务运行状态

一旦发现Redis服务发出异常状态,可以通过查询Redis集群中每个节点服务的运行状态来判断哪些服务出现了问题,可以在终端里运行以下命令。

使用Redis客户端执行命令:

//127.0.0.1:7000为Redis节点IP地址 $redis-cli -h 127.0.0.1 -p 7000 info

节点运行出现问题的状态会显示在info中,可以发现出现问题的节点。

2.排查Redis集群的网络状况

如果发现Redis集群中的节点服务状况正常,但是仍然出现红灯,可能是由于Redis集群节点间网络出现了问题。可以通过担任端检查网络是否畅通,使用 ping 命令检查网络情况:

ping -c 5

例如:

ping -c 5 127.0.0.1

如果发现 ping 通网络情况,可以使用telnet 命令进行端口检查:

telnet 127.0.0.1 6379

如果发现 telnet 检测到端口,有可能是系统服务没有正确启动,此时可以尝试重启Redis服务再查看具体的网络状况。

3.排查Redis集群的节点请求异常

有可能网络状况正常,但是Redis集群连接仍然有问题,此时可以查询Redis节点日志,以确定具体请求信息,排查出现问题的地方,可以使用如下命令查看Redis服务日志:

less /redis.log

综上,当Redis红灯亮的情况出现时,可以通过查看Redis集群服务运行状态、网络状况以及查看Redis节点日志等方式来帮助排查出现的问题。

相关文章