「DolphinDB教程」如何正确定位节点宕机的原因

2022-03-28 00:00:00 命令 文件 节点 内存 进程

在使用DolphinDB时,有时客户端会抛出异常信息:Connection refused。此时,linux操作系统上使用ps命令查看,会发现DolphinDB进程不见了。本教程针对出现这种情况的各种原因进行定位分析,并给出相应解决方案。

1.查看节点日志排查原因

DolphinDB每个节点的运行情况会记录在相应的日志文件中。通过分析日志,能有效地掌握DolphinDB运行状况,从中发现和定位一些错误原因。当节点宕机时,非DolphinDB系统运行原因导致节点关闭的情形通常有以下三种:

  • Web集群管理界面上手动关闭节点或调用stopDataNode函数停止节点
  • 操作系统kill命令杀死节点进程
  • license有效期到期关机

通过查看节点在退出前是否打印了日志:MainServer shutdown进行盘查。下面假设宕机节点为datanode1,操作命令示例如下:

less datanode1.log|grep "MainServer shutdown"

相关文章