「DolphinDB教程」如何正确定位节点宕机的原因
在使用DolphinDB时,有时客户端会抛出异常信息:Connection refused。此时,linux操作系统上使用ps命令查看,会发现DolphinDB进程不见了。本教程针对出现这种情况的各种原因进行定位分析,并给出相应解决方案。
1.查看节点日志排查原因
DolphinDB每个节点的运行情况会记录在相应的日志文件中。通过分析日志,能有效地掌握DolphinDB运行状况,从中发现和定位一些错误原因。当节点宕机时,非DolphinDB系统运行原因导致节点关闭的情形通常有以下三种:
- Web集群管理界面上手动关闭节点或调用
stopDataNode
函数停止节点 - 操作系统kill命令杀死节点进程
- license有效期到期关机
通过查看节点在退出前是否打印了日志:MainServer shutdown进行盘查。下面假设宕机节点为datanode1
,操作命令示例如下:
less datanode1.log|grep "MainServer shutdown"
相关文章