探索Pacemaker集群管理工具相关问题的小结

使用 Pacemaker 时或多或少会遇到一些问题,现把解决问题时用到的一些方法,收集到的资料整理如下:

命令执行流程

只有知道命令的流程,才可以更好地 debug 问题,例如 pcs cluster start --all 命令是如何执行的,这篇博文 Pacemaker管理工具中 pcs/pcsd 的关系 – 肥叉烧 feichashao.com 从代码层面给了很详细的解释。
大致来说pcs cluster start --all的流程:pcs调用命令直接stop本地节点,并向其他节点发送HTTP request;其他节点的pcsd接收到HTTP request后,调用它本地的pcs执行stop命令。另外,可以在命令后面加 --debug 让命令输出更多信息:pcs cluster start --all --debug

日志

  • 查看日志:tail -f /var/log/messages
  • 查看详细日志:tail -f /var/log/cluster/corosync.log
  • 如果需要更详细的DEBUG级别的信息,将 /etc/corosync/corosync.conf 做如下修改:

[code lang=text]
logging {
to_logfile: yes
logfile: /var/log/cluster/corosync.log
to_syslog: yes
debug: on
}
[/code]

进程相关

  • 查看 Pacemaker 相关进程,拿到 ps -elf |grep pacemaker
  • 查看某个进程系统调用情况:strack -p
  • 查看某个进程打开的fd:lsof -p

参考链接

如无特殊说明,文章均为本站原创,转载请注明出处
源自: 王明军的博客
本文链接地址: 探索Pacemaker集群管理工具相关问题的小结
广告

发表评论

This site uses Akismet to reduce spam. Learn how your comment data is processed.