探索Pacemaker集群管理工具相关问题的小结

使用 Pacemaker 时或多或少会遇到一些问题,现把解决问题时用到的一些方法,收集到的资料整理如下:

命令执行流程

只有知道命令的流程,才可以更好地 debug 问题,例如 pcs cluster start --all 命令是如何执行的,这篇博文 Pacemaker管理工具中 pcs/pcsd 的关系 – 肥叉烧 feichashao.com 从代码层面给了很详细的解释。
大致来说pcs cluster start --all的流程:pcs调用命令直接stop本地节点,并向其他节点发送HTTP request;其他节点的pcsd接收到HTTP request后,调用它本地的pcs执行stop命令。另外,可以在命令后面加 --debug 让命令输出更多信息:pcs cluster start --all --debug

日志

  • 查看日志:tail -f /var/log/messages
  • 查看详细日志:tail -f /var/log/cluster/corosync.log
  • 如果需要更详细的DEBUG级别的信息,将 /etc/corosync/corosync.conf 做如下修改:
logging {
    to_logfile: yes
    logfile: /var/log/cluster/corosync.log
    to_syslog: yes
    debug: on
}

进程相关

  • 查看 Pacemaker 相关进程,拿到 “:ps -elf |grep pacemaker
  • 查看某个进程系统调用情况:strack -p
  • 查看某个进程打开的fd:lsof -p

参考链接

Advertisements

发表评论

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  更改 )

Google+ photo

You are commenting using your Google+ account. Log Out /  更改 )

Twitter picture

You are commenting using your Twitter account. Log Out /  更改 )

Facebook photo

You are commenting using your Facebook account. Log Out /  更改 )

w

Connecting to %s