Posts tagged ‘hang’

mount点fail以后影响rpm和check_raid

今天碰到一个比较奇怪的问题。我们的一台机器,突然跑rpm和check_raid会hang死。
另外一个同事跟进以后发现把这个系统中一个已经失效mount点强制umount掉以后就能够恢复。
感觉这个是两个问题啊。

库哥通过strace最终找到了具体的原因。
通过strace可以看到rpm运行的时候会首先检查整个文件系统的挂载点。
由于该挂载点的提供服务者已经下线,所以对应的节点访问会hang住。
也就导致了rpm无法继续运行下去。
目前还不能确认这种问题的影响面有多少。

另外一位大牛旺旺介绍了文件系统IO延时的文章。先记录下来,细细品味
Brendan Gregg 写的关于文件系统IO延时的系列文章,,虽然是基于Solaris系统做的,,对于Linux以及相关的系统也比较有参考意义,,有兴趣的同学可以了解下.
http://dtrace.org/blogs/brendan/2011/05/11/file-system-latency-part-1/
http://dtrace.org/blogs/brendan/2011/05/13/file-system-latency-part-2/
http://dtrace.org/blogs/brendan/2011/05/18/file-system-latency-part-3/
http://dtrace.org/blogs/brendan/2011/05/24/file-system-latency-part-4/

may your success