#### 故障现象:
1. 异常重启
2. 运行慢(CPU使用率高)
#### 检查点:
1. 节能模式(开启节能模式可能会导致CPU利用率飙高)
2. 刷新BIOS版本为2.5.4
3. 刷新IDRAC版本为2.30.30.30
#### 分析:
1. message里发现有很多的进程的状态都在不可中断状态。
#### 日志信息:
Jun 22 19:04:11 djt_40_86 kernel: INFO: task jbd2/dm-3-8:1006 blocked for more than 120 seconds.
Jun 22 19:04:11 djt_40_86 kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Jun 22 19:04:11 djt_40_86 kernel: jbd2/dm-3-8 D ffff88101f2f3680 0 1006 2 0x00000000
Jun 22 19:04:11 djt_40_86 kernel: ffff88100c657bb8 0000000000000046 ffff88100c657fd8 0000000000013680
Jun 22 19:04:11 djt_40_86 kernel: ffff88100c657fd8 0000000000013680 ffff88080e96c440 ffff88101f2f3f48
Jun 22 19:04:11 djt_40_86 kernel: ffff88103ffcba78 0000000000000002 ffffffff811f89e0 ffff88100c657c30
Jun 22 19:04:11 djt_40_86 kernel: Call Trace:
Jun 22 19:04:11 djt_40_86 kernel: [<ffffffff811f89e0>] ? generic_block_bmap+0x70/0x70
Jun 22 19:04:11 djt_40_86 kernel: [<ffffffff8160a13d>] io_schedule+0x9d/0x140
Jun 22 19:04:11 djt_40_86 kernel: [<ffffffff811f89ee>] sleep_on_buffer+0xe/0x20
Jun 22 19:04:11 djt_40_86 kernel: [<ffffffff81607f00>] __wait_on_bit+0x60/0x90
- 说明OS状态不是很稳定,有进程在运行。
- OS 里有一些zombie进行在运行。这些进程也会影响机器性能。
###
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
odin 4690 0.0 0.0 0 0 ? Z 14:09 0:00 [cat] <defunct>
odin 4692 0.0 0.0 0 0 ? Z 14:09 0:00 [cat] <defunct>
odin 34273 0.0 0.0 0 0 ? Z 16:07 0:00 [cat] <defunct>
- sosreport 和 Dset 里没有发现硬件方面的报错。性能慢问题有可能是OS自身进程导致。
#### 总结:
综合上面几点,建议客户可以重新安装此系统,在一个干净的环境下查看CPU是否还会load过大
文章最后更新时间:
2017年05月18日 18:44:32