IT运维中文博客

ITer工作中的积累,学习,分享!!

avatar

【故障处理】crontab任务被清空

背景描述:     某次,同事告知有台服务器上的crontab里面的任务全部都没有了,要我帮忙查一下,幸好crontab内容有备份。于是就先恢复了crontab的任务。 再具体查一下是由人为操作导致的还是其他情况问题排查:     检查一下所有的history记录,发现没有cro

2015-01-28

【故障处理】Web页面访问出错故障总结

故障现象:访问abc.com出现"The page you are looking for is temporarily unavailable。Please try again later."故障排查:经查看日志,发现nginx访问后端wgapi的resin报502错误,就尝试

2015-01-02

IT运维之“想当然”

IT运维旅途中总有很多“想当然的事”,幸运的人会以为自己想得很周全,所有的事情都在自己的考虑当中、准备当中;悲剧的人,还需要加班加点解决故障,还需要招领导的责备和不信任,更重要的是这个季度的绩效或奖金没有了。两者都是在“想当然”地工作,总觉得已经做好了,想全了。结果呢,上面两种情

2013-09-10

【Linux】LinuxPAE内核

         由于线上机经常发生网卡宕掉的情况,所以需要对所有机器在初始化阶段对其进行驱动检查,对于版本较低的进行升级,在升级到某一台机器时,发生了错误。         提示/lib/modules/2.6.18-164.el5PAE/build:No such file

2013-08-29

【Case案例】NTP服务器引起的故障

最近被要求做一个时间同步服务器,将集群内的服务器全都时间同步,因为集群内服务器总会差个几秒钟,影响数据的一致性。这个很简单,我们的使用的是RedHat企业版5.4,一般默认是安装有ntp服务的,只要开启一下,然后做一个计划任务就可以了。操作步骤:1. 首先修改,vi /etc/n

2013-08-13