linux 运维故障排查思路

一、linux系统故障处理思路

1.重视报错信息,一般情况下此提示基本定位了问题的所在

2.查阅日志文件,系统日志和应用日志

3.分析、定位问题

4.动手解决


二、网络问题处理思路

1.网络硬件问题。网线、网卡、路由器、交换机等是否正常工作。

2.网卡驱动是否正常加载、网卡ip设置是否正确,系统路由是否正确。

3.检查局域网之间的通信是否正常。

4.检查dns是否设定正确。可从/etc/resolv.conf、/etc/host文件来确认。

5.服务是否打开。

6.访问权限是否打开。iptables、selinux

 

三、linux系统无响应

1.系统硬件问题

2.外围硬件问题,网络设备,网络参数方面查找解决。

3.软件问题,系统bug,软件bug,升级内核,修复程序bug,更新驱动等方面解决。

4.系统设置问题,参数设置不当。


四、Linux系统无法启动

常见系统故障,比如突然断电,配置更新,软件升级,内核升级等都有可能造成无法正常启动。常见的情况如:

1.文件系统破坏,一般是linux的根分区文件系统遭到破坏,一般由系统突然断点或者非法关机引起。

2.文件系统配置不当,比如/etc/fstab文件、/etc/inittab文件等配置文件错误或者丢失,一般是执行配置更新时人为导致的。

3.linux内核文件丢失或者崩溃。一般由内核升级错误或者内核存在bug引起。

4.系统引导程序问题。比如grub丢失或者损坏,一般由人为修改错误或者文件系统故障。

5.系统硬件故障。主板、电源、硬盘等出现问题。

作者头像
南宫俊逸创始人

君子好学,自强不息~

上一篇:ubuntu12.04打文本文件出现中文乱码
下一篇:操作系统 / dev/sda6 分区文件系统出现了问题

发表评论