当前位置:首页 > 嵌入式 > 嵌入式教程
[导读]Linux系统死机的软硬件问题分析

系统出现死机,一般分为两种情况:一是硬件问题;二是软件问题。

  一、硬件问题

  可以考虑分析以下几点:

  1、不要超频CPU,如果已经超频的先回复到原来的频率

  虽然平时运行没有问题,但可能在高负载的使用中就会出现不可预料的故障了。特别是Linux系统在某些应用上,是可以把硬件的性能发挥到极限的,但这样的硬件运行Windows可能是没有问题的。

  2、确认电源供电充足

  必须确保在高负载的状态下,电源可以满足负载。

  3、使用memtest86检查内存状态

  4、恢复BIOS到默认状态

  对于服务器,可以使用自带的监测工具进行测试,也是一个不错的排错方法。

  二、软件问题

  如果已经基本排除硬件问题,那我们就必须考虑从软件上去获得死机状态的系统信息了。

  1、运气足够好的话,系统死机不一定是完全死掉(此时键盘可能还能响应),那我们就可以使用Sysrq大法。

  前提是我们必须先打开sysrq功能:

  #echo "1" > /proc/sys/kernel/sysrq

  #setterm-blank

  这样,当系统出现问题的时候,我们可以使用:

  引用

  Alt+Sysrq-T 获得进程系统堆栈信息

  Alt+Sysrq-M 获得内存分配信息

  Alt+Sysrq-W 获得当前寄存器信息

  更多的热键可以参考系统上的/usr/src/linux/Documentaion/sysrq.txt

  其中,setterm -blank可以关闭字符下定时黑屏保护,方便记录屏幕信息。

  2、为了让屏幕显示更多的内核调试信息,可以修改控制台的显示模式为80x25,在/boot/grub/menu.lst中对应的kernel一行最后,增加vga=0x305,如:

  引用

  kernel /boot/vmlinuz-2.4.21-9.30AXsmp ro root="/LABEL"=/1 vga="0x305"

  3、万一键盘也不幸死掉了,那我们只能采用串口方式,把系统信息发送到另一台系统上,方法:

  修改/boot/grub/menu.lst文件,在kernel一行最后增加核心参数"console=ttyS0 console="tty1"",如:

  引用

  kernel /boot/grub/vmlinuz-2.4.21-9.30AXsmp ro root="/LABEL"=/1 console="ttyS0" console="tty1"

  然后,修改/etc/sysconfig/syslog,加入klogd选项"-c 7",如:[!--empirenews.page--]

  引用

  KLOGD_OPTIONS="-x -c 7"

  重启服务器;进行测试:

  1)使用串口直连线连接客户机和服务器,在客户机上运行:

  cat /dev/ttyS0

  服务器上运行:

  echo hi > /dev/ttyS0

  如果客户机有"hi"输出即可。

  2)服务器上运行:

  echo w > /proc/sysrq-trigger

  看看客户机上是否有相应的内核信息输出

  3)服务器上运行:

  modprobe loop

  看看客户机上是否有相应的内核信息输出

  如果测试都通过的话,那么在客户机上运行:

  cat /dev/ttyS0 | tee /tmp/result

  当死机出现的时候,我们就可以从客户机上看到需要的内核信息了(查看/tmp/result)。

  三、总结

  一般造成Linux系统死机的原因有:

  系统硬件问题(SCSI卡,主板,RAID卡,HBA卡,网卡,硬盘等)

  外围硬件问题(网络等)

  软件问题(系统、应用软件)

  驱动bug(找新的驱动)

  核心系统bug(到LKML看看,或更换核心再试)

  系统设置(恢复到缺省状态,关闭防火墙等)

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

港交所拟修改主板上市规则,以便利尚未有盈利或业绩支持的先进技术企业融资。港交所刊发有关特专科技公司上市制度的咨询文件,提议对《上市规则》进行修订,建议设立新渠道,以让特专科技公司于联交所主板上市,并就此征询市场意见。新规...

关键字: 信息技术 新能源 硬件

流水账式的推文比较乱,不够系统,也形成不了好的宣传效应,所以我整理了一个硬件基础知识框架,后面推文会围绕这个展开,中间也会穿插一些项目和实际应用例程。

关键字: 硬件 项目 例程

Linux内核是从V2.6开始引入设备树的概念,其起源于OF:OpenFirmware, 用于描述一个硬件平台的硬件资源信息,这些信息包括:CPU的数量和类别、内存基地址和大小、总线和桥、外设连接、中断控制器和中断使用情...

关键字: Linux内核 硬件 CPU

珀金埃尔默日前推出Cellaca PLX图像式细胞分析系统,这是业界第一款能让研究人员在单个自动化工作流中实现对细胞样本多个关键质量属性进行分析和评估的台式平台,包括对细胞性质、质量和数量的分析评估。拥有尖端技术的Cel...

关键字: AC EXCEL 硬件 自动化

上周说开始盘三极管,周末我专门花时间去研究了小伙伴的留言,又去翻了模电的书,目的是寻找好的切入点。去翻课本,发现课本上总是会从三极管的发展历程讲起,谈谈三极管的物理构成,分析内部载流子的传输过程,电流的分配关系等等。这些...

关键字: 三极管 内部载流子 硬件

据相关消息报道,爱立信近日表示,自从俄乌冲突发生以来,爱立信方面只向俄罗斯提供软件和技术支持,已经停止了向移动运营商出售任何电信硬件设备的渠道和业务。

关键字: 爱立信 俄罗斯 硬件

有人问我射频怎么学?能不能速成?老实说我这水平也只是刚入门,5G/4G/V2X/毫米波雷达/相控阵等等我都没有设计过,仅仅是对PA,LNA,混频器,滤波器,单芯片收发(零中频/低中频),超外差架构等等有一些对应的项目设计...

关键字: 射频 硬件

近日,随着万众瞩目的苹果秋季发布会告一段落,几款新产品也进入大众视野。这一届新产品虽在软件上令人耳目一新,但硬件上却无太大更新。不过在硬件的布置方面,苹果仍有值得一提的动作,比如被嵌入到AirPods Pro耳机盒中的U...

关键字: 苹果 硬件 U1芯片

深圳2022年9月14日 /美通社/ -- 近日,忆联旗下企业级固态硬盘UH811a/UH831a系列经过微软中国技术中心的各项严格测试,已正式通过了微软WHQL认证。标志着忆联UH811a/UH831a系列与Windo...

关键字: 微软 硬件 SSD 读写

9月8日凌晨消息,苹果公司召开秋季新品发布会,推出iPhone 14系列、Apple Watch Pro 2代,以及Apple Watch Series 8,新一代的“苹果三件套”诞生。

关键字: 硬件 芯片 苹果

嵌入式教程

6897 篇文章

关注

发布文章

编辑精选

技术子站

关闭