主板启动所带来的困扰
最近遇到一起关于darc 启动失败的案例,跟大家分享一下:
P
北京307 医院, darc 启动失败
A
到场地单独启动darc ,可以正常启动,但将网线与 HP 连接后,用 HP 去唤醒 darc ,可以看到 HP 的 os 启动过程中也“ power up darc ”成功,能听到 darc风扇的声音, 并且看到 darc 主板的版本信息,紧接着 darc 就掉电了。
T
以下是处理过程:
1. 考虑到HP不能唤醒darc,或者唤醒后darc启动会中断,得出darc的启动过程受到了影响,更换darc主板,故障依旧
2. 将处理问题的重心放在了HP和darc的通讯上,做LFC,故障依旧
3. 交换过darc和ig的电源,darc可以启动正常,开始怀疑是darc电源的问题
4. Darc可以正常启动,ig也出现了和darc同样的情况,单独能启动,一旦接通了和darc的网线主板自检都过不了。
5. 最后更换了三个IG的电源和darc的电源,故障解决。
原理分析:
经过反复查询相关资料和整理,找到了一些关于主板启动的资料跟大家分享下,不妥的地方,请大家指教:
1. 电源管理:
我们在按下启动键时,首先启动的应是电源(因为如果没有电源供电,那么主板上所有的配件都是无法工作的)。但是为了保证安全使用,电源部分采取了一系列安全保护措施;因此开关电源从起振到稳定之间会有一段时间的延迟,等待各组电压都稳定下来后,电源各部分会输出一个检测信号,这个信号为高电平时表示该部分电压正常,这些部分包括输入电压和各组输出电压。这些信号总和的结果就是一个POWER GOOD信号(也称为POWER OK或PWR OK信号);如果主板接受不到这个信号,那么时钟芯片会持续向CPU发送复位(RESET)信号(与我们按下RESET键相当),CPU就不会工作,系统就一直处理RESET(复位)循环中,因此主板也就无法启动。
2. 主板启动管理:
DARC&IG的主板在OC 的POWER ON SWITCH 按下后就接通了OC的120V 电源,主板上有standby电源,这里借用郭安然的图片(下左图)进行说明,这个standby电源是由机箱里的ATX电源提供的,也就是我们订的海韵电源的450W或者520W里的+5V电源提供。这个+5V电源给BMC(IPMI所依赖硬件)和相关的支持电路供电。
上右图讲解了主板启动过程:硬件启动,软件启动,操作系统引导。由于DARC是server级别的设备还有SCSI hdd的自检过程。在此过程中涉及:bios设置,POST自检,OS加载,SDDA disk自检关键信息。POST阶段会检测许多硬件信息,大致为:加电-CPU-ROM-BIOS-System Clock-DMA-64KB RAM-IRQ-显卡。如果有致命的故障,主板会自我保护(掉电),如果有非致命故障比如显卡,内存,CPU问题就会有beep声音,就是我们熟知的HP8000和HP8200的几声报警所指示的故障。
3. 主板远程唤醒
DARC在接通了120V电源后主板上就有了+5V >600mA的standby电源给网卡和主板供电,在bios的Power Management Setup中Wake Up On LAN项设置为“Enable”,当hp的os启动到power up darc时就会给DARC特定的启动帧,数据祯的内容是16位网卡的MAC地址,网卡收到数据祯后比对自己的MAC地址,如果正确,网卡就会通过PCI插槽向主板发送一个开机信号,主板启动。

