■ 山東 張艷霞 樊培彩
編者按:筆者在處理服務(wù)器內(nèi)存故障中遇到服務(wù)器響應(yīng)異常慢的現(xiàn)象,經(jīng)分析后發(fā)現(xiàn)是由于服務(wù)器內(nèi)存插法順序錯誤導(dǎo)致的。
筆者有一臺2013 年購置的HP DL388eGEN8服務(wù)器,為雙CPU配置。近期該服務(wù)器出現(xiàn)內(nèi)存報警,提示內(nèi)存故障。
該機(jī)器上本來有4 條4 GB 內(nèi)存,筆者因不確定哪一條內(nèi)存故障,故順手拔掉了其中兩條內(nèi)存,機(jī)器能識別剩余8 GB 內(nèi)存,也能正常啟動。而啟動后,內(nèi)存利用率不高,CPU 利用率卻居高不下,基本上是大于80%,經(jīng)常是100%。機(jī)器響應(yīng)異常緩慢,system 進(jìn)程過高占用CPU,大于50%。運行Ping 命令時明顯響應(yīng)慢。該設(shè)備作為Ping 的目標(biāo)機(jī),響應(yīng)異常慢。筆者在處理這個問題時,頗費了一番周折。
開始筆者懷疑機(jī)器中病毒了,通過升級殺毒軟件,系統(tǒng)打補(bǔ)丁,但故障依舊,并未發(fā)現(xiàn)中病毒的跡象。無意中筆者看到了服務(wù)器內(nèi)存插槽圖,終于明白了服務(wù)器異常慢的根本原因。內(nèi)存插槽圖如圖1 所示。
Intel xeon 5500 系列處理器集成3 個內(nèi)存控制器,內(nèi)存子系統(tǒng)劃分為通道channels,每個控制器控制一個通道(channel),組成3通道內(nèi)存,每個處理器支持3個channel,每個channel 支持2 個內(nèi)存。對內(nèi)存的插法也有很多種情況,根據(jù)不同的插法可以達(dá)到性能和安全不同的效果。在多處理器配置的機(jī)型中,為達(dá)到最大化性能的目的,應(yīng)盡可能均勻地分配所有處理器對應(yīng)的內(nèi)存總?cè)萘?。?nèi)存條的配置:插法按照“ABCDEF”配置。
圖1 內(nèi)存插槽圖
筆者拔掉的2 條內(nèi)存,正好位于P2 這個CPU 旁邊,導(dǎo)致P2 邊上沒有內(nèi)存。
這才是造成服務(wù)器異常緩慢的根本原因。
因此,筆者通過拔出故障內(nèi)存,在P2 處理器旁邊A插槽插入正常內(nèi)存,服務(wù)器內(nèi)存從4 條4 GB 減為3 條4 GB,最終恢復(fù)正常。