引言:筆者單位曾對一臺華為服務(wù)器進行硬盤擴容。在升級過程中,遇到兩個故障,一是硬盤在插入服務(wù)器插槽,啟動服務(wù)器后,服務(wù)器掃描未發(fā)現(xiàn)任何硬盤。二是在故障排除后,在RAID配置界面顯示硬盤容量不正確。本文介紹故障的排除過程
筆者單位曾對一臺華為FusionServer RH2285服務(wù)器進行硬盤擴容。服務(wù)器原來配置了5塊容量為146GB的15000轉(zhuǎn)SATA硬盤,使用的是LSI1064E REID卡,并使用RAID5技術(shù)將10塊硬盤做成磁盤陣列。后采購了5塊4TB硬盤對原有硬盤進行擴容升級。
在升級過程中遇到了2個故障:一是硬盤在插入服務(wù)器插槽,啟動服務(wù)器后,服務(wù)器掃描未發(fā)現(xiàn)任何硬盤。二是在故障一排除后,在RAID配置界面顯示硬盤容量不正確,每塊硬盤少了2TB的硬盤空間。
故障一:將硬盤插入服容量。務(wù)器硬盤插槽,啟動服務(wù)器,服務(wù)器對硬盤進行初始化掃描操作,但當掃描結(jié)束后,所有的硬盤信號燈均顯示紅色(非正常),同時系統(tǒng)提示檢測不到物理硬盤。
重啟服務(wù)器后,進入RAID配置界面后,仍然未發(fā)現(xiàn)任何一塊硬盤,也就是說5塊新購硬盤都沒有被系統(tǒng)識別到。
故障二:在故障一被排除后,進入RAID配置界面,所有的硬盤卻只能識別到2TB硬盤空間,剩余2TB的硬盤空間卻無法識別到,而在服務(wù)器開機自檢的時候,卻可以識別到完整的4TB
首先對連接服務(wù)器和RAID卡的數(shù)據(jù)線進行了檢查,然后將服務(wù)器PCI插槽中的RAID卡的線纜拔了下來連接到服務(wù)器主板的SATA接口,另一端直接連接新增的4TB硬盤。重啟服務(wù)器,發(fā)現(xiàn)服務(wù)器可以正常識別硬盤,證明數(shù)據(jù)線正常。
接下來是檢查RAID卡,擔心在置換的時候因靜電原因造成RAID卡損壞。采用硬件置換的方法對該服務(wù)器的RAID卡進行了置換,來檢測RAID卡是否發(fā)生損壞。啟動服務(wù)器后,服務(wù)器系統(tǒng)在檢測掃描硬盤時,仍未發(fā)現(xiàn)硬盤,換回原來的RAID卡,連接原有146GB的服務(wù)器硬盤,可以正常識別所有硬盤。這樣基本可以確定,RAID卡沒有物理故障。
第三,對新購硬盤進行了檢查。對新購的物理硬盤,從主板上直接連接硬盤,逐一進行測試,發(fā)現(xiàn)其中一塊物理硬盤無法識別,其余硬盤識別均正常。將可以正常識別的物理硬盤插入服務(wù)器插槽,然后恢復原有連接,啟動服務(wù)器,發(fā)現(xiàn)所有的硬盤均可以正常識別??磥硎且驗槠渲幸粔K硬盤損壞,造成所有的硬盤都無法正常識別。
服務(wù)器只能識別2TB的硬盤空間,而不能識別4TB硬盤空間,我們采取了以下一些措施。
將原來的146GB硬盤更換回去后,所有的硬盤均可以正常識別,硬盤空間也均正常。經(jīng)分析,認為可能是服務(wù)器對硬盤大小支持或RAID卡支持硬盤大小的問題,后進入華為官網(wǎng),發(fā)現(xiàn)該服務(wù)器支持SATA硬盤,支持最大硬盤容量為24TB,支持 RAID 0,1,10,5,6,50 的數(shù)據(jù)保護技術(shù),而新購硬盤總共大小為4×4=16TB,不存在超過服務(wù)器支持容量的現(xiàn)象。
圖1 READ(12)協(xié)議報文
接下來了解了一下該型號RAID卡的具體信息,發(fā)現(xiàn)LSI1064E型號的RAID卡只能識別2TB的硬盤,無法識別超過2TB的硬盤,看來只能更換RAID卡了。
后購買了一塊LSI2308的RAID卡,所有的硬盤都可以正常識別,硬盤空間可以正常識別為4TB,一切恢復正常。
在安裝新的物理硬盤時,如果有一塊物理硬盤損壞,則有可能造成RAID卡無法正常識別所有的物理硬盤,這區(qū)別于服務(wù)器在正常使用中物理硬盤損壞的現(xiàn)象。服務(wù)器在正常使用過程中物理硬盤損壞時,其他正常工作的硬盤是可以正常識別和使用的。
對于服務(wù)器無法正常識別硬盤容量,一般都是受主板、RAID卡和OS軟件所分別支持的尋址模式三個方面決定的。一般可以先查詢服務(wù)器和RAID卡的支持信息來查看是哪個原因造成的。
對于RAID卡而言,對于硬盤空間的尋址方式?jīng)Q定了其可以識別和支持的磁盤容量。而RAID卡的尋址長度是基于SBC協(xié)議的READ字段來定義和決定的。對LSI1064E RAID卡而言,支持的協(xié)議為 READ(12),尋址長度為 12位(如圖 1)。其最大的尋址空間為4byte,即2^32×512B=2TB,支 持 最大的單個硬盤空間為2TB。故只能識別到2TB的容量,多余的容量不能被識別。正確識別的容量可以正常使用,建議使用單盤容量不超過2TB的硬盤。
而新購的LSI2308 RAID卡,支持的協(xié)議是READ(16),支持的尋址大小為8 byte,故支持的單元盤容量大小為2^64×512B=32TB。