黃明亮
摘要:SKYNET-X空管自動化系統(tǒng)包括多種類型的節(jié)點,每種類型節(jié)點所需的系統(tǒng)環(huán)境,網(wǎng)絡(luò)配置,驅(qū)動等均有所差異,人工安裝操作系統(tǒng)不僅工作量巨大且極易出錯。我們通過EHCT工具可以輕松完成全系統(tǒng)節(jié)點操作系統(tǒng)安裝工作。本文詳細闡述了SKYNET-X自動化設(shè)備通過EHCT工具遠程安裝操作系統(tǒng)的原理和步驟,并結(jié)合系統(tǒng)安裝過程中常見的故障進行分析,為全國SKYNET-X自動化系統(tǒng)用戶提供了較好的THALIX 12操作系統(tǒng)裝機經(jīng)驗參考。
關(guān)鍵詞:SKYNET-X、EHCT、THALIX
正文:
SKYNET-X空管自動化系統(tǒng)采用基于Linux系統(tǒng)開發(fā)而成的THALIX 12操作系統(tǒng)。SKYNET-X空管自動化系統(tǒng)包括多種類型的節(jié)點,每種類型節(jié)點所需的系統(tǒng)環(huán)境,網(wǎng)絡(luò)配置,驅(qū)動等均有所差異,人工安裝操作系統(tǒng)不僅工作量巨大且極易出錯,為了解決批量安裝各節(jié)點操作系統(tǒng)的問題,THALIX廠家提供了一套強大的在線安裝操作系統(tǒng)工具EHCT,通過EHCT工具,可以輕松完成全系統(tǒng)節(jié)點裝機工作。
SKYNET-X自動化系統(tǒng)通常將DBM工作站配置為EHCT服務(wù)器,在該服務(wù)器中部署EHCT工具及相關(guān)腳本、系統(tǒng)RPM包、驅(qū)動等。通過以下幾個步驟完成全系統(tǒng)節(jié)點自動裝機工作:
一、在EHCTServer上開啟DHCP、NFS和TFTP服務(wù)
系統(tǒng)裝機前,需確保以下系統(tǒng)服務(wù)已經(jīng)開啟,開啟這些服務(wù)需要root權(quán)限,并通過指令service dhcpd start 、service nsf start和 service xinetd restart開啟對應(yīng)系統(tǒng)服務(wù)。
(一)DHCP服務(wù)
動態(tài)主機設(shè)置協(xié)議(Dynamic Host Configuration Protocol,DHCP)是一個局域網(wǎng)的網(wǎng)絡(luò)協(xié)議,使用UDP協(xié)議工作,主要有兩個用途:給內(nèi)部網(wǎng)絡(luò)或網(wǎng)絡(luò)服務(wù)供應(yīng)商自動分配IP地址,給用戶或者內(nèi)部網(wǎng)絡(luò)管理員作為對所有計算機作中央管理的手段。
(二)NFS服務(wù)
NFS(Network File System)即網(wǎng)絡(luò)文件系統(tǒng),它允許網(wǎng)絡(luò)中的計算機之間共享資源。在NFS的應(yīng)用中,本地NFS的客戶端應(yīng)用可以透明地讀寫位于遠端NFS服務(wù)器上的文件。
(三)TFTP服務(wù)
TFTP(Trivial File Transfer Protocol,簡單文件傳輸協(xié)議)是TCP/IP協(xié)議族中的一個用來在客戶機與服務(wù)器之間進行簡單文件傳輸?shù)膮f(xié)議,提供不復(fù)雜、開銷不大的文件傳輸服務(wù)。
二、在EHCTServer上進行相關(guān)參數(shù)配置
EHCT工具裝機前需對以下兩個文件夾中的文件參數(shù)進行詳細配置,其中Database_HDMT目錄下的文件定義了系統(tǒng)節(jié)點安裝系統(tǒng)所需的各項配置;machine_types目錄下文件定義了系統(tǒng)各種機器類型。
(一)Database_HDMT目錄下關(guān)鍵配置文件解析
1.Configuration.hcs:定義系統(tǒng)需安裝的節(jié)點名稱。
2.Environment_linux.hcs:定義系統(tǒng)環(huán)境:系統(tǒng)名,版本,用戶和登錄密碼以及用戶對應(yīng)的SHELL目錄。
3.eurocat.hcs:定義系統(tǒng)各節(jié)點和系統(tǒng)分區(qū)的對應(yīng)關(guān)系。
4.graphic.hcs:定義機器類型對應(yīng)視頻圖像顯示。
5.hardware_params.hcs:定義安裝操作系統(tǒng)的硬盤分區(qū),此處路徑需與各節(jié)點機器/dev/disk/by-path/中定義保持一致。
6.hdmt_hosts.txt:存儲具有關(guān)聯(lián)IP地址的主機名的文本文件,所有節(jié)點/etc/hosts文件通過這個文件生成。
7.hdmt_networks.txt:是給計算機各網(wǎng)段起的一個名字,裝機時所有節(jié)點的/etc/networks通過這個文件生成。
8.hosts_linux.hcs:定義節(jié)點名字,編號(編號為該節(jié)點ip地址最后一位),機器類型,ntp服務(wù)配置和分配網(wǎng)段。
9.interface.hcs:定義各節(jié)點網(wǎng)卡配置和網(wǎng)卡工作模式。
10.mac.hcs:節(jié)點S網(wǎng)的網(wǎng)卡mac地址,裝機時EHCT服務(wù)器通過mac地址找到相應(yīng)的節(jié)點,安裝操作系統(tǒng)。
11.machine_types.hcs:定義不同機器類型裝機所需安裝組件
12.master_slave_standby.hcs:定義EHCTserver備份服務(wù)器
13.xxx.ntp:定義系統(tǒng)時鐘同步。
(二)machine_types目錄下關(guān)鍵配置文件解析
1.+_etc_X11_xorg.conf:定義系統(tǒng)顯示輸出,視頻輸出接口以及視頻輸出分辨率等
2.+__lib__kbd__keymaps__lk461.map:定義系統(tǒng)鍵盤映射
3.hardware_params.txt:定義該類型節(jié)點安裝操作系統(tǒng)默認pci編號
完成以上文件配置后,通過指令build_platform.sh,執(zhí)行平臺編譯腳本,結(jié)合以上配置的各項參數(shù),生成kickstart文件,kickstart文件位于/EHCT_data/built/GL/12/kickstart文件夾內(nèi),每個節(jié)點均有對應(yīng)的kickstart文件。kickstart文件為安裝系統(tǒng)指引,文件內(nèi)容包括裝機過程中需要執(zhí)行的腳本,命令以及需要從EHCTserver中獲取的軟件包,通過kickstar可以自動完成節(jié)點系統(tǒng)安裝,網(wǎng)絡(luò)設(shè)置,硬盤分區(qū)等操作。
三、客戶機安裝操作系統(tǒng)
(一)將客戶機板載網(wǎng)卡在bios中禁用,設(shè)置USB啟動為最高優(yōu)先級,接上usb_key,啟動機器進入U盤引導(dǎo)操作系統(tǒng)安裝進程。
(二)客戶機eth0網(wǎng)口接入與EHCT服務(wù)器S網(wǎng)同一網(wǎng)絡(luò)后,客戶機會在網(wǎng)絡(luò)中廣播DHCP Discover報文,報文中包含客戶機eth0的mac地址。EHCT服務(wù)器收到客戶機的報文后,并通過DHCP服務(wù)為節(jié)點分配IP地址。
(三)客戶機通過NFS服務(wù),從EHCT服務(wù)器中下載kickstart文件,自動完成操作系統(tǒng)的遠程安裝和系統(tǒng)配置。
四、常見故障排查
(一)裝機過程提示W(wǎng)ARNING:THE “—no-network” option is deprecated:nvidia-installed will ignore this option。
當(dāng)節(jié)點顯卡型號不一致時,系統(tǒng)裝機過程中容易出現(xiàn)這個告警提示,原因是由于該節(jié)點從EHCT服務(wù)器上獲取的顯卡驅(qū)動與當(dāng)前的顯卡不適配造成,我們首先需要查看安裝節(jié)點的顯卡型號,并從廠家獲取對應(yīng)顯卡THALES系統(tǒng)驅(qū)動包,將對應(yīng)的顯卡驅(qū)動放置在/EHCT_data/misc/EX_PACKAGE_T12/Drivers/目錄下,重啟機器后完成節(jié)點操作系統(tǒng)安裝。
(二)裝機過程提示warning:dracut-initqueue timeout – starting timeout scripts后,自動退出裝機。
1.安裝節(jié)點eth0網(wǎng)卡mac地址與服務(wù)器配置參數(shù)不一致
取下安裝節(jié)點eth0所在網(wǎng)卡,記錄下網(wǎng)卡mac地址。在EHCT服務(wù)器上,進入到/EHCT_data/database/GL/12/Database_HDMT目錄下,編輯mac.hcs文件,將節(jié)點的eth0網(wǎng)卡的mac地址填寫到對應(yīng)的節(jié)點名后,重新執(zhí)行build_platform.sh腳本,以更新kickstart文件,重啟節(jié)點后完成操作系統(tǒng)安裝。
2.安裝節(jié)點eth0網(wǎng)卡所在pci設(shè)備地址與服務(wù)器默認配置不一致
該問題經(jīng)常出現(xiàn)在機器型號與原安裝節(jié)點機器型號不一致時,此時系統(tǒng)引導(dǎo)安裝文件kickstart中pci設(shè)備地址和實際不一致,我們需要通過指令ls–al /dev/disk/by-path 查看并記錄下sda1對應(yīng)地址信息。在EHCT服務(wù)器上打開位于/EHCT_data/built/GL/12/kick start目錄對應(yīng)節(jié)點的kickstart文件,編輯并替換掉kickstart文件里兩處pci地址信息,由于是直接編輯的kickstart文件,所以不需要執(zhí)行腳本編譯,可以直接重啟節(jié)點完成操作系統(tǒng)安裝。
五、結(jié)束語
本文從原理和配置出發(fā),詳細闡述了SKYNET-X自動化設(shè)備通過EHCT工具遠程安裝操作系統(tǒng)的原理和步驟,并結(jié)合操作系統(tǒng)安裝過程中常見的故障進行分析,為全國SKYNET-X自動化系統(tǒng)用戶提供了較好的THALIX 12操作系統(tǒng)裝機經(jīng)驗參考。
參考文獻:
[1]蔣增恒 THALIX操作系統(tǒng)網(wǎng)絡(luò)安裝服務(wù)原理分析,《空中交通》,2016