朱明亮,顧秀秀,史洪瑋
(1.宿遷學(xué)院 信息工程學(xué)院,江蘇 宿遷 223800;2.宿遷市AI+智慧醫(yī)療重點(diǎn)實(shí)驗(yàn)室,江蘇 宿遷 223800)
隨著5G 技術(shù)標(biāo)準(zhǔn)的不斷完善,各類5G 商用場景也日趨多樣化。作為解決居民醫(yī)療衛(wèi)生服務(wù)需求的新方法,5G智慧醫(yī)療自誕生以來就備受矚目,衍生出了涵蓋院前輔助、院中診療、院后護(hù)理等多個(gè)具體環(huán)節(jié)的智慧醫(yī)療分領(lǐng)域[1]。由于兼具5G 網(wǎng)絡(luò)的諸多優(yōu)點(diǎn),5G 智慧醫(yī)療不管是在健康信息監(jiān)測,還是在遠(yuǎn)程診療、手術(shù)示教等方面都具有較大的發(fā)展空間[2]。
同時(shí)也應(yīng)看到,由于5G 智慧醫(yī)療的應(yīng)用尚屬于探索發(fā)展期,相關(guān)場景在網(wǎng)絡(luò)承載運(yùn)營方面的設(shè)定仍過于簡易和理想化,隨著5G 智慧醫(yī)療融合應(yīng)用的不斷推進(jìn),承載網(wǎng)絡(luò)的安全性和有效性日益突出,網(wǎng)絡(luò)時(shí)延和帶寬保證能力亟待提升[3]。開展面向5G 智慧醫(yī)療的承載網(wǎng)告警識(shí)別研究,對提升其場景化運(yùn)營能力,促進(jìn)其長效發(fā)展至關(guān)重要[4]。
網(wǎng)絡(luò)應(yīng)用,承載先行。作為搭建通信網(wǎng)絡(luò)和運(yùn)行各類業(yè)務(wù)的基礎(chǔ),選擇恰當(dāng)?shù)某休d方式顯得尤為重要。面對5G 背景下各類新型通信場景的承載要求,中國移動(dòng)選擇切片分組網(wǎng)(Slicing Packet Network, SPN)作為其5G 時(shí)代的主要承載方式。研究表明,SPN 可有效滿足5G 智慧醫(yī)療在帶寬、連接、切片、時(shí)延、同步以及智能調(diào)度等方面的個(gè)性化要求,可按需進(jìn)行虛擬專網(wǎng)搭建,同時(shí)具備較強(qiáng)的演化升級能力,滿足未來網(wǎng)絡(luò)的發(fā)展要求[5]。
5G 行業(yè)專網(wǎng)組網(wǎng)架構(gòu)主要涉及行業(yè)終端、5G 覆蓋、端到端網(wǎng)絡(luò)切片、行業(yè)網(wǎng)關(guān)以及邊緣計(jì)算平臺(tái)等[6],則基于SPN 的5G 智慧醫(yī)療切片 專網(wǎng)同樣包含上述四個(gè)部分,具體構(gòu)成如圖1 所示。
圖1 基于SPN 的5G 智慧醫(yī)療切片專網(wǎng)構(gòu)成
其中行業(yè)終端主要指5G 智慧醫(yī)療場景下的各類具備聯(lián)網(wǎng)功能的應(yīng)用設(shè)備、穿戴設(shè)備、測試設(shè)備、醫(yī)療設(shè)備等[7];5G 覆蓋主要指針對具體部署場景,提供符合帶寬、時(shí)延、安全、連接數(shù)量等要求的5G 室內(nèi)及室外網(wǎng)絡(luò)覆蓋[8];端到端網(wǎng)絡(luò)切片主要由SPN 網(wǎng)絡(luò)完成,可根據(jù)業(yè)務(wù)等級和重要性進(jìn)行差異化的切片管理;行業(yè)網(wǎng)關(guān)以及邊緣計(jì)算平臺(tái)為具體的醫(yī)療應(yīng)用提供專業(yè)化的解決方案和數(shù)據(jù)處理,實(shí)現(xiàn)智慧醫(yī)療各類功能的有效閉環(huán)[9]。
選擇和建設(shè)高效的承載網(wǎng)絡(luò),有利于實(shí)現(xiàn)對現(xiàn)有網(wǎng)絡(luò)資源的統(tǒng)一規(guī)劃、調(diào)配,提升網(wǎng)絡(luò)資源利用率,確保網(wǎng)絡(luò)的可靠、穩(wěn)定運(yùn)行[10]。
選用基于SPN 技術(shù)的5G 智慧醫(yī)療切片專網(wǎng),可根據(jù)具體需求靈活劃分虛擬專網(wǎng)業(yè)務(wù)切片,實(shí)現(xiàn)各類醫(yī)療數(shù)據(jù)的存儲(chǔ)和傳輸安全,滿足不同醫(yī)療應(yīng)用場景下的低時(shí)延、高帶寬網(wǎng)絡(luò)需求[11]。為開展后續(xù)驗(yàn)證,搭建了端到端的具備3 條靈活以太網(wǎng)(Flexible Ethernet, FlexE)通道的SPN 智慧醫(yī)療切片專網(wǎng)業(yè)務(wù)模型,具體切片劃分示意如圖2 所示。
圖2 SPN 智慧醫(yī)療切片專網(wǎng)模型
由于5G 智慧醫(yī)療的業(yè)務(wù)場景復(fù)雜多樣,且很多場景關(guān)乎患者的生命健康,時(shí)延及帶寬敏感,網(wǎng)絡(luò)安全要求較為特殊,因此需要一套響應(yīng)及時(shí)、判斷精準(zhǔn)的智能告警處置機(jī)制,以實(shí)現(xiàn)網(wǎng)絡(luò)運(yùn)維提質(zhì)增效,保障各業(yè)務(wù)的安全運(yùn)行。
針對SPN 切片網(wǎng)絡(luò)告警的構(gòu)成及現(xiàn)狀,采用告警三級智能處置模型,進(jìn)行快速精準(zhǔn)的網(wǎng)絡(luò)運(yùn)維,相應(yīng)的模型架構(gòu)如圖3 所示。
圖3 SPN 智慧醫(yī)療切片專網(wǎng)智能告警處置模型架構(gòu)
告警是網(wǎng)絡(luò)故障的外在呈現(xiàn),具有傳遞性、多方性、重復(fù)性等特點(diǎn)[12]。一般情況下,網(wǎng)絡(luò)設(shè)備發(fā)生故障時(shí),其上、下聯(lián)同網(wǎng)設(shè)備因?yàn)闊o法獲取組網(wǎng)端口的信息同樣會(huì)產(chǎn)生告警,由此造成短時(shí)間內(nèi)的大量告警積壓,其中既有主要的根因告警,也有其衍生告警,既有本專業(yè)的直接告警,也有其他專業(yè)的間接告警[13]。面對海量的突發(fā)告警,快速精準(zhǔn)的進(jìn)行告警識(shí)別是智能告警處置模型的第一步[14]。
告警處置模型依據(jù)不同告警產(chǎn)生原因的差異,結(jié)合SPN切片網(wǎng)絡(luò)告警構(gòu)成及現(xiàn)狀,將相關(guān)告警統(tǒng)分為工程告警、空閑告警、重復(fù)告警以及根因告警四類,便于第二步驟告警壓縮的開展。
通過時(shí)間關(guān)聯(lián)算法、業(yè)務(wù)關(guān)聯(lián)算法、名稱關(guān)聯(lián)算法聯(lián)合去重降噪,實(shí)現(xiàn)切片網(wǎng)絡(luò)告警總量的顯著壓縮。三種算法之間依次為遞進(jìn)關(guān)系,最終實(shí)現(xiàn)海量告警的過濾去重,確定根因告警。具體壓縮規(guī)則定義為:
(1)時(shí)間關(guān)聯(lián)算法:研究表明,網(wǎng)絡(luò)告警日志的數(shù)據(jù)內(nèi)容往往與時(shí)間存在較強(qiáng)的關(guān)聯(lián)性,屬于典型的時(shí)序數(shù)據(jù)[15]。因此可根據(jù)告警時(shí)間序列對上報(bào)的數(shù)據(jù)進(jìn)行規(guī)律分析,建立特定時(shí)段的動(dòng)態(tài)閾值告警模型。同一個(gè)故障產(chǎn)生的告警,發(fā)生時(shí)間基本接近,規(guī)定5 分鐘為算法閾值點(diǎn),對5 分鐘以外的告警信息進(jìn)行慮重降噪操作;
(2)業(yè)務(wù)關(guān)聯(lián)算法:針對上報(bào)告警屬于同一切片拓?fù)渖贤粋€(gè)環(huán)或同一區(qū)域的告警,或者上報(bào)告警的兩網(wǎng)元之間有業(yè)務(wù)路徑關(guān)聯(lián),或者網(wǎng)元間隔在3 跳以內(nèi)的相關(guān)告警,進(jìn)行慮重降噪操作;
(3)權(quán)重關(guān)聯(lián)算法:同一種故障產(chǎn)生的影響在告警信息中具有很大相似性,主要表現(xiàn)在告警名稱方面,根據(jù)告警名稱給每個(gè)告警按照根因告警、重要告警、次要告警三個(gè)等級進(jìn)行權(quán)重分配,并統(tǒng)計(jì)各告警的上報(bào)次數(shù),最終將經(jīng)過時(shí)間關(guān)聯(lián)算法和業(yè)務(wù)關(guān)聯(lián)算法降噪過的告警信息根據(jù)“告警比重=告警權(quán)重×告警次數(shù)”的關(guān)系進(jìn)行比重計(jì)算,最終確定根因告警。具體權(quán)重分配表如表1 所示。
表1 名稱關(guān)聯(lián)算法權(quán)重分配表
依據(jù)壓縮后確定的各類根因告警,依次進(jìn)入告警處理環(huán)節(jié)。
(1)故障診斷:集成現(xiàn)有診斷功能,整合以往歷史處理經(jīng)驗(yàn),提供基于故障的可視化診斷能力,依據(jù)根因告警信息判定故障種類歸屬,生成故障處置指導(dǎo)意見,協(xié)助網(wǎng)絡(luò)維護(hù)人員及客戶快速排障;
(2)故障派單:將根因告警自動(dòng)生成告警工單,連同故障處置指導(dǎo)意見一同發(fā)送至維護(hù)人員處,同時(shí)檢查業(yè)務(wù)倒換及環(huán)網(wǎng)安全保護(hù)機(jī)制,在不影響承載業(yè)務(wù)感知的基礎(chǔ)上為故障盡快消除贏得時(shí)間;
(3)故障修復(fù):一線網(wǎng)絡(luò)維護(hù)人員依據(jù)診斷意見和派單內(nèi)容進(jìn)行業(yè)務(wù)恢復(fù)和告警清除,系統(tǒng)同時(shí)提供故障修復(fù)后的優(yōu)化預(yù)案,并支持切片網(wǎng)絡(luò)用戶自定義故障修復(fù)后的優(yōu)化意見上傳。
依據(jù)上述的智慧醫(yī)療切片專網(wǎng)業(yè)務(wù)模型和告警處置模型,模擬故障場景進(jìn)行效果驗(yàn)證。
設(shè)定某承載SPN 智慧醫(yī)療業(yè)務(wù)的切片網(wǎng)絡(luò)接入層級環(huán)網(wǎng)中,網(wǎng)元B、C 間光纖中斷導(dǎo)致環(huán)網(wǎng)開環(huán),如圖4 所示。
圖4 SPN 智慧醫(yī)療切片專網(wǎng)故障場景模擬
該故障場景中,鏈路兩端網(wǎng)元B、C 均上報(bào)Eth-Los 接口失效告警,同時(shí)經(jīng)過此物理鏈路的所有Tunnel/PW 均上報(bào)中斷告警及其他大量衍生告警。經(jīng)統(tǒng)計(jì),故障環(huán)網(wǎng)在故障發(fā)生的前后1 小時(shí)內(nèi)累計(jì)上報(bào)251 個(gè)告警,淹沒根因告警,具體分布如圖5 所示,其中橫坐標(biāo)為告警上報(bào)時(shí)間(min),縱坐標(biāo)為告警個(gè)數(shù)。
圖5 原始告警散點(diǎn)圖
(1)引入智能告警處置模型后,處置模型首先自動(dòng)識(shí)別告警類型,排除工程告警、空閑告警后按時(shí)間關(guān)聯(lián)算法進(jìn)行降噪,251 個(gè)原始告警中濾除重復(fù)及無效告警88 個(gè),壓降率達(dá)35%,壓降后的告警散點(diǎn)圖如圖6 所示。
圖6 時(shí)間關(guān)聯(lián)慮重后的告警散點(diǎn)圖
(2)其次按業(yè)務(wù)關(guān)聯(lián)算法進(jìn)行降噪,濾除重復(fù)和衍生告警104 個(gè),壓降率達(dá)41%,壓降后的告警散點(diǎn)圖如圖7 所示。
圖7 業(yè)務(wù)關(guān)聯(lián)慮重后的告警散點(diǎn)圖
(3)最后按權(quán)重關(guān)聯(lián)算法進(jìn)行降噪,聚合告警信息,濾除低權(quán)重告警54 個(gè),壓降率達(dá)22%,壓降后的告警散點(diǎn)圖如圖8 所示。
圖8 權(quán)重關(guān)聯(lián)慮重后的告警散點(diǎn)圖
經(jīng)過三輪算法的依次降噪,保留有效告警5 個(gè),累計(jì)壓降率達(dá)98%,最終識(shí)別出根因告警Eth_Los(以太網(wǎng)接口失效),明確故障為Fiber Cut(光纜纖芯中斷)引起,并在推薦故障處理建議后將有效告警派給相應(yīng)處理人員進(jìn)行根因修復(fù)。
隨著5G 智慧醫(yī)療應(yīng)用場景的逐步完善,承載相應(yīng)業(yè)務(wù)的SPN 切片網(wǎng)絡(luò)也將日趨復(fù)雜。智能告警模型通過三重算法聯(lián)合使用,壓縮大量衍生告警,明確對業(yè)務(wù)安全承載產(chǎn)生真正影響的根因告警,有效地提升了切片網(wǎng)絡(luò)面對故障沖擊的健壯性和時(shí)效性,并對告警背后隱藏問題進(jìn)行溯源,針對故障類型提出優(yōu)化方案,為后續(xù)的網(wǎng)絡(luò)全流程智能化運(yùn)維奠定了基礎(chǔ)。