[王翀 李光亞 謝炯炯]
NB-IOT 物聯(lián)網(wǎng)智能空調(diào)業(yè)務,基于NB-IOT 物聯(lián)網(wǎng)的網(wǎng)絡連接模式,利用NB-IoT 網(wǎng)絡實現(xiàn)服務控制平臺與智能空調(diào)的通信和控制,從而實現(xiàn)空調(diào)智能控制。
目前該業(yè)務使用場景多為學生宿舍,同一個校區(qū)內(nèi)通常安裝上千臺智能空調(diào)。校區(qū)空調(diào)安裝完成后,需進行集控驗機測試,如果一次集控率低,將會導致大量空調(diào)無法遠程控制,則集控驗機環(huán)節(jié)不通過。物聯(lián)網(wǎng)智能空調(diào)組網(wǎng)如圖1 所示。
圖1 物聯(lián)網(wǎng)智能空調(diào)組網(wǎng)
一次集控成功率是智能空調(diào)重要業(yè)務指標,一次集控成功率集控規(guī)則,定義為控制平臺通過NB-IOT 網(wǎng)絡對智能空調(diào)1 s 下發(fā)5 個并發(fā)信號,10 s 內(nèi)控制平臺能收到空調(diào)的回復信號,則表示空題集控成功,如未收到空調(diào)的回復信號,則判斷為第一次信號超時,此時平臺會重發(fā)1 次信號,第二次仍未收到回復信號則判斷為控制失敗。集控是對目標區(qū)全量空調(diào)同時發(fā)送控制信息,統(tǒng)計出空調(diào)安裝區(qū)域內(nèi)空調(diào)一次集中控制成功率。通??蛻魳藴适且淮渭爻晒β时WC在97%以上。
根據(jù)物聯(lián)網(wǎng)智能空調(diào)業(yè)務組網(wǎng)和歷次故障處理經(jīng)驗析,導致一次集控成功率低的原因目前有5 個。
(1)網(wǎng)絡設備故障,例如物聯(lián)網(wǎng)平臺、物聯(lián)網(wǎng)核心網(wǎng)、基站設備故障等,設備故障會有告警產(chǎn)生。
(2)網(wǎng)絡線路故障,例如客戶控制平臺至物聯(lián)網(wǎng)平臺的鏈路故障,基站與核心網(wǎng)之間的線路故障等。
(3)無線信號故障,例如基站信號覆蓋弱。
(4)性能類故障,例如基站容量不足,基站上下行鏈接異常。
(5)終端和卡故障,例如終端模組和物聯(lián)網(wǎng)卡不匹配,物聯(lián)網(wǎng)卡數(shù)據(jù)異常,終端模組故障等。
上述5 種故障原因,可通過設備告警、線路告警、機卡測試等手段,容易排查故障原因,但是有些故障原因?qū)σ淮涡约爻晒β视绊懞艽?,卻很容易被大家忽視。下面就根據(jù)故障處理案例,給大家分享這三類故障現(xiàn)象,請大家關注。
3.1.1 頻點優(yōu)先介紹
在NB 物聯(lián)網(wǎng)智能空調(diào)業(yè)務網(wǎng)絡中,用戶終端(User Equipment,UE,下簡稱模組),需要先搜索網(wǎng)絡,找到合適的網(wǎng)絡后接入所述網(wǎng)絡,才能享用運營商提供的服務。
目前,模組開機后,其搜網(wǎng)過程為:首先按照通信模式的優(yōu)先級,依次在每個通信模式下進行頻點搜索,獲得若干個候選頻點;然后從所獲得的候選頻點中選擇符合所述通信模式規(guī)定的頻點,并對所選擇的頻點對應的小區(qū)依次執(zhí)行搜網(wǎng)過程,直至找到合適的小區(qū);最后駐留在該小區(qū),完成模組的搜網(wǎng)過程。
模組在進行搜網(wǎng)時,首先接收各頻點的無線信號,再對頻點的接收信號強度指示(Received Signal Strength Indication,RSSI)測量,然后將頻點功率值大于一定功率閥值的無線信號對應的頻點作為候選頻點。
物聯(lián)網(wǎng)模組選擇網(wǎng)絡的方式,目前主要有兩種,一種是頻點優(yōu)先,另一種是信號優(yōu)先。
頻點優(yōu)先:根據(jù)模組內(nèi)置的頻點選擇優(yōu)先級,選擇排名第一的頻點接入網(wǎng)絡,選擇的這個頻點不一定是信號最強的頻點。
信號優(yōu)先:就是模組選擇候選頻點中信號最強的頻點接入無線網(wǎng)絡。
3.1.2 頻點優(yōu)先策略導致的故障案例
廣東電信某客戶反映其安裝在浙江某學校的物聯(lián)網(wǎng)空調(diào)一次集控率低,只有75%。經(jīng)過多方排查,網(wǎng)絡、設備、性能、信號和終端都無異常。專家團隊通過物聯(lián)網(wǎng)平臺、物聯(lián)網(wǎng)核心網(wǎng)和無線網(wǎng)優(yōu)工程師共同抓包分析,核心側抓包數(shù)據(jù)和基站側轉(zhuǎn)包的空調(diào)數(shù)量數(shù)據(jù)不匹配,發(fā)現(xiàn)該校區(qū)部分智能空調(diào)并未接入到浙江省份的基站。進一步對比分析,發(fā)現(xiàn)該校區(qū)部分智能空調(diào)接入臨近的江蘇NB 基站。
從現(xiàn)場分析來看,浙江該學院宿舍樓NB 無線信號應該由LF_H_NXDJQB-NB_81、LF_H_NXJL-NB_81、LF_H_NXQT-NB_83 等幾個小區(qū)覆蓋,而不是接入到較遠的江蘇側基站。無線網(wǎng)優(yōu)工程師繼續(xù)測試發(fā)現(xiàn)LF_H_ NXDJQB-NB_81、LF_H_NXJL-NB_81 的頻點均為2504,LF_H_NXQT -NB_83 的頻點為2508。學生宿舍位置和基站分布圖如圖2 所示。
圖2 學生宿舍位置和基站分布圖
通過集中控制發(fā)現(xiàn)部分空調(diào)占用的江蘇NB 基站使用頻點為2509,廣東電信聯(lián)合客戶廠家工程師分析原因為智能空調(diào)是廣東設計和生產(chǎn),廣東與江蘇都使用2503、2507、2509 頻點,同時該學院地處湖州NX,距離江蘇邊界很近,智能空調(diào)的NB 模組設置為頻點優(yōu)先,所以優(yōu)先選擇2503、2507、2509 頻點,接入江蘇NB 基站,但是占用江蘇信號后,由于江蘇基站較遠,NB 信號不穩(wěn)定,導致無線鏈路異常,智能空調(diào)出現(xiàn)無法正常使用。
將LF_H_NXQT-NB_83 小區(qū)頻點由2508 頻點改為2509 頻點,再次集控測試原先占用200 多次的江蘇信號降低為0 次,遠程接入江蘇基站的問題得到解決。后將LF_H_ NXDJQB -NB_81 小區(qū)頻點調(diào)整為為2506,讓3 個主覆蓋小區(qū)都保持異頻,也消除模三干擾。
經(jīng)過此次調(diào)整后,一次集控成功率提升至85%。
3.1.3 案例小結
由于NB-IOT 網(wǎng)絡存在幾個頻點,逐個頻點進行RSSI測量會導致頻點搜索速度很慢,頻點優(yōu)先會減少模組電量損耗,且讓模組快速接入無線網(wǎng)絡。由于上述兩個優(yōu)點,個別模組廠家會選擇頻點優(yōu)先策略,如果網(wǎng)絡環(huán)境簡單的情況下,頻點優(yōu)先是好的選擇。但是如浙江此類地跨邊界的復雜信號環(huán)境,頻點優(yōu)先策略反而會導致一次集控率低,終端也相對耗電,并且電池容易老化。
3.2.1 NB-IOT 無線信號覆蓋簡介
NB 無線信號在傳輸過程中,易受影響的因素有:
(1)物理的障礙物,不僅阻擋微波無線信號,它還能把電磁的能量給吸收掉,生成弱電流泄流掉,其中含有金屬物體的障礙物對信號的衰減最大。
(2)距離無線設備及電纜線路100 m 內(nèi)的無線電發(fā)射塔、電焊機、電車或高壓電力變壓器等強信號干擾源,也可能會對無線信號或設備產(chǎn)生強干擾;
(3)IEEE 802.11b/g 標準的工作頻段為2.4 GHz,而工業(yè)上許多設備也正好工作在這一頻段如:微波爐、藍牙設備、無繩電話、電冰箱等。如果附近有較強的磁場存在,那么無線網(wǎng)絡會受到影響。
3.2.2 模組安裝密閉環(huán)境導致無線信號覆蓋弱的故障案例
3.2.2.1 故障案例介紹和分析
廣東電信某客戶反映其安裝在浙江某學校的物聯(lián)網(wǎng)空調(diào)一次性集控率低,經(jīng)CQT 測試,該學校無線信號覆蓋良好,所有區(qū)域的RSRP ≥ -120 以上,完全符合物聯(lián)網(wǎng)卡的接入需求。然而智能空調(diào)安裝完畢后,進行一次集控率測試,大量的空調(diào)超時接入網(wǎng)絡,導致集控率只有85%左右。經(jīng)排查,網(wǎng)絡、設備、性能、信號和終端都無異常。
為解決此問題,組織無線側對智能空調(diào)安裝區(qū)域進行多次抓包對比分析,發(fā)現(xiàn)失敗率較高的智能空調(diào)都是處于宿舍低樓層信號覆蓋弱的區(qū)域。經(jīng)過現(xiàn)場觀察,發(fā)現(xiàn)空調(diào)模組放置于空調(diào)內(nèi)部,懷疑空調(diào)蓋板遮擋導致NB 模組接收信號弱,從而接入網(wǎng)絡失敗。
3.2.2.2 無線信號測試
為證實改猜測,廣東電信核查了前期進行的CQT 測試結果,組織無線人員現(xiàn)場測試NB 網(wǎng)絡信號覆蓋情況。測試方式采用抽測,相距較近的樓從中抽取一棟,每棟樓抽取高低各一層進行測試,測試內(nèi)容主要包括無線信號質(zhì)量測試和PING 業(yè)務測試。重點測試區(qū)域包括底層宿舍區(qū)域和其他NB 信號弱覆蓋區(qū)域。
并建議物聯(lián)網(wǎng)智能空調(diào)NB 無線信號覆蓋區(qū)域心哈滿足以下基本條件:
(1)RSRP ≥-107 dBm
(2)SINR ≥-3 dB
測試方案如下。
(1)依據(jù)測試點選取規(guī)則,在測試點NB-IoT 成功附著連接網(wǎng)絡;
(2)NB-IoT 終端連接成功后,對PING 服務器IP地址進行上行PING 操作(可ping 測地址117.60.157.137),對測試點進行PING 32 Bytes 業(yè)務,每次PING 包間隔為5 s;
(3)每次連接PING 20 個包;
(4)統(tǒng)計每個測試點Ping 包成功率。成功率=ping包成功次數(shù)/ping 包嘗試次數(shù)×100%。
為保證空調(diào)使用,每個點的ping 包成功率要求達到90%以上。
注:如出現(xiàn)網(wǎng)絡連接異常中斷,可自動重新連接網(wǎng)絡后繼續(xù)測試,該次異常事件對應的PING 周期內(nèi)的PING時延、嘗試及失敗次數(shù)不納入統(tǒng)計。
3.2.2.3 無線測試結果
測試發(fā)現(xiàn)現(xiàn)場大部分區(qū)域NB 信號強度和信號質(zhì)量均在要求范圍以內(nèi),少部分區(qū)域出現(xiàn)信號覆蓋較差?;疚磧?yōu)化前的CQT 測試結果如表1 所示。
表1 基站未優(yōu)化前的校區(qū)CQT 測試結果
NB 無線信號未滿足建議的信號強度,因此采取優(yōu)化措施如下。
(1)增強用戶區(qū)域附近NB 基站的發(fā)射功率,從而提升覆蓋區(qū)域內(nèi)的NB 信號強度;
(2)調(diào)整用戶區(qū)域附近NB 基站的天線下傾角度,在不影響其他業(yè)務使用的情況,盡可能將天線下傾角度對準故障區(qū)域,從而提升故障區(qū)域的NB 信號強度。
從現(xiàn)場測試來看,該學院宿舍樓主要由LF_H_NXDJQB-NB_81、LF_H_NXJL-NB_81、LF_H_NXQTNB_83 等幾個小區(qū)覆蓋,3 個小區(qū)LF_H_NXDJQBNB_81、LF_H_NXJL-NB_81、LF_H_NXQT-NB_83 功 率由調(diào)整由29.2 dBm 調(diào)整至35.2 dBm。并對基站天線方位角調(diào)整,LF_H_NXQT-NB_83 小區(qū)調(diào)整至290 度,LF_H_NXDJQB-NB_81 小區(qū)調(diào)整至160 度。
通過對無線基站信號的優(yōu)化調(diào)整后,該學院校區(qū)內(nèi)NB 無線信號覆蓋情況已完全符合要求,電信再次按照宿舍進行CQT 抽樣測試,并將測試結果記錄如下?;緝?yōu)化后校區(qū)CQT 測試情況如表2 所示。
表2 基站優(yōu)化后校區(qū)CQT 測試情況
(1)測試空調(diào)安裝宿舍信號強度RSRP,記錄每個點數(shù)據(jù),大于-107 dBm 達標。
(2)測試空調(diào)安裝宿舍信號質(zhì)量SINR,記錄每個點數(shù)據(jù)。大于-3 dB 達標。
經(jīng)過無線基站優(yōu)化后,所有區(qū)域均已正常覆蓋NB 信號,滿足覆蓋需求。立即安排客戶進行集控測試,測試結果顯示,集控成功率大幅提升至95%。
3.2.3 模組安裝密閉環(huán)境導致無線信號覆蓋弱的案例小結
智能空調(diào)業(yè)務中,物聯(lián)網(wǎng)卡是放入空調(diào)模組中使用,模組是放到空調(diào)內(nèi)部,一旦空調(diào)的蓋板合上,模組處于密閉空間,無線信號經(jīng)過空調(diào)金屬蓋板會產(chǎn)生較大的衰耗,預估金屬蓋板對信號會產(chǎn)生十多個DB 的衰耗。為保障模組接受到的NB 信號質(zhì)量,CQT 測試時,空調(diào)所在區(qū)域的信號強度應該比平常CQT 的信號強度高10 個DB。
因此,建議物聯(lián)網(wǎng)智能空調(diào)NB 無線信號需要滿足以下基本條件:
(1)RSRP ≥ -107 dBm
(2)SINR ≥ -3 dB
3.3.1 LP 故障介紹
如圖1 物聯(lián)網(wǎng)智能空調(diào)組網(wǎng)所示,NB 模組在空調(diào)內(nèi)部通過有線線路與空調(diào)主控板鏈接,NB 模組接收客戶控制臺的信號,然后傳遞給空調(diào)主控板。實現(xiàn)客戶控制平臺與空調(diào)的對話,模組和空調(diào)主控板之間如出現(xiàn)鏈接失敗,則定義為LP 故障。LP 故障發(fā)生后,即便模組正常接收控制臺信號,也無法實現(xiàn)對空調(diào)的遠程控制。必然會對智能空調(diào)一次集控成功率產(chǎn)生影響。
3.3.2 LP 故障案例
廣東電信某客戶反映安裝在浙江某學校的物聯(lián)網(wǎng)空調(diào)一次性集控率不高,經(jīng)過排查,網(wǎng)絡各個環(huán)節(jié)都正常,然而集控率依然不高。廣東電信專家團隊進行分析討論時,為了掌握集控率低的時間規(guī)律,組織廠家進行了多次、不同時間段的集控測試。
在進行集中控制測試時發(fā)現(xiàn)智能空調(diào)在晚上7 點~8點之間經(jīng)常出現(xiàn)LP 告警,過一段時間又會自動恢復。根據(jù)LP 告警的定義,可以確認智能空調(diào)主機上報LP 告警,導致集控成功率不高,由于該告警所反映的問題屬于空調(diào)自身設計問題。廣東電信立即聯(lián)系客戶工程師溝通,并協(xié)助客戶排查LP 告警故障。
根據(jù)客戶提供的部分出現(xiàn)LP 故障的空調(diào)信息(空調(diào)所在位置、使用的物聯(lián)網(wǎng)卡ICCID/IMEI/IMSI),廣東電信協(xié)調(diào)物聯(lián)網(wǎng)公司核查空調(diào)在故障時間段的網(wǎng)絡連接情況。經(jīng)測試,智能空調(diào)在出現(xiàn)LP 告警的時,空調(diào)的無線模組已經(jīng)附著到電信網(wǎng)絡,接收到控制平臺下發(fā)的指令,但在連接空調(diào)顯示板之間出現(xiàn)異常,導致故障發(fā)生。
經(jīng)過廣東電信專家組分析,定位故障點為智能空調(diào)NB 模組與空調(diào)顯示板之間通信問題,并配合模組廠家進一步核查,經(jīng)核查發(fā)現(xiàn)空調(diào)模組軟件存在BUG,導致出現(xiàn)LP 故障,經(jīng)過廠家處理后,一次集控率成功率達標。
綜上所述,此三類故障原因發(fā)生后,運營商網(wǎng)絡沒有告警,然而對物聯(lián)網(wǎng)智能空調(diào)一次成功率卻影響很大,會導致物聯(lián)網(wǎng)智能空調(diào)集控率低,影響客戶感知。
(1)模組信號選擇問題,由于模組設置擇頻點優(yōu)先而不是信號優(yōu)化,導致智能空調(diào)遠程接入到信號覆蓋較弱基站,信號不穩(wěn)定引起集控率低。
(2)NB 基站信號覆蓋問題,平常CQT 測試信號符合集團規(guī)范。然而未考慮到物聯(lián)網(wǎng)模組放置于空調(diào)內(nèi)部,空調(diào)閉合導致信號衰減大,實際模組接收到的信號弱。
(3)智能空調(diào)的NB 模組軟件BUG,導致與空調(diào)主控板之間通信異常,頻繁出現(xiàn)LP 告警,造成控制失敗。
針對以上3 個原因,為確保滿足客戶業(yè)務使用需求,建議同類型業(yè)務,NB 無線基站信號做以下優(yōu)化。
(1)增強區(qū)域內(nèi)NB 基站的信號發(fā)射功率,調(diào)整天線方位角度,確保信號RSRP≥ -107 dBm,SINR≥ -3 dB的要求。
(2)了解模組的無線信號選擇策略,建議客戶模組設置為信號優(yōu)先接入NB-IOT 網(wǎng)絡,如需要可優(yōu)化區(qū)域內(nèi)NB 基站頻點,以適應客戶使用要求。
(3)關注模組與空調(diào)主控板之間的通信情況,確保模組與空調(diào)主控板正常連接,能有效提高集控率。