文/周慶忠 朱建成
油料保障系統(tǒng)(POL Support System, POLSS)自治性,即在不完整油料勤務(wù)知識支持下,響應(yīng)動態(tài)變化保障態(tài)勢,進(jìn)行有目標(biāo)自主決策的性能。提及“自治”往往誤解成油料保障計(jì)算機(jī)系統(tǒng)的“指揮者”獨(dú)立決策和采取失控行動。應(yīng)該指出,不能孤立地將POLSS自治性,看成是油料保障系統(tǒng)內(nèi)在屬性,事實(shí)上自治是由預(yù)先授予計(jì)算機(jī)油料保障決策的設(shè)計(jì)權(quán)限來實(shí)現(xiàn),在一定程度上由人工操作所監(jiān)控。自治性離不開在動態(tài)保障環(huán)境中人與系統(tǒng)的交互協(xié)同。POLSS自治性研究,有助于探討權(quán)衡油料保障聯(lián)盟(POL Support Alliance, POLSA)各成員自治與協(xié)同關(guān)系,對增強(qiáng)油料保障力度具有重要意義。
POLSS自治性,對指揮官、操作者和開發(fā)人員提出了挑戰(zhàn)。指揮員不能很好地理解將自治權(quán)融入任務(wù)的功能,難于把握好自治與協(xié)同關(guān)系。操作者渴望執(zhí)行任務(wù)時所需的人機(jī)協(xié)同功能,卻受制于系統(tǒng)設(shè)計(jì)缺陷,導(dǎo)致意外操作。這些均歸納為對POLSS的“可信危機(jī)”。因系統(tǒng)自治性,部分決策處于“黑箱”狀態(tài),不可測和不可控,不清楚在所面臨局勢下可操作的系統(tǒng)功能,POLSA成員間互不信任,甚至對自治功能缺乏信任。
系統(tǒng)開發(fā)人員所面對的挑戰(zhàn)是,從以硬件(如裝備、設(shè)備與設(shè)施等)、信息采集為中心的軟件開發(fā),向創(chuàng)建自治性軟件功能過程轉(zhuǎn)移。此外,部署應(yīng)用POLSS,尤其是在應(yīng)急保障行動中,時間緊迫,難于有足夠時間來形成油料保障新理念。硬件資產(chǎn)呈分布式配置,聯(lián)盟成員習(xí)慣于原有油料業(yè)務(wù)流程,各級人員使用系統(tǒng)的方式很可能是開發(fā)人員沒有預(yù)料到的,需要開發(fā)人員來解決對油料保障系統(tǒng)能力過度限制的問題,更新或升級系統(tǒng)以便適應(yīng)使用要求。
圖1 POLSS自治性設(shè)計(jì)與評價框架圖
POLSS自治性設(shè)計(jì)與評價框架如圖1所示。從三個視圖的觀察角度來展開POLSS自治性設(shè)計(jì)與評價。
自治認(rèn)知態(tài)勢視圖反映油料保障控制范圍為油料保障任務(wù)、部門、保障資源。將保障實(shí)體分類為決策、任務(wù)、操作三個級別角色,賦予對應(yīng)控制權(quán)限和職責(zé)范圍。人們常關(guān)注納入到物理裝置(加油機(jī)、泵、閥門等)操作級別的自治。實(shí)際上自治也用于油料保障任務(wù)級別,POLSS規(guī)劃工具支持各級決策者產(chǎn)生油料保障行動計(jì)劃和任務(wù)管理功能。決策級別的自治主要用于高層次任務(wù)目標(biāo)保障資源管理。油料保障各級決策運(yùn)作中,獲取自治潛在好處,有助于增加使用自治機(jī)會,較明確地獲知自治權(quán)在哪些地方被使用,在哪些地方仍采用手動方式,將有助于將新增有效自治權(quán)融入系統(tǒng),完善改進(jìn)系統(tǒng)整體性能。
自治任務(wù)調(diào)度視圖反映當(dāng)各類保障Agent自治增加時,關(guān)鍵問題轉(zhuǎn)移到跨角色跨層次的交互協(xié)同。當(dāng)油料保障事件中斷、新事件觸發(fā)和自治機(jī)會出現(xiàn)時,將影響各類自治Agent在跨越任務(wù)階段、角色和層次的協(xié)同活動中同步程度。決策類型也改變保障任務(wù)的時序。油料保障任務(wù)由啟動、執(zhí)行和終止三個階段組成。每個階段都表現(xiàn)出不同的自治機(jī)會和不同的使用自治權(quán)方式。在強(qiáng)調(diào)POLSA成員自主決策的同時,采用動態(tài)優(yōu)先級進(jìn)行任務(wù)調(diào)度,確保實(shí)時任務(wù)調(diào)度的高效率和靈活性。以往僅根據(jù)按任務(wù)時間屬性約束來確定任務(wù)執(zhí)行的靜態(tài)優(yōu)先級,無法反映保障環(huán)境動態(tài)變化,并且忽略任務(wù)執(zhí)行的其它因素約束影響。
自治交互協(xié)同視圖反映POLSA自治域之間、人—機(jī)/系統(tǒng)之間自治決策與交互協(xié)同關(guān)系。設(shè)計(jì)關(guān)注問題有:選擇在系統(tǒng)何處注入自治功能?何時觸發(fā)使用自治功能?如何進(jìn)行系統(tǒng)的多個性能之間的權(quán)衡?過度追求自治性存在一定風(fēng)險,例如,對調(diào)整改進(jìn)POLSA某自治域的某一自治功能,很可能對系統(tǒng)的其它性能受損,產(chǎn)生負(fù)面影響。適度的自治性,才能既滿足油料保障自主響應(yīng)決策的需要,又能增加系統(tǒng)的整體能力。要從以下5個方面來約束自治的盲目擴(kuò)張,平衡協(xié)調(diào)系統(tǒng)各性能,如表1所示。
油料保障決策需要實(shí)時感知任務(wù)執(zhí)行環(huán)境。通過物理裝置在線采集油料裝備運(yùn)行狀態(tài)數(shù)據(jù),自主地感應(yīng)保障態(tài)勢,比查閱記錄本、手冊、說明書更為有效。POLSS重點(diǎn)關(guān)注對油料物理裝備(如儲存、運(yùn)輸油料裝備等)健康狀態(tài)感知,用于故障檢測管理、失效預(yù)測、重新規(guī)劃和應(yīng)急管理。物理裝備健康自治式監(jiān)測有三大優(yōu)勢,一是支持裝備性能良性退化,從故障中恢復(fù),因?yàn)樽灾喂收蠙z測、識別和恢復(fù)比人類操作更快。二是增加對POLSS的信任,特別是在任務(wù)關(guān)鍵階段,系統(tǒng)不會產(chǎn)生意外行為或失效。三是減少操作者認(rèn)知工作量,將其從觀看診斷顯示中解放出來。
目前傳感器應(yīng)用于POLSS來捕獲感知,仍處于檢測數(shù)據(jù)采集處理“弱感知”階段,還不能直接決策。無論將感知看作是全部由人、還是全部由計(jì)算機(jī)系統(tǒng)來完成,都忽視了人與計(jì)算機(jī)協(xié)同感知這關(guān)鍵點(diǎn)。涵蓋檢測數(shù)據(jù)處理與智能決策整個過程的新型智能傳感器正在研究中,它的面世,將會產(chǎn)生超越人類行為的自治感知物理裝置的方案。
POLSS需重點(diǎn)解決的問題是對油料勤務(wù)知識工程工具的有效利用,例如,以人工方式憑經(jīng)驗(yàn)進(jìn)行保障任務(wù)配置,或者雖然計(jì)算機(jī)運(yùn)行算法模型來生成決策方案,仍產(chǎn)生大量數(shù)據(jù)I/O工作量,例如,由操作者錄入數(shù)據(jù),輸出保障計(jì)劃方案等報(bào)表文件需人工做二次處理,以便呈報(bào)或下發(fā)。在加油環(huán)節(jié),由操作員直接控制執(zhí)行加油動作,而不是由一個遠(yuǎn)程集中服務(wù)器控制實(shí)現(xiàn)加油。
表1 系統(tǒng)性能的權(quán)衡
知識工程工具支持應(yīng)用指定表示格式的解釋和驗(yàn)證,是自治規(guī)劃的技術(shù)基礎(chǔ)。將人工智能AI規(guī)劃理論用于POLSS開發(fā),提供不需人在現(xiàn)場的自主保障行動決策所需的算法。最優(yōu)油料保障計(jì)劃雖難以實(shí)現(xiàn),但可實(shí)時提供近似最優(yōu)計(jì)劃,還可減少操作人員培訓(xùn)和工作量。
油料保障任務(wù)在動態(tài)環(huán)境中進(jìn)行,地圖、手冊所提供的指導(dǎo)幫助很有限。機(jī)器學(xué)習(xí)是開發(fā)智能自治地響應(yīng)動態(tài)保障環(huán)境變化的POLSS有效方法之一。機(jī)器學(xué)習(xí)通常有效地識別已被明確訓(xùn)練過的對象、人員和活動的特定類別。通過機(jī)器學(xué)習(xí),POLSS自主地學(xué)習(xí)大量監(jiān)測訓(xùn)練樣本數(shù)據(jù),自動適應(yīng)新環(huán)境變化,來尋找可靠的油料加注補(bǔ)給方式,使得POLSS成為準(zhǔn)確而強(qiáng)大的自治系統(tǒng),效率遠(yuǎn)高于原來的“檢測”與“決策”分離保障模式。
然而,需要大量有效的訓(xùn)練樣本數(shù)據(jù)也是現(xiàn)有機(jī)器學(xué)習(xí)方法的主要限制之一。建立必要的訓(xùn)練數(shù)據(jù)是昂貴和費(fèi)力的過程,對油料管理工作提出了新要求。在日常業(yè)務(wù)工作中,必須投入人力物力,采集油料保障相關(guān)數(shù)據(jù),進(jìn)行分析處理,建立各類油料保障數(shù)據(jù)庫。目前,為了減少系統(tǒng)學(xué)習(xí)所需訓(xùn)練樣本數(shù)據(jù)量,涌現(xiàn)了許多技術(shù),如主動學(xué)習(xí)、遷移學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、跨模態(tài)培訓(xùn)等。這將降低開發(fā)POLSS所需的時間和成本,有利于POLSS的進(jìn)一步完善。
POLSS人機(jī)交互重點(diǎn)關(guān)注雙向和認(rèn)知交互,主要解決人們?nèi)绾尾僮饔?jì)算機(jī)或儀器裝置的問題。使用以人為本的設(shè)計(jì)原則,提高人機(jī)交互性能的益處有:1)任務(wù)執(zhí)行較快,失誤較少。2)改進(jìn)接口,增強(qiáng)系統(tǒng)可用與可靠性,減少系統(tǒng)操作人數(shù)。3)降低為不同需求所設(shè)計(jì)獨(dú)特顯示功能的成本;4)解決在特定情況下人與系統(tǒng)的自治功能局限性,有助于所設(shè)計(jì)系統(tǒng),使POLSS不僅可監(jiān)控限制違規(guī)運(yùn)作,還可預(yù)測油料保障新需求。5)增加系統(tǒng)完成保障任務(wù)和適應(yīng)新局勢能力,增加各級人員對系統(tǒng)的信任度。
系統(tǒng)通信和計(jì)算機(jī)運(yùn)行狀態(tài)(如計(jì)算機(jī)正在做什么和為什么這樣做等)的能見度仍是待解決問題。例如,在操作員所控制的單元屏幕上顯示多過信息,使其視覺超負(fù)荷反而無法專心操作。目前正在研究的多模態(tài)顯示器可使這一問題迎刃而解。
目前圖形用戶界面雖是POLSS與系統(tǒng)通信的有效方法。但在許多情形下(如,當(dāng)加油員的雙手正在進(jìn)行加油操作時),自然語言則是更為理想的人與計(jì)算機(jī)系統(tǒng)的溝通模式。POLSS需解決的問題是,如何在視覺范圍內(nèi),以抬起頭、免提模式操作系統(tǒng),以自然語言方式發(fā)出或索取決策指令。直接賦予系統(tǒng)口頭指令將簡化和加快任務(wù)被指派過程,減少操作工作量,增強(qiáng)POLSS在復(fù)雜環(huán)境下的運(yùn)行能力。
現(xiàn)有的自然語言理解技術(shù)主要關(guān)注理解書面形式文字,直接關(guān)注人與機(jī)對話互動指令尚處于起步階段,需要基礎(chǔ)研究來支持。由于目前自然語言理解技術(shù)只能支持簡單的語言指令,對于復(fù)雜油料保障任務(wù)的要求來說,用有限的詞匯和少量的命令集來描述是遠(yuǎn)遠(yuǎn)不夠的。
多Agent協(xié)同與人機(jī)交互有一定聯(lián)系,但多Agent協(xié)同研究更注重于不同類型Agent配置的協(xié)同調(diào)度。而人機(jī)交互則更注重于協(xié)同認(rèn)知。在POLSS中,多Agent被應(yīng)用于協(xié)同完成分布在各個自治域、或同一個自治域不同層次中的油料保障任務(wù)。設(shè)置油料保障所涉及的各類Agent,它們是具有某種程度的自治個體,既可擺脫Agent相互間影響,也可交互談判,實(shí)現(xiàn)分布式協(xié)同,或被上級決策者明確指示,進(jìn)行集中式協(xié)同。多Agent協(xié)同重點(diǎn)關(guān)注Agent相互同步、響應(yīng)環(huán)境動態(tài)變化等問題。
在POLSS的頂層設(shè)置全局總管Agent TMA,用于協(xié)調(diào)、派發(fā)、控制、指揮POLSA成員完成協(xié)同保障任務(wù)。POLSA的每一個自治域系統(tǒng)在Agent層設(shè)有自治主管Agent MA與之對應(yīng),用來管理油料保障任務(wù)自治域?qū)哟沃凶灾鞲兄h(huán)境、分析判斷、決策和行動的各類具有復(fù)雜行為的保障Agent。MA負(fù)責(zé)域內(nèi)任務(wù)調(diào)度及保障資源的分配,提供本級決策方案后,由其所管轄的各類保障執(zhí)行Agent(如運(yùn)輸Agent、加油Agent等)來具體執(zhí)行保障任務(wù),MA還負(fù)責(zé)監(jiān)測資源狀態(tài)和任務(wù)執(zhí)行過程。