油料保障系統(tǒng)的自治性研究

2013-07-02 05:59:00周慶忠朱建成

中國儲運(yùn) 2013年6期

文/周慶忠朱建成

油料保障系統(tǒng)(POL Support System, POLSS)自治性，即在不完整油料勤務(wù)知識支持下，響應(yīng)動態(tài)變化保障態(tài)勢，進(jìn)行有目標(biāo)自主決策的性能。提及“自治”往往誤解成油料保障計(jì)算機(jī)系統(tǒng)的“指揮者”獨(dú)立決策和采取失控行動。應(yīng)該指出，不能孤立地將POLSS自治性，看成是油料保障系統(tǒng)內(nèi)在屬性，事實(shí)上自治是由預(yù)先授予計(jì)算機(jī)油料保障決策的設(shè)計(jì)權(quán)限來實(shí)現(xiàn)，在一定程度上由人工操作所監(jiān)控。自治性離不開在動態(tài)保障環(huán)境中人與系統(tǒng)的交互協(xié)同。POLSS自治性研究，有助于探討權(quán)衡油料保障聯(lián)盟（POL Support Alliance, POLSA）各成員自治與協(xié)同關(guān)系，對增強(qiáng)油料保障力度具有重要意義。

1.POLSS自治性所帶來的挑戰(zhàn)

POLSS自治性，對指揮官、操作者和開發(fā)人員提出了挑戰(zhàn)。指揮員不能很好地理解將自治權(quán)融入任務(wù)的功能，難于把握好自治與協(xié)同關(guān)系。操作者渴望執(zhí)行任務(wù)時所需的人機(jī)協(xié)同功能，卻受制于系統(tǒng)設(shè)計(jì)缺陷，導(dǎo)致意外操作。這些均歸納為對POLSS的“可信危機(jī)”。因系統(tǒng)自治性，部分決策處于“黑箱”狀態(tài)，不可測和不可控，不清楚在所面臨局勢下可操作的系統(tǒng)功能，POLSA成員間互不信任，甚至對自治功能缺乏信任。

系統(tǒng)開發(fā)人員所面對的挑戰(zhàn)是，從以硬件（如裝備、設(shè)備與設(shè)施等）、信息采集為中心的軟件開發(fā)，向創(chuàng)建自治性軟件功能過程轉(zhuǎn)移。此外，部署應(yīng)用POLSS，尤其是在應(yīng)急保障行動中，時間緊迫，難于有足夠時間來形成油料保障新理念。硬件資產(chǎn)呈分布式配置，聯(lián)盟成員習(xí)慣于原有油料業(yè)務(wù)流程，各級人員使用系統(tǒng)的方式很可能是開發(fā)人員沒有預(yù)料到的，需要開發(fā)人員來解決對油料保障系統(tǒng)能力過度限制的問題，更新或升級系統(tǒng)以便適應(yīng)使用要求。

圖1 POLSS自治性設(shè)計(jì)與評價框架圖

2.POLSS自治性設(shè)計(jì)與評價框架

POLSS自治性設(shè)計(jì)與評價框架如圖1所示。從三個視圖的觀察角度來展開POLSS自治性設(shè)計(jì)與評價。

2.1 自治認(rèn)知態(tài)勢視圖

自治認(rèn)知態(tài)勢視圖反映油料保障控制范圍為油料保障任務(wù)、部門、保障資源。將保障實(shí)體分類為決策、任務(wù)、操作三個級別角色，賦予對應(yīng)控制權(quán)限和職責(zé)范圍。人們常關(guān)注納入到物理裝置（加油機(jī)、泵、閥門等）操作級別的自治。實(shí)際上自治也用于油料保障任務(wù)級別，POLSS規(guī)劃工具支持各級決策者產(chǎn)生油料保障行動計(jì)劃和任務(wù)管理功能。決策級別的自治主要用于高層次任務(wù)目標(biāo)保障資源管理。油料保障各級決策運(yùn)作中，獲取自治潛在好處，有助于增加使用自治機(jī)會，較明確地獲知自治權(quán)在哪些地方被使用，在哪些地方仍采用手動方式，將有助于將新增有效自治權(quán)融入系統(tǒng)，完善改進(jìn)系統(tǒng)整體性能。

2.2 自治任務(wù)調(diào)度視圖

自治任務(wù)調(diào)度視圖反映當(dāng)各類保障Agent自治增加時，關(guān)鍵問題轉(zhuǎn)移到跨角色跨層次的交互協(xié)同。當(dāng)油料保障事件中斷、新事件觸發(fā)和自治機(jī)會出現(xiàn)時，將影響各類自治Agent在跨越任務(wù)階段、角色和層次的協(xié)同活動中同步程度。決策類型也改變保障任務(wù)的時序。油料保障任務(wù)由啟動、執(zhí)行和終止三個階段組成。每個階段都表現(xiàn)出不同的自治機(jī)會和不同的使用自治權(quán)方式。在強(qiáng)調(diào)POLSA成員自主決策的同時，采用動態(tài)優(yōu)先級進(jìn)行任務(wù)調(diào)度，確保實(shí)時任務(wù)調(diào)度的高效率和靈活性。以往僅根據(jù)按任務(wù)時間屬性約束來確定任務(wù)執(zhí)行的靜態(tài)優(yōu)先級，無法反映保障環(huán)境動態(tài)變化，并且忽略任務(wù)執(zhí)行的其它因素約束影響。

2.3 自治交互協(xié)同視圖

自治交互協(xié)同視圖反映POLSA自治域之間、人—機(jī)/系統(tǒng)之間自治決策與交互協(xié)同關(guān)系。設(shè)計(jì)關(guān)注問題有：選擇在系統(tǒng)何處注入自治功能？何時觸發(fā)使用自治功能？如何進(jìn)行系統(tǒng)的多個性能之間的權(quán)衡？過度追求自治性存在一定風(fēng)險，例如，對調(diào)整改進(jìn)POLSA某自治域的某一自治功能，很可能對系統(tǒng)的其它性能受損，產(chǎn)生負(fù)面影響。適度的自治性，才能既滿足油料保障自主響應(yīng)決策的需要，又能增加系統(tǒng)的整體能力。要從以下5個方面來約束自治的盲目擴(kuò)張，平衡協(xié)調(diào)系統(tǒng)各性能，如表1所示。

3.關(guān)鍵自治技術(shù)

3.1 感知

油料保障決策需要實(shí)時感知任務(wù)執(zhí)行環(huán)境。通過物理裝置在線采集油料裝備運(yùn)行狀態(tài)數(shù)據(jù)，自主地感應(yīng)保障態(tài)勢，比查閱記錄本、手冊、說明書更為有效。POLSS重點(diǎn)關(guān)注對油料物理裝備（如儲存、運(yùn)輸油料裝備等）健康狀態(tài)感知，用于故障檢測管理、失效預(yù)測、重新規(guī)劃和應(yīng)急管理。物理裝備健康自治式監(jiān)測有三大優(yōu)勢，一是支持裝備性能良性退化，從故障中恢復(fù)，因?yàn)樽灾喂收蠙z測、識別和恢復(fù)比人類操作更快。二是增加對POLSS的信任，特別是在任務(wù)關(guān)鍵階段，系統(tǒng)不會產(chǎn)生意外行為或失效。三是減少操作者認(rèn)知工作量，將其從觀看診斷顯示中解放出來。

目前傳感器應(yīng)用于POLSS來捕獲感知，仍處于檢測數(shù)據(jù)采集處理“弱感知”階段，還不能直接決策。無論將感知看作是全部由人、還是全部由計(jì)算機(jī)系統(tǒng)來完成，都忽視了人與計(jì)算機(jī)協(xié)同感知這關(guān)鍵點(diǎn)。涵蓋檢測數(shù)據(jù)處理與智能決策整個過程的新型智能傳感器正在研究中，它的面世，將會產(chǎn)生超越人類行為的自治感知物理裝置的方案。

3.2 規(guī)劃

POLSS需重點(diǎn)解決的問題是對油料勤務(wù)知識工程工具的有效利用，例如，以人工方式憑經(jīng)驗(yàn)進(jìn)行保障任務(wù)配置，或者雖然計(jì)算機(jī)運(yùn)行算法模型來生成決策方案，仍產(chǎn)生大量數(shù)據(jù)I/O工作量，例如，由操作者錄入數(shù)據(jù)，輸出保障計(jì)劃方案等報(bào)表文件需人工做二次處理，以便呈報(bào)或下發(fā)。在加油環(huán)節(jié)，由操作員直接控制執(zhí)行加油動作，而不是由一個遠(yuǎn)程集中服務(wù)器控制實(shí)現(xiàn)加油。

表1 系統(tǒng)性能的權(quán)衡

知識工程工具支持應(yīng)用指定表示格式的解釋和驗(yàn)證，是自治規(guī)劃的技術(shù)基礎(chǔ)。將人工智能AI規(guī)劃理論用于POLSS開發(fā)，提供不需人在現(xiàn)場的自主保障行動決策所需的算法。最優(yōu)油料保障計(jì)劃雖難以實(shí)現(xiàn)，但可實(shí)時提供近似最優(yōu)計(jì)劃，還可減少操作人員培訓(xùn)和工作量。

3.3 學(xué)習(xí)

油料保障任務(wù)在動態(tài)環(huán)境中進(jìn)行，地圖、手冊所提供的指導(dǎo)幫助很有限。機(jī)器學(xué)習(xí)是開發(fā)智能自治地響應(yīng)動態(tài)保障環(huán)境變化的POLSS有效方法之一。機(jī)器學(xué)習(xí)通常有效地識別已被明確訓(xùn)練過的對象、人員和活動的特定類別。通過機(jī)器學(xué)習(xí)，POLSS自主地學(xué)習(xí)大量監(jiān)測訓(xùn)練樣本數(shù)據(jù)，自動適應(yīng)新環(huán)境變化，來尋找可靠的油料加注補(bǔ)給方式，使得POLSS成為準(zhǔn)確而強(qiáng)大的自治系統(tǒng)，效率遠(yuǎn)高于原來的“檢測”與“決策”分離保障模式。

然而，需要大量有效的訓(xùn)練樣本數(shù)據(jù)也是現(xiàn)有機(jī)器學(xué)習(xí)方法的主要限制之一。建立必要的訓(xùn)練數(shù)據(jù)是昂貴和費(fèi)力的過程，對油料管理工作提出了新要求。在日常業(yè)務(wù)工作中，必須投入人力物力，采集油料保障相關(guān)數(shù)據(jù)，進(jìn)行分析處理，建立各類油料保障數(shù)據(jù)庫。目前，為了減少系統(tǒng)學(xué)習(xí)所需訓(xùn)練樣本數(shù)據(jù)量，涌現(xiàn)了許多技術(shù)，如主動學(xué)習(xí)、遷移學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、跨模態(tài)培訓(xùn)等。這將降低開發(fā)POLSS所需的時間和成本，有利于POLSS的進(jìn)一步完善。

3.4 人機(jī)交互

POLSS人機(jī)交互重點(diǎn)關(guān)注雙向和認(rèn)知交互，主要解決人們?nèi)绾尾僮饔?jì)算機(jī)或儀器裝置的問題。使用以人為本的設(shè)計(jì)原則，提高人機(jī)交互性能的益處有：1）任務(wù)執(zhí)行較快，失誤較少。2）改進(jìn)接口，增強(qiáng)系統(tǒng)可用與可靠性，減少系統(tǒng)操作人數(shù)。3）降低為不同需求所設(shè)計(jì)獨(dú)特顯示功能的成本；4）解決在特定情況下人與系統(tǒng)的自治功能局限性，有助于所設(shè)計(jì)系統(tǒng)，使POLSS不僅可監(jiān)控限制違規(guī)運(yùn)作，還可預(yù)測油料保障新需求。5）增加系統(tǒng)完成保障任務(wù)和適應(yīng)新局勢能力，增加各級人員對系統(tǒng)的信任度。

系統(tǒng)通信和計(jì)算機(jī)運(yùn)行狀態(tài)（如計(jì)算機(jī)正在做什么和為什么這樣做等）的能見度仍是待解決問題。例如，在操作員所控制的單元屏幕上顯示多過信息，使其視覺超負(fù)荷反而無法專心操作。目前正在研究的多模態(tài)顯示器可使這一問題迎刃而解。

3.5 自然語言理解

目前圖形用戶界面雖是POLSS與系統(tǒng)通信的有效方法。但在許多情形下（如，當(dāng)加油員的雙手正在進(jìn)行加油操作時），自然語言則是更為理想的人與計(jì)算機(jī)系統(tǒng)的溝通模式。POLSS需解決的問題是，如何在視覺范圍內(nèi)，以抬起頭、免提模式操作系統(tǒng)，以自然語言方式發(fā)出或索取決策指令。直接賦予系統(tǒng)口頭指令將簡化和加快任務(wù)被指派過程，減少操作工作量，增強(qiáng)POLSS在復(fù)雜環(huán)境下的運(yùn)行能力。

現(xiàn)有的自然語言理解技術(shù)主要關(guān)注理解書面形式文字，直接關(guān)注人與機(jī)對話互動指令尚處于起步階段，需要基礎(chǔ)研究來支持。由于目前自然語言理解技術(shù)只能支持簡單的語言指令，對于復(fù)雜油料保障任務(wù)的要求來說，用有限的詞匯和少量的命令集來描述是遠(yuǎn)遠(yuǎn)不夠的。

3.6 多Agent協(xié)同

多Agent協(xié)同與人機(jī)交互有一定聯(lián)系，但多Agent協(xié)同研究更注重于不同類型Agent配置的協(xié)同調(diào)度。而人機(jī)交互則更注重于協(xié)同認(rèn)知。在POLSS中，多Agent被應(yīng)用于協(xié)同完成分布在各個自治域、或同一個自治域不同層次中的油料保障任務(wù)。設(shè)置油料保障所涉及的各類Agent，它們是具有某種程度的自治個體，既可擺脫Agent相互間影響，也可交互談判，實(shí)現(xiàn)分布式協(xié)同，或被上級決策者明確指示，進(jìn)行集中式協(xié)同。多Agent協(xié)同重點(diǎn)關(guān)注Agent相互同步、響應(yīng)環(huán)境動態(tài)變化等問題。

在POLSS的頂層設(shè)置全局總管Agent TMA，用于協(xié)調(diào)、派發(fā)、控制、指揮POLSA成員完成協(xié)同保障任務(wù)。POLSA的每一個自治域系統(tǒng)在Agent層設(shè)有自治主管Agent MA與之對應(yīng)，用來管理油料保障任務(wù)自治域?qū)哟沃凶灾鞲兄h(huán)境、分析判斷、決策和行動的各類具有復(fù)雜行為的保障Agent。MA負(fù)責(zé)域內(nèi)任務(wù)調(diào)度及保障資源的分配，提供本級決策方案后，由其所管轄的各類保障執(zhí)行Agent（如運(yùn)輸Agent、加油Agent等）來具體執(zhí)行保障任務(wù)，MA還負(fù)責(zé)監(jiān)測資源狀態(tài)和任務(wù)執(zhí)行過程。