程文靜
摘 要:業(yè)務(wù)流程管理和業(yè)務(wù)智能化是近年來備受關(guān)注的領(lǐng)域。這些技術(shù)的應(yīng)用可以提高業(yè)務(wù)處理的效率,并且節(jié)省了可觀的成本?;趫D的概念(如對象、數(shù)據(jù)等)表示也被應(yīng)用于業(yè)務(wù)領(lǐng)域,作為對上述技術(shù)的支持。圖挖掘方法已被成功應(yīng)用于發(fā)現(xiàn)新關(guān)系、新知識和可視化等許多領(lǐng)域。本文探討了已成功應(yīng)用圖形挖掘技術(shù)的領(lǐng)域,同時也討論了在業(yè)務(wù)流程中應(yīng)用此項(xiàng)技術(shù)的優(yōu)勢和面臨的一些問題。
關(guān)鍵詞:圖挖掘;業(yè)務(wù)流程;圖挖掘應(yīng)用程序;業(yè)務(wù)流程分析
中圖分類號:TB ? ? 文獻(xiàn)標(biāo)識碼:A ? ? ?doi:10.19311/j.cnki.1672-3198.2020.26.078
0 引言
業(yè)務(wù)流程是企業(yè)成功和一個機(jī)構(gòu)正常運(yùn)轉(zhuǎn)的重要因素,因此所有的企業(yè)總是致力于研究更有效和高效的方式來處理和開展業(yè)務(wù)。多種不同的技術(shù)已被成功地用于實(shí)現(xiàn)和管理業(yè)務(wù)流程。在IT技術(shù)中,可以使用工作流管理系統(tǒng)來定義、管理、執(zhí)行和監(jiān)控業(yè)務(wù),由此工作流程可以被定義為全部或部分業(yè)務(wù)流程的自動化。在這個自動化處理過程中,在這個過程中,文檔、信息和其他元素會依據(jù)步驟規(guī)則依次通過各類資源。為了了解業(yè)務(wù)流程的執(zhí)行情況和規(guī)則,研究者在這個領(lǐng)域做出了大量的研究,并且提出了一些建模語言與分析方法以便于更好地理解和改進(jìn)業(yè)務(wù)流程。
基于圖形的概念(對象、數(shù)據(jù))表示已被成功應(yīng)用于許多領(lǐng)域,如化學(xué)結(jié)構(gòu)分析、生物信息學(xué)、電影票房的預(yù)測和流程的成功中止。在這些領(lǐng)域中,實(shí)體和其屬性之間的關(guān)系信息非常重要,因?yàn)樗鼈冇兄谌藗儼l(fā)現(xiàn)新知識。在業(yè)務(wù)流程管理中,這些新知識可以幫助人們解決與業(yè)務(wù)流程改進(jìn)有關(guān)的各種問題。問題的種類很多,我們列舉一些常見的。比如,哪些活動會經(jīng)常執(zhí)行?已定義好的任務(wù)通常通過哪條路徑完成?各個活動、業(yè)務(wù)對象及它們之間的流和關(guān)系具有哪些常見特征和聯(lián)系?我們可以在執(zhí)行成功和失敗的不同情況下發(fā)現(xiàn)哪些共同特征?對一個特定的業(yè)務(wù)流程,預(yù)測其是否會達(dá)到一個期望的狀態(tài)或者執(zhí)行失敗。我們能在不同用戶業(yè)務(wù)應(yīng)用程序的執(zhí)行中發(fā)現(xiàn)哪些共同點(diǎn)?應(yīng)該如何建構(gòu)一個組織,來使員工的工作產(chǎn)生最大效益(進(jìn)行社交網(wǎng)絡(luò)分析)?在業(yè)務(wù)流程的執(zhí)行過程中,用戶對系統(tǒng)的下一個信息請求會是什么?
上述問題有些已經(jīng)得到了解決,有些還有待于研究。本文對針對業(yè)務(wù)流程中元素(對象、數(shù)據(jù))的圖形化表示研究提出了進(jìn)一步的要求。對業(yè)務(wù)流程中關(guān)系知識的挖掘工作來說,用圖形化的方式來表達(dá)數(shù)據(jù)不僅能保留關(guān)系信息,還能有效地開展挖掘任務(wù)。
本文的結(jié)構(gòu)如下:在第1節(jié)中簡要地介紹業(yè)務(wù)流程和圖形挖掘的基礎(chǔ)知識;在第2節(jié)中討論在業(yè)務(wù)流程管理領(lǐng)域中應(yīng)用圖形挖掘的優(yōu)勢;在第3節(jié)中我們討論一些關(guān)于圖挖掘的其他問題;第4節(jié)總結(jié)了全文,并展望了未來的工作。
1 圖形挖掘與業(yè)務(wù)流程
圖由節(jié)點(diǎn)和連接節(jié)點(diǎn)的邊組成。圖形經(jīng)常用于概念的可視化表示,它提供了一種簡便的方法來表示實(shí)體間的聯(lián)系和各自的數(shù)據(jù)。在圖挖掘中,我們利用關(guān)系信息來提取模式和發(fā)現(xiàn)新知識。新知識可以是一個子圖模式,一個尚未被發(fā)現(xiàn)的和其他元素的聯(lián)系,或者是對數(shù)據(jù)趨勢在更抽象的層次上的表達(dá)。
基于圖的表示和圖挖掘技術(shù)已經(jīng)被應(yīng)用于各種領(lǐng)域,這樣的可視化技術(shù)有助于更好地理解和管理任務(wù)。例如,在通信網(wǎng)絡(luò)中,它可以用于監(jiān)視和管理復(fù)雜網(wǎng)絡(luò),定義連接策略,捕獲流量中的重復(fù)模式,檢測路由的不穩(wěn)定性和網(wǎng)絡(luò)外推(設(shè)計(jì)下一代生成協(xié)議等)。它也可用于社交網(wǎng)絡(luò)分析,在這一領(lǐng)域已經(jīng)開發(fā)了各種應(yīng)用程序來分析不同個體之間的關(guān)系,如國土安全(犯罪和毒品販運(yùn)鏈)、生物學(xué)計(jì)算和網(wǎng)絡(luò)搜索。
業(yè)務(wù)流程是一組相互關(guān)聯(lián)的活動集合,這些活動按特定順序執(zhí)行以完成給定的任務(wù)。它可以像填寫訂單一樣簡單,或者像執(zhí)行從選擇供應(yīng)商到支付賬單的整個訂購過程一樣復(fù)雜。業(yè)務(wù)流程管理要求有效地定義、設(shè)計(jì)、執(zhí)行和評估業(yè)務(wù)活動,并能有效地利用其涉及的各類資源,從而使企業(yè)或組織的目標(biāo)得以實(shí)現(xiàn)。為了理解這種復(fù)雜性,可以通過對業(yè)務(wù)流程建模來實(shí)現(xiàn)。即針對整個業(yè)務(wù)流程管理生命周期中的通信、分析和理解問題,以各種語言進(jìn)行圖形化建模來解決。
除了業(yè)務(wù)流程數(shù)據(jù)的不同表示方法之外,我們還要討論兩種工作流程分析的表示方法。在其中一種方法中,活動被表示為節(jié)點(diǎn),其他符號,比如粗線和虛線用于區(qū)分AND和XOR結(jié)構(gòu)。第二種方法使用了一種叫作Petri網(wǎng)的二分圖,在這種結(jié)構(gòu)中活動被表示為庫所,行為被表示為變遷。在本文中,我們建議使用后一種符號進(jìn)行圖形挖掘。Petri網(wǎng)是二分的有向圖,它包括庫所(用圓圈表示)、變遷(用矩形表示),以及用于連接它們的圓弧。庫所表示緩沖區(qū),是評估的條件和制定的決策的存儲位置;變遷表示任務(wù)/事件/行為。庫所可以包含特定的標(biāo)記,用來描述系統(tǒng)在某個特定階段的狀態(tài)和相關(guān)屬性值。
2 圖挖掘在業(yè)務(wù)流程中的應(yīng)用
圖的應(yīng)用有助于保持元素之間的結(jié)構(gòu)關(guān)系,如在化合物結(jié)構(gòu)分析和生物信息學(xué)中,圖是表示信息的必要手段。相比較而言,在傳統(tǒng)的方法中,元素之間的關(guān)系信息可能會有丟失。在業(yè)務(wù)流程中,采用基于圖的表示方法的最大的好處之一是有助于發(fā)現(xiàn)多個活動間的新關(guān)系、它們的屬性和對活動的總體影響。在圖中表示業(yè)務(wù)流程及其屬性可以保存數(shù)據(jù)對象和活動之間的聯(lián)系,這種聯(lián)系對發(fā)現(xiàn)關(guān)系知識至關(guān)重要。媒體行業(yè)的研究人員已經(jīng)利用圖挖掘方法來發(fā)掘關(guān)系知識。圖挖掘在媒體行業(yè)中的應(yīng)用實(shí)例還包括IMDB(互聯(lián)網(wǎng)電影數(shù)據(jù)庫)網(wǎng)站,此網(wǎng)站是一個資源網(wǎng)站,包含大量電影和電視節(jié)目的相關(guān)信息。用戶可通過在線查詢獲取電影和電視節(jié)目的細(xì)節(jié)信息。在IMDB電影數(shù)據(jù)庫中使用了圖挖掘技術(shù),其中用圖節(jié)點(diǎn)表示電影屬性(演員、導(dǎo)演、制片人等),然后運(yùn)用圖挖掘方法來發(fā)現(xiàn)新的關(guān)系和知識。這些知識用于預(yù)測某部電影在某一時間段內(nèi)會有多少票房,以及是否會被某個獎項(xiàng)提名。在該文中作者討論了將圖挖掘技術(shù)應(yīng)用于IMDB系統(tǒng)和一些其他領(lǐng)域得到的結(jié)果。