張遠 熊靜 王羽 周潔 劉詩儀 張亦民 張虹
【摘 要】 近年來民航領域的數據規(guī)模越來越巨大,但民航數據分布分散,數據結構存在差異形成了數據孤島,沒有得到有效治理。如何管理和利用數據,使其發(fā)揮價值,對個體及其企業(yè)做出貢獻,是企業(yè)必須考慮的重要問題。為了使民航大數據有效治理,本文通過對民航元數據管理, 主數據管理,數據質量管理,數據標準化管理等方面對民航大數據進行分析,對民航大數據資源治理的具體機制進行了研究,初步形成了民航大數據資源治理架構。
【關鍵詞】 大數據資源治理 民航 元數據 主數據
引 言
民航信息化普及程度比較高,大量的民航機構、從業(yè)人員產生了海量的行業(yè)相關數據,這些數據分布在民航業(yè)不同的機構,數據異構嚴重。民航企業(yè)目前龐大的現(xiàn)存數據中,75%都是非結構化數據,包括各種文字,語音,圖像,視頻,社交關系,空間軌跡等。因為行業(yè)數據量較大,分布比較分散,導致數據整合能力較低,大量的行業(yè)信息被淹沒在海量數據當中,沒有得到充分的利用。各個信息化系統(tǒng)之間數據結構存在差異,形成了數據孤島,沒有形成民航領域內有效的數據治理機制。
2013年,王瑋[1]指出有效治理大數據和挖掘分析其潛在的業(yè)務價值,是商業(yè)銀行面臨的新課題,從大數據時代的機遇和挑戰(zhàn),剖析數據治理面臨的問題,并基于制定數據標準體系和流程、數據質量規(guī)劃、評估和管理模式等方面提出大數據時代的數據治理措施。2014年,曾鋒[2]針對貴陽機場各系統(tǒng)獨立分散現(xiàn)狀,自主設計構建了數據管理集成系統(tǒng),詳盡解析了數據管理集成系統(tǒng)的結構、功能和實現(xiàn)途徑。2015年,李湘濱、鄭蕓、熊國民[3]結合中國民航的實際情況,提出了一種適用于開放平臺旅客服務信息系統(tǒng)的主數據識別與管理方法,設計了主數據管理系統(tǒng)的功能架構,并分析了適用于此系統(tǒng)架構的兩種關鍵技術。
由上述研究綜述可知,民航信息化經過的多年的發(fā)展,基礎設施比較完善,信息化系統(tǒng)也得到了廣泛的應用,同時也儲存了大量的操作數據以及事務數據,但一直以來對數據的管理研究主要集中在結構化數據的分析,民航大數據治理相關研究起步較晚,研究成果較少,較少,因此本文將對民航大數據治理機制進行具體研究具有理論和現(xiàn)實意義。。
1民航元數據管理
元數據是描述數據倉庫內數據的結構和建立方法的數據,可將其按用途的不同分為兩類:技術元數據(Technical Metadata)和業(yè)務元數據(Business Metadata)。
民航企業(yè)可以研究以OMG的公共倉庫元模型為核心的元數據集成體系結構。在明確了元數據集成體系結構之后,民航企業(yè)可以根據需要選擇合適的業(yè)務元數據和技術元數據管理工具,并制定相應的元數據管理制度進行全面的元數據管理。
民航大數據管理涉及到氣象信息,航班信息,客票訂座信息,地面服務信息等多個功能信息,各個功能的數據必須按照一定的模式存入數據倉庫中。數據倉庫中數據的對應關系及轉換規(guī)則都要存儲在元數據知識庫中。忽視元數據管理,就會使數據集成出現(xiàn)混亂的局面,很難進行數據倉庫的集成。
民航大數據數據容量大,具有多樣性,75%是非結構化數據。通過創(chuàng)建體現(xiàn)關鍵大數據業(yè)務術語的業(yè)務定義詞庫(本體),該業(yè)務定義詞庫不僅包含結構化數據,還可以將半結構化和非結構化數據納入其中。通過構建基礎本體、領域本體、任務本體和應用本體,在整個企業(yè)范圍提供一個完整的共享詞匯表,保證每個元數據元素在信息供應鏈中每個組件的語義上保持一致。
2民航主數據管理
主數據是指在整個企業(yè)范圍內各個系統(tǒng)間要共享的、高價值的數據,也稱企業(yè)基準數據[4]。那么民航主數據就是在民航企業(yè)中各個系統(tǒng)所共享的有價值的數據,這些數據在被整理之前,分散于各個系統(tǒng)中,而民航主數據可以達到讓這些數據通過集中整理分析,存儲于同一系統(tǒng)中,這樣可以更加方便快捷的查找并整合出最有價值的數據。
在民航主數據管理的應用方面,民航主數據管理應用于民航氣象信息和民航客票訂座信息管理等方面。
①民航氣象信息:民航主數據管理系統(tǒng)可以收集并整理某個指定地區(qū)的所有氣象信息,并且可以通過比對和分析,準確推斷出未來某段時間的氣象狀況,為民航飛機航行安全做保證。
②民航客票訂座信息:民航主數據管理系統(tǒng)可以根據乘客購買車票以及乘坐航班的實際乘客數量進行大數據分析,計算出最優(yōu)的客票訂座方案,從而使航空公司的利益達到最大化。
3民航數據質量管理
高質量的數據是大數據發(fā)揮作用的前提。如果不對大數據進行有效的數據質量管理,會使大數據會對決策產生有害的結果。大多數民航企業(yè)慢慢只能做到實時收集大數據,不注重對數據進行質量方面的管理,導致數據雜亂無章,最終成為無用的數據垃圾。如此大大降低了民航業(yè)對顧客的服務質量,降低了民航業(yè)的運營能力,以及與其他行業(yè)相比的競爭力。
6σ管理法是一種統(tǒng)計評估法,采用希臘字母“σ”來衡量標準偏差。6σ管理法強調制定極高的目標、收集數據以及分析結果,以減少產品和服務缺陷,是一種改善企業(yè)質量流程管理的技術。主要運用DMAIC模式,即Define、Measure、Analyze、Improve、Control五個步驟來改進項目。[5]可以采用基于6σ管理法方法對民航大數據進行質量管理。以下是在訂座信息管理領域的質量管理步驟。
(1)Define
對訂座信息的數據進行從準確性、一致性、時效性、唯一性等方面進行質量評估,為數據質量分析提供標準和依據。
(2)Measure
收集航空訂座信息等數據,并從最多的和最少的訂座位置、消費者訂座的時間段等進行測量,并進行整理。此階段是后續(xù)分析、改進和控制階段的基礎。
(3)Analyze
對于上階段所測量的訂座信息數據,通過對比分析整理的數據,得出消費者的訂座偏好以及較為集中的訂座時間段;進一步分析得出消費者的訂座偏好和訂座時間往往由哪些因素所決定。
(4)Improve
針對于訂座信息數據而言,航空企業(yè)應按分析得出的結果制定出方案,如怎樣營銷才能使消費者不集中在靠窗位置的偏愛、才能使消費者“雨露均沾”;根據消費者傾向的訂座時間應該如何調整訂票開始時間以及優(yōu)惠政策。
(5)Control
在大數據的質量管理控制階段,在選擇并確定了上述一種方案后,應有專人監(jiān)控實施方案后消費者對訂座的滿意度、訂座帶來的盈利等信息數據,并及時進行改正和控制。
4民航數據標準化管理
2018年已經是中國民航信息化發(fā)展的第33年。在民航信息化領域,我國已經建立了一系列基礎民航信息系統(tǒng)來初步幫助民航信息管理,但是隨著科學技術的日益提高,中國民航也高速發(fā)展,民航信息管理面對的問題也越來越多,但是現(xiàn)有的信息系統(tǒng)并不能解決全部問題,并且對于現(xiàn)在日益嚴格的客戶要求難以滿足。因此我們在大力發(fā)展民航信息系統(tǒng)的階段,務必要對數據標準化進行管理。
數據標準化意味著我們要為這些民航大數據,例如氣象信息、航班信息、訂座信息等制定一個標準,并進行標準化的管理。
數據標準管理由數據標準規(guī)劃、數據標準化實施、數據標準反饋這三部分內容組成,而重點在于數據標準化實施階段,由此又可細分為:數據標準制定、數據標準匹配,數據標準執(zhí)行、數據標準維護和數據標準監(jiān)控。
數據標準制定包括單詞標準化、數據規(guī)范化,確??煽康男畔碓匆约靶畔⒌募皶r性、準確性。
數據標準匹配主要是把四面八方收集來的信息(氣象、客票訂座、航班號等)準確地結合起來,提高工作組的高作效率。
數據標準執(zhí)行是指在數據匹配完之后各民航企業(yè)的系統(tǒng)按照統(tǒng)一制定的標準開始實踐。
數據標準維護是指在數據標準管理的同時時刻反饋運作狀態(tài),并根據當前及未來可能發(fā)生的情況進行修復和升級以減少錯誤率。
數據標準監(jiān)控是指在數據標準執(zhí)行的過程中,對數據的流通、加工及傳送進行監(jiān)視,并且及時反饋效果,同時也為數據標準的維護提供服務支持。
結束語
本文首先分析了大數據如今的現(xiàn)狀以及民航大數據的具體困境,其次通過數據標準化管理,數據質量管理,主數據管理,和元數據管理對民航大數據資源治理機制進行了研究,初步形成了民航大數據治理架構,但研究不夠深入,缺乏實踐性,希望有朝一日能完全實現(xiàn)民航大數據資源治理。
【參考文獻】
[1] 王瑋大數據時代的商業(yè)銀行數據治理研究[J].中國金融電腦,2013,(7):36-38.
[2] 曾鋒.機場數據管理集成系統(tǒng)的設計應用[J].現(xiàn)代機械,2012(3):83-85.
[3] 李湘濱、鄭蕓、熊國民. 面向民航開放平臺的主數據識別與管理[J]. 計算機與數字工程,2015(7):1304-1327.
[4] 李雋。主數據管理在供電企業(yè)中的應用研究[J].電力信息化,2010,9:9-12.
[5] 楊晶、陳曉冬.對6σ管理法的認識[J].發(fā)展,2006(12):78-79