李麗芬
摘 要
隨著軌道交通的迅速發(fā)展,南京地鐵網(wǎng)絡(luò)化的運(yùn)營(yíng),客流信息的日益增長(zhǎng),對(duì)票務(wù)系統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)的信息化,自動(dòng)化、智能化以及全面化的要求越來越迫切。為了提高南京地鐵運(yùn)營(yíng)的管理水平和智能化程度,在大力建設(shè)智慧城市環(huán)境的影響下,城市軌道交通也開始將數(shù)據(jù)挖掘技術(shù)引入到我們的AFC系統(tǒng)中,大大提高我們運(yùn)營(yíng)管理人員的工作效率全面實(shí)現(xiàn)高效的信息化管理,為軌道交通帶來巨大的信息價(jià)值和社會(huì)經(jīng)濟(jì)效益,為城市未來的軌道交通發(fā)展規(guī)劃建設(shè)和運(yùn)營(yíng)提供有利的指導(dǎo)。
【關(guān)鍵詞】AFC系統(tǒng) 數(shù)據(jù)挖掘技術(shù) 數(shù)據(jù)統(tǒng)計(jì)
1 背景概述
隨著軌道交通的迅速發(fā)展,南京地鐵網(wǎng)絡(luò)化的運(yùn)營(yíng),客流信息的日益增長(zhǎng),對(duì)票務(wù)系統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)的信息化,自動(dòng)化、智能化以及全面化的要求越來越迫切。由于建設(shè)時(shí)間的不同,南京地鐵自動(dòng)售檢票系統(tǒng)各條線路數(shù)據(jù)處理的能力,數(shù)據(jù)統(tǒng)計(jì)的信息化程度以及統(tǒng)計(jì)的方式都存在著差異化,所以對(duì)南京地鐵AFC系統(tǒng)的整個(gè)線網(wǎng)的運(yùn)行情況只能做到基礎(chǔ)的統(tǒng)計(jì)和分析,難以達(dá)到對(duì)細(xì)節(jié)的監(jiān)視,無法對(duì)線網(wǎng)的運(yùn)行狀態(tài)進(jìn)行實(shí)時(shí)評(píng)估和分析,不能滿足南京地鐵網(wǎng)絡(luò)化運(yùn)營(yíng)和提高AFC系統(tǒng)服務(wù)的質(zhì)量。因此,結(jié)合目前南京地鐵網(wǎng)絡(luò)化運(yùn)營(yíng)的需求和特點(diǎn)利用數(shù)據(jù)挖掘技術(shù)和數(shù)據(jù)處理技術(shù),深度挖掘南京地鐵自動(dòng)售檢票系統(tǒng)數(shù)據(jù)中的潛在有用的信息,將成為我們南京地鐵未來發(fā)展和研究方向。它可以大大提高我們運(yùn)營(yíng)管理人員的工作效率全面實(shí)現(xiàn)高效的信息化管理,能夠使我們?nèi)婕?xì)致的監(jiān)控到我們AFC系統(tǒng)的運(yùn)行狀態(tài),實(shí)現(xiàn)智能化和自動(dòng)化的輔助決策,為運(yùn)營(yíng)企業(yè)帶來巨大的信息價(jià)值和社會(huì)經(jīng)濟(jì)效益,為城市未來的軌道交通發(fā)展規(guī)劃建設(shè)和運(yùn)營(yíng)提供有利的指導(dǎo)。
2 數(shù)據(jù)挖掘技術(shù)
2.1 數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘其實(shí)就是一種深層次數(shù)據(jù)分析,就是從大量的、不完整的、模糊的,隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的,人們事先不知道的,但是又是潛在有用的信息和知識(shí)的過程。
2.2 數(shù)據(jù)挖掘方法
數(shù)據(jù)挖掘又稱數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),是目前人工智能和數(shù)據(jù)庫(kù)領(lǐng)域研究的熱點(diǎn)問題,所謂數(shù)據(jù)挖掘是指從數(shù)據(jù)庫(kù)的大量數(shù)據(jù)中揭示出隱含的、先前未知的并有潛在價(jià)值的信息的非平凡過程利用數(shù)據(jù)挖掘進(jìn)行數(shù)據(jù)分析常用的方法主要有分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、特征、變化和偏差分析、Web頁(yè)挖掘等,它們分別從不同的角度對(duì)數(shù)據(jù)進(jìn)行挖掘。
3 數(shù)據(jù)挖掘技術(shù)在AFC系統(tǒng)中的應(yīng)用
南京地鐵AFC系統(tǒng)的數(shù)據(jù)主要包括交易數(shù)據(jù)、審計(jì)數(shù)據(jù),事情數(shù)據(jù)等。這些數(shù)據(jù)涉及到公司的運(yùn)營(yíng)經(jīng)營(yíng)情況,是公司運(yùn)營(yíng)管理的重要基礎(chǔ),公司需要從這些數(shù)據(jù)中獲取信息來滿足運(yùn)營(yíng)收益、客流、票卡信息和維修等管理的要求。根據(jù)數(shù)據(jù)挖掘技術(shù)的知識(shí)類型和任務(wù)目標(biāo),將數(shù)據(jù)挖掘技術(shù)應(yīng)用于AFC系統(tǒng),主要可以實(shí)現(xiàn)數(shù)據(jù)統(tǒng)計(jì)和信息預(yù)測(cè)分析,其主要過程是從以下幾個(gè)方面進(jìn)行:
3.1 數(shù)據(jù)信息調(diào)研
3.1.1 資料收集
收集源系統(tǒng)源、系統(tǒng)需求文檔、操作手冊(cè)、表結(jié)構(gòu)說明書、代碼值、樣本數(shù)據(jù)和建庫(kù)腳本。
3.1.2 系統(tǒng)與表級(jí)調(diào)研
(1)了解系統(tǒng)架構(gòu)、功能、業(yè)務(wù)以及各個(gè)業(yè)務(wù)功能之前的的關(guān)系。
(2)了解系統(tǒng)的表結(jié)構(gòu),以及表與表之間的主鍵關(guān)系。
3.1.3 字段級(jí)調(diào)研
(1)了解源系統(tǒng)的字段業(yè)務(wù)含義。
(2)對(duì)系統(tǒng)主要字段進(jìn)行研究初步帥選出有用字段。
3.1.4 樣本數(shù)據(jù)分析與ER圖復(fù)原
(1)通過分析樣本數(shù)據(jù)驗(yàn)證前期調(diào)研的結(jié)果、分析表間關(guān)系。
(2)數(shù)據(jù)質(zhì)量的一般性檢查。
(3)確定代碼表取值范圍。
3.1.5 信息調(diào)研報(bào)告編寫
(1)根據(jù)調(diào)研結(jié)果及入倉(cāng)策略帥選入倉(cāng)范圍。
(2)基于信息調(diào)研結(jié)果編寫信息調(diào)研報(bào)告。
3.1.6 信息調(diào)研報(bào)告評(píng)審
(1)分析系統(tǒng)確認(rèn)信息調(diào)研報(bào)告,主要確認(rèn)入倉(cāng)范圍。
(2)評(píng)審信息調(diào)研報(bào)告。
3.2 數(shù)據(jù)模型的建立
數(shù)據(jù)模型概念設(shè)計(jì)包括五個(gè)步驟,各主題迭代進(jìn)行,并不斷優(yōu)化形成最終的概念模型設(shè)計(jì)與概念模式設(shè)計(jì)說明書。
3.2.1 主實(shí)體數(shù)據(jù)準(zhǔn)入
確定源系統(tǒng)數(shù)據(jù)入個(gè)主題主實(shí)體原則、范圍。
3.2.2 實(shí)體分類
(1)確定個(gè)主題主實(shí)體的分類標(biāo)注。
(2)根據(jù)分類標(biāo)準(zhǔn)建立主實(shí)體的數(shù)據(jù)分類。
(3)分類要求:分類標(biāo)準(zhǔn)明確統(tǒng)一,分類全面,擴(kuò)展性強(qiáng),便于理解。
3.2.3 ID生成規(guī)則
(1)制定各類編號(hào)的生成規(guī)則。
(2)要求:無業(yè)務(wù)含義,根據(jù)源系統(tǒng)的字段生成,預(yù)留足夠程度便于擴(kuò)展。
3.2.4 數(shù)據(jù)整合
(1)對(duì)分布在各源系統(tǒng)的主數(shù)據(jù)的歸并。
(2)建立分布在各源系統(tǒng)的業(yè)務(wù)數(shù)據(jù)間的關(guān)系。
3.2.5 歷史數(shù)據(jù)
確定各主題需保存歷史的信息,便于追蹤其歷史變化的痕跡。
3.3 數(shù)據(jù)統(tǒng)計(jì)
3.3.1 收益數(shù)據(jù)統(tǒng)計(jì)
收益信息的統(tǒng)計(jì)是對(duì)運(yùn)營(yíng)收入信息的統(tǒng)計(jì),主要包括車站級(jí)各類設(shè)備售賣情況的統(tǒng)計(jì)、中央級(jí)各類設(shè)備的交易數(shù)據(jù)和審核數(shù)據(jù)的統(tǒng)計(jì)。
3.3.2 客流信息統(tǒng)計(jì)
(1)客流統(tǒng)計(jì)量通常有進(jìn)站客流、出站客流、換乘客流統(tǒng)通過對(duì)閘機(jī)交易數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,反應(yīng)各個(gè)車站交通客流的特征,幫助客運(yùn)組織優(yōu)化、票務(wù)組織優(yōu)化、實(shí)現(xiàn)行車組織優(yōu)化、設(shè)備布局優(yōu)化等從而科學(xué)的指導(dǎo)公司運(yùn)營(yíng)組織方案。
(2)特殊節(jié)假日客流分析,通過對(duì)特殊節(jié)假日客流的分析來實(shí)施公司的運(yùn)輸組織方案。
3.3.3 數(shù)據(jù)完整性統(tǒng)計(jì)
為了確保AFC系統(tǒng)數(shù)據(jù)的完整性主要從交易文件的連續(xù)性、交易流水號(hào)的連續(xù)性和設(shè)備數(shù)據(jù)文件上傳時(shí)間的延續(xù)性等幾個(gè)方面進(jìn)行統(tǒng)計(jì)分析。
3.3.4 數(shù)據(jù)異常信息的統(tǒng)計(jì)
(1)統(tǒng)計(jì)交易文件中線路、車站、交易類型、票種、交易時(shí)間等的合法性。
(2)統(tǒng)計(jì)異常交易文件,如MAC、TAC錯(cuò)誤的文件。
(3)統(tǒng)計(jì)設(shè)備審計(jì)文件AR值的累計(jì)情況,是否有跳變、重置、清零的情況。
(4)統(tǒng)計(jì)審計(jì)文件AR值的合法性,是否有負(fù)數(shù)、較大數(shù)值。
(5)統(tǒng)計(jì)UD與AR的差異情況,對(duì)每筆差異能自動(dòng)分析其原因。
(6)統(tǒng)計(jì)SC、LC、ACC按設(shè)備、票種、交易類型統(tǒng)計(jì)的交易總筆數(shù)及總金額,對(duì)筆差異自動(dòng)分析其原因。
3.3.5 票卡信息的統(tǒng)計(jì)
票卡信息的統(tǒng)計(jì)包括票卡的流動(dòng)、使用情況、庫(kù)存分類、庫(kù)存調(diào)撥等情況,反映了各級(jí)管理中心庫(kù)存狀態(tài)的變化和各個(gè)車站對(duì)票卡的需求,是票務(wù)管理實(shí)施的基礎(chǔ)。
4 結(jié)束語
為了進(jìn)一步提高南京地鐵運(yùn)營(yíng)的管理水平和智能化程度,我們把數(shù)據(jù)挖掘技術(shù)引入到我們的票務(wù)管理系統(tǒng)中,本文主要從整體上闡述了引入數(shù)據(jù)挖掘技術(shù)的背景、數(shù)據(jù)挖掘技術(shù)的概念、數(shù)據(jù)挖掘的方法以及數(shù)據(jù)數(shù)據(jù)挖掘技術(shù)在我們AFC系統(tǒng)的具體實(shí)際應(yīng)用,使的我們南京地鐵運(yùn)營(yíng)管理更加信息化,自動(dòng)化和智能化。