李廣
摘 要 隨著我國社會經(jīng)濟飛速發(fā)展,私家車以及大貨車等各種交通工具數(shù)量大幅度增加,各高速公路上經(jīng)常出現(xiàn)交通運行不暢的現(xiàn)象,交通事故也時有發(fā)生。針對這一情況,應(yīng)當結(jié)合大數(shù)據(jù)分析技術(shù),構(gòu)建智能交通系統(tǒng),本文將圍繞著基于交通大數(shù)據(jù)的智能分析決策技術(shù)展開論述,對構(gòu)建ITS數(shù)據(jù)挖掘平臺和設(shè)計數(shù)據(jù)倉庫的策略進行分析。
關(guān)鍵詞 數(shù)據(jù)倉庫;數(shù)據(jù)挖掘;智能交通系統(tǒng)
引言
就目前的交通系統(tǒng)建設(shè)來看,交通智能化趨勢十分明顯,數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)倉庫設(shè)計等基于交通大數(shù)據(jù)的智能分析決策技術(shù)的研究和應(yīng)用是交通設(shè)計領(lǐng)域中的熱門話題,能夠有效提升交通管理的水平和效率。國內(nèi)外眾多學者都對數(shù)據(jù)挖掘技術(shù)在交通設(shè)計中多樣化應(yīng)用、模型的構(gòu)建等內(nèi)容進行了研究和分析,關(guān)于這些問題都得到了專家學者的關(guān)注。
1ITS數(shù)據(jù)挖掘平臺
構(gòu)建ITS數(shù)據(jù)挖掘平臺首先要進行框架的設(shè)計,設(shè)計人員在設(shè)計過程中應(yīng)當對信息處理流程進行把握,從平臺的功能出發(fā),參考一般情況下的數(shù)據(jù)信息綜合信息平臺的構(gòu)架,還要特別注意ITS平臺的特殊性和處理對象的特點,接著設(shè)計人員要掌握ITS數(shù)據(jù)挖掘平臺的數(shù)據(jù)組織策略,關(guān)鍵在于交通數(shù)據(jù)倉庫的構(gòu)建,這就要求把智能交通系統(tǒng)中的所有數(shù)據(jù)進行綜合處理。構(gòu)建ITS數(shù)據(jù)挖掘平臺的重點在于要將系統(tǒng)模型中融入數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù),形成一個層次性的結(jié)構(gòu),結(jié)構(gòu)可以按照不同的層次分為數(shù)據(jù)層、算法層、分析層和應(yīng)用層。這樣ITS數(shù)據(jù)平臺才能夠?qū)崿F(xiàn)跨平臺的應(yīng)用,并且提升系統(tǒng)的靈活性,促使系統(tǒng)從實際情況出發(fā)分析出最佳應(yīng)用方式??偠灾?,在ITS數(shù)據(jù)挖掘平臺的構(gòu)建過程中,不僅僅要進行數(shù)據(jù)信息集成處理平臺,更重要的是在數(shù)據(jù)倉庫的基礎(chǔ)上進行數(shù)據(jù)挖掘技術(shù)的應(yīng)用,對數(shù)據(jù)信息進行深化處理,才能夠豐富平臺的功能性,促進數(shù)據(jù)信息的處理效率和水平,獲得更好的數(shù)據(jù)挖掘技術(shù)的應(yīng)用效果[1]。
2數(shù)據(jù)倉庫的設(shè)計策略
2.1 數(shù)據(jù)倉庫的概念模型
交通數(shù)據(jù)倉庫概念模型的構(gòu)建是以決策分析主題作為中心的,圍繞著不同的決策分析主題進行數(shù)據(jù)集成分析,將與分析決策主題相關(guān)的數(shù)據(jù)列入相應(yīng)的數(shù)據(jù)倉庫。例如,當決策分析主題是短時交通流預測時,相應(yīng)的模型事實屬性就是流量、速度、占有率,維度屬性就是時間、路段、天氣情況;當決策分析主題是交通狀態(tài)辨識時,相應(yīng)的模型事實屬性就是流量、速度、占有率、狀態(tài)等級,維度屬性就是時間、路段、流量等級、速度等級、占有率等級、天氣情況、狀態(tài)類型。在概念模型中對主題和主體之間進行描述可以借助E-R圖來完成。圖中間的長方形代表的是主題,上方和下方的橢圓形表示的是主題相關(guān)的事實屬性和維度屬性,長方形和橢圓形之間用無向邊來連接,無向邊所表示的聯(lián)系是一對一,有向邊所表示的聯(lián)系是一對多或者多對多。
2.2 數(shù)據(jù)倉庫的邏輯模型
在交通數(shù)據(jù)倉庫的構(gòu)建過程中,進行邏輯模型設(shè)計時主要是以關(guān)系數(shù)據(jù)庫為基礎(chǔ)完成星型模型的構(gòu)建。例如,進行交通狀態(tài)辨識主題的邏輯模型構(gòu)建時,中間是交通狀態(tài)事實表,內(nèi)容是與交通流情況有所聯(lián)系的信息、數(shù)據(jù)屬性,左右兩側(cè)是信息屬性具體的數(shù)據(jù)內(nèi)容表,也就是維度表。事實表中含有一定的數(shù)據(jù)屬性,也就是流量、速度、占有率。在數(shù)據(jù)倉庫發(fā)揮交通狀態(tài)辨識功能時,從事實表出發(fā)查詢,就可以獲得相關(guān)的多項數(shù)據(jù)信息內(nèi)容,而不用再對多個屬性表進行連接,這樣就很大程度上縮短了查詢的時間,提升了查詢效率[2]。
2.3 數(shù)據(jù)倉庫的物理模型
物理模型的構(gòu)建有多重作用,能夠解決數(shù)據(jù)索引策略問題,有助于進行數(shù)據(jù)存儲設(shè)計,提升存儲分配水平。模型所針對的主要有兩點,分別是提高系統(tǒng)性能和提升存儲數(shù)據(jù)管理的水平和效率。數(shù)據(jù)倉庫的數(shù)據(jù)量很大,在多維查詢的OLAP中,索引的重要性不言而喻。這就要求保證數(shù)據(jù)存取路徑的正確性,提升索引的有效性,以便減少數(shù)據(jù)讀取時間以及提高數(shù)據(jù)檢索效率。在數(shù)據(jù)倉庫中常用的索引策略有四種:B-Tree索引、位圖索引、廣義索引以及連接索引。當今主流商業(yè)數(shù)據(jù)中已普遍實現(xiàn)了位圖索引,因此本系統(tǒng)采用位圖索引是合適的。
3智能交通數(shù)據(jù)挖掘系統(tǒng)的應(yīng)用
3.1 創(chuàng)造系統(tǒng)所需的軟硬件環(huán)境
要想在實際的交通管理中應(yīng)用智能交通數(shù)據(jù)挖掘系統(tǒng),就要創(chuàng)造出系統(tǒng)運營所需的軟硬件環(huán)境。首先要對系統(tǒng)內(nèi)的多項子系統(tǒng)進行了解,這些子系統(tǒng)分別是數(shù)據(jù)區(qū)、交通應(yīng)用區(qū)、GIS區(qū)、通信區(qū)和終端區(qū),然后為各個子系統(tǒng)配備相應(yīng)的服務(wù)器等操作終端,例如為數(shù)據(jù)區(qū)子系統(tǒng)配備數(shù)據(jù)區(qū)服務(wù)器,為通信區(qū)子系統(tǒng)配備通信服務(wù)器,以此來保證各個子系統(tǒng)的正常運行。除此之外,還要設(shè)置綜合交通應(yīng)用服務(wù)器操作系統(tǒng)和數(shù)據(jù)庫服務(wù)器。
3.2 把握系統(tǒng)的設(shè)計要點
要保證智能交通數(shù)據(jù)挖掘系統(tǒng)正常運轉(zhuǎn),還要做好系統(tǒng)設(shè)計。這就要求對數(shù)據(jù)倉庫進行全方位的了解和掌握,將其中的數(shù)據(jù)組織與顯示方式作為出發(fā)點,通過B/S的體系結(jié)構(gòu)完成系統(tǒng)設(shè)計,對系統(tǒng)模塊的功能開展設(shè)計時要注意以下內(nèi)容,多維數(shù)據(jù)集定制模塊:可以方便地對所要分析的多維數(shù)據(jù)集的維度進行設(shè)置,導入所用分析的維度,或過濾掉此維度。圖表顯示模塊:可以靈活配置圖表類型、橫軸、縱軸的名稱,顯示的字體,圖表的大小,圖例顯示等并實現(xiàn)結(jié)果顯示功能。數(shù)據(jù)挖掘模型選擇模塊:可以根據(jù)所要分析數(shù)據(jù)的特點以及分析的目標,合理的確定所要應(yīng)用的挖掘模型。
4結(jié)束語
綜上所述,為了促進交通問題的解決,構(gòu)建智能交通系統(tǒng),給人們的日常生活提供便利,給經(jīng)濟發(fā)展創(chuàng)造有利條件,應(yīng)當合理應(yīng)用智能分析決策技術(shù)。這就要求構(gòu)建ITS數(shù)據(jù)挖掘平臺和設(shè)計交通數(shù)據(jù)倉庫,對基于交通大數(shù)據(jù)的智能分析決策技術(shù)進行研究和應(yīng)用,有利于將交通建設(shè)與數(shù)字信息技術(shù)合理結(jié)合在一起,提升交通系統(tǒng)的智能化程度,更好地對實際路況信息進行掌握,更好地做出決策。
參考文獻
[1] 章威.廣州市ITS共用信息平臺體系結(jié)構(gòu)與關(guān)鍵算法研究[D].廣州:華南理工大學,2007.
[2] 楊宏旭.上海市公路網(wǎng)交通信息化與智能化關(guān)鍵技術(shù)研究[D].上海:同濟大學,2006.