■薛 陽
(中國人民大學)
在經(jīng)濟飛速發(fā)展背景下,當下經(jīng)濟統(tǒng)計所需要的數(shù)據(jù)量十分龐大,根據(jù)數(shù)據(jù)統(tǒng)計者的統(tǒng)計數(shù)據(jù)的情況,如果僅僅適用數(shù)理知識的采集,缺少對經(jīng)濟數(shù)據(jù)的深入挖掘,就會導致統(tǒng)計結(jié)果缺少準確性。而且統(tǒng)計數(shù)量也會隨著時間累計而不斷增加,數(shù)據(jù)類別也會拓展,基于這種情況,如果依然沿用傳統(tǒng)數(shù)據(jù)統(tǒng)計模式,并不能解決統(tǒng)計結(jié)果不準確的問題,也無法實現(xiàn)全面的數(shù)據(jù)統(tǒng)計和分析。數(shù)據(jù)挖掘技術(shù)是一種全新的數(shù)據(jù)統(tǒng)計方式,能夠橫向?qū)?shù)據(jù)深入挖掘,更好地滿足社會對于經(jīng)濟統(tǒng)計數(shù)據(jù)結(jié)果準確性和科學分析與決策的需求。
數(shù)據(jù)挖掘技術(shù)是創(chuàng)新技術(shù)應(yīng)用手段,對數(shù)據(jù)庫各類信息深入挖掘,找到對自身有價值的信息,提高信息分析和處理的效率。其應(yīng)用原理是將原本復(fù)雜且多變的數(shù)據(jù)庫通過對數(shù)據(jù)信息的簡化,提取其中有價值和符合需求的數(shù)據(jù),在此基礎(chǔ)上,在對數(shù)據(jù)進行深入分析、歸納和整合,以此高效利用數(shù)據(jù)。結(jié)合我國目前經(jīng)濟數(shù)據(jù)信息情況,我國有著龐大的數(shù)據(jù)信息儲量,并且這些數(shù)據(jù)信息并不具備很強的規(guī)律性和完備性,很多數(shù)據(jù)信息的隨意性比較強,而且很多數(shù)據(jù)信息存在缺失的情況,面對這種情況,以往按照一般化數(shù)據(jù)統(tǒng)計方法無法確保數(shù)據(jù)處理效率,尤其對信息不健全、數(shù)據(jù)信息隨意性強的問題,無法系統(tǒng)化、科學化的加以分析,自然會增加數(shù)據(jù)統(tǒng)計和分析結(jié)果的準確性。但是數(shù)據(jù)挖掘技術(shù)則不同,它可以有效解決這一問題,能夠利用數(shù)據(jù)統(tǒng)計軟件以及相應(yīng)的程序算法,能夠?qū)Σ煌暾㈦S意性強的數(shù)據(jù)信息按照系統(tǒng)的程序進行科學、有序歸類。方便數(shù)據(jù)使用人員對所需要的數(shù)據(jù)信息的調(diào)取與應(yīng)用,能夠高效找到有價值的數(shù)據(jù),不需要依靠人為操作,就能夠?qū)λ鸭臄?shù)據(jù)自動加工與處理,并綜合分析對比,具有很強的實用性價值[1]。
決策樹方法主要是挖掘數(shù)據(jù)中包含的有意義的、有價值的信息,并對這些數(shù)據(jù)信息進行集中整合,并且深度處理,保證開發(fā)的項目以更加全面,推動系統(tǒng)優(yōu)化升級。與此同時,在實踐應(yīng)用中,可以從復(fù)雜的數(shù)據(jù)庫中有效提取有價值的信息,確保達到數(shù)據(jù)整合與分析的目標,進行科學有效的預(yù)測,從海量的數(shù)據(jù)信息中深入挖掘出數(shù)據(jù)的實際價值,決策樹會形成完整的流程圖,建造數(shù)據(jù)分析和處理結(jié)構(gòu),決策樹相當于數(shù)據(jù)分析的載體,每個根節(jié)點和葉子節(jié)點之間展現(xiàn)的是數(shù)據(jù)之間的排列組合方式,按照系統(tǒng)算法內(nèi)在操作方式,實現(xiàn)數(shù)據(jù)信息的整合,每個葉子節(jié)點所展示的就是對數(shù)據(jù)分類和預(yù)測后的結(jié)果,在此基礎(chǔ)上可以對變量實施測試,而決策樹的分枝則體現(xiàn)了變量測試結(jié)果的可能性。
決策樹可以很好地解決日常生活的決策性問題,具有很強的實用性。比如:在一家餐廳,管理人員想要確定服務(wù)人員的實際數(shù)量,以此實現(xiàn)對服務(wù)人員數(shù)量以及餐廳支出成本與勞動資源的協(xié)調(diào)性管理,統(tǒng)籌規(guī)劃,合理利用,能夠最大限度上節(jié)約資源,同時,還能確保在飯點時顧客增多而服務(wù)人員數(shù)量不夠的情況,還可以有效解決這一問題。為此,就需要根據(jù)這家餐廳的顧客量對服務(wù)人員的數(shù)量進行有效調(diào)整,以此既能達到應(yīng)有的服務(wù)效能,還能確保最大的經(jīng)濟效益。比如:參照餐廳7月份的顧客量的數(shù)據(jù),構(gòu)建決策樹模型,綜合相關(guān)因素分析,在下雨天雖然也有顧客量到餐廳吃飯,但是相對來說要比平常的顧客數(shù)量有所減少,在天氣晴朗或者特定節(jié)日,顧客數(shù)量會有所增加,這時通過決策樹的方式對數(shù)據(jù)以及相關(guān)影響要素進行綜合把握,對餐廳服務(wù)人員的數(shù)量進行確認,獲得準確的統(tǒng)計結(jié)果。所以綜合得出的方案就是對特定時期雇傭臨時服務(wù)人員,加強在顧客量增多時段服務(wù)人員的配備數(shù)量,以此確保經(jīng)濟效益最大化。
數(shù)據(jù)集成方法主要體現(xiàn)在兩個方面:一是模式集成方法。數(shù)據(jù)挖掘技術(shù)可以在科技的輔助下,拓寬發(fā)展領(lǐng)域,但由于我國數(shù)據(jù)庫數(shù)據(jù)儲量較為龐大且包含很多復(fù)雜的因素,不同數(shù)據(jù)之間的關(guān)系以及數(shù)據(jù)的完整性方面,都需要綜合考慮到位,對同一文件的不同數(shù)據(jù),以及對不同數(shù)據(jù)關(guān)系和數(shù)據(jù)是否有缺失等問題,就可以有效識別,并對數(shù)據(jù)按照一定規(guī)律進行分類和整理,同時能夠有效管理和把握這些數(shù)據(jù),從中選擇有用的數(shù)據(jù)應(yīng)用到實際中。
二是冗余問題。對數(shù)據(jù)之間的相關(guān)性實施有效的判定,利用數(shù)學計算公式來加強對相關(guān)數(shù)據(jù)的科學判斷,確定數(shù)據(jù)之間的相互關(guān)系,這種方法也常常會用于購房中,主要是對購房者收入、購房價值以及購房能力的有效判斷。
如今,面對計算機技術(shù)、大數(shù)據(jù)等各項信息技術(shù)的發(fā)展,數(shù)據(jù)挖掘技術(shù)功能價值也逐漸凸顯出來,并在諸多領(lǐng)域中得到了廣泛的應(yīng)用。近年來,社會經(jīng)濟活動日益頻繁,在此背景下,信息量呈現(xiàn)爆炸式發(fā)展,不斷增多的信息也讓經(jīng)濟結(jié)構(gòu)變得更加復(fù)雜,為了高效管理數(shù)據(jù)信息,把握住信息的實際價值,就需要加強對信息的精細化管理,這樣也滿足了不同領(lǐng)域?qū)?shù)據(jù)分析的需求。數(shù)據(jù)挖掘技術(shù)以強大的統(tǒng)計能力、數(shù)據(jù)挖掘能力以及對數(shù)據(jù)之間的關(guān)系的自動分析和歸納能力等,其中這項技術(shù)在經(jīng)濟統(tǒng)計應(yīng)用中,發(fā)揮著極強的功能作用,能夠?qū)ζ髽I(yè)經(jīng)營、業(yè)務(wù)進展、數(shù)據(jù)使用人員之間的有效溝通等,提供便捷高效的服務(wù),對經(jīng)濟數(shù)據(jù)的整理和分類以科學有效方式,整理出準確的數(shù)據(jù)統(tǒng)計結(jié)果[2]。
數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計工作中其應(yīng)用價值十分顯著,通過對經(jīng)濟數(shù)據(jù)的科學處理和再加工,對原有數(shù)據(jù)重新歸類和分析,組成需要的內(nèi)容,保障數(shù)據(jù)發(fā)揮應(yīng)有的價值,也為數(shù)據(jù)管理人員提供便捷的數(shù)據(jù)統(tǒng)計和分析服務(wù),進一步強化了傳統(tǒng)數(shù)據(jù)統(tǒng)計工作效能,讓我國在經(jīng)濟數(shù)據(jù)領(lǐng)域的分析、統(tǒng)計與整理能力等方面得到了強化,并且可以利用數(shù)據(jù)挖掘技術(shù)深入挖掘出更有意義和更有價值的數(shù)據(jù)信息,提升經(jīng)濟統(tǒng)計分析作用,有助于提升數(shù)據(jù)信息管理效率,確保經(jīng)濟統(tǒng)計信息的真實性和數(shù)據(jù)分析結(jié)果的可靠性[3]。此外,目前,很多企業(yè)各部門在經(jīng)營管理過程中會形成各種各樣的經(jīng)濟統(tǒng)計信息,信息的內(nèi)容是經(jīng)濟管理必要的基礎(chǔ)條件。但是管理部門涉及的經(jīng)濟領(lǐng)域與經(jīng)營管理方面存在一定的差異,而且管理方式和權(quán)限范圍也有很大的不同,面對這種情況,就需要促進各部門的有效協(xié)同,建構(gòu)統(tǒng)一化的信息統(tǒng)計體系和處理方式。
數(shù)據(jù)挖掘技術(shù)應(yīng)用于宏觀型數(shù)據(jù)庫中取得了良好的效果。如果按照我國傳統(tǒng)經(jīng)濟數(shù)據(jù)統(tǒng)計分析所使用的方法,信息采集、分析與處理的效率是無法滿足實際需求的,會滯后于時代發(fā)展,缺少準確識別不同數(shù)據(jù)信息之間的關(guān)系的科學性。多數(shù)數(shù)據(jù)使用者在對數(shù)據(jù)進行全方面的管理時,往往無法實現(xiàn)數(shù)據(jù)高效分析與統(tǒng)計的目標,會產(chǎn)生很多阻礙問題。數(shù)據(jù)挖掘技術(shù)可以在宏觀經(jīng)濟統(tǒng)計數(shù)據(jù)庫中發(fā)揮實際作用,其良好的適應(yīng)性能夠借助宏觀經(jīng)濟統(tǒng)計數(shù)據(jù)庫在這一平臺,發(fā)揮出自身的特性和優(yōu)勢,確保獲得的數(shù)據(jù)分析結(jié)果的精確度,而且以最快的速度對不同數(shù)據(jù)進行優(yōu)化處理,綜合分析出更有效的宏觀經(jīng)濟統(tǒng)計數(shù)據(jù)[4]。
定義目標階段作為數(shù)據(jù)挖掘過程的起始階段,需要做好開始的準備,應(yīng)結(jié)合數(shù)據(jù)統(tǒng)計者以及相關(guān)行業(yè)領(lǐng)域的研究學者的要求,綜合制定挖掘目標,這樣才能讓定義的挖掘目標以及所產(chǎn)生的實際數(shù)據(jù)挖掘結(jié)果保持一致。為此需要相關(guān)應(yīng)用領(lǐng)域的專家和具有數(shù)據(jù)挖掘技術(shù)工作經(jīng)驗的人員共同定義目標,一是在定義數(shù)據(jù)挖掘目標的同時,也需要對算法進行演算,多方對比后,保障定義目標產(chǎn)生的相應(yīng)的準確結(jié)果;二是立足于工作實際來確定目標。將數(shù)據(jù)挖掘技術(shù)應(yīng)用到經(jīng)濟統(tǒng)計中,按照一定的挖掘流程,收集數(shù)據(jù)庫中需要的相關(guān)數(shù)據(jù)。
數(shù)據(jù)準備階段是數(shù)據(jù)挖掘及應(yīng)用時間最長,是整個數(shù)據(jù)挖掘流程中起著至關(guān)重要的發(fā)展階段,需要充分重視。在準備階段主要分為三個方面:一是數(shù)據(jù)的挑選。數(shù)據(jù)的挑選主要從宏觀經(jīng)濟統(tǒng)計數(shù)據(jù)庫中選擇相關(guān)聯(lián)的數(shù)據(jù),并對數(shù)據(jù)進行科學篩選與排列,結(jié)合數(shù)據(jù)定義,將這些所需要的和選擇的數(shù)據(jù)作為目標數(shù)據(jù)。二是數(shù)據(jù)的處理,主要是應(yīng)用數(shù)據(jù)分析和處理技術(shù)對篩選的數(shù)據(jù)進行初步的整合,找到符合需求的數(shù)據(jù)。三是數(shù)據(jù)變化,利用數(shù)據(jù)變換功能對數(shù)據(jù)進行簡化,達到深層次挖掘數(shù)據(jù)的目的。
數(shù)據(jù)挖掘階段的第一操作步驟需要預(yù)定算法,其實質(zhì)就是采用什么樣的條件來對變化的數(shù)據(jù)源進行科學挑選,深入挖掘,按照算法完成目標工作。并在這一過程中,需要相關(guān)領(lǐng)域?qū)I(yè)和數(shù)據(jù)挖掘技術(shù)人員進行操作,挖掘數(shù)據(jù)的關(guān)鍵要點。在此階段,數(shù)據(jù)挖掘技術(shù)應(yīng)用到經(jīng)濟統(tǒng)計中主要體現(xiàn)在三個方面:一是數(shù)據(jù)集成方式為經(jīng)濟數(shù)據(jù)統(tǒng)計的精確性奠定基礎(chǔ);二是將預(yù)處理應(yīng)用到數(shù)據(jù)挖掘中,在原有數(shù)據(jù)基礎(chǔ)上進行智能化、自動化分析與處理;三是通過回歸分析找出變量間的關(guān)系。
評估與結(jié)果展示是經(jīng)過上述各階段數(shù)據(jù)統(tǒng)計和分析過程所獲得最終數(shù)據(jù)結(jié)果的尾聲階段,數(shù)據(jù)的使用者需要對數(shù)據(jù)挖掘結(jié)果做一個系統(tǒng)的分析和總結(jié),并利用數(shù)據(jù)挖掘技術(shù)分析得到的數(shù)據(jù)結(jié)果進行展示,借助自動數(shù)據(jù)生成功能,形成完整的數(shù)據(jù)評估結(jié)論報告,經(jīng)過相關(guān)操作和選擇的數(shù)據(jù),保留符合工作需求且有實際價值 信息,如果不符合要求,信息也缺少完整性,系統(tǒng)也會按照內(nèi)部操作程序自動對這部分數(shù)據(jù)進行重新篩選,返回上一步操作,再進行重新分析,確保最終獲得而定數(shù)據(jù)符合要求。
數(shù)據(jù)使用者使用的數(shù)據(jù)如果和目標數(shù)據(jù)不相符合,需要具體情況具體分析,結(jié)合系統(tǒng)數(shù)據(jù)中的各種變化情況,利用數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)科學分析。但是理論與實際還存在一定的差異,我國數(shù)據(jù)挖掘技術(shù)的發(fā)展層次還有待提升,其發(fā)展水平并不足以應(yīng)對當前數(shù)據(jù)發(fā)展的難題,缺少與之相對應(yīng)的數(shù)據(jù)挖掘功能。
所以還需要技術(shù)研究者加強對數(shù)據(jù)挖掘技術(shù)的研究,設(shè)計出更多有效的數(shù)據(jù)挖掘系統(tǒng),及時攻克數(shù)據(jù)統(tǒng)計難關(guān)。
數(shù)據(jù)挖掘技術(shù)可以從宏觀經(jīng)濟統(tǒng)計數(shù)據(jù)庫中對各類數(shù)據(jù)進行篩選,利用自動化數(shù)據(jù)分析功能,對數(shù)據(jù)進行深度挖掘,并根據(jù)相應(yīng)的算法將數(shù)據(jù)應(yīng)用到實際當中,對不完整的數(shù)據(jù)進行完善,找出相似數(shù)據(jù)存在的規(guī)律性。同時,利用數(shù)據(jù)挖掘技術(shù)可以幫助數(shù)據(jù)使用者提升應(yīng)用效率,簡化數(shù)據(jù)結(jié)果。
經(jīng)濟數(shù)據(jù)統(tǒng)計過程需要確保安全性,防止數(shù)據(jù)挖掘和分析過程中造成數(shù)據(jù)丟失或者泄露,保證所挖掘的數(shù)據(jù)結(jié)果和經(jīng)濟數(shù)據(jù)統(tǒng)計的保密性。伴隨著科技的發(fā)展,數(shù)據(jù)使用者也對數(shù)據(jù)挖掘結(jié)果的保密性和安全性更加重視,著重強調(diào)數(shù)據(jù)的隱私。
數(shù)據(jù)挖掘技術(shù)不僅在經(jīng)濟統(tǒng)計中發(fā)揮優(yōu)勢作用,并且在諸多領(lǐng)域中也得到了廣泛的普及與應(yīng)用,有助于加強企業(yè)數(shù)據(jù)管理水平和提升經(jīng)濟效益,實現(xiàn)對多元數(shù)據(jù)以及不同變化的科學歸類和高效處理,可見數(shù)據(jù)挖掘技術(shù)對經(jīng)濟統(tǒng)計方面的重要作用,可以加速推動我國經(jīng)濟發(fā)展,為我國經(jīng)濟數(shù)據(jù)統(tǒng)計,獲得準確的數(shù)據(jù)結(jié)果,提供有效服務(wù)。