邱建舒 艾泓宇 四川大學(xué)華西第二醫(yī)院
目前,我國市場經(jīng)濟(jì)正保持穩(wěn)步提升的發(fā)展?fàn)顟B(tài),且時有爆炸性增長的情況出現(xiàn),這促使經(jīng)濟(jì)統(tǒng)計工作中,涉及的數(shù)據(jù)規(guī)模日漸龐大,與此同時,經(jīng)濟(jì)市場的越發(fā)繁榮,必然會導(dǎo)致經(jīng)濟(jì)數(shù)據(jù)信息更為繁雜,在這一背景下,市場經(jīng)濟(jì)的發(fā)展,對經(jīng)濟(jì)統(tǒng)計工作的準(zhǔn)確性、高效性提出更高要求[1]。正因如此,我國經(jīng)濟(jì)統(tǒng)計相關(guān)部門,正在持續(xù)探索如何提高經(jīng)濟(jì)統(tǒng)計工作水平,不斷創(chuàng)新統(tǒng)計的模式與方法。數(shù)據(jù)挖掘技術(shù)的成熟,促使經(jīng)濟(jì)統(tǒng)計工作取得了新的思路與方法,可以實現(xiàn)經(jīng)濟(jì)統(tǒng)計中海量數(shù)據(jù)的資源整合,且可在最短時間內(nèi),對數(shù)據(jù)進(jìn)行準(zhǔn)確挖掘及分析,促使數(shù)據(jù)統(tǒng)計質(zhì)量不斷提升,所獲取的信息也更為準(zhǔn)確、廣泛[2]。
數(shù)據(jù)挖掘技術(shù)是人工智能領(lǐng)域和數(shù)據(jù)庫領(lǐng)域重要的研究內(nèi)容,屬于多學(xué)科交叉技術(shù)。具體而言,數(shù)據(jù)挖掘是指從隨機(jī)、模糊的海量數(shù)據(jù)中,挖掘、提取出具有一定價值的數(shù)據(jù)這一過程,主要是在神經(jīng)網(wǎng)絡(luò)、統(tǒng)計學(xué)、可視化技術(shù)、模式識別、人工智能基礎(chǔ)上開展。簡單來說,數(shù)據(jù)挖掘技術(shù)即從冗雜、海量的數(shù)據(jù)中,提取有價值信息的技術(shù)方法,可以實現(xiàn)數(shù)據(jù)的智能化、自動化分析,并進(jìn)行歸納、整合和推理,從而為決策者提供科學(xué)數(shù)據(jù)支持,以便決策者對市場經(jīng)營策略及時調(diào)整[3]。當(dāng)前信息時代的到來,讓數(shù)據(jù)變化高度復(fù)雜,很多時候必須通過數(shù)據(jù)挖掘,將重要數(shù)據(jù)提取出來,從而對信息數(shù)據(jù)予以整合。因此,數(shù)據(jù)挖掘技術(shù)已經(jīng)成為現(xiàn)代社會重要的分析技術(shù)。
因現(xiàn)代社會需要處理的數(shù)據(jù)量極大,而傳統(tǒng)統(tǒng)計分析的方法,是在未明確假設(shè)的基礎(chǔ)上展開信息挖掘,這樣工作效率相對較低,在解決問題時,效果也不十分理想。換言之,傳統(tǒng)數(shù)據(jù)統(tǒng)計分析方法,并未探索不同數(shù)據(jù)彼此之間內(nèi)在的關(guān)聯(lián),因此其分析工作只能對過去的情況加以反映,而對未來難以提供預(yù)測價值,對于要探索的目標(biāo),也無法獲取相應(yīng)結(jié)論。數(shù)據(jù)挖掘技術(shù)可以將獲取的信息作為基礎(chǔ),獲知潛在、未知的內(nèi)容,是在原有數(shù)據(jù)基礎(chǔ)上,發(fā)現(xiàn)傳統(tǒng)統(tǒng)計分析無法預(yù)料的、人的感官無法察覺的,或是和實際生活相違背的信息[4]??梢哉f,數(shù)據(jù)挖掘技術(shù)是對傳統(tǒng)技術(shù)的高度拓展,是統(tǒng)計分析和人工智能的結(jié)合,符合現(xiàn)代社會對數(shù)據(jù)分析要求不斷提高的現(xiàn)實局面,正因如此,數(shù)據(jù)挖掘結(jié)果在現(xiàn)代社會具有極高應(yīng)用價值。
如今,數(shù)據(jù)挖掘技術(shù)已經(jīng)從其他學(xué)科中,獲取了海量經(jīng)驗與知識。這一技術(shù)具有如下特點:
1.信息數(shù)據(jù)量較大
借助數(shù)據(jù)挖掘技術(shù),可提取出大量信息,其信息可用TB或GB這一容量進(jìn)行描述,可見,數(shù)據(jù)挖掘技術(shù)處理的信息十分復(fù)雜,涉及范圍廣泛。不過在運行中,離不開統(tǒng)計人員對數(shù)據(jù)的精加工、深加工處理。
2.提取關(guān)鍵詞信息
在應(yīng)用數(shù)據(jù)庫的過程中,若用戶未能獲取自身搜尋的信息,或不知自己需要搜尋哪些信息,可借助關(guān)鍵詞來展開搜索,提升查找效率,縮短用戶獲取信息的時間,可促使經(jīng)濟(jì)統(tǒng)計效率大幅提升。
3.可擴(kuò)展性強(qiáng)
計算機(jī)技術(shù)與信息技術(shù)不斷發(fā)展,促使數(shù)據(jù)挖掘技術(shù)內(nèi)部容量逐漸擴(kuò)大,同時數(shù)據(jù)挖掘精準(zhǔn)度也逐漸提升。數(shù)據(jù)挖掘技術(shù)具備的可擴(kuò)展性,使其適應(yīng)性更強(qiáng)。目前我國經(jīng)濟(jì)發(fā)展迅速,經(jīng)濟(jì)信息量不斷增長,經(jīng)濟(jì)統(tǒng)計工作日益繁重,數(shù)據(jù)挖掘技術(shù)的這一特點,能夠滿足經(jīng)濟(jì)統(tǒng)計工作的發(fā)展需求。
借助數(shù)據(jù)挖掘技術(shù),可從海量的原始數(shù)據(jù)中,準(zhǔn)確挖掘出真實性、高價值性的數(shù)據(jù),同時還可對挖掘出的數(shù)據(jù)展開處理、分析,進(jìn)一步提升其價值。在挖掘技術(shù)不斷創(chuàng)新、不斷完善的背景下,這一技術(shù)對于經(jīng)濟(jì)統(tǒng)計的應(yīng)用意義可逐漸提升。在經(jīng)濟(jì)統(tǒng)計工作中,應(yīng)用數(shù)據(jù)挖掘技術(shù),具有如下優(yōu)勢:
在經(jīng)濟(jì)統(tǒng)計中運用數(shù)據(jù)挖掘技術(shù),不僅能對數(shù)據(jù)展開分析,同時也可滿足使用主體對于信息的需求。我國各行各業(yè),在生產(chǎn)運營中均會形成海量的經(jīng)濟(jì)統(tǒng)計信息,而這些信息能夠為經(jīng)營者的經(jīng)濟(jì)管理決策提供重要支持[5]。因為不同管理部門的經(jīng)營管理范圍、所涉及經(jīng)濟(jì)領(lǐng)域各有不同,經(jīng)濟(jì)管控權(quán)限也差異較大,各部門需根據(jù)自身的具體情況,構(gòu)建系統(tǒng)化處理機(jī)制,形成符合自身實際情況的數(shù)據(jù)解讀方式。正因在這一過程中需要處理的數(shù)據(jù)信息量極大,因此不同部門的數(shù)據(jù)統(tǒng)計工作,對數(shù)據(jù)處理信息路徑、數(shù)據(jù)統(tǒng)計系統(tǒng)均提出更高要求。在選擇統(tǒng)計方式及處理方法時,不僅需要考慮不同管理部門具體需求,同時還需根據(jù)需求以不同方式將數(shù)據(jù)換算、呈現(xiàn)出來,從計算層面、信息來源層面,實現(xiàn)信息評估可靠性的提升,從而確保數(shù)據(jù)處理更為全面,更加高效。
運用數(shù)據(jù)挖掘技術(shù),可以構(gòu)建宏觀的數(shù)據(jù)庫,這可對數(shù)據(jù)統(tǒng)計的效果加以優(yōu)化。在具體的數(shù)據(jù)統(tǒng)計工作中,可以借助多元化經(jīng)濟(jì)統(tǒng)計機(jī)制,為經(jīng)濟(jì)管理活動整體的需求提供支持,避免數(shù)據(jù)統(tǒng)計的重復(fù)性。并且,通過這一技術(shù),可對不同的統(tǒng)計系統(tǒng)加以整合,讓數(shù)據(jù)信息彼此融合。因此,借助數(shù)據(jù)挖掘技術(shù)構(gòu)建宏觀的數(shù)據(jù)庫,可以為數(shù)據(jù)優(yōu)化創(chuàng)建更廣闊的平臺,確保統(tǒng)計信息更加完整、準(zhǔn)確。
因數(shù)據(jù)挖掘技術(shù)本質(zhì)上屬于深加工技術(shù),其目的性十分明確,特別是在實際的應(yīng)用范圍之中,可對長期積累的海量數(shù)據(jù)加以統(tǒng)計,對數(shù)據(jù)進(jìn)行解讀,這樣使用者可通過分析數(shù)據(jù),來對其深層次的應(yīng)用價值、象征意義有所了解[6]?,F(xiàn)階段,在應(yīng)用數(shù)據(jù)實踐中,數(shù)據(jù)挖掘技術(shù)不僅能夠?qū)崿F(xiàn)對長期積累的經(jīng)濟(jì)數(shù)據(jù)的高效管理,同時還可從多個角度出發(fā),分析現(xiàn)有經(jīng)濟(jì)數(shù)據(jù)的目的性,或可基于經(jīng)濟(jì)數(shù)據(jù)管理的視角,實現(xiàn)數(shù)據(jù)分類、明確信息統(tǒng)計單元,以更加系統(tǒng)、科學(xué)的歸類方式,來整合數(shù)據(jù)庫中原本混亂的信息,提升這些信息中的價值含量,從而提升統(tǒng)計數(shù)據(jù)管理應(yīng)用的便利性,提高數(shù)據(jù)使用效率。在進(jìn)行經(jīng)濟(jì)數(shù)據(jù)處理、再加工時,對數(shù)據(jù)進(jìn)行統(tǒng)計、分析的目標(biāo),是要對原始數(shù)據(jù)組成的內(nèi)容展開重新加工,而這也需要通過數(shù)據(jù)挖掘技術(shù)來實現(xiàn)。原始數(shù)據(jù)的加工可以將數(shù)據(jù)背后的價值充分發(fā)揮出來,這樣經(jīng)濟(jì)統(tǒng)計數(shù)據(jù)可為管理者具體的應(yīng)用需求提供最大限度的服務(wù)。
在經(jīng)濟(jì)統(tǒng)計過程中,運用數(shù)據(jù)挖掘技術(shù),首先需要通過預(yù)處理方式對基礎(chǔ)信息實現(xiàn)智能化分析。數(shù)據(jù)挖掘結(jié)構(gòu)會被經(jīng)濟(jì)信息所影響,無法無中生有建立數(shù)據(jù)收集的體系,在應(yīng)用這一技術(shù)的過程中,數(shù)據(jù)信息的預(yù)處理是重要的控制措施,也是一種管理機(jī)制。經(jīng)濟(jì)統(tǒng)計的數(shù)據(jù)預(yù)處理,可統(tǒng)籌劃定數(shù)據(jù)的差距、不真實性及不正確性。數(shù)據(jù)挖掘技術(shù)中的數(shù)據(jù)清理過程,即對基礎(chǔ)數(shù)據(jù)中的問題加以全面處理,其方法包括平滑法數(shù)據(jù)處理、均值法數(shù)據(jù)處理。
(1)平滑法數(shù)據(jù)處理:這一方法可對基礎(chǔ)數(shù)據(jù)中空值、噪聲數(shù)據(jù)統(tǒng)一展開計算,借助加權(quán)平均數(shù)的處理及時,對提取到的數(shù)據(jù)展開影響權(quán)重值分析,這樣獲得的計算結(jié)果和真實數(shù)值更為接近。在應(yīng)用中,可借助下列公式來分析當(dāng)前數(shù)據(jù)點的取值結(jié)果。
備注:Wj為CJ實際的權(quán)值。
(2)均值法數(shù)據(jù)處理:這一方法指的是對基礎(chǔ)數(shù)據(jù)中的噪聲數(shù)據(jù)、數(shù)據(jù)點空值來實施均值處理,確保數(shù)據(jù)可借助屬性均值,填充、補(bǔ)足數(shù)據(jù)的空白。只有數(shù)據(jù)挖掘系統(tǒng)充分分析基礎(chǔ)數(shù)據(jù),才可確保數(shù)據(jù)的統(tǒng)計分析具有實效性和完整性。在當(dāng)前數(shù)據(jù)點取值分析時,可用公式如下:
在對經(jīng)濟(jì)數(shù)據(jù)進(jìn)行預(yù)處理后,需構(gòu)建相應(yīng)決策樹。運用數(shù)據(jù)挖掘技術(shù)實施經(jīng)濟(jì)統(tǒng)計,在構(gòu)建決策樹的過程中,工作人員在初步構(gòu)建過程中,可借助訓(xùn)練集這一工具,之后再通過專門決策樹算法,來簡化構(gòu)建的初步?jīng)Q策樹,而這時構(gòu)建的模型,就是數(shù)據(jù)輸出分析的模型。之后,統(tǒng)計工作人員需充分利用構(gòu)建的決策樹,來準(zhǔn)確分類經(jīng)濟(jì)數(shù)據(jù),并對數(shù)據(jù)展開深度分析。根據(jù)決策樹,從決策樹的根本向決策樹的各枝干進(jìn)行延伸,到數(shù)據(jù)符合既定條件之后,分割即可終止。若同時展開兩個分割,且這兩個分割點上具有完全相同的數(shù)據(jù),那么分割會自行終止,決策過程即可順利完成。若數(shù)據(jù)并無分類的屬性,不過可將經(jīng)濟(jì)數(shù)據(jù)繼續(xù)實現(xiàn)分割,此時需將分割立即停止。在具體的經(jīng)濟(jì)統(tǒng)計過程中,還可結(jié)合該地區(qū)企業(yè)歷年提供的數(shù)據(jù)報表,建立企業(yè)對應(yīng)序列模式,借助數(shù)據(jù)挖掘來計算企業(yè)的預(yù)測值,并且將預(yù)測值和歷年所報的經(jīng)濟(jì)數(shù)據(jù)展開對比,即可得知差別率。之后,工作人員可以分類分析所得差別率,根據(jù)差別率占比情況,將之劃分成三大類,如20%以上者劃為A類,10%-20%者劃為B類,10%以內(nèi)可劃為C類。
對某一地區(qū)展開經(jīng)濟(jì)統(tǒng)計分析時,應(yīng)用數(shù)據(jù)挖掘技術(shù)時,工作人員可以根據(jù)本地區(qū)企業(yè)以前報告的數(shù)據(jù),結(jié)合企業(yè)規(guī)模是否出現(xiàn)變化、企業(yè)內(nèi)部是否出現(xiàn)重大的經(jīng)營事件等,來判斷是否需要進(jìn)一步展開調(diào)查、分析[7]。若數(shù)據(jù)挖掘之后發(fā)現(xiàn),企業(yè)規(guī)模的變化差異率大,不過仍在合理范圍之內(nèi),則不需展開進(jìn)一步的調(diào)查,即可獲取可靠、準(zhǔn)確的經(jīng)濟(jì)信息。若企業(yè)的規(guī)模有較大變化差異率,且超出了規(guī)定的范圍,或雖然企業(yè)規(guī)模的變化差異率很小,不過在其內(nèi)部出現(xiàn)了一些重大的經(jīng)營事件,這時工作人員就需對當(dāng)?shù)仄髽I(yè)中的經(jīng)濟(jì)問題進(jìn)行深入了解,以便制定切實有效、針對性強(qiáng)的經(jīng)濟(jì)決策決議,在保證經(jīng)濟(jì)統(tǒng)計結(jié)構(gòu)可靠、完整的基礎(chǔ)上,協(xié)助企業(yè)提升自身的競爭力,促使其經(jīng)濟(jì)效益規(guī)模逐漸擴(kuò)大,實現(xiàn)推動當(dāng)?shù)亟?jīng)濟(jì)發(fā)展的目的。
現(xiàn)階段,我國市場經(jīng)濟(jì)活動過程中,部分管理部門在職權(quán)劃分中還缺少清晰界限,經(jīng)濟(jì)統(tǒng)計管理工作也有其局限性,而經(jīng)濟(jì)主體管理人員不同,對數(shù)據(jù)挖掘的需求及目的也有所不同[8]。在經(jīng)濟(jì)統(tǒng)計工作中,管理部門需要改變傳統(tǒng)數(shù)據(jù)處理的方式,充分應(yīng)用數(shù)據(jù)挖掘技術(shù),才能從根本上促進(jìn)經(jīng)濟(jì)統(tǒng)計工作質(zhì)量不斷提升。這是因為數(shù)據(jù)挖掘技術(shù)可以規(guī)避傳統(tǒng)數(shù)據(jù)統(tǒng)計分析工作中的不足,降低不完全統(tǒng)計、重復(fù)統(tǒng)計的可能性,對于我國經(jīng)濟(jì)統(tǒng)計工作而言十分適用。相信在未來的市場發(fā)展中,數(shù)據(jù)挖掘技術(shù)將有很大的發(fā)展空間。值得注意的是,在具體應(yīng)用中,我們應(yīng)該對這一技術(shù)的應(yīng)用方式及時調(diào)整,確保數(shù)據(jù)挖掘技術(shù)保持其適用性,以滿足經(jīng)濟(jì)統(tǒng)計管理工作的需求。
另外一方面,數(shù)據(jù)挖掘技術(shù)對信息深度加工處理后,可以為數(shù)據(jù)統(tǒng)計工作人員提供數(shù)據(jù)支持,且其數(shù)據(jù)信息可以長期保存,能夠增強(qiáng)工作人員理解相關(guān)數(shù)據(jù)的程度,有助于構(gòu)建一體化、系統(tǒng)化的信息結(jié)構(gòu)[9]。數(shù)據(jù)挖掘技術(shù)還可促使信息數(shù)據(jù)管理更加高效、便捷,是數(shù)據(jù)統(tǒng)計工作有序開展的基石。數(shù)據(jù)挖掘技術(shù)在積累海量數(shù)據(jù)信息后,其應(yīng)用價值可以進(jìn)一步凸顯。相信在未來的發(fā)展中,這一技術(shù)具備的有效性優(yōu)勢可以進(jìn)一步發(fā)展,對數(shù)據(jù)庫中數(shù)據(jù)混亂、信息重復(fù)的現(xiàn)象進(jìn)一步優(yōu)化,促使數(shù)據(jù)信息得以整合,進(jìn)而提升經(jīng)濟(jì)統(tǒng)計的工作質(zhì)量。
總體來看,將數(shù)據(jù)挖掘技術(shù)用于經(jīng)濟(jì)統(tǒng)計工作中,可以推動經(jīng)濟(jì)數(shù)據(jù)資源的擴(kuò)展,且可為經(jīng)濟(jì)局勢、經(jīng)濟(jì)發(fā)展走向的判定,提供可靠、真實的數(shù)據(jù)知識。在具體應(yīng)用過程中,數(shù)據(jù)統(tǒng)計工作人員需要把握數(shù)據(jù)挖掘技術(shù)的原理、應(yīng)用方法及特征,對原始統(tǒng)計數(shù)據(jù)展開預(yù)處理,構(gòu)建對應(yīng)決策樹,在實現(xiàn)數(shù)據(jù)分類、對調(diào)查對象予以確定的基礎(chǔ)上,必要時結(jié)合企業(yè)經(jīng)營情況,展開進(jìn)一步調(diào)查,通過挖掘獲取價值較高的經(jīng)濟(jì)數(shù)據(jù),從而為經(jīng)濟(jì)管理活動提供數(shù)據(jù)支持。