萬(wàn)小理
?
大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)在企業(yè)中的應(yīng)用
萬(wàn)小理
廣東省電信規(guī)劃設(shè)計(jì)院有限公司,廣東 廣州 510630
大數(shù)據(jù)時(shí)代是信息時(shí)代的一個(gè)重要特征。實(shí)際上,在大數(shù)據(jù)時(shí)代的背景下進(jìn)行數(shù)據(jù)挖掘技術(shù)的探究與應(yīng)用,其實(shí)就是在巨大的信息群中不斷挖掘出具有一定價(jià)值意義的信息進(jìn)行整合,在此基礎(chǔ)上對(duì)已整合的信息進(jìn)行進(jìn)一步處理,以提高信息數(shù)據(jù)的價(jià)值。鑒于此,分析了大數(shù)據(jù)時(shí)代的發(fā)展歷程及現(xiàn)狀,探討了大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)及其應(yīng)用。
大數(shù)據(jù)時(shí)代;數(shù)據(jù)挖掘技術(shù);數(shù)據(jù)信息
1.1 聚類分析法
聚類分析就是將物理或抽象對(duì)象的集合進(jìn)行分組,然后組成為由類似或相似的對(duì)象組成的多個(gè)分類的分析過(guò)程。其實(shí),聚類分析就如同劃分?jǐn)?shù)據(jù),在各個(gè)數(shù)據(jù)組中尋找有意義的數(shù)據(jù)。但其又與普通形式的分類不同,它是在不知對(duì)象的情況下進(jìn)行數(shù)據(jù)劃分,相對(duì)來(lái)說(shuō)聚類分析更為困難[1]。
目前,數(shù)據(jù)聚類分析有兩種方法,即硬聚類和模糊聚類。硬聚類就是將距離較近的數(shù)據(jù)分為一類,而模糊聚類則是根據(jù)數(shù)據(jù)的隸屬度劃分。盡管兩種方法的分類方式不同,但目的一致。所以,在具體利用聚類分析方法進(jìn)行數(shù)據(jù)挖掘時(shí),以上兩種方法均適用。
1.2 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是通過(guò)大批量的數(shù)據(jù)進(jìn)行分析,而這種數(shù)據(jù)分析方式本身是建立在一定的數(shù)據(jù)模型基礎(chǔ)上的,通常都可以隨時(shí)根據(jù)數(shù)據(jù)需求進(jìn)行分類,所以人工神經(jīng)網(wǎng)絡(luò)也是當(dāng)下數(shù)據(jù)挖掘技術(shù)中最常用的數(shù)據(jù)分析方式之一。
1.3 關(guān)聯(lián)性分析法
在自然界中,事物之間有千絲萬(wàn)縷的關(guān)系,某事件發(fā)生時(shí)必然會(huì)引發(fā)其他事件。數(shù)據(jù)關(guān)聯(lián)分析就是基于這一自然原理展開的,即利用數(shù)據(jù)之間的關(guān)聯(lián)性,尋找數(shù)據(jù)之間的規(guī)律,進(jìn)而通過(guò)規(guī)律分析獲得有價(jià)值、有意義的數(shù)據(jù)信息。所以,關(guān)聯(lián)分析也是數(shù)據(jù)挖掘中一種切實(shí)有效的基本分析方法。
1.4 特征性數(shù)據(jù)分析法
特征性數(shù)據(jù)分析方法是通過(guò)分析數(shù)據(jù)特征來(lái)挖掘有價(jià)值、有意義的數(shù)據(jù)信息。因?yàn)閿?shù)據(jù)資源應(yīng)用日益廣泛,相關(guān)學(xué)者及研究者通過(guò)數(shù)據(jù)資源的特征分析,提出了多種特征數(shù)據(jù)分析方法,如利用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)分析,也就是通過(guò)建立數(shù)據(jù)模型,利用神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)分析,尋找有價(jià)值的數(shù)據(jù)信息;利用遺傳基因算法進(jìn)行數(shù)據(jù)分析,也就是對(duì)數(shù)據(jù)進(jìn)行選擇、重組、突變分析,尋找有價(jià)值的數(shù)據(jù)信息;利用可視化技術(shù)進(jìn)行數(shù)據(jù)分析,即通過(guò)利用圖形、圖像、動(dòng)畫等形象的指導(dǎo)操作、挖掘數(shù)據(jù),從而尋找有價(jià)值的數(shù)據(jù)信息。
2.1 數(shù)據(jù)挖掘后數(shù)據(jù)信息資源的職能范圍及表現(xiàn)
目前具有信息化特征的數(shù)據(jù)挖掘技術(shù)已經(jīng)可以更好地融入當(dāng)前的社會(huì)環(huán)境中,考慮社會(huì)經(jīng)濟(jì)、科技、文化等方面,更加合理地配合企業(yè)生產(chǎn)經(jīng)營(yíng)活動(dòng),解釋生產(chǎn)經(jīng)營(yíng)活動(dòng)中物質(zhì)的性質(zhì)及價(jià)值變化,并找出物質(zhì)相關(guān)數(shù)據(jù)變化特征及規(guī)律,以便使企業(yè)能夠以此為依據(jù),合理調(diào)整生產(chǎn)經(jīng)營(yíng)活動(dòng)目標(biāo)、方向、方式,改善生產(chǎn)經(jīng)營(yíng)活動(dòng)效果,為企業(yè)創(chuàng)造更多的經(jīng)濟(jì)效益。由此看來(lái),數(shù)據(jù)挖掘技術(shù)應(yīng)用,擴(kuò)大了數(shù)據(jù)信息資源的職能范圍,更好地服務(wù)于企業(yè)業(yè)務(wù),提高企業(yè)業(yè)務(wù)水平。
2.2 數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用
2.2.1 市場(chǎng)營(yíng)銷領(lǐng)域
相對(duì)來(lái)說(shuō),市場(chǎng)營(yíng)銷領(lǐng)域是應(yīng)用數(shù)據(jù)挖掘技術(shù)最早、最多的領(lǐng)域。主要是因?yàn)樵谑袌?chǎng)營(yíng)銷中利用數(shù)據(jù)挖掘技術(shù)可以進(jìn)行用戶相關(guān)數(shù)據(jù)信息的挖掘,獲得有價(jià)值的數(shù)據(jù)信息資源,如顧客消費(fèi)行為信息資源,為更好地進(jìn)行產(chǎn)品銷售、用戶服務(wù)提供依據(jù),提高市場(chǎng)營(yíng)銷水平。
2.2.2 科學(xué)研究
科學(xué)研究中數(shù)據(jù)挖掘技術(shù)相當(dāng)于輔助工具,用于尋找觀測(cè)數(shù)據(jù)的相關(guān)規(guī)律及知識(shí),為更好地進(jìn)行科研項(xiàng)目研究提供依據(jù)。例如,利用數(shù)據(jù)挖掘技術(shù)進(jìn)行DNA 數(shù)據(jù)分析等。所以,在科學(xué)研究方面,數(shù)據(jù)挖掘技術(shù)的應(yīng)用也起到非常重要的作用[2]。
2.2.3 制造業(yè)
在人們對(duì)產(chǎn)品質(zhì)量要求越來(lái)越高的情況下,制造業(yè)領(lǐng)域中應(yīng)用數(shù)據(jù)挖掘技術(shù)也是非常重要的。應(yīng)用數(shù)據(jù)挖掘技術(shù)可以對(duì)產(chǎn)品相關(guān)數(shù)據(jù)進(jìn)行分析,獲得產(chǎn)品存在缺陷、產(chǎn)品生產(chǎn)效率的相關(guān)數(shù)據(jù),為科學(xué)、合理地分析產(chǎn)品缺陷及生產(chǎn)效率低的原因提供依據(jù),如此制造企業(yè)可以有針對(duì)性地調(diào)整和優(yōu)化產(chǎn)品生產(chǎn),提高產(chǎn)品生產(chǎn)效率,創(chuàng)造更多的經(jīng)濟(jì)效益,推動(dòng)制造業(yè)不斷進(jìn)步與發(fā)展。所以,在制造業(yè)領(lǐng)域中,科學(xué)、合理地應(yīng)用數(shù)據(jù)挖掘技術(shù)是非常有意義的。
2.2.4 電信業(yè)
在電信業(yè)蓬勃發(fā)展的今天,電信服務(wù)的客戶群體龐大,這使得電信企業(yè)需要為之提供優(yōu)質(zhì)的技術(shù)服務(wù)。但是,因?yàn)殡娦偶夹g(shù)與服務(wù)已成為一個(gè)非常龐大的混合載體,這使得技術(shù)服務(wù)易受到影響,導(dǎo)致技術(shù)服務(wù)質(zhì)量不佳。數(shù)據(jù)挖掘技術(shù)的應(yīng)用則可以改變此種局面,因?yàn)閿?shù)據(jù)挖掘技術(shù)可以對(duì)電信復(fù)雜數(shù)據(jù)進(jìn)行有效分析,從中尋找規(guī)律,為電信技術(shù)服務(wù)提供有應(yīng)用價(jià)值的數(shù)據(jù)信息資源,從而優(yōu)化電信技術(shù)服務(wù),滿足用戶需求。
2.2.5 教育領(lǐng)域
在教育領(lǐng)域中,數(shù)據(jù)挖掘技術(shù)也發(fā)揮著不可忽略的作用。應(yīng)用數(shù)據(jù)挖掘技術(shù),可以分析學(xué)生的心理特點(diǎn),使教師根據(jù)相關(guān)數(shù)據(jù)信息資源調(diào)整教學(xué)活動(dòng);可以利用數(shù)據(jù)挖掘技術(shù)分析學(xué)生學(xué)習(xí)成績(jī),了解學(xué)生學(xué)習(xí)薄弱之處,以便教師有針對(duì)性地教育、指導(dǎo)學(xué)生;可以利用數(shù)據(jù)挖掘技術(shù)進(jìn)行教學(xué)資源的優(yōu)化配置,使得教學(xué)資源利用率最大化,為提高教學(xué)水平創(chuàng)造條件。
2.3 數(shù)據(jù)挖掘技術(shù)延展方向
從當(dāng)前我國(guó)數(shù)據(jù)挖掘技術(shù)在各個(gè)領(lǐng)域應(yīng)用實(shí)際情況來(lái)看,數(shù)據(jù)挖掘技術(shù)在市場(chǎng)營(yíng)銷、科學(xué)研究、電信、教育等領(lǐng)域發(fā)揮著重要作用。未來(lái)隨著數(shù)據(jù)挖掘技術(shù)的不斷優(yōu)化、創(chuàng)新、完善,此項(xiàng)技術(shù)將會(huì)延伸到更多領(lǐng)域當(dāng)中,比如生物制藥、刑偵調(diào)查、航空航天等,并發(fā)揮更大作用[3]。
基于大數(shù)據(jù)時(shí)代背景來(lái)看,數(shù)據(jù)挖掘技術(shù)符合時(shí)代特點(diǎn),并且滿足各個(gè)行業(yè)應(yīng)用需求,將其科學(xué)、合理地應(yīng)用到制造、市場(chǎng)營(yíng)銷、科學(xué)研究、教育等領(lǐng)域中,利用適合的基礎(chǔ)分析方法來(lái)進(jìn)行相關(guān)數(shù)據(jù)的分析,可以探尋到有價(jià)值的數(shù)據(jù)信息資源,為推動(dòng)各個(gè)領(lǐng)域更好發(fā)展奠定基礎(chǔ)。所以,積極研究和應(yīng)用數(shù)據(jù)挖掘技術(shù)非常有意義。
[1]肖明.大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)在企業(yè)中的應(yīng)用[J].中國(guó)管理信息化,2015,18(2):58.
[2]李平榮.大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘技術(shù)與應(yīng)用[J].重慶三峽學(xué)院學(xué)報(bào),2014(3):45-47.
[3]夏緒衛(wèi).大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)在電力中的應(yīng)用分析[J].通信世界,2016(7):115.
The Application of Data Mining Technology in Enterprise in Big Data Age
Wan Xiaoli
Guangdong Planning and Designing Institute of Telecommunications Co., Ltd., Guangdong Guangzhou 510630
The era of large data is an important feature of the information age. In fact, the research and application of data mining technology in the background of large data age is in fact through the great information group to dig out a certain value of information Integration, on the basis of the integration of the information to be further processed to improve the value of information data.The author discusses the development process and the present situation of the large data age, and then discusses the data mining technology and its application in the era of large data.
large data age; data mining technology; data information
F426.61;TP311.13
A
1009-6434(2017)02-0155-02