翟治宇
摘 要:本文以網(wǎng)絡(luò)經(jīng)濟(jì)為背景,在對(duì)數(shù)據(jù)挖掘進(jìn)行簡(jiǎn)單介紹的基礎(chǔ)上,結(jié)合現(xiàn)有數(shù)據(jù)挖掘技術(shù)和分析方法,圍繞工商管理的應(yīng)用展開(kāi)了討論,內(nèi)容涉及提煉訪問(wèn)者信息、企業(yè)預(yù)測(cè)與估計(jì)等方面,希望能給相關(guān)人員以啟發(fā),使數(shù)據(jù)挖掘優(yōu)勢(shì)在工商管理領(lǐng)域得到充分發(fā)揮。
關(guān)鍵詞:網(wǎng)絡(luò)經(jīng)濟(jì);工商管理;數(shù)據(jù)挖掘
0 引言
在網(wǎng)絡(luò)經(jīng)濟(jì)下,如何使供應(yīng)商、合作者擁有可靠的交流平臺(tái),引起越來(lái)越多人的重視?,F(xiàn)有搜索引擎,通常無(wú)法對(duì)全部網(wǎng)頁(yè)進(jìn)行搜索,用戶(hù)需求難以得到滿(mǎn)足,數(shù)據(jù)挖掘的出現(xiàn),使上述問(wèn)題迎刃而解。有關(guān)人員可以憑借數(shù)據(jù)挖掘技術(shù),對(duì)網(wǎng)頁(yè)隱藏信息加以提煉,通過(guò)全面分析得出相應(yīng)規(guī)律。由此可見(jiàn),無(wú)論是對(duì)工商管理,還是其他工作而言,本文所研究課題都有重要意義。
1 數(shù)據(jù)挖掘介紹
無(wú)論是網(wǎng)絡(luò)技術(shù)的發(fā)展,還是數(shù)據(jù)庫(kù)的完善,均加快了人們對(duì)數(shù)據(jù)進(jìn)行加工與收集的速度,如何在大量數(shù)據(jù)中,對(duì)所需數(shù)據(jù)進(jìn)行精準(zhǔn)提煉,自然成為各行各業(yè)關(guān)注的重點(diǎn),數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。
數(shù)據(jù)挖掘強(qiáng)調(diào)的是以大量隨機(jī)且不規(guī)則的數(shù)據(jù)為基礎(chǔ),對(duì)有價(jià)值的信息進(jìn)行提煉,為用戶(hù)決策的制定提供幫助。具體來(lái)說(shuō),就是以數(shù)據(jù)庫(kù)為載體,發(fā)現(xiàn)所需信息。由此可見(jiàn),數(shù)據(jù)挖掘要滿(mǎn)足三點(diǎn)要求:其一,數(shù)據(jù)源隨機(jī)且不規(guī)則,有噪聲存在;其二,以用戶(hù)需求對(duì)象為信息;其三,在可理解、可接受和可使用范圍內(nèi),對(duì)信息進(jìn)行選取。此外,即便滿(mǎn)足上述要求,有關(guān)人員仍要對(duì)問(wèn)題是否具有針對(duì)性加以判斷,即:信息篩選有明確限制和約束存在,不僅要與用戶(hù)表現(xiàn)出的學(xué)習(xí)與理解能力相符,還要能夠利用簡(jiǎn)單易懂的語(yǔ)言,對(duì)最終結(jié)論加以表達(dá)。
對(duì)Web數(shù)據(jù)進(jìn)行挖掘,則是網(wǎng)絡(luò)經(jīng)濟(jì)衍生出的全新概念。作為數(shù)據(jù)挖掘分支,Web數(shù)據(jù)挖掘與數(shù)據(jù)挖掘的差異,主要體現(xiàn)在數(shù)據(jù)庫(kù)上,常規(guī)數(shù)據(jù)庫(kù)以數(shù)學(xué)模型為基礎(chǔ),利用模型完成數(shù)據(jù)的描述,Web數(shù)據(jù)庫(kù)則以Web服務(wù)器加載數(shù)據(jù)文件為主體,從中對(duì)用戶(hù)需要信息加以提煉。由此可見(jiàn),Web數(shù)據(jù)挖掘內(nèi)容,通常是電子商務(wù)、頁(yè)面內(nèi)容和訪問(wèn)信息。
2 數(shù)據(jù)挖掘技術(shù)
2.1 數(shù)據(jù)挖掘類(lèi)型
2.1.1 結(jié)構(gòu)挖掘
結(jié)構(gòu)挖掘?qū)ο笠枣溄咏Y(jié)構(gòu)模式為主。引文分析是最早對(duì)結(jié)構(gòu)挖掘加以利用的載體,在對(duì)鏈接結(jié)構(gòu)模式進(jìn)行建立時(shí),有關(guān)人員以網(wǎng)頁(yè)鏈接主體和數(shù)量為主要借鑒對(duì)象。落實(shí)網(wǎng)頁(yè)歸類(lèi)及相關(guān)工作時(shí),大部分企業(yè)均會(huì)選擇結(jié)構(gòu)挖掘技術(shù),旨在獲得網(wǎng)頁(yè)關(guān)聯(lián)度、相似度數(shù)據(jù)。除此之外,結(jié)構(gòu)挖掘的作用,還有助于瀏覽者對(duì)所需網(wǎng)站進(jìn)行尋找。
2.1.2 用法挖掘
提出用法挖掘的初衷,主要是對(duì)用戶(hù)網(wǎng)絡(luò)行為及相關(guān)數(shù)據(jù)加以掌握。上文提到的結(jié)構(gòu)挖掘,還有下文將要介紹的內(nèi)容挖掘,均以原始數(shù)據(jù)為挖掘?qū)ο?,而用法挖掘?qū)ο髣t是二手?jǐn)?shù)據(jù),例如,用戶(hù)信息、交易信息和聊天記錄,此類(lèi)數(shù)據(jù)均以人機(jī)交互為基礎(chǔ)。
2.1.3 內(nèi)容挖掘
內(nèi)容挖掘?qū)ο笠跃W(wǎng)頁(yè)文檔和數(shù)據(jù)為主,對(duì)網(wǎng)頁(yè)進(jìn)行搜索時(shí),以上內(nèi)容是主要考察對(duì)象。在網(wǎng)絡(luò)經(jīng)濟(jì)下,信息呈爆發(fā)式增長(zhǎng),若以信息源為依據(jù),則可將信息分為以下幾類(lèi):其一,WWW數(shù)據(jù),此類(lèi)數(shù)據(jù)的特點(diǎn)是隱藏于WWW形式后,例如,Usenet、Gopher等;其二,在數(shù)據(jù)庫(kù)存儲(chǔ)的數(shù)據(jù);其三,無(wú)法直接訪問(wèn)的數(shù)據(jù)。若以資源形式為依據(jù),那么,常見(jiàn)信息類(lèi)型有文本、音頻等。
2.2 數(shù)據(jù)挖掘分析方法
2.2.1 序列分析
序列分析的目的,主要是對(duì)數(shù)據(jù)聯(lián)系進(jìn)行挖掘,其中,因果關(guān)系是分析側(cè)重點(diǎn)。廠商以序列模式為依托,完成銷(xiāo)售記錄的分析工作,通常能夠?qū)撛谫?gòu)物模式有準(zhǔn)確了解,例如,在對(duì)微波爐進(jìn)行購(gòu)買(mǎi)前,大部分顧客都會(huì)提前備選好商品。
2.2.2 分類(lèi)分析
對(duì)數(shù)據(jù)庫(kù)、特征不同類(lèi)別進(jìn)行設(shè)置,該數(shù)據(jù)庫(kù)下屬記錄均有類(lèi)別與之對(duì)應(yīng)。分類(lèi)分析強(qiáng)調(diào)以示例數(shù)據(jù)庫(kù)含有數(shù)據(jù)為分析對(duì)象,以準(zhǔn)確描述不同類(lèi)別為前提,通過(guò)建立分析模型的方式,使分類(lèi)規(guī)則更為明確,在此基礎(chǔ)上,在分類(lèi)規(guī)則的指導(dǎo)下,完成記錄分類(lèi)的相關(guān)工作。
2.2.3 關(guān)聯(lián)分析
針對(duì)數(shù)據(jù)挖掘展開(kāi)的研究,通常以關(guān)聯(lián)分析為主要內(nèi)容,由關(guān)聯(lián)規(guī)則衍生出的挖掘算法較多,其中,最具代表性的有DHP、AIS等。綜合考慮多方因素可知,關(guān)聯(lián)分析的初衷是對(duì)數(shù)據(jù)隱藏關(guān)系進(jìn)行挖掘,有關(guān)人員可憑借該技術(shù),獲取“九成顧客會(huì)同時(shí)購(gòu)買(mǎi)A商品和B商品”等信息。此外,關(guān)聯(lián)分析內(nèi)涵同樣要引起重視,詳細(xì)來(lái)說(shuō),就是以用戶(hù)指定支持度、置信度最小值為依據(jù),對(duì)關(guān)聯(lián)規(guī)則進(jìn)行生成。
2.2.4 組合分析
在網(wǎng)絡(luò)發(fā)展迅速的當(dāng)下,信息超載和信息過(guò)載的情況無(wú)法避免,但以數(shù)據(jù)挖掘?yàn)橐劳校@得過(guò)濾機(jī)制所需信息,可削弱上述情況帶來(lái)的負(fù)面影響,在減少信息獲取負(fù)擔(dān)的基礎(chǔ)上,確保用戶(hù)能夠獲得優(yōu)質(zhì)信息。例如,在對(duì)內(nèi)容挖掘技術(shù)加以使用前,通過(guò)篩選并歸檔網(wǎng)絡(luò)文檔信息的方式,以減少有處理需求的數(shù)據(jù)為基礎(chǔ),在提高數(shù)據(jù)質(zhì)量、信息挖掘速度的前提下,縮短用戶(hù)獲得信息需要花費(fèi)的時(shí)間,為信息精確度提供保證。
3 工商管理中數(shù)據(jù)挖掘的應(yīng)用
3.1 提煉訪問(wèn)者信息
近幾年,持續(xù)發(fā)展的電子商務(wù)行業(yè),促使大量供應(yīng)商進(jìn)入市場(chǎng),與常規(guī)企業(yè)爭(zhēng)奪市場(chǎng)份額。事實(shí)證明,電子商務(wù)的大范圍推廣,給交易帶來(lái)了十分積極的影響,即效率高、成本低、透明度佳、協(xié)調(diào)性強(qiáng)。
企業(yè)挖掘網(wǎng)站數(shù)據(jù)的第一步,便是對(duì)訪問(wèn)者特點(diǎn)加以明確,使訪問(wèn)者適用條款得到精準(zhǔn)提煉。研究表明,訪問(wèn)者特征往往涉及心理狀態(tài)、人口統(tǒng)計(jì)與交互信息。心理狀態(tài)是指心理調(diào)研所展現(xiàn)的個(gè)性,例如,技術(shù)興趣、商品選擇方向,如果網(wǎng)站訪問(wèn)者的數(shù)量持續(xù)增加,可供分析的數(shù)據(jù)也會(huì)更多。人口統(tǒng)計(jì)并非一成不變,無(wú)論是收入和消費(fèi)水平,還是家庭住址,均處于不斷變化的狀態(tài)下。而交互信息所指代的內(nèi)容,主要是優(yōu)選信息、購(gòu)買(mǎi)歷史。除此之外,有關(guān)人員還應(yīng)對(duì)公司信息、網(wǎng)站信息引起重視,公司信息對(duì)應(yīng)服務(wù)器傳達(dá)的要素,網(wǎng)站信息則以會(huì)話(huà)信息為主,二者均與訪問(wèn)者密切相關(guān)。
3.2 確定目標(biāo)并描述問(wèn)題
網(wǎng)上交易的優(yōu)勢(shì),主要是在對(duì)訪問(wèn)者做出反應(yīng)方面,企業(yè)擁有突出的前瞻性。如果食品、服裝等廠商擁有具象而明確的目標(biāo),便可借助數(shù)據(jù)挖掘技術(shù),使目標(biāo)擁有快速實(shí)現(xiàn)的基礎(chǔ)。以名品鞋柜為例,該廠商所設(shè)定的目標(biāo),依次為增加網(wǎng)頁(yè)訪問(wèn)量—延長(zhǎng)網(wǎng)頁(yè)瀏覽時(shí)間—降低退換貨比例—提升品牌知名度。
對(duì)電子商務(wù)企業(yè)而言,如何高效傳播商品是工作重點(diǎn),要想在凸顯網(wǎng)頁(yè)個(gè)性化的基礎(chǔ)上,確保商品信息能夠完整展現(xiàn)在顧客眼前,對(duì)訪問(wèn)者特征加以了解是關(guān)鍵,只有這樣才能準(zhǔn)確預(yù)測(cè)后續(xù)行為。上述工作能否順利完成,通常取決于隱含模式能否得到支持。
3.3 完成關(guān)聯(lián)分析
以顧客交易數(shù)據(jù)為依據(jù)見(jiàn)表1,通過(guò)關(guān)聯(lián)規(guī)則分析的方式,對(duì)顧客購(gòu)買(mǎi)趨勢(shì)加以掌握,便是關(guān)聯(lián)分析的主要作用。本文提到的關(guān)聯(lián)分析,主要指的是某次瀏覽、會(huì)話(huà)提及的商品,如果淘寶網(wǎng)等商務(wù)網(wǎng)站能夠?qū)ι唐愤M(jìn)行整合,不僅會(huì)使顧客瀏覽時(shí)間得到節(jié)約,還對(duì)購(gòu)買(mǎi)概率的提高有著積極影響。若關(guān)聯(lián)商品有促銷(xiāo)計(jì)劃,該組合中其他商品的銷(xiāo)量,通常能夠大幅提高。當(dāng)然,對(duì)網(wǎng)站目錄等靜態(tài)網(wǎng)頁(yè)而言,關(guān)聯(lián)分析同樣適用,若引入關(guān)聯(lián)分析,網(wǎng)站目錄對(duì)商品進(jìn)行排序的依據(jù),將以廠商選擇為主。除此之外,網(wǎng)站首頁(yè)還會(huì)有選擇性、有針對(duì)性地展示商品相關(guān)信息。
3.4 聚類(lèi)、描繪決策樹(shù)
聚類(lèi)主要是指對(duì)特征相同的商品進(jìn)行歸類(lèi),通過(guò)特征平均的方式,獲得特征矢量?,F(xiàn)階段,聚類(lèi)技術(shù)主要被用來(lái)對(duì)數(shù)據(jù)類(lèi)別加以確定,根據(jù)特定聚類(lèi)對(duì)其他數(shù)據(jù)進(jìn)行表示。一般來(lái)說(shuō),在確定訪問(wèn)者類(lèi)型時(shí),大部分企業(yè)均會(huì)對(duì)該技術(shù)加以使用。
決策樹(shù)的描繪對(duì)象,以決策制定所遇到數(shù)據(jù)點(diǎn)和問(wèn)題為主。例如,消費(fèi)者決定購(gòu)買(mǎi)電視機(jī),便要思考自身需求、商品尺寸與品牌等,從而確保決定正確。而決策樹(shù)的作用,主要是排序決策過(guò)程,通過(guò)對(duì)最優(yōu)路徑加以確定的方式,精簡(jiǎn)不必要的決策步驟,使決策速度與質(zhì)量得到提高。近幾年,以耐克為代表的諸多廠商,在完善產(chǎn)品選擇系統(tǒng)時(shí),均對(duì)決策樹(shù)體系進(jìn)行了引入,旨在為訪問(wèn)者問(wèn)題的解決提供幫助。
3.5 企業(yè)預(yù)測(cè)與估計(jì)
3.5.1 預(yù)測(cè)
對(duì)個(gè)性化網(wǎng)頁(yè)而言,判斷未來(lái)事項(xiàng)的預(yù)測(cè)十分重要,相關(guān)企業(yè)可以通過(guò)匯總數(shù)據(jù)的方式,達(dá)到全面了解客戶(hù)的效果。即便分析對(duì)象是已經(jīng)發(fā)生的事件,同樣能夠獲得有價(jià)值的信息。由此可見(jiàn),預(yù)測(cè)主要被用來(lái)匯總訪問(wèn)者信息,為企業(yè)制定商品組合方案提供參考,確保商品與客戶(hù)訴求高度契合。
3.5.2 估計(jì)
如果預(yù)測(cè)是以當(dāng)前趨勢(shì)為依據(jù),對(duì)未來(lái)進(jìn)行判斷,估計(jì)則是對(duì)未知量進(jìn)行判斷。在網(wǎng)絡(luò)經(jīng)濟(jì)下,估計(jì)擁有和預(yù)測(cè)相似的算法,企業(yè)能夠通過(guò)估計(jì)的方式,準(zhǔn)確預(yù)判空白項(xiàng)目。例如,淘寶網(wǎng)想要對(duì)訪問(wèn)者收入加以了解,便可以選擇估計(jì)收入相關(guān)量,參考特征相同訪問(wèn)者的收入,對(duì)特定訪問(wèn)者收入進(jìn)行衡量。
4 結(jié)論
由上文所敘述內(nèi)容能夠看出,強(qiáng)調(diào)人工智能、網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫(kù)技術(shù)的數(shù)據(jù)挖掘,有其出現(xiàn)的可行性及必然性。在數(shù)據(jù)被大量生產(chǎn)出來(lái)的當(dāng)下,只有掌握高效挖掘數(shù)據(jù)的技術(shù),才能使大量數(shù)據(jù)被自動(dòng)轉(zhuǎn)化為所需信息,并為工商管理等工作的開(kāi)展提供助力。
參考文獻(xiàn):
[1]文珂,汪鋒.基于數(shù)據(jù)挖掘技術(shù)的銀行客戶(hù)關(guān)系管理系統(tǒng)設(shè)計(jì)與建設(shè)[J].電腦編程技巧與維護(hù),2020(07):82-83.
[2]門(mén)學(xué)林.大數(shù)據(jù)背景下數(shù)據(jù)挖掘技術(shù)在管理會(huì)計(jì)中的運(yùn)用[J].當(dāng)代會(huì)計(jì),2020(11):3-4.
[3]潘翠芬.基于數(shù)據(jù)挖掘技術(shù)的數(shù)字檔案管理信息系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].城建檔案,2020(04):25-26.
科技經(jīng)濟(jì)市場(chǎng)2020年10期