呂紹鑫
摘? ?要:隨著計算機網(wǎng)絡技術的日益發(fā)展,而數(shù)據(jù)挖掘技術在高校網(wǎng)站信息當中的實踐應用已經(jīng)到了一個比較成熟的階段。網(wǎng)站作為信息傳播的主要載體,運用其直觀形象的使用方式,見證網(wǎng)絡信息的快速發(fā)展,在既能夠給予人們便利的情況下,也相應的給相關機構(gòu)帶來了巨大挑戰(zhàn)。本文將針對高校針對網(wǎng)站規(guī)劃以及網(wǎng)站建設方面,運用數(shù)據(jù)挖掘技術進行實踐應用的內(nèi)容,做相關闡述。
關鍵詞:數(shù)據(jù)挖掘技術? 高校? 網(wǎng)站信息? 實踐應用
中圖分類號:G647? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ?文章編號:1674-098X(2020)03(b)-0091-02
隨著教育信息化的發(fā)展,高校網(wǎng)站建設已經(jīng)從形象建設轉(zhuǎn)變?yōu)楝F(xiàn)如今的信息建設,這主要是因為當今社會是信息時代,高校用戶對于信息的需求量也在與日俱增。也就是說在內(nèi)容和數(shù)據(jù)方面都被要求需要達到較高的水平,在高校信息化建設的目標前提下,使用數(shù)據(jù)挖掘技術來幫助設計人員針對高校網(wǎng)站數(shù)據(jù)進行挖掘,從而找到適合高校網(wǎng)站建設的一種模式,在大量的信息中為人們提供有價值的信息以保證良好的服務。
1? 相關概念
1.1 數(shù)據(jù)挖掘技術
數(shù)據(jù)挖掘技術在實踐中體現(xiàn)出一種較強的綜合性,它既能夠針對網(wǎng)站設計來對數(shù)據(jù)實現(xiàn)有效采集,還能夠通過技術本身來對網(wǎng)站數(shù)據(jù)來進行初步整理。也就是說數(shù)據(jù)挖掘技術能夠在歸納式的推測前提下來針對用戶進行預測,從而使得決策更加準確。數(shù)據(jù)挖掘技術涵蓋眾多學科方面的內(nèi)容知識,不僅包含數(shù)據(jù)庫技術和信息獲取技術,在某些時候還會使用到統(tǒng)計學的相關技術[1]。
根據(jù)數(shù)據(jù)挖掘技術所面對的處理對象的不同,它分別有三種應用模式,其在各個行業(yè)發(fā)揮著不同的重要作用,第一個就是結(jié)構(gòu)挖掘,第二個則是內(nèi)容挖掘,第三個是使用挖掘。在數(shù)據(jù)挖掘技術實踐過程中比較常用的,有關聯(lián)規(guī)則技術,序列模式技術以及數(shù)據(jù)挖掘當中特有的路徑分析技術[2]。網(wǎng)站數(shù)據(jù)本身相對于傳統(tǒng)的數(shù)據(jù)庫,其有著數(shù)據(jù)內(nèi)容龐大且復雜的特性,并且它并沒有以規(guī)定的數(shù)據(jù)模型呈現(xiàn)出來,所以網(wǎng)站數(shù)據(jù)內(nèi)容當中,每一個站點都必須采取獨立設計,這也就導致了,在網(wǎng)站數(shù)據(jù)背景下的數(shù)據(jù)挖掘技術也比每個結(jié)構(gòu)化數(shù)據(jù)都要更加復雜[2]。
1.2 數(shù)據(jù)處理
針對現(xiàn)實的網(wǎng)站數(shù)據(jù),可以發(fā)現(xiàn)半結(jié)構(gòu)化是網(wǎng)站數(shù)據(jù)的典型特點,所以要想解決半結(jié)構(gòu)化數(shù)據(jù)源模型,在數(shù)據(jù)挖掘技術當中已經(jīng)成為了最重要的問題之一[3]。這將對網(wǎng)站的數(shù)據(jù)模型進行重新定義,也就是說需要針對半結(jié)構(gòu)化模型當中所需的相關數(shù)據(jù)進行自動檢索,通過數(shù)據(jù)挖掘來應用半結(jié)構(gòu)化數(shù)據(jù)模型抽取技術和半結(jié)構(gòu)化模型,這也是數(shù)據(jù)挖掘技術當中的重要環(huán)節(jié)[4]。
半結(jié)構(gòu)化的數(shù)據(jù)模型是以一種xml的新型元標注語言為數(shù)據(jù)基礎的,其數(shù)據(jù)描述與對應的關系,數(shù)據(jù)庫當中的屬性可以實現(xiàn)1對1,并且在這個過程中的網(wǎng)站建設是相對來說較為容易的,可以在這樣的基礎上針對數(shù)據(jù)模型進行精確查詢。與此同時,該新型元標注語言的開源代碼也是較為豐富的,在它的應用下將大大的降低網(wǎng)站工作人員的工作成本,通過相應的技術與條件幫助解決網(wǎng)站數(shù)據(jù)半結(jié)構(gòu)化分析困難的主要問題。
2? 具體應用
2.1 數(shù)據(jù)的收集與整理
對數(shù)據(jù)進行大量的收集是數(shù)據(jù)挖掘當中的重點組成部分,但是因為表達方式不同,往往會造成數(shù)據(jù)挖掘當中存在一定的不確定性。所以就需要針對數(shù)據(jù)來做好相應的簡單處理,確保數(shù)據(jù)能夠受到專業(yè)化的提取與進凈化。為相關設計人員提供網(wǎng)站數(shù)據(jù)基礎,讓他們能夠獲得應有的有用信息,從而在數(shù)據(jù)挖掘過程中提高工作的質(zhì)量效率與水平。綜上所述,數(shù)據(jù)預處理就是用戶針對網(wǎng)站進行訪問時所需要的最原始的數(shù)據(jù)庫內(nèi)容。
高校網(wǎng)站的服務器能夠針對用戶訪問的次數(shù)跟時間來進行記錄,用戶訪問的數(shù)據(jù)將會被網(wǎng)站日志進行記錄,所以網(wǎng)站日志就是得到數(shù)據(jù)最簡單直接的方法之一??梢酝ㄟ^網(wǎng)站日志來對這些內(nèi)容做好簡單記錄,其中包含用戶名、瀏覽日期等方面的內(nèi)容。但是在實踐操作過程中,會發(fā)現(xiàn)網(wǎng)站日志,對于他自身所收集到的信息也有存在不準確的情況,所以如果直接的對其進行利用往往是不可取的,所以需要針對相應數(shù)據(jù)做好一定的處理才可以確定相關內(nèi)容。其中包含針對瀏覽界面的確定以及用戶與用戶的訪問序列的確定,還有對用戶的訪問路徑進行完善等方面的內(nèi)容,如果對信息的質(zhì)量要求較高的話還需要高校網(wǎng)站能夠形成專門的數(shù)據(jù)庫。
2.2 數(shù)據(jù)模式的發(fā)現(xiàn)
要想發(fā)現(xiàn)數(shù)據(jù)模型,就必須運用數(shù)據(jù)挖掘的算法,可以通過針對頁面的網(wǎng)頁瀏覽量設計來確定網(wǎng)頁的瀏覽數(shù)。產(chǎn)生的結(jié)果,在相關人員對此進行有效測量的情況下,能夠?qū)r間序列建模和時間序列的預測情況進行具體了解,從而分析出時間序列的主要目標。整體的趨勢與長期運動的規(guī)律都是需要觀察的點,在時間序列當中周期運動又或者是周期性變動,也是需要重點關注的要點之一。上述內(nèi)容都是趨勢分析當中的關鍵所在。
此外在針對頁面訪問進行統(tǒng)計的過程中能夠發(fā)現(xiàn),往往排名靠前的都是對于高校網(wǎng)站首頁的訪問,也就是說大部分的高校用戶都是通過瀏覽器收藏夾的資源定位來對網(wǎng)站進行訪問的。在此情況下進入到高校網(wǎng)站訪問當中,只能基本上就是對第一個頁面進行大致的瀏覽。當然也有小部分用戶在對網(wǎng)站進行訪問時是從其他頁面進入的,不過占比并不高。但是根據(jù)網(wǎng)站各個網(wǎng)頁被訪問的次數(shù)和瀏覽時間,可以得出哪些頁面內(nèi)容是網(wǎng)站當中最受關注的,而哪些頁面內(nèi)容又是網(wǎng)站當中最不受關注的,其中重點內(nèi)容部分是否包含用戶訪問網(wǎng)站的主要目標具體內(nèi)容,哪些內(nèi)容又是屬于高校用戶一點都不會關心的無用內(nèi)容,從而針對用戶訪問網(wǎng)站的主要目的進行具體分析。
2.3 網(wǎng)站改進
對于網(wǎng)站改進,可以運用模式分析的方法來進行模式分析,其本身就是針對已經(jīng)產(chǎn)生的模式來進行分析和優(yōu)化的,它是在原有的基礎上,針對被發(fā)現(xiàn)的數(shù)據(jù)模式和統(tǒng)計資料來進行轉(zhuǎn)化的,通過這種方式為用戶實現(xiàn)更優(yōu)質(zhì)的服務體驗。也就是說,可以把現(xiàn)有的數(shù)據(jù)模式和統(tǒng)計資料轉(zhuǎn)化成所需的知識,從而在其中尋找到最有價值的數(shù)據(jù)模式加以應用。在數(shù)據(jù)挖掘過程中,需要了解到用戶趨勢,才是反映用戶對網(wǎng)站訪問的主要內(nèi)容,也是后期改變和提升的主要方向所在。在用戶趨勢上可以看出城市人員是針對高校網(wǎng)站進行訪問的主力軍,所以應當通過采取相關的措施,在能夠覆蓋到城市人員的網(wǎng)站上進行推廣,并且采取多種宣傳手段來加大推廣力度,從而使得用戶能夠更為直觀更為方便的訪問到高校網(wǎng)站。
此外還需要意識到網(wǎng)站本身不僅僅可以作為外界了解高校具體情況的一個展示平臺,也可以成為內(nèi)部學生獲取信息的主要通道,將教學資源整合到網(wǎng)站當中,也有助于更好的展示學校的教育資源水平。但是為了防止內(nèi)部教育資源,泄露或者是重要的實驗資料被竊取,同樣也要做好相應的數(shù)據(jù)加密工作。針對高校內(nèi)的優(yōu)質(zhì)師生資源進行數(shù)據(jù)挖掘,讓他們也參與到高校網(wǎng)站建設工作當中,能夠在校內(nèi)達到教學資源共享,幫助更多的學生提升自身的學業(yè)水平,這才是努力辦學,嚴謹辦學的最終目的,數(shù)據(jù)挖掘技術對于高校網(wǎng)站信息建設方面的貢獻,不僅僅是為了通過淺層的數(shù)據(jù)挖掘來保證高校形象的建設,更是要讓高校自身成為一個具有關鍵作用的信息平臺。
3? 結(jié)語
在數(shù)據(jù)挖掘技術與高校網(wǎng)站建設的結(jié)合應用當中,逐漸在實踐過程中尋找到了解決問題的方法,也就是根據(jù)網(wǎng)站建設的指導內(nèi)容來實現(xiàn)解決策略優(yōu)化,從而提升高效用戶的訪問質(zhì)量。針對網(wǎng)站建設重點進行明確,并且將高校網(wǎng)站頁面做好優(yōu)化設計,同時根據(jù)信息采集內(nèi)容來針對網(wǎng)站的結(jié)構(gòu)內(nèi)容做好及時的調(diào)整與設計,從而提升高校網(wǎng)站的總體使用質(zhì)量。
參考文獻
[1] 付蓉,何毅.Web數(shù)據(jù)挖掘在高校網(wǎng)站建設中的運用[J].信息與電腦:理論版,2015(10):89-90.
[2] 陳金菊.基于數(shù)據(jù)挖掘的讀者個性化服務研究[J].圖書館學研究,2016(23):84-91.
[3] 穆榮.Web數(shù)據(jù)挖掘在高校網(wǎng)站建設中的運用研究[J].中國戰(zhàn)略新興產(chǎn)業(yè),2017(16):89.
[4] 孫永輝,周宏.數(shù)據(jù)挖掘技術在高校成績分析中的應用研究[J].科技創(chuàng)新導報,2015,12(33):157-159.