• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      聚類分析算法在圖書管理系統(tǒng)中的應用分析

      2017-11-06 13:33:01彭燕
      卷宗 2017年29期
      關鍵詞:圖書館

      彭燕

      摘 要:文章首先對聚類分析算法的含義進行了簡明扼要的概括,并對“聚類”、“簇”等聚類分析算法涉及的重點詞匯進行了說明,然后又介紹了聚類分析算法——K-均值算法,和以該算法為基礎所延伸出的改進算法,最后通過理論與實際相結合的方式,以圖書、讀者這兩個圖書管理工作主體為切入點,對圖書管理系統(tǒng)中聚類分析算法的實際應用進行了分析,希望本文所討論的內(nèi)容能夠在某些方面為圖書管理工作的開展提供參考或幫助。

      關鍵詞:圖書館;聚類分析算法;圖書管理系統(tǒng)

      隨著科學技術的進步,各圖書館在對圖書進行管理時應用的系統(tǒng)與之前相比也出現(xiàn)了相應的變化,將聚類分析算法應用其中已成為大勢所趨。通過實踐能夠發(fā)現(xiàn),在圖書管理系統(tǒng)中對聚類分析算法進行合理應用,不僅能夠?qū)ψx者前往圖書館的主要目的加以了解,還能夠以讀者需求為導向,對服務工作進行相應的優(yōu)化,除此之外,在采購圖書資源時,工作人員也具有了更加科學、系統(tǒng)的參考依據(jù)。由此可以看出,本文所研究課題具有一定的現(xiàn)實意義。

      1 聚類分析算法的概述

      作為數(shù)據(jù)挖掘領域應用頻率極高的技術之一,聚類分析計算的關鍵在于“聚類”。聚類指的是將抽象或是物理對象集合轉化為由類似對象組成的簇的全過程;對作為數(shù)據(jù)對象集合而存在的簇而言,同一簇所包含的對象往往存在高度的一致性,不同簇所包含的對象則具有高度相異性,這是需要人們準確掌握的內(nèi)容[1]。只有對上文所提及的內(nèi)容進行了解和掌握,才能準確、科學的應用聚類分析算法,也才能保證對數(shù)據(jù)分布特征進行深入的挖掘和掌握。

      現(xiàn)階段,聚類分析算法已經(jīng)被廣泛應用在諸多領域中,例如,模式識別、圖像分割、數(shù)據(jù)挖掘等。在商務領域,聚類分析法主要被用于對客戶信息進行分析,保證人們能夠發(fā)現(xiàn)潛在客戶群體,并在購買模式的輔助下對客戶群體具有的特征進行刻畫。除此之外,聚類分析算法還能夠被應用在對挖掘算法進行預處理的過程中,例如,人們可以應用該法對某些數(shù)據(jù)進行聚類,然后再以所得出結果為基礎,開展相應的研究或是處理工作,保證工作質(zhì)量和效率均能夠得到應有的提升。

      2 聚類分析算法——K-均值算法的概述

      2.1 K-均值算法

      作為聚類分析法中相對典型的劃分方法,K-均值算法的本質(zhì)為迭代聚類算法,通過在迭代過程中對簇集成員進行不斷移動的方式,保證理想簇集的得出。通過實踐能夠發(fā)現(xiàn),K-均值算法具有的優(yōu)勢主要體現(xiàn)在簡單和快速這兩個方面。在應用該法展開計算時,需要將對象劃分為n個簇,并保證每個簇所包含對象具有高度相似性,另外,不同簇所包含的對象應當具有高度相異性。但是通過實踐發(fā)現(xiàn),K-均值算法受初始值影響較大,也就是說,如果初始值不同,運行效率也會隨之發(fā)生變化。因此,想要保證運行效率的有效提升,相關人員以K-均值算法為基礎提出了相應的改進算法。

      2.2改進算法

      通過對K-均值算法的應用過程進行分析能夠發(fā)現(xiàn),如果能夠在數(shù)據(jù)分布相對密集的區(qū)域中心處對初始聚類中心進行選擇,那么,位于該中心周圍的數(shù)據(jù),便能夠被劃分至最近類當中,聚類收斂的速度自然能夠得到提升,迭代次數(shù)也會因此而減少。也就是說,以數(shù)據(jù)分布特點為主要依據(jù),對初代聚類中心進行選取是十分重要的。想要保證針對數(shù)據(jù)分布情況所開展分析工作的全面性和科學性,必然需要花費更多的時間。根據(jù)數(shù)據(jù)具有的隨機分布這一特點可以看出,聚類數(shù)據(jù)應當位于數(shù)據(jù)均值周圍,除此之外,對數(shù)據(jù)分布進行評價需要應用到的指標還包括標準差,因此,改進算法和K-均值算法最大的區(qū)別體現(xiàn)在對初始聚類中心進行選取的方面,改進算法在選取初始聚類中心時,需要應用到的數(shù)據(jù)包括均值和標準差。

      可根據(jù)實際情況在1……n的范圍內(nèi)進行選取[2]。通過實踐能夠發(fā)現(xiàn),與K-均值算法相比,改進算法在準確率和計算效率方面都具有十分明顯的提升,因此,下文所開展研究工作應用的均為改進后的聚類分析法。

      3 圖書管理系統(tǒng)中,聚類分析算法的實際應用

      3.1 圖書數(shù)據(jù)的聚類分析

      在應用聚類分析算法對圖書進行聚類分析時,需要應用到的數(shù)據(jù)包括圖書流通總次數(shù)以及圖書當年流通次數(shù),也就是說在開展相關分析工作前,工作人員首先需要對上述數(shù)據(jù)進行調(diào)查。圖書聚類分析的結果能夠?qū)D書借閱頻率的高低進行準確、直觀的呈現(xiàn),工作人員便可以在此基礎上對符合圖書利用情況、讀者需求情況的決策進行制定,并對館藏資源以及布局加以優(yōu)化。圖書聚類分析步驟具體如下:

      3.1.1對數(shù)據(jù)進行預處理

      通過實踐能夠發(fā)現(xiàn),對數(shù)據(jù)進行預處理時需要花費挖掘全過程約70%的成本和時間,由此可以看出,想要保證數(shù)據(jù)挖掘工作的高效開展,關鍵在于對數(shù)據(jù)預處理工作的質(zhì)量和效率進行提升。完整的數(shù)據(jù)預處理工作分為四個步驟,分別是數(shù)據(jù)的清洗、集成、轉換和消減。

      在應用聚類分析法對數(shù)據(jù)進行預處理時,需要工作人員對數(shù)據(jù)主要屬性進行重點關注,正常情況下,主要屬性不應當出現(xiàn)空值的情況,若在實踐過程中發(fā)現(xiàn)有某些屬性出現(xiàn)空值,則需要參考挖掘內(nèi)容和表的屬性,及時對空值進行相應的填充。具體來說,在對圖書數(shù)據(jù)進行聚類分析時,需要應用到的分析屬性包括圖書流通總次數(shù)以及圖書當年流通次數(shù),如果圖書館中存在某些從未被讀者借閱過的圖書,那么這兩個字段就為空值,在實際處理的過程中,工作人員應當用0對空值處進行填充,保證工作的順利進行[3]。除此之外,如果需要挖掘的數(shù)據(jù)分散于數(shù)據(jù)庫的不同表內(nèi),工作人員還需要對數(shù)據(jù)庫字段進行整合,并形成完整的表,這樣做的目的在于保證運行效率能夠得到一定程度的提高。

      3.1.2應用聚類分析算法對圖書數(shù)據(jù)加以分析

      在對圖書數(shù)據(jù)進行聚類分析前,工作人員首先需要對聚類個數(shù)進行設置,在本文中,聚類個數(shù)被設置為3,分別代表具有較高利用率、中等利用率和較低利用率的圖書,然后再應用上文所介紹的改進算法,針對圖書借閱次數(shù)展開聚類挖掘工作,得出相應的聚類情況和統(tǒng)計結果。此時,工作人員便可以將聚類分析結果作為主要依據(jù),從3個聚類中對圖書群體存在的共性特征進行分析,明確對圖書利用率產(chǎn)生影響的主要因素,為后續(xù)關聯(lián)規(guī)則的挖掘工作奠定良好基礎。endprint

      3.2 讀者數(shù)據(jù)的聚類分析

      在應用聚類分析算法對讀者進行聚類分析時,需要應用到的數(shù)據(jù)為讀者對圖書進行借閱的次數(shù),也就是說,工作人員在掌握讀者借閱次數(shù)后,便可以開展相應的聚類分析工作。

      3.2.1對數(shù)據(jù)進行預處理

      應用聚類分析法對讀者數(shù)據(jù)進行聚類分析的步驟與圖書數(shù)據(jù)分析相同,本文不再贅述,具體參考上文。

      3.2.2應用聚類分析算法對讀者數(shù)據(jù)加以分析

      在對讀者數(shù)據(jù)進行聚類分析前,工作人員同樣需要對聚類個數(shù)進行設置,本文將聚類個數(shù)設置為3個,分別代表了活躍讀者、一般讀者以及不活躍讀者,然后再通過對改進算法加以應用的方式,針對讀者所借閱圖書的數(shù)量展開聚類挖掘工作,得出相應的聚類情況和統(tǒng)計結果。通過對計算結果進行分析能夠發(fā)現(xiàn),不同類型讀者的圖書利用情況存在著十分明顯的差別,此時,工作人員便可以對原有的借閱標準進行改進,增加活躍讀者能夠借閱的圖書數(shù)量,減少不活躍讀者能夠借閱的圖書數(shù)量,這樣做不僅能夠?qū)Σ煌x者具有的需求進行最大限度的滿足,還可以在一定程度上使圖書利用率得到提升。

      除此之外,工作人員還可以將統(tǒng)計結果作為主要依據(jù),針對不同讀者制定相應的服務計劃,對活躍讀者具有的借閱習慣進行分析,并推薦符合活躍讀者需求的圖書;對不活躍讀者則可以進行相應的問卷調(diào)查,了解導致他們較少借閱圖書的原因和需求,在此基礎上對館藏資源進行優(yōu)化,這樣做能夠使不活躍讀者的借閱次數(shù)得到相應的增加。

      4 結論

      通過對上文所敘述的內(nèi)容進行分析能夠看出,文中所應用聚類分析算法是以K-均值算法為基礎所延伸出的改進算法。將改進后的算法應用在對圖書進行管理的系統(tǒng)中,能夠?qū)D書數(shù)據(jù)以及讀者數(shù)據(jù)進行準確、高效的聚類分析,工作人員則可以通過對統(tǒng)計結果進行分析的方式,了解圖書館內(nèi)現(xiàn)有圖書的利用率以及讀者的需求和愛好,再以此為基礎開展相應的圖書管理工作,則可以取得事半功倍的效果。

      參考文獻

      [1]丁麗,詹林,孫高峰,馬健.數(shù)據(jù)挖掘技術在高職院校圖書管理中的應用[J].綏化學院學報,2013,3306:121-125.

      [2]肖健,刁洪祥.聚類分析算法在數(shù)字圖書館中的應用研究[J].當代圖書館,2013,03:14-17.

      [3]張衛(wèi)東.基于多維度屬性權重優(yōu)化的FCM聚類算法的圖書管理數(shù)據(jù)聚類研究[J].農(nóng)業(yè)圖書情報學刊,2016,2806:50-57.endprint

      猜你喜歡
      圖書館
      去圖書館坐坐
      圖書館
      圖書館里送流年
      圖書館
      文苑(2019年20期)2019-11-16 08:52:12
      夜間的圖書館
      幽默大師(2019年5期)2019-05-14 05:39:38
      圖書館里的小驚喜
      圖書館 Library
      幼兒畫刊(2018年11期)2018-12-03 05:11:44
      時間重疊的圖書館
      文苑(2018年17期)2018-11-09 01:29:40
      圖書館
      小太陽畫報(2018年1期)2018-05-14 17:19:25
      飛躍圖書館
      盐池县| 秦安县| 沐川县| 罗定市| 漳平市| 长乐市| 宜都市| 连城县| 腾冲县| 辽宁省| 平谷区| 砀山县| 大方县| 本溪市| 浦城县| 大方县| 抚松县| 中江县| 东港市| 昆山市| 丰城市| 民县| 清丰县| 巴马| 德阳市| 鄂尔多斯市| 安国市| 沙田区| 武平县| 常德市| 彭州市| 仪陇县| 大英县| 洞口县| 财经| 肇州县| 孟州市| 九龙坡区| 雷州市| 米泉市| 公安县|