• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于數(shù)據(jù)挖掘的高校圖書館圖書采購計劃輔助決策研究

      2009-10-13 03:29:52遲春佳毛志勇
      現(xiàn)代情報 2009年7期
      關(guān)鍵詞:高校圖書館數(shù)據(jù)挖掘

      遲春佳 毛志勇

      〔摘 要〕針對如何科學(xué)制訂高校圖書館圖書采購計劃以提高圖書采購質(zhì)量和效率的問題,分析了傳統(tǒng)圖書采購計劃制訂方法的不足,闡述了數(shù)據(jù)挖掘技術(shù)的內(nèi)涵,提出了將數(shù)據(jù)挖掘技術(shù)用于高校圖書館圖書采購計劃制訂輔助決策的方法,探討了該方法的可行性,并詳細給出了數(shù)據(jù)挖掘技術(shù)應(yīng)用于制訂高校圖書館圖書采購計劃的過程。

      〔關(guān)鍵詞〕數(shù)據(jù)挖掘;圖書采購;高校圖書館

      〔中圖分類號〕G250 〔文獻標識碼〕A 〔文章編號〕1008-0821(2009)07-0108-03

      Research on Assistant Decision-making in Formulating University Library

      Book Purchasing Plan Based on Data MiningChi Chunjia1 Mao Zhiyong2

      (1.Library,Liaoning Technical University,Huludao 125105,China;

      2.College of Business Administration,Liaoning Technical University,Huludao 125105,China)

      〔Abstract〕To improve the book quality and increase the labor efficiency,the data mining technology has been introduced into book purchasing system to formulate a reasonable purchasing plan.After the deficiency analysis of the traditional book purchasing system and thorough investigating of the data mining technology,a new method of drawing up book purchasing plan based on the data mining technology has been brought forward.A detailed procedure of formulating a purchasing plan using this method has been introduced and the method has been proved to be helpful.

      〔Key words〕data mining;book purchase;university library

      隨著辦學(xué)規(guī)模的不斷擴大,國內(nèi)各高校在校人數(shù)迅速增長,廣大師生對圖書館文獻信息服務(wù)的要求越來越高,高校圖書館面臨著巨大壓力,必須通過不斷加強建設(shè)才能滿足讀者需求。圖書采購是圖書館業(yè)務(wù)的一個關(guān)鍵環(huán)節(jié),也是圖書館服務(wù)工作的基礎(chǔ),如何有效使用有限的資金,制訂科學(xué)的采購計劃,合理添置讀者真正需要的圖書,提高圖書資料的利用效率,是圖書采購工作面臨的主要問題,這對于館藏資源體系的建設(shè)完善起著決定性的作用,在很大程度上決定著圖書館整體服務(wù)水平,會直接影響到讀者服務(wù)工作的效果和圖書館任務(wù)的完成。然而,在制訂采購計劃時,傳統(tǒng)的方法卻存在諸多缺陷,已不能很好滿足采購工作的需要,因而迫切需要一種更加高效、科學(xué)的方法進行該項工作。

      1 傳統(tǒng)圖書采購計劃制訂方法的分析

      1.1 傳統(tǒng)的圖書采購計劃制訂主要采用的方法

      1.1.1 專家法

      這是一種最為常見的方法。通常做法是圖書采購部門邀請各個學(xué)科的專家,請專家在書目信息列表上選擇出他們認為有價值、能反映學(xué)科前沿問題、突出學(xué)科重點的圖書,然后再結(jié)合經(jīng)費情況、館藏圖書的學(xué)科專業(yè)分布、發(fā)展趨勢、現(xiàn)有藏書量以及學(xué)校的學(xué)科發(fā)展規(guī)劃情況、圖書流通信息等進行調(diào)整,最終確定采購計劃。專家法的優(yōu)點是發(fā)揮了專家熟悉本領(lǐng)域圖書資料的長處,專家根據(jù)其對本專業(yè)發(fā)展需要、學(xué)科發(fā)展趨勢、同行圖書作者、圖書內(nèi)容的了解,保證了圖書采購的專業(yè)水準,尤其是保證反映本學(xué)科最新發(fā)展成就和趨勢的圖書能夠入選。

      1.1.2 經(jīng)驗法

      此種方法是指在制訂采購計劃時,主要依據(jù)圖書采購人員的經(jīng)驗,根據(jù)其對館藏資源的了解和對圖書需求的判斷來決定圖書采購目錄和數(shù)量,制訂采購計劃。這種做法的優(yōu)點是管理人員長期從事本職工作,對圖書館的現(xiàn)實有充分的了解,工作效率較高。

      1.2 兩種方法的不足與缺陷

      1.2.1 計劃制訂容易受到主觀因素影響

      在圖書采購過程中,盡管采購人員或?qū)<覍I(yè)學(xué)識水平較高、業(yè)務(wù)能力較強,但不可避免地會帶有一定的主觀性和個人喜好,從而很容易導(dǎo)致計劃失去客觀性。

      1.2.2 計劃制訂容易缺乏全面性

      在影響計劃制訂結(jié)果的諸多因素中,由于缺乏有效的技術(shù),讀者的真實需求情況對于采購計劃的制訂者往往是難于準確把握的,這就極易導(dǎo)致計劃制訂缺乏全面性,最終花費了大量資金購置的圖書卻并不能很好地滿足讀者的實際需求。

      2 數(shù)據(jù)挖掘概述

      數(shù)據(jù)挖掘(Data Mining)又稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowledge Discovery in Database,KDD),是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又潛在有用的信息和知識的過程。數(shù)據(jù)挖掘相對于傳統(tǒng)的數(shù)據(jù)分析(如信息查詢、報表分析)而言,其本質(zhì)區(qū)別是數(shù)據(jù)挖掘使用的是基于發(fā)現(xiàn)的方法,運用模式匹配和其它算法決定數(shù)據(jù)之間的重要聯(lián)系,其任務(wù)是從數(shù)據(jù)中發(fā)現(xiàn)模式。數(shù)據(jù)挖掘主要致力于知識的自動發(fā)現(xiàn),是知識發(fā)現(xiàn)研究在數(shù)據(jù)庫系統(tǒng)中的延伸。數(shù)據(jù)挖掘在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識,不僅能對過去的數(shù)據(jù)進行查詢和遍歷,并且能夠?qū)淼内厔莺托袨檫M行預(yù)測并自動探測以前未發(fā)現(xiàn)的模式,從而很好地支持人們的決策。被挖掘出來的信息具有先未知性、有效性和實用性3個特征,能夠用于信息管理、查詢處理、決策支持、過程控制以及許多其它應(yīng)用。目前,數(shù)據(jù)挖掘的主要功能有:

      (1)分類:按照數(shù)據(jù)對象的屬性、特征,建立不同的組類來描述數(shù)據(jù)。

      (2)聚類:識別出數(shù)據(jù)對象內(nèi)在的規(guī)則,按照這些規(guī)則把對象分成若干類。與分類不同的是,聚類沒有預(yù)先定義數(shù)據(jù)對象,而是由數(shù)據(jù)對象決定。

      (3)關(guān)聯(lián)規(guī)則和序列發(fā)現(xiàn):關(guān)聯(lián)分析是揭示數(shù)據(jù)間沒有直接表示的相互關(guān)系,而關(guān)聯(lián)規(guī)則是解釋并識別這些數(shù)據(jù)關(guān)聯(lián)的模式。與關(guān)聯(lián)不同,序列是一種縱向的聯(lián)系,用于發(fā)現(xiàn)并確定數(shù)據(jù)對象之間與時間相關(guān)的序列模式。

      (4)預(yù)測:把握數(shù)據(jù)對象發(fā)展的規(guī)律,對未來的數(shù)據(jù)狀態(tài)趨勢做出預(yù)見。

      (5)偏差的檢測:數(shù)據(jù)庫中總有一些數(shù)據(jù)對象是少數(shù)的、極端的或特例的,對他們進行描述并揭示內(nèi)在的原因。

      數(shù)據(jù)挖掘的技術(shù)和算法主要有統(tǒng)計方法(包括點估計、基于匯總的模型、貝葉斯定理、假設(shè)檢驗、回歸和相關(guān))、相似性度量、決策樹、模糊邏輯、神經(jīng)網(wǎng)絡(luò)和遺傳算法等。而在實際的數(shù)據(jù)挖掘應(yīng)用中,所使用的數(shù)據(jù)挖掘功能和技術(shù)、算法往往不止一種,經(jīng)常是綜合運用的。

      3 數(shù)據(jù)挖掘在制訂高校圖書館圖書采購計劃中的應(yīng)用

      3.1 數(shù)據(jù)挖掘在制訂圖書采購計劃中應(yīng)用的可行性

      目前,數(shù)據(jù)挖掘在經(jīng)過多年的發(fā)展之后已經(jīng)形成相對成熟的技術(shù)體系,特別是在數(shù)據(jù)挖掘設(shè)計、數(shù)據(jù)抽取以及聯(lián)機分析處理技術(shù)等方面都取得了令人滿意的進展,為數(shù)據(jù)挖掘的應(yīng)用奠定了技術(shù)基礎(chǔ)。數(shù)據(jù)挖掘技術(shù)在電信、制造、零售、金融等領(lǐng)域已得到了廣泛的應(yīng)用,并取得了巨大的回報。由于我國各高校圖書館系統(tǒng)經(jīng)過多年的自動化建設(shè),已具備相當?shù)奈镔|(zhì)條件和人才儲備,并積累了大量業(yè)務(wù)數(shù)據(jù),可以為數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書采購奠定一定的物質(zhì)基礎(chǔ)。利用數(shù)據(jù)挖掘技術(shù),圖書采購人員可以非常方便地通過對圖書館自動化系統(tǒng)所積累的數(shù)據(jù)進行處理,分析出文獻的利用情況,從而準確把握讀者實際需求,可以很好地克服了傳統(tǒng)方法中對讀者需求把握不準確的不足。此外由于數(shù)據(jù)挖掘結(jié)果可以為采購文獻提供科學(xué)合理的各種分析報告及預(yù)測信息,從而將人員的主觀因素的影響降到最低,可以最大程度提升決策的科學(xué)性、準確性和全面性。因此,在圖書采購中應(yīng)用數(shù)據(jù)挖掘技術(shù),為圖書采購計劃輔助決策是完全可行的。

      3.2 數(shù)據(jù)挖掘在制訂高校圖書館圖書采購計劃中應(yīng)用的過程數(shù)據(jù)挖掘在制訂圖書采購計劃中的應(yīng)用過程如圖1所示,包括收集原始數(shù)據(jù)、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、結(jié)果分析和制訂采購計劃5個步驟。

      3.2.1 收集原始數(shù)據(jù)

      收集原始數(shù)據(jù)的目的是為后期的數(shù)據(jù)挖掘提供數(shù)據(jù)源。在實際應(yīng)用中,收集的原始數(shù)據(jù)主要包括圖書館自動化系統(tǒng)數(shù)據(jù)庫里的采訪、編目、典藏、流通等的業(yè)務(wù)數(shù)據(jù)。收集的業(yè)務(wù)數(shù)據(jù)信息主要包括以下內(nèi)容:

      (1)讀者信息數(shù)據(jù):主要包括讀者證件號、姓名、性別、專業(yè)、班級、院系、讀者類型、聯(lián)系方式等。

      (2)流通借閱數(shù)據(jù):主要包括借閱記錄號、書名、索書號、讀者證件號、借閱時間、歸還時間等。這部分信息是利用數(shù)據(jù)挖掘技術(shù)獲取圖書館文獻利用狀況的關(guān)鍵,通過對它們的統(tǒng)計、歸類、分析有助于了解書刊的使用情況并對讀者需求進行挖掘和預(yù)測分析。

      (3)文獻檢索記錄:其主要內(nèi)容包括讀者證件號、檢索字段、檢索時間等。這部分數(shù)據(jù)能很好地反映檢索者的需求和借閱傾向,非常有助于對讀者需求的挖掘。

      (4)館藏圖書數(shù)據(jù):主要包括書名、索書號、館藏位置、作者、出版社、出版日期、購入日期等。

      3.2.2 數(shù)據(jù)預(yù)處理

      由于原始數(shù)據(jù)是從圖書館自動化系統(tǒng)數(shù)據(jù)庫導(dǎo)出,一般都會存在大量的含有噪聲、不完整甚至是不一致的數(shù)據(jù)。因此,必須對數(shù)據(jù)挖掘所涉及的數(shù)據(jù)對象進行預(yù)處理,以提高數(shù)據(jù)挖掘效率和所獲模式知識質(zhì)量。

      按照數(shù)據(jù)挖掘理論,數(shù)據(jù)預(yù)處理主要包括:數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)消減。數(shù)據(jù)清洗主要是對原始數(shù)據(jù)填補遺漏數(shù)據(jù)、消除異常數(shù)據(jù)、平滑噪聲數(shù)據(jù),以糾正不一致的數(shù)據(jù)。數(shù)據(jù)集成是將來自多個數(shù)據(jù)源的數(shù)據(jù),結(jié)合在一起并形成一個統(tǒng)一數(shù)據(jù)集合。數(shù)據(jù)轉(zhuǎn)換是將數(shù)據(jù)轉(zhuǎn)換或歸并以構(gòu)成適合數(shù)據(jù)挖掘的形式。數(shù)據(jù)消減用于將數(shù)據(jù)集合進行精簡,精簡結(jié)果數(shù)據(jù)集保持原有的數(shù)據(jù)集的完整性,但挖掘效率更高,且挖掘出的結(jié)果與使用原數(shù)據(jù)集的結(jié)果基本相同。

      具體地,在對3.2.1中收集到的原始數(shù)據(jù)集合進行數(shù)據(jù)預(yù)處理的過程中,首先是對收集到的數(shù)據(jù)檢查完整性及數(shù)一致性、去除噪聲、刪除無效數(shù)據(jù)、填補丟失的域、去除空白數(shù)據(jù)域、考慮時間順序和數(shù)據(jù)變化,如果發(fā)現(xiàn)原始數(shù)據(jù)記錄中某些屬性值為空,如讀者類型或?qū)I(yè)等,可以對其進行遺漏處理。發(fā)現(xiàn)某些數(shù)據(jù)值出現(xiàn)不一致或隨機錯誤時,可以通過手工或其他方式加以糾正。根據(jù)挖掘需求,可將部分屬性取值進行泛化處理,如將年齡屬性可泛化映射成:青年、中年、老年,專業(yè)可泛化為:文、理、工、管、法等。由于分析單一讀者的需求意義并不大,讀者類型可分為本科生、研究生、教師、教輔等類別,分析不同類型讀者的需求特征會更有意義。為了數(shù)據(jù)挖掘的需要,還可以進行屬性構(gòu)造,即根據(jù)已有屬性集來構(gòu)造新的屬性,如構(gòu)造“外借次數(shù)”屬性,其值可通過“借書日期”、“還書日期”導(dǎo)出。構(gòu)造“借出時間”屬性,其值可由“借書日期”、“還書日期”方便地導(dǎo)出。對某些數(shù)據(jù)可以進行統(tǒng)計、匯總處理來構(gòu)造新屬性,如可以累計各類圖書的總冊數(shù)來反映不同類圖書在館藏中的比例關(guān)系。為找到數(shù)據(jù)的特征,可用維變換或轉(zhuǎn)換方法減少無效變量的數(shù)目,可刪除一些與挖掘任務(wù)無關(guān)的屬性,比如證件號、姓名、聯(lián)系方式等。通過一系列的數(shù)據(jù)預(yù)處理工作,可以為下一步的數(shù)據(jù)挖掘過程提供良好的數(shù)據(jù)基礎(chǔ),做好前期準備。

      3.2.3 數(shù)據(jù)挖掘

      這一過程建立在經(jīng)過數(shù)據(jù)預(yù)處理之后的數(shù)據(jù)集合之上,數(shù)據(jù)集合中有大量的數(shù)據(jù),蘊藏著一些潛在的規(guī)則和知識,可以利用關(guān)聯(lián)分析、聚類分析等各種分析方法加以發(fā)現(xiàn)。通過對讀者信息與圖書借閱信息之間的聯(lián)系進行關(guān)聯(lián)性分析,可以了解某類讀者和某類圖書之間的關(guān)聯(lián)度。挖掘文獻頻繁借閱和檢索以及續(xù)借圖書情況,可得出哪些類別圖書讀者比較感興趣。通過對借閱者借書信息的聚類分析,可分析出不同年齡段的人的借閱傾向。通過對還書時間的分析,了解讀者對所借書的態(tài)度等等,還可以得出在不同時期流通較活躍的圖書分類等等。

      3.2.4 結(jié)果分析和制訂采購計劃

      利用數(shù)據(jù)挖掘技術(shù),可以獲得讀者借閱、檢索頻率較高的圖書信息,或缺書比例較大的圖書以及讀者借閱傾向、關(guān)注重點等信息,有助于科學(xué)分析各類文獻的利用率和需求情況,為采購文獻提供科學(xué)合理的各種分析報告及預(yù)測信息,從而指導(dǎo)采購人員對文獻種類進行科學(xué)地篩選,制訂科學(xué)的采購計劃,合理地確定各種文獻所需的復(fù)本量,及時補充短缺的文獻,剔除過時的文獻,從而保障圖書館信息資源體系的科學(xué)性和合理性。

      4 結(jié) 語

      綜上所述,把數(shù)據(jù)挖掘技術(shù)用于高校圖書館圖書采購計劃的制訂,是挖掘高校圖書館信息技術(shù)應(yīng)用潛力、提高管理水平和讀者服務(wù)水平的有益探索,必將有效地改進圖書采購工作水平,使高校圖書館更好地服務(wù)于全校師生。

      參考文獻

      [1]資蕓,李一鵬.基于數(shù)據(jù)倉庫的高校圖書館圖書采訪決策系統(tǒng)研究[J].新世紀圖書館,2006,(4):12-14.

      [2]金建旺,施國生.基于數(shù)據(jù)倉庫的圖書館采購決策研究[J].浙江理工大學(xué)學(xué)報,2008,(2):191-194.

      [3]蘇新寧.數(shù)據(jù)倉庫和數(shù)據(jù)挖掘[M].北京:清華大學(xué)出版社,2006.

      [4]彭木根.數(shù)據(jù)倉庫技術(shù)與實現(xiàn)[M].北京:電子工業(yè)出版社,2002.

      [5]張存祿,等.數(shù)據(jù)挖掘在圖書采購中的應(yīng)用[J].情報科學(xué),2004,(5):284-286.

      [6]龔宇花,刑耐生.數(shù)據(jù)挖掘技術(shù)在高校數(shù)字化圖書館中的應(yīng)用[J].電腦知識與技術(shù),2008,(7):1547-1548,1557.

      [7]郭佳慧.數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書館中的實現(xiàn)[J].農(nóng)業(yè)圖書情報學(xué)刊,2008,(9):36-38.

      [8]朱明.數(shù)據(jù)挖掘[M].合肥:中國科學(xué)技術(shù)大學(xué)出版社,2002.

      [9]Jiawei Han,Micheline Kamber.Data Mining:Concepts and techniques.Morgan Kaufmann Publishers,Inc.2001.

      猜你喜歡
      高校圖書館數(shù)據(jù)挖掘
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
      高校圖書館閱讀推廣案例分析
      科技視界(2016年21期)2016-10-17 19:32:37
      微信公眾平臺在高校圖書館信息服務(wù)中的應(yīng)用研究
      科技視界(2016年21期)2016-10-17 19:25:20
      高校圖書館閱讀推廣活動研究
      商(2016年27期)2016-10-17 06:38:27
      試論高校圖書館在網(wǎng)絡(luò)環(huán)境沖擊下的人文建設(shè)
      商(2016年27期)2016-10-17 06:30:59
      高校圖書館閱讀推廣實踐探討
      科技視界(2016年20期)2016-09-29 13:17:57
      高校圖書館電子資源的宣傳與推廣
      科技視界(2016年20期)2016-09-29 11:22:45
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      随州市| 阳江市| 安达市| 平安县| 龙州县| 普宁市| 崇明县| 淳安县| 恭城| 瑞安市| 奎屯市| 玉屏| 台南县| 鱼台县| 阿合奇县| 正宁县| 抚州市| 瓮安县| 曲麻莱县| 丰台区| 利川市| 张北县| 昆明市| 邵东县| 青冈县| 贵南县| 恩施市| 长武县| 宁远县| 大港区| 嘉禾县| 石楼县| 仁布县| 南京市| 西平县| 秦安县| 仙居县| 白玉县| 秦皇岛市| 孝昌县| 澄江县|