• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)挖掘技術(shù)在高校圖書文獻(xiàn)情報(bào)分析中的應(yīng)用

      2015-12-13 20:21:15程九菊
      創(chuàng)新科技 2015年1期
      關(guān)鍵詞:數(shù)據(jù)挖掘圖書數(shù)據(jù)庫(kù)

      [文獻(xiàn)標(biāo)識(shí)碼]A

      文章編號(hào):1671-0037(2015)01-78-2

      收稿日期:2014-12-18

      作者簡(jiǎn)介:程九菊(1987.4-),女,本科,助教,研究方向:數(shù)字圖書館。

      Application of Data Exploitation Technology in University Library and Information Analysis

      Cheng Jiuju

      (Library of Xinyang Vocational and Technical College, Xinyang Henan 464000)

      Abstract:Data exploitation is a kind of relatively young information processing technology, has been widely used in many fields, and its important role has become increasingly prominent. This paper mainly introduces the concept of data exploitation, the process of data exploitation, and its important role in the university library has been dominantly discussed.

      Keywords:data exploitation; university library; application

      隨著社會(huì)的不斷發(fā)展,科學(xué)技術(shù)的不斷進(jìn)步,各行各業(yè)都涌現(xiàn)出了各種各樣的大量的數(shù)據(jù),數(shù)據(jù)爆炸式的增長(zhǎng),使得我們已經(jīng)沒(méi)有更多的精力和時(shí)間去查看這些數(shù)據(jù),而更為關(guān)注于找到行之有效地方法去方便快捷的利用數(shù)據(jù),自動(dòng)的處理數(shù)據(jù),智能地找到隱藏在其中的潛在的對(duì)我們的生活、工作有幫助的信息和知識(shí) [1]。因此一個(gè)作為計(jì)算機(jī)科學(xué)前沿學(xué)科的數(shù)據(jù)挖掘技術(shù)也應(yīng)運(yùn)而生,它出現(xiàn)于20世紀(jì)80年代后期,20世紀(jì)90年代有了更加迅猛的發(fā)展,目前數(shù)據(jù)挖掘已經(jīng)在金融、商務(wù)、電信產(chǎn)業(yè)、醫(yī)療衛(wèi)生、科學(xué)與工程等方面得到了廣泛的應(yīng)用,同樣數(shù)據(jù)挖掘技術(shù)在高校圖書館中也發(fā)揮著巨大的作用。

      1 數(shù)據(jù)挖掘的概念

      什么是數(shù)據(jù)挖掘呢?顧名思義就是從海量的數(shù)據(jù)中挖掘出知識(shí)的過(guò)程。各行各業(yè)所產(chǎn)生的數(shù)據(jù)形式是不一樣的,作為一種實(shí)用的技術(shù),數(shù)據(jù)挖掘可以應(yīng)用于各種類型的數(shù)據(jù),包括事務(wù)數(shù)據(jù)、數(shù)據(jù)庫(kù)數(shù)據(jù)、數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)、空間數(shù)據(jù)、多媒體數(shù)據(jù)、數(shù)據(jù)流、圖或網(wǎng)絡(luò)數(shù)據(jù)等,從這些數(shù)據(jù)中發(fā)現(xiàn)潛藏的規(guī)律,找到其中的有趣的模式即知識(shí),為人們的生產(chǎn)、生活、科研等提供依據(jù),推動(dòng)著社會(huì)更快更好地往前發(fā)展 [2]。

      2 數(shù)據(jù)挖掘的過(guò)程

      2.1 數(shù)據(jù)清理

      即刪除掉不正確、不一致、不完整或冗余數(shù)據(jù),光滑噪聲數(shù)據(jù),改進(jìn)數(shù)據(jù)的質(zhì)量,使得最后的數(shù)據(jù)集合有利于數(shù)據(jù)挖掘的進(jìn)行,能夠順利地推導(dǎo)出正確的模式,得到可靠的輸出及結(jié)論。

      2.2 數(shù)據(jù)集成

      即將不同數(shù)據(jù)源中的數(shù)據(jù)進(jìn)行合并存放在一個(gè)具有相同結(jié)構(gòu)及屬性的數(shù)據(jù)存儲(chǔ)中,有效地集成可以減少結(jié)果數(shù)據(jù)集的不一致和冗余,有利于提高后續(xù)挖掘過(guò)程的速度及準(zhǔn)確性。

      2.3 數(shù)據(jù)變換

      即通過(guò)聚集或匯總操作,把數(shù)據(jù)統(tǒng)一和變換成方便于挖掘的結(jié)構(gòu)。數(shù)據(jù)變換使的挖掘過(guò)程更有效,促進(jìn)了數(shù)據(jù)挖掘的成功。

      2.4 數(shù)據(jù)選擇

      即從數(shù)據(jù)庫(kù)中取出與目標(biāo)任務(wù)有關(guān)的數(shù)據(jù),例如高校圖書館的數(shù)據(jù)庫(kù)中包含有各個(gè)院系的學(xué)生個(gè)人信息及借閱信息。如果我們想分析某個(gè)系的學(xué)生借閱圖書的情況,則只需要提取出本系學(xué)生借閱記錄即可,而如果我們想分析各系各屆學(xué)生對(duì)于各類圖書的熱愛(ài)程度,以方便于為學(xué)生進(jìn)行圖書推薦,則此任務(wù)與學(xué)生信息中的性別、學(xué)號(hào)等屬性無(wú)關(guān),在數(shù)據(jù)挖掘前可以通過(guò)刪除冗余的或不相關(guān)的屬性來(lái)減少要分析的數(shù)據(jù)量,能夠加快挖掘的進(jìn)程,而且能使得到的模式更宜于理解。

      2.5 數(shù)據(jù)挖掘

      即使用智能的方法來(lái)提取出數(shù)據(jù)的模式。

      2.6 模式評(píng)估

      即根據(jù)某種興趣度度量,找到代表知識(shí)的真正有趣的模式,所謂有趣的模式是指所產(chǎn)生的模式是新穎的,潛在能用的,易于被人理解的,而且在某種確信度上對(duì)于新的或是檢驗(yàn)數(shù)據(jù)是有效地。

      2.7 知識(shí)表示

      即使用知識(shí)表示和可視化的技術(shù),使得挖掘出來(lái)的知識(shí)能夠呈現(xiàn)到用戶面前,使知識(shí)容易理解,方便人們使用。

      3 數(shù)據(jù)挖掘在圖書館中的應(yīng)用

      隨著科學(xué)技術(shù)的不斷進(jìn)步,高校圖書館的管理也從原來(lái)的人工記錄轉(zhuǎn)變?yōu)榱爽F(xiàn)代化的圖書管理系統(tǒng),方便了圖書的管理及借閱,但是,隨著社會(huì)的不斷進(jìn)步,圖書館不能僅局限于借、還書這種最基本的職能,而應(yīng)該更主動(dòng)地去為讀者提供更高質(zhì)量的服務(wù),使的圖書館能更大程度地發(fā)揮其功效,因此,作為一門新興的信息處理技術(shù)的數(shù)據(jù)挖掘技術(shù)也在圖書館找到了用武之地,圖書館的大量的數(shù)據(jù)資源為其挖掘提供了肥沃的土壤。

      3.1 為高校圖書館的領(lǐng)導(dǎo)決策及購(gòu)買圖書提供強(qiáng)有力的依據(jù)

      圖書館是高校的靈魂所在,是一個(gè)學(xué)校的精髓部分,學(xué)校在進(jìn)步,圖書館也必須要不斷地前進(jìn),這就要求要不斷地給圖書館注入新鮮的血液,但是,圖書館的經(jīng)費(fèi)是有限的,我們要利用有限的經(jīng)費(fèi)在更大程度的為讀者服務(wù),就必須能夠采購(gòu)到有更高利用率的圖書,以往我們采購(gòu)圖書有三種方法:一是各院系各推薦一名老師隨圖書館老師一起去采購(gòu);二是由各院系向圖書館推薦圖書;三是圖書館老師根據(jù)已有經(jīng)驗(yàn),對(duì)館藏的了解等自行采購(gòu)。但這些采購(gòu)方法都具有很強(qiáng)的主觀意識(shí),缺乏全面性,而數(shù)據(jù)挖掘技術(shù)的引進(jìn)就能很好地解決這一問(wèn)題,通過(guò)讀者的借閱記錄,系統(tǒng)中的歷史采購(gòu)記錄等,挖掘出各類圖書的利用度,能夠使得更有針對(duì)性地去購(gòu)買圖書。利用數(shù)據(jù)挖掘技術(shù)作用于圖書館的數(shù)據(jù)庫(kù),我們可以從中了解到各學(xué)科的關(guān)聯(lián)度,使得圖書館領(lǐng)導(dǎo)在進(jìn)行館藏分布時(shí)能夠更正確地進(jìn)行決策。

      3.2 使得圖書館能主動(dòng)地為讀者提供更為貼心的服務(wù)

      高校圖書館基本都有檢索系統(tǒng),當(dāng)你知道自己想要看哪本書時(shí),只要在檢索系統(tǒng)中輸入該書的名字,便能找到此書的相關(guān)信息,并且能很快捷地找到該書,實(shí)現(xiàn)借閱。但當(dāng)讀者漫無(wú)目的時(shí),去諾大的圖書館借書卻是一件很費(fèi)時(shí)費(fèi)精力的事,有時(shí)來(lái)來(lái)回回走了數(shù)趟還沒(méi)有發(fā)現(xiàn)自己鐘愛(ài)的圖書,這樣會(huì)逐漸減少讀者對(duì)圖書館的興趣,進(jìn)而也使讀者的數(shù)量逐漸減少了。

      采用數(shù)據(jù)挖掘技術(shù)作用于圖書館管理系統(tǒng)的數(shù)據(jù)庫(kù)可以根據(jù)讀者的專業(yè),以往的借閱記錄,以及同專業(yè)學(xué)生的借閱記錄等挖掘出有趣的模式,評(píng)估讀者的興趣愛(ài)好,初步預(yù)測(cè)此讀者可能喜愛(ài)的圖書,實(shí)現(xiàn)圖書的推送,縮小了讀者的選擇范圍,同樣也可以挖掘出同屆學(xué)生最熱愛(ài)的圖書,而且可以根據(jù)相關(guān)性分組或關(guān)聯(lián)規(guī)則,找到圖書借閱的常有的頻繁序列,如DELPHI書總是和數(shù)據(jù)庫(kù)建設(shè)這類書同時(shí)被借出,這是一個(gè)頻繁的子結(jié)構(gòu),這樣,當(dāng)有同學(xué)借閱DELPHI這本書時(shí),我們就可以給他推薦數(shù)據(jù)庫(kù)建設(shè)這本書,進(jìn)行主動(dòng)地提供服務(wù),不僅留住了當(dāng)前的讀者,同時(shí)也能挖掘出潛在的讀者,增加圖書館的讀者流量,也增加了各類圖書的利用率。同樣從挖掘出來(lái)的信息我們可以區(qū)分開(kāi)來(lái)熱門圖書和冷門圖書,以及認(rèn)識(shí)到各類圖書之間的關(guān)聯(lián)度,以此來(lái)實(shí)現(xiàn)圖書館圖書分布位置的優(yōu)化,更方便于讀者的借閱。

      3.3 防止圖書館的數(shù)據(jù)庫(kù)被入侵

      高校圖書館的數(shù)據(jù)庫(kù)是圖書館的核心,其中記錄了各系學(xué)生的個(gè)人信息,學(xué)生的借閱信息,以及所有館藏圖書的信息,一旦遭到入侵,數(shù)據(jù)庫(kù)被破壞,也許就會(huì)使圖書館一度回到“原始社會(huì)”,后果將不堪設(shè)想。所以,我們要保護(hù)圖書館數(shù)據(jù)庫(kù)的安全,通常在圖書館的服務(wù)器上都安裝的有防火墻,并且服務(wù)器也設(shè)置了密碼,但是,為了做到萬(wàn)無(wú)一失,我們也可以使用數(shù)據(jù)挖掘技術(shù),構(gòu)建出正常訪問(wèn)行為的模型,或是挖掘頻繁遇到的事件序列,檢測(cè)到離群點(diǎn),阻止或停止惡意的行為,并提供報(bào)告信息,實(shí)現(xiàn)入侵檢測(cè),保護(hù)圖書館的數(shù)據(jù)安全。

      4 結(jié)語(yǔ)

      隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展,其在圖書館發(fā)揮的作用也日益顯著,它使得圖書館的服務(wù)質(zhì)量進(jìn)一步提高了,同時(shí)也優(yōu)化了館藏的分布,能檢測(cè)惡意攻擊圖書館數(shù)據(jù)庫(kù)的行為,保護(hù)了圖書館的數(shù)據(jù)安全,作為一門新興的信息處理技術(shù),它得到了越來(lái)越多人的關(guān)注,也得到了進(jìn)一步的研究,相信在不久的將來(lái),隨著數(shù)據(jù)挖掘技術(shù)的不斷深化,功能的不斷加強(qiáng),它將為圖書館提供更多的幫助,使的圖書館能更大程度的去發(fā)揮其潛在的作用,更好地為廣大的師生員工服務(wù)。

      猜你喜歡
      數(shù)據(jù)挖掘圖書數(shù)據(jù)庫(kù)
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      圖書推薦
      南風(fēng)(2020年22期)2020-09-15 07:47:08
      歡迎來(lái)到圖書借閱角
      班里有個(gè)圖書角
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      數(shù)據(jù)庫(kù)
      數(shù)據(jù)庫(kù)
      數(shù)據(jù)庫(kù)
      數(shù)據(jù)庫(kù)
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      宽甸| 大宁县| 油尖旺区| 高台县| 珲春市| 嘉定区| 汉寿县| 玉环县| 罗定市| 如东县| 九江市| 恩平市| 华池县| 揭阳市| 阆中市| 呼和浩特市| 定陶县| 临海市| 高青县| 万载县| 都昌县| 浦城县| 虹口区| 阆中市| 习水县| 临泉县| 土默特左旗| 富蕴县| 大竹县| 东山县| 子洲县| 资阳市| 邹城市| 鄂托克前旗| 南部县| 共和县| 广水市| 股票| 肥城市| 唐河县| 乌鲁木齐市|