• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      小數(shù)據(jù)思維下的文獻(xiàn)資源建設(shè)創(chuàng)新研究

      2020-09-26 09:51孫東瑩
      河南圖書(shū)館學(xué)刊 2020年8期
      關(guān)鍵詞:資源建設(shè)圖書(shū)館

      孫東瑩

      摘?要:文章分析了高校圖書(shū)館建設(shè)小數(shù)據(jù)庫(kù)的可行性,設(shè)計(jì)了建設(shè)小數(shù)據(jù)庫(kù)的步驟,提出了小數(shù)據(jù)庫(kù)建設(shè)過(guò)程中需要注意的問(wèn)題,以期優(yōu)化館藏資源結(jié)構(gòu),助力高?!半p一流”建設(shè)。

      中圖分類(lèi)號(hào):G250文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-1588(2020)08-0074-03

      關(guān)鍵詞:小數(shù)據(jù);小數(shù)據(jù)庫(kù);圖書(shū)館;資源建設(shè)

      1?小數(shù)據(jù)概念介紹

      “互聯(lián)網(wǎng)+”時(shí)代,大數(shù)據(jù)已深入社會(huì)的各個(gè)領(lǐng)域,圖書(shū)館也積極利用大數(shù)據(jù)開(kāi)展創(chuàng)新服務(wù)和相關(guān)研究,如智慧圖書(shū)館研究、學(xué)科創(chuàng)新服務(wù)等。大數(shù)據(jù)具有海量(Volume)、多樣(Variety)、快速(Velocity)、價(jià)值密度低(Value)等特性[1]。大數(shù)據(jù)專(zhuān)家舍恩伯格在《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》一書(shū)中指出,大數(shù)據(jù)時(shí)代人們對(duì)待數(shù)據(jù)的思維方式將發(fā)生三個(gè)變化:一是人們處理的數(shù)據(jù)從樣本數(shù)據(jù)變成全部數(shù)據(jù)。二是由于是全部數(shù)據(jù),人們不得不接受數(shù)據(jù)的混雜性,而放棄對(duì)精確性的追求。三是人們通過(guò)對(duì)大數(shù)據(jù)的處理,解決問(wèn)題的思維方式由追求因果關(guān)系轉(zhuǎn)向關(guān)注相關(guān)關(guān)系[2]。

      與大數(shù)據(jù)相對(duì)應(yīng)的是小數(shù)據(jù),小數(shù)據(jù)指以個(gè)人為中心的全方位數(shù)據(jù),包括被采集對(duì)象的生活習(xí)慣、身體狀況、社交、財(cái)務(wù)、喜好、情緒、行為等數(shù)據(jù)[3]。隨著現(xiàn)代科技的發(fā)展,數(shù)據(jù)管理者可通過(guò)移動(dòng)技術(shù)、傳感器及可穿戴設(shè)備等采集個(gè)體信息,并對(duì)采集到的信息進(jìn)行整理、分析,構(gòu)建具有個(gè)人特色的數(shù)據(jù)系統(tǒng),并對(duì)個(gè)人的特性、社會(huì)關(guān)系、需求和行為進(jìn)行精準(zhǔn)分析與預(yù)測(cè)。小數(shù)據(jù)是特定領(lǐng)域的樣本數(shù)據(jù),具有個(gè)性化、精確性和隱蔽性等特點(diǎn)。與大數(shù)據(jù)擁有海量信息不同,小數(shù)據(jù)的樣本數(shù)量有限;與大數(shù)據(jù)采用相關(guān)關(guān)系分析不同,小數(shù)據(jù)采用因果關(guān)系分析。

      圖書(shū)館可利用大數(shù)據(jù)技術(shù)快速獲取海量、多樣的數(shù)據(jù),為自身的建設(shè)、運(yùn)營(yíng)和服務(wù)決策提供數(shù)據(jù)支撐。但是,大數(shù)據(jù)分析只有在整個(gè)行業(yè)或某個(gè)區(qū)域內(nèi)收集巨量數(shù)據(jù),利用Hadoop、HPCC、Storm等工具,才能使事物之間的相關(guān)關(guān)系得以呈現(xiàn)[4]。普通高校圖書(shū)館一般不具備這樣的技術(shù)、能力和人力資源,且整個(gè)行業(yè)的大數(shù)據(jù)分析結(jié)果未必與其實(shí)際情況相符。筆者認(rèn)為,單個(gè)高校圖書(shū)館收集小數(shù)據(jù)對(duì)于自身的建設(shè)具有重要的意義。因此,高校圖書(shū)館應(yīng)以用戶(hù)為中心,通過(guò)移動(dòng)閱讀終端、傳感器技術(shù)、可穿戴設(shè)備、物聯(lián)網(wǎng)技術(shù)等方式收集與本館相關(guān)的小數(shù)據(jù),構(gòu)建具有本館用戶(hù)特點(diǎn)的數(shù)據(jù)系統(tǒng),進(jìn)而為創(chuàng)新服務(wù)提供參考。

      2?開(kāi)展小數(shù)據(jù)庫(kù)研究的意義

      2018年8月,教育部、財(cái)政部與國(guó)家發(fā)展改革委聯(lián)合印發(fā)了《關(guān)于高等學(xué)校加快“雙一流”建設(shè)的指導(dǎo)意見(jiàn)》的通知,為高校指明了發(fā)展方向,“雙一流”是指建設(shè)一流大學(xué)和一流學(xué)科,走內(nèi)涵式發(fā)展路線(xiàn)。建設(shè)一流大學(xué)和一流學(xué)科需要一流人才,因此,高校圖書(shū)館作為學(xué)校的文獻(xiàn)信息中心,應(yīng)加強(qiáng)文獻(xiàn)資源建設(shè),為一流人才提供優(yōu)質(zhì)的信息服務(wù),滿(mǎn)足他們的多元化需求。如何實(shí)現(xiàn)資源與用戶(hù)的精準(zhǔn)配置,已成為高校圖書(shū)館在完成資源積累后亟待解決的問(wèn)題[5]。目前,高校圖書(shū)館的文獻(xiàn)資源建設(shè)面臨實(shí)體館藏不可取代、虛擬館藏需求量激增兩個(gè)問(wèn)題,在經(jīng)費(fèi)有限的情況下,高校圖書(shū)館一般根據(jù)文獻(xiàn)采訪(fǎng)原則和年度采訪(fǎng)計(jì)劃采購(gòu)文獻(xiàn)資源,但實(shí)際上采購(gòu)的文獻(xiàn)資源無(wú)法滿(mǎn)足讀者的多元化需求,讀者滿(mǎn)意率也逐年下降。很多高校圖書(shū)館采取讀者需求驅(qū)動(dòng)采購(gòu)模式,開(kāi)展了“你買(mǎi)書(shū),我買(mǎi)單”、讀者薦購(gòu)、圖書(shū)展覽等活動(dòng),以期提高館藏資源利用率,但實(shí)際效果并不明顯。因此,高校圖書(shū)館應(yīng)建設(shè)小數(shù)據(jù)庫(kù),為讀者提供精準(zhǔn)的信息服務(wù),最大限度地滿(mǎn)足讀者的多元化需求,助力高?!半p一流”建設(shè)[6]。

      3?建設(shè)小數(shù)據(jù)庫(kù)

      3.1?成立小數(shù)據(jù)庫(kù)建設(shè)團(tuán)隊(duì)

      高校圖書(shū)館應(yīng)成立小數(shù)據(jù)庫(kù)建設(shè)團(tuán)隊(duì),開(kāi)展數(shù)據(jù)收集、數(shù)據(jù)清洗等工作,挖掘讀者的實(shí)際需求,實(shí)現(xiàn)信息服務(wù)與讀者需求的精準(zhǔn)對(duì)接。數(shù)據(jù)收集工作涉及高校圖書(shū)館、院系及行政部門(mén),因此,高校圖書(shū)館應(yīng)加強(qiáng)與院系及行政部門(mén)的合作,獲得學(xué)校的政策支持和技術(shù)支持。

      3.2?收集數(shù)據(jù)

      高校圖書(shū)館建設(shè)小數(shù)據(jù)庫(kù)需要收集讀者在學(xué)校的各種活動(dòng)信息,以及使用圖書(shū)館產(chǎn)生的與文獻(xiàn)資源建設(shè)相關(guān)的數(shù)據(jù),如基本數(shù)據(jù)、圖書(shū)館行為數(shù)據(jù)及科研數(shù)據(jù)等?;緮?shù)據(jù)包括讀者的職業(yè)、年齡、性別、專(zhuān)業(yè)等信息,是讀者的基本信息,這些數(shù)據(jù)來(lái)源于圖書(shū)館讀者管理系統(tǒng);圖書(shū)館行為數(shù)據(jù)是指讀者在利用圖書(shū)館的過(guò)程中產(chǎn)生的數(shù)據(jù),如入館時(shí)間、入館次數(shù)、推薦圖書(shū)記錄、借閱記錄、使用OPAC系統(tǒng)記錄、使用數(shù)據(jù)庫(kù)記錄、咨詢(xún)記錄、文獻(xiàn)傳遞記錄等,這些數(shù)據(jù)來(lái)源于視頻監(jiān)控系統(tǒng)、傳感器網(wǎng)絡(luò)系統(tǒng)、讀者服務(wù)終端數(shù)據(jù)采集系統(tǒng)及數(shù)據(jù)庫(kù)商監(jiān)控系統(tǒng);科研數(shù)據(jù)包括專(zhuān)業(yè)建設(shè)信息和科研成果信息,如學(xué)科建設(shè)動(dòng)向、教學(xué)改革動(dòng)向、課程安排、科研成果、學(xué)術(shù)會(huì)議及項(xiàng)目實(shí)施情況等,這些數(shù)據(jù)來(lái)源于院系和行政部門(mén)等。

      3.3?數(shù)據(jù)清洗

      為了減少數(shù)據(jù)產(chǎn)生的噪音,小數(shù)據(jù)庫(kù)建設(shè)團(tuán)隊(duì)需要對(duì)收集到的數(shù)據(jù)進(jìn)行清洗。數(shù)據(jù)清洗是指發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識(shí)別的錯(cuò)誤的最后一道程序,包括檢查數(shù)據(jù)一致性、處理無(wú)效值和缺失值等[7]。數(shù)據(jù)清洗是數(shù)據(jù)分析中最復(fù)雜的部分,需要花費(fèi)大量的時(shí)間。小數(shù)據(jù)庫(kù)建設(shè)過(guò)程中的數(shù)據(jù)清洗主要涉及數(shù)據(jù)缺失、數(shù)據(jù)錯(cuò)誤、數(shù)據(jù)邏輯錯(cuò)誤、數(shù)據(jù)重復(fù)等問(wèn)題[8]。對(duì)數(shù)據(jù)缺失、數(shù)據(jù)錯(cuò)誤的處理,主要用刪除法和插補(bǔ)法。刪除法即直接將存在缺失的數(shù)據(jù)刪除,插補(bǔ)法是通過(guò)均值平滑、建立回歸模型、極大似然估計(jì)推算出空值等方式補(bǔ)全數(shù)據(jù)。數(shù)據(jù)邏輯錯(cuò)誤是指數(shù)據(jù)的屬性值與實(shí)際值不符,違背了業(yè)務(wù)規(guī)則或邏輯,如:一條數(shù)據(jù)記錄的某個(gè)學(xué)生的出生日期為“1990/10/35”,超出了日期的最大值,這種錯(cuò)誤的處理方法是根據(jù)相應(yīng)領(lǐng)域知識(shí)制定約束規(guī)則,利用數(shù)學(xué)方法獲得規(guī)則閉集,自動(dòng)判斷字段值是否違反規(guī)則約束。數(shù)據(jù)重復(fù)是指多次出現(xiàn)某一條數(shù)據(jù),常用的檢測(cè)方法有基于排序比較思想的優(yōu)先隊(duì)列算法、鄰近排序算法、多趟近鄰排序法等,針對(duì)數(shù)據(jù)重復(fù)這一問(wèn)題的處理方法主要有基于相似度函數(shù)的算法、基于規(guī)則的算法、基于機(jī)器學(xué)習(xí)的算法、人機(jī)結(jié)合的算法等[9]。

      猜你喜歡
      資源建設(shè)圖書(shū)館
      圖書(shū)館
      氣味圖書(shū)館
      歡迎到圖書(shū)館做客
      科學(xué)數(shù)據(jù)共享平臺(tái)的建設(shè)與服務(wù)探討
      檢察檔案信息資源建設(shè)與開(kāi)發(fā)利用
      教學(xué)資源庫(kù)建設(shè)和共享機(jī)制研究
      保定旅游資源建設(shè)現(xiàn)狀及存在的問(wèn)題研究
      移動(dòng)學(xué)習(xí)方式下實(shí)驗(yàn)教學(xué)資源建設(shè)的研究
      去圖書(shū)館
      阆中市| 阳高县| 隆安县| 汝阳县| 云和县| 沁源县| 德庆县| 苍山县| 中超| 钦州市| 余干县| 江阴市| 昂仁县| 沭阳县| 重庆市| 明水县| 平安县| 平山县| 涡阳县| 腾冲县| 迁安市| 巴楚县| 伊春市| 康马县| 宝兴县| 潢川县| 开江县| 木里| 麦盖提县| 安国市| 定远县| 田阳县| 天水市| 永年县| 鄂托克前旗| 汉寿县| 安图县| 赤城县| 西乌| 基隆市| 仁布县|