李 偉
(河南科技大學(xué) 應(yīng)用工程學(xué)院,河南 三門峽 472000)
近年來,我國(guó)信息技術(shù)飛速發(fā)展,各類信息數(shù)據(jù)呈現(xiàn)幾何級(jí)增長(zhǎng)態(tài)勢(shì),形成海量信息數(shù)據(jù)。大數(shù)據(jù)技術(shù)作為一種綜合的信息數(shù)據(jù)處理工具,能夠分析結(jié)構(gòu)化、半結(jié)構(gòu)化及異構(gòu)化的信息數(shù)據(jù),具有精準(zhǔn)和高效的特性,已經(jīng)廣泛應(yīng)用于信息處理和數(shù)據(jù)分析領(lǐng)域[1]。圖書館是圖書信息采集、存儲(chǔ)、傳播、服務(wù)的主要場(chǎng)所,是圖書信息的集散地,隨著圖書館信息化建設(shè)的不斷加強(qiáng),其管理和服務(wù)業(yè)務(wù)都逐步走向了智能化[2]。具體到圖書采編業(yè)務(wù)領(lǐng)域,由于電子信息資源的大量涌入,圖書采編對(duì)象早已不再局限于單一的紙質(zhì)文獻(xiàn),而是融入了包括音像產(chǎn)品、機(jī)讀文件、電子文獻(xiàn)、網(wǎng)絡(luò)文獻(xiàn)等數(shù)字資源,并且其占比在逐年增長(zhǎng)。采編對(duì)象的多樣化,迫切需要采編方式、采編途徑的多元化,以及采編目錄的自動(dòng)化、規(guī)范化、標(biāo)準(zhǔn)化,這樣才能滿足讀者的多樣化閱讀需求,保證圖書館的工作效率和服務(wù)水平[3,4]。這些數(shù)量巨大、種類多樣的電子信息資源,靠人工采編是無法完成的,而大數(shù)據(jù)技術(shù)具有快速獲取數(shù)據(jù)、有效分析數(shù)據(jù)、標(biāo)準(zhǔn)化處理數(shù)據(jù)的優(yōu)勢(shì),使用大數(shù)據(jù)技術(shù)進(jìn)行圖書智能化采編,可以輕松實(shí)現(xiàn)多樣化的圖書信息采集并對(duì)其數(shù)據(jù)加以高效分析,提高采編效率[5]。因此,對(duì)大數(shù)據(jù)場(chǎng)域中的圖書館智能采編模式進(jìn)行研究具有重要的應(yīng)用價(jià)值和現(xiàn)實(shí)意義。
大數(shù)據(jù)技術(shù),簡(jiǎn)單而言,就是從多種類型的數(shù)據(jù)中快速獲取有價(jià)值的信息的技術(shù)。目前,科學(xué)技術(shù)高度發(fā)達(dá),人與人、人與物、物與物之間的交流越來越密切,所產(chǎn)生的信息量巨大,在這些巨量的信息數(shù)據(jù)面前,人們需要快速有效、簡(jiǎn)單準(zhǔn)確地挖掘出其中“有用”的信息,以獲取海量數(shù)據(jù)中有利于自己使用的有價(jià)值的數(shù)據(jù),由此而產(chǎn)生的數(shù)據(jù)處理技術(shù)就是大數(shù)據(jù)技術(shù)[6]。由此可見,大數(shù)據(jù)技術(shù)的實(shí)質(zhì)就是對(duì)繁雜的海量數(shù)據(jù)中潛藏的有價(jià)值的數(shù)據(jù)進(jìn)行提煉的數(shù)據(jù)處理技術(shù),其核心是通過多種形式的數(shù)據(jù)挖掘來幫助人們更好地分析數(shù)據(jù)、理解數(shù)據(jù)、應(yīng)用數(shù)據(jù),有利于人們做出科學(xué)的有針對(duì)性的決策判斷。經(jīng)過近年來的快速發(fā)展,大數(shù)據(jù)技術(shù)不斷涌現(xiàn)出新的技術(shù)模式,逐步形成了完善的技術(shù)體系,已經(jīng)滲透到國(guó)民經(jīng)濟(jì)的各個(gè)領(lǐng)域,成為數(shù)據(jù)采集、存儲(chǔ)、處理和展現(xiàn)的有力武器。
傳統(tǒng)圖書采編工作主要針對(duì)大量的紙質(zhì)印刷型文獻(xiàn)資源及少量的如音像制品等電子文獻(xiàn)資源,采編對(duì)象結(jié)構(gòu)相對(duì)簡(jiǎn)單,文獻(xiàn)資料的分類采集、編目?jī)?chǔ)存等工作主要通過機(jī)器設(shè)備輔助人工操作來完成,雖然其組織形式相對(duì)簡(jiǎn)單,但其內(nèi)容卻既繁瑣又復(fù)雜,采編人員需要付出大量的時(shí)間和精力,工作壓力較大[7]。隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的快速發(fā)展,圖書采編內(nèi)容發(fā)生了很大變化,電子信息資源的采編業(yè)務(wù)量增幅較大,促使圖書館加強(qiáng)采編業(yè)務(wù)的信息化建設(shè)力度,將數(shù)字化信息技術(shù)應(yīng)用于圖書采編業(yè)務(wù)領(lǐng)域,實(shí)現(xiàn)圖書采編業(yè)務(wù)的智能化。圖書智能化采編與傳統(tǒng)圖書采編相比,具有以下優(yōu)勢(shì):采編人員可以更方便地采編電子文獻(xiàn)資源,豐富館藏電子資源數(shù)量;拓寬圖書采編渠道,實(shí)現(xiàn)圖書的網(wǎng)上采編;便于圖書館之間采編業(yè)務(wù)的交流合作,實(shí)現(xiàn)信息資源共享[8]。基于以上優(yōu)勢(shì)可知,智能圖書采編業(yè)務(wù)能夠順應(yīng)信息化時(shí)代圖書館工作的發(fā)展變化,滿足人們?nèi)找嬖鲩L(zhǎng)的電子文獻(xiàn)閱讀需求,提高圖書館的服務(wù)效率和服務(wù)質(zhì)量。
采用大數(shù)據(jù)采集及處理技術(shù),借助PLC、人工智能技術(shù),構(gòu)建圖書采編的智能化解決方案,加強(qiáng)圖書資源供給端和用戶服務(wù)端信息數(shù)據(jù)的分析、分類標(biāo)簽和建模[9],在采編系統(tǒng)和采編流程層面控制成本、提升效率。
基于大數(shù)據(jù)技術(shù)的智能圖書采編系統(tǒng)的整體架構(gòu)如圖1所示,主要由硬件層、邏輯層、應(yīng)用層構(gòu)成,各層間相互作用,共同完成圖書采編功能[10]。其中,硬件層主要完成圖書數(shù)據(jù)分析系統(tǒng)、電子書架及終端設(shè)備的信號(hào)傳送網(wǎng)絡(luò)架設(shè),為整個(gè)采編系統(tǒng)提供硬件支持;邏輯層具有定位引擎功能,對(duì)硬件層提供所需邏輯服務(wù)內(nèi)容,通過轉(zhuǎn)換、校驗(yàn)、篩選等功能實(shí)現(xiàn)對(duì)輸入輸出信息的管理;應(yīng)用層主要實(shí)現(xiàn)采編系統(tǒng)與館員、讀者的交互接口,滿足圖書管理人員及讀者的需要,實(shí)現(xiàn)圖書館的個(gè)性化、多樣化服務(wù),同時(shí)為數(shù)據(jù)庫(kù)提供安全保障。
圖1 智能圖書采編系統(tǒng)架構(gòu)
傳統(tǒng)的圖書采編過程,從圖書拆包、驗(yàn)收、加工、編目、分揀、上架等操作,需要大量人工處理,而智能采編作業(yè)系統(tǒng)以自動(dòng)化、智能化、可視化方式實(shí)現(xiàn)自動(dòng)采編,可以解決圖書積壓?jiǎn)栴},縮短采編周期;同時(shí),大部分館員可以脫離重復(fù)的瑣碎的采編流程,把主要精力投入到資源建設(shè)、館藏建設(shè)中去,以豐富館藏、創(chuàng)新服務(wù)。
智能采編作業(yè)系統(tǒng)主要由驗(yàn)收加工、自動(dòng)編目、分揀上架、可視化管理模塊組成(圖2)。其中,驗(yàn)收加工模塊代替人工實(shí)現(xiàn)圖書的驗(yàn)收和加工,包括拆包分送、驗(yàn)收貼碼、封面掃描、打碼蓋章等子系統(tǒng),通過PLC技術(shù)串聯(lián)同步運(yùn)行;自動(dòng)編目模塊基于OCR技術(shù),通過對(duì)大量已校對(duì)編目書目數(shù)據(jù)的機(jī)器學(xué)習(xí),準(zhǔn)確地完成自動(dòng)編目任務(wù);分揀上架模塊借鑒比較成熟的物流自動(dòng)分揀系統(tǒng)[14],實(shí)現(xiàn)圖書貼索書號(hào)、覆膜、分揀、上架功能;可視化管理模塊搭建了智能圖書采編作業(yè)流程控制中心,對(duì)整條作業(yè)流水線進(jìn)行實(shí)時(shí)監(jiān)督、控制。
圖2 智能圖書采編作業(yè)流程
利用大數(shù)據(jù)技術(shù)強(qiáng)大的數(shù)據(jù)處理及數(shù)據(jù)分析能力,構(gòu)建智能化的圖書信息采集系統(tǒng),實(shí)現(xiàn)圖書館采編業(yè)務(wù)流程的智能化管理。圖書館數(shù)據(jù)收集及圖書分類工作的業(yè)務(wù)量巨大,傳統(tǒng)的信息處理系統(tǒng)不僅工作效率較低,而且很容易出錯(cuò)。而智能化采集作業(yè)實(shí)現(xiàn)了圖書信息采集業(yè)務(wù)的智能化新業(yè)態(tài),在圖書信息識(shí)別、分類編目、典藏加工等環(huán)節(jié)更加突出自動(dòng)化和規(guī)范化操作,打造了全新的圖書信息采集流程和一體化的智能作業(yè)模式,能顯著提高圖書采編業(yè)務(wù)的綜合效率,有很高的經(jīng)濟(jì)價(jià)值和社會(huì)價(jià)值。
電子數(shù)據(jù)資源不同于單一的紙質(zhì)文獻(xiàn),其數(shù)據(jù)量巨大且種類繁雜,進(jìn)行整理和分類的難度很大,極易出現(xiàn)數(shù)據(jù)名稱不符、數(shù)據(jù)信息不匹配、數(shù)據(jù)存儲(chǔ)不合理等問題,對(duì)圖書館的信息管理和讀者的信息查詢都會(huì)造成很多困擾。而基于大數(shù)據(jù)技術(shù)的智能采編系統(tǒng)能夠?qū)崿F(xiàn)數(shù)據(jù)信息的智能化控制,在數(shù)據(jù)審核、信息分類、圖書編目等環(huán)節(jié)幫助圖書管理員進(jìn)行智能化控制、標(biāo)準(zhǔn)化處理,能夠高效完成數(shù)據(jù)調(diào)整和更新,提高圖書館的新型服務(wù)能力,滿足讀者多方位的閱讀需求,給讀者更好的服務(wù)體驗(yàn),體現(xiàn)圖書館有效服務(wù)社會(huì)的價(jià)值。
圖書館信息資源管理的效率,在很大程度上取決于信息采編業(yè)務(wù)的效率。采編業(yè)務(wù)一般包括圖書預(yù)訂、圖書審核、圖書入庫(kù)等環(huán)節(jié),現(xiàn)階段,電子圖書資源的融入,給圖書管理人員帶來了巨大的工作壓力,在一定程度上影響了圖書采編效率,也使采編管理工作顯得尤為重要。利用大數(shù)據(jù)技術(shù)強(qiáng)大的數(shù)據(jù)分析能力,可以使管理人員對(duì)圖書采選進(jìn)行個(gè)性化設(shè)置,根據(jù)個(gè)性需求選擇高質(zhì)量的、適合本館的書目;可以根據(jù)出版社、作者知名度、發(fā)行數(shù)量、市場(chǎng)反響等數(shù)據(jù)多維度考量,輔助分析是否值得購(gòu)買;可以對(duì)采編人員的業(yè)務(wù)量和工作質(zhì)量進(jìn)行統(tǒng)計(jì)并反饋評(píng)估信息,輔助提高館員的業(yè)務(wù)能力。因此,基于大數(shù)據(jù)技術(shù)的圖書采編智能化管理,能極大地提高采編工作效率。
基于大數(shù)據(jù)技術(shù)的智能圖書采編系統(tǒng),通過采編作業(yè)的自動(dòng)化模式,把館員從重復(fù)繁瑣的采編業(yè)務(wù)中徹底解放出來,既降低了圖書加工編目的成本,也提高了工作效率。未來,隨著大數(shù)據(jù)技術(shù)的進(jìn)一步發(fā)展,圖書自動(dòng)編目、分類標(biāo)引等相關(guān)數(shù)據(jù)處理的效率、準(zhǔn)確率會(huì)越來越高,圖書館采編業(yè)務(wù)和讀者服務(wù)工作的智能化管理也會(huì)更加高效,為圖書館帶來良好的社會(huì)效益和經(jīng)濟(jì)效益。
漯河職業(yè)技術(shù)學(xué)院學(xué)報(bào)2022年1期