馮海英 趙秀敏
(吉林省社會科學(xué)院圖書館,吉林長春 130033)
隨著互聯(lián)網(wǎng)信息技術(shù)的快速發(fā)展,學(xué)術(shù)資源網(wǎng)絡(luò)建設(shè)得到大大提高,削弱了傳統(tǒng)數(shù)字圖書館的優(yōu)勢。在新形式背景下,圖書館要想實(shí)現(xiàn)持續(xù)健康、穩(wěn)定的發(fā)展,有必要樹立起大數(shù)據(jù)思維,依托于現(xiàn)代化科學(xué)技術(shù)條件不斷拓寬自身的資源范疇,提高服務(wù)品質(zhì),以充分滿足讀者提出的多樣化需求,實(shí)現(xiàn)在當(dāng)代社會更好更快地發(fā)展。
目前,國內(nèi)外學(xué)術(shù)界尚未針對大數(shù)據(jù)的概念給出統(tǒng)一定義,各個行業(yè)領(lǐng)域基于自身發(fā)展視角,對大數(shù)據(jù)的內(nèi)涵做出了相應(yīng)的解釋。Gartner認(rèn)為大數(shù)據(jù)是一種大容量的、多樣化的信息資產(chǎn),需求新的處理方式,以提高洞察能力和決策優(yōu)化能力。維基百科關(guān)于大數(shù)據(jù)的定義則顯得要相對簡單明了一些:大數(shù)據(jù)是指無法在一定的時間內(nèi)利用傳統(tǒng)的硬件工具、軟件或IT技術(shù)對其內(nèi)容進(jìn)行獲取、收集、處理、服務(wù)等操作。簡而言之,所謂的大數(shù)據(jù)即是指一種“復(fù)雜類型”的“海量數(shù)據(jù)”,通常涉及兩種及以上的不同數(shù)據(jù)形式,其基本特征包括以下四個方面:
第一,數(shù)量大。大數(shù)據(jù)時代下,數(shù)據(jù)的量級已然由TB躍升至PB乃至ZB,根據(jù)中國云計算調(diào)研數(shù)據(jù)顯示,目前我國有超過50%的企業(yè)每天生成的數(shù)據(jù)量超過1TB,有10%的企業(yè)每天數(shù)據(jù)生成量會達(dá)到10%以上,這其中便包括圖書館的信息資源數(shù)量。
第二,類型繁多。大數(shù)據(jù)包含多種形式的數(shù)據(jù)資源,除了傳統(tǒng)的文本數(shù)據(jù)以外,還包括音頻、視頻、數(shù)據(jù)庫、歷史檢索記錄等信息。大數(shù)據(jù)時代下,可以是同一個知識存在于不同的數(shù)據(jù)源中,也可以是同一個數(shù)據(jù)源分別支持一個或多個的知識、智慧,這就使得大數(shù)據(jù)時代下數(shù)據(jù)信息的分析結(jié)果存在一定的交叉性。開發(fā)者在決策過程中需有意識地對這些數(shù)據(jù)源進(jìn)行融合,揭示出不同數(shù)據(jù)、信息之間的內(nèi)在聯(lián)系。
第三,處理速度快。在開放式的大數(shù)據(jù)環(huán)境下,一方面,非結(jié)構(gòu)化的數(shù)據(jù)增多,增大了數(shù)據(jù)分析處理的難度;另一方面,這些數(shù)據(jù)是隨機(jī)動態(tài)產(chǎn)生和實(shí)時變化的,需要分析人員以更快的速度進(jìn)行處理分析,部分?jǐn)?shù)據(jù)則更是要求實(shí)時分析或準(zhǔn)實(shí)時分析。
第四,高價值。數(shù)據(jù)資源本身也是一種資產(chǎn),通過科學(xué)的技術(shù)手段對大量數(shù)據(jù)進(jìn)行篩選、融合、分析,可以從中挖掘出許多有價值的知識、智慧,將其應(yīng)用于現(xiàn)代生活與生產(chǎn)領(lǐng)域中能夠收獲巨大的成果并創(chuàng)造出更多新的價值。
新時期背景下,數(shù)字圖書館應(yīng)與時俱進(jìn),利用新媒體技術(shù)重新整合讀者接觸點(diǎn),由過去的以藏書為中心逐漸向以讀者為中心的服務(wù)模式過渡轉(zhuǎn)變。借助于大數(shù)據(jù)分析平臺,圖書館能夠通過郵件、博客、終端設(shè)備、社交網(wǎng)絡(luò)等途徑收集用戶的半結(jié)構(gòu)化數(shù)據(jù)信息,并對其進(jìn)行分析處理,從而準(zhǔn)確了解讀者用戶的業(yè)務(wù)需求和閱讀動機(jī)。此外,圖書館還可以利用聚類分析的方法對讀者用戶進(jìn)行分類篩選,甄別出優(yōu)質(zhì)讀者、一般讀者、潛在讀者和有流失傾向的讀者。例如,在對有流失傾向的讀者用戶進(jìn)行分析時,可以通過大數(shù)據(jù)平臺收集其誠信記錄、投訴記錄、借閱頻次等信息,從而對這類讀者的行為與心理特征進(jìn)行分析定位,以便在用戶流失前采取相應(yīng)的挽留措施,維系好圖書館與讀者用戶之間的關(guān)系。
大數(shù)據(jù)技術(shù)應(yīng)用背景下,圖書館通過大數(shù)據(jù)平臺能夠快速、方便地對讀者用戶的借閱記錄、個人身份、搜索方式等數(shù)據(jù)信息進(jìn)行宏觀全面的分析、跟蹤和挖掘,將不同類型的讀者進(jìn)行聚類處理,有助于圖書館人員更加清晰地了解不同類別讀者的知識結(jié)構(gòu)、閱讀習(xí)慣、服務(wù)訴求等信息,從而有針對性地推出相應(yīng)的知識產(chǎn)品服務(wù),打破傳統(tǒng)營銷模式下無差別、被動化的服務(wù)方式。大數(shù)據(jù)技術(shù)在圖書館的應(yīng)用,不僅大幅度地提高了圖書館信息服務(wù)快速營銷的水平,還能有效增強(qiáng)讀者用戶對圖書館服務(wù)的滿意程度。
對于數(shù)字圖書館而言,提高其自身服務(wù)質(zhì)量水平最簡單也是最為有效的方法便是擴(kuò)大擁有的數(shù)字圖書館資源。大數(shù)據(jù)時代的來臨,使得傳統(tǒng)數(shù)字圖書館的產(chǎn)品變得多元化,不再僅僅是以單一化的文獻(xiàn)類型資源為主,而是根據(jù)讀者用戶需求為其提供不同的產(chǎn)品,如教育類資源、智能資源等。同時,大數(shù)據(jù)分析技術(shù)結(jié)合多媒體技術(shù)的應(yīng)用還能夠根據(jù)用戶平時的閱讀習(xí)慣主動為其提供各種科普教育產(chǎn)品或者智庫產(chǎn)品,從而為廣大讀者帶來舒適化、人性化和智能化的產(chǎn)品服務(wù),對于提升數(shù)字圖書館的核心競爭力而言有著十分重要的意義。
大數(shù)據(jù)時代的到來,令未來信息數(shù)據(jù)的處理過程變得更加繁瑣、復(fù)雜和難以被利用,但對于數(shù)字圖書館而言,也不失為一種機(jī)遇。如果圖書館能夠準(zhǔn)確把握并深入挖掘這些資源的價值特色,了解自身資源庫建設(shè)中存在的不足之處,并且針對用戶的閱讀習(xí)慣和行為信息進(jìn)行有針對性地分析,科學(xué)合理地分配現(xiàn)有的圖書館資源,使不同層次水平的用戶都能夠充分使用所需資源,以達(dá)到提高圖書館信息服務(wù)智能化水平的目的,打造高端化的圖書館產(chǎn)品,使數(shù)字圖書館與一般的學(xué)術(shù)資源商區(qū)分開來,得到用戶的廣泛認(rèn)可與信任青睞,同時也為將來的創(chuàng)新發(fā)展提供無限可能的機(jī)會。
大數(shù)據(jù)技術(shù)的應(yīng)用使得未來數(shù)字化圖書館的產(chǎn)品服務(wù)更加地智能化。傳統(tǒng)服務(wù)模式下,數(shù)字圖書館提供的服務(wù)一直都比較地被動化和僵硬化,難以給讀者帶來良好的用戶體驗(yàn)。用戶面對海量的資源信息常常會覺得無從下手,無法及時獲取自己所需的信息。大數(shù)據(jù)時代背景下,對于數(shù)字圖書館而言,也是一個重要的發(fā)展機(jī)遇。圖書館如果能夠利用大數(shù)據(jù)技術(shù)對用戶的閱讀習(xí)慣、行為信息進(jìn)行分析,為其量身制定特色化的產(chǎn)品服務(wù),既能夠充分滿足用戶需求,還能給他們帶來良好的服務(wù)體驗(yàn)。同時,數(shù)字圖書館還應(yīng)充分把握這一機(jī)遇,不斷豐富自身的咨詢服務(wù)方式,主動增進(jìn)與用戶之間的溝通交流,將人工智能回答與專家在線咨詢兩種服務(wù)方式相結(jié)合,為用戶提供智能化、便捷化的產(chǎn)品服務(wù),從而在用戶群體中樹立起良好的品牌形象,提高新老用戶對圖書館的信任感與忠誠度。
數(shù)字圖書館存儲了大量的結(jié)構(gòu)化、標(biāo)準(zhǔn)化數(shù)據(jù),隨著網(wǎng)絡(luò)資源建設(shè)渠道逐漸滲透至移動終端、社交網(wǎng)絡(luò)等媒介,大量隱含在讀者用戶行為信息中的一些非結(jié)構(gòu)化數(shù)據(jù)的資源價值正在等待被挖掘。圖書館應(yīng)充分發(fā)揮自身優(yōu)勢,將一些可信度高、專業(yè)性強(qiáng)、具有科研借鑒價值的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行有效的整合分析,提高其可行性和經(jīng)濟(jì)高效性,進(jìn)而達(dá)到促進(jìn)知識體系結(jié)構(gòu)橫向擴(kuò)展的目的,滿足人們?nèi)找嬖鲩L的知識服務(wù)需求。大數(shù)據(jù)時代背景下,數(shù)字圖書館要想提高自身的服務(wù)能力和資源建設(shè)能力,不能只是單純地依靠數(shù)據(jù)更新、資源共享、服務(wù)創(chuàng)新等內(nèi)容,而是要主動利用大數(shù)據(jù)對收集到的用戶信息進(jìn)行深入分析,挖掘其中隱含的知識規(guī)律和潛在價值,并根據(jù)分析結(jié)果及時調(diào)整圖書館相應(yīng)的服務(wù)策略。
數(shù)據(jù)挖掘是對已發(fā)現(xiàn)知識進(jìn)行有效組織或重構(gòu)的一種重要方式,也是任何一種類型的信息分析機(jī)構(gòu)所必須面臨的課題之一?,F(xiàn)階段,傳統(tǒng)數(shù)字圖書館的知識服務(wù)內(nèi)容大多還停留在信息檢索、收集、分析、傳遞等層面,只能夠?qū)@些數(shù)據(jù)或信息資源進(jìn)行簡單的利用。盡管如今絕大多數(shù)的數(shù)字圖書館均已配備了云計算、圖書館2.0等技術(shù)以推動圖書館知識服務(wù)朝著人性化、結(jié)構(gòu)化與個性化的方向發(fā)展,但也只是簡單地根據(jù)用戶的結(jié)構(gòu)化數(shù)據(jù)來分析其具體表現(xiàn)出來的服務(wù)需求和行為習(xí)慣的差異性。數(shù)字圖書館作為大數(shù)據(jù)技術(shù)的開發(fā)者、提供者和直接的使用者與受益者,理應(yīng)主動深入挖掘資源價值,不僅要根據(jù)用戶的結(jié)構(gòu)化數(shù)據(jù)分析其當(dāng)前的服務(wù)需求,還要能夠從半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)中挖掘更多的信息,對用戶潛在的需求進(jìn)行預(yù)測分析,以便圖書館找到更為先進(jìn)的服務(wù)模式,以有效應(yīng)對大數(shù)據(jù)時代發(fā)展所帶來的嚴(yán)峻考驗(yàn)。
大數(shù)據(jù)時代下對數(shù)據(jù)信息的處理分析要求與傳統(tǒng)的數(shù)據(jù)信息處理分析存在較大的區(qū)別,過去圖書館所采用的數(shù)據(jù)倉庫、智能分析等方法手段已然難以適應(yīng)當(dāng)今社會大數(shù)據(jù)技術(shù)應(yīng)用發(fā)展的需求。就目前大數(shù)據(jù)技術(shù)在數(shù)字圖書館的應(yīng)用情況來看,由于大數(shù)據(jù)技術(shù)需集成語義引擎、人工智能、數(shù)據(jù)管理、數(shù)學(xué)算法、可視化分析等多個學(xué)科領(lǐng)域的科學(xué)技術(shù)成果,這就對分析人員的綜合素質(zhì)提出了較高的要求,除了要具備較強(qiáng)的業(yè)務(wù)理解能力和數(shù)據(jù)統(tǒng)計能力以外,還應(yīng)掌握清理、組織大數(shù)據(jù)的能力。這是因?yàn)椋诖髷?shù)據(jù)時代背景下,許多數(shù)據(jù)都是碎片化、非結(jié)構(gòu)化的,缺乏相對固定的模式且價值密度較低,但也正是這些非結(jié)構(gòu)化的數(shù)據(jù)最能夠體現(xiàn)讀者用戶的實(shí)際需求。因此,在未來圖書館發(fā)展中需求這樣一批精通大數(shù)據(jù)分析技術(shù)的專業(yè)化人才,能夠深入挖掘讀者用戶的隱形訴求,將半結(jié)構(gòu)化、碎片化的數(shù)據(jù)轉(zhuǎn)化為決策支持?jǐn)?shù)據(jù),從而全方位地提高數(shù)字圖書館的服務(wù)質(zhì)量水平。
綜上所述,大數(shù)據(jù)時代背景下,不僅給數(shù)字圖書館的發(fā)展帶來了新的機(jī)遇,同時也使其面臨著一系列嚴(yán)峻的挑戰(zhàn)。隨著大數(shù)據(jù)技術(shù)的廣泛普及和深入應(yīng)用,數(shù)字圖書館要想實(shí)現(xiàn)持續(xù)健康發(fā)展,首先應(yīng)正確認(rèn)識到自身存在的不足之處,并且要靈活運(yùn)用大數(shù)據(jù)技術(shù)對已有的資源優(yōu)勢進(jìn)行整合,不斷提高圖書館知識產(chǎn)品服務(wù)的質(zhì)量水平,取得廣大用戶的信任與支持,從而有效增強(qiáng)自身的綜合競爭實(shí)力。