劉 瑜
(四川文理學院圖書館,四川 達州 635000)
大數據挾裹的信息技術革命浪潮,必將對圖書館行業(yè)產生深刻的影響。盡管大數據時代還處于技術開發(fā)和應用的誘發(fā)階段,圖書館仍然應審時度勢,適時推進角色轉變。本文借用企業(yè)管理中的SWOT分析方法探討大數據背景下的圖書館定位問題。
目前,業(yè)界對“大數據”(Big Data)概念還未形成統(tǒng)一的定義。不過,在諸多定義中存在著一個共識點:大數據不僅僅是對數據量的定量描述,而是表征了一個 “數據無限多與人類掌控數據能力的有限性之間的矛盾關系”的存在事實。全球最權威的咨詢公司Gartner就將大數據定義為“在一個或多個維度上超出傳統(tǒng)信息技術的處理能力的極端信息管理和處理問題”[1];維基百科也強調大數據是 “無法在一定時間內用常規(guī)軟件工具對其內容進行抓取、管理和處理的數據集合”[2]。
根據該矛盾關系,我們就可“管窺”大數據的基本內涵:第一,大數據首先是指數量維度上的“大”,具體表現為增長速度快、絕對量大。據IDC監(jiān)測,全球數據量以大約60%的速度在增長,每兩年就翻一番;僅2012年一年產生的數據量(2.8ZB)就相當于先前整個人類生產數據的總和;預計到2020年,全球將擁有35ZB的數據[3]。第二,大數據的產生主要是由于半結構數據和非結構數據(以下統(tǒng)稱“非結構數據”)的快速增長。云計算、移動網絡、Web2.0和社交平臺等信息技術的廣泛應用,使每一臺現代通信工具都成為數據源,從而制造出大量樣式不一的、碎片化的傳感數據和點擊數據。人們完全習慣了處理結構數據,而非結構數據的爆炸式涌現,必然讓人們茫然失措。第三,大數據價值密度低但價值巨大,不少商家運用大數據的成功案例已經證明:大數據是財富資源。第四,解決非結構數據處理難題的關鍵是開發(fā)出對應的大數據技術,而目前相關研究思路及應用前景并不明朗。第五,大數據技術研發(fā)不僅成本高昂,而且在技術標準上是“高門檻準入制”,因此,投身大數據研發(fā)的除IT巨頭外,一般都是政府統(tǒng)籌下的集體力量。第六,在大數據時代,誰掌握了先進的大數據技術,誰就能夠搶得先機。為了避免在可能的“信息技術鴻溝”上處于劣勢,各國政府都把它上升到了戰(zhàn)略高度,視為未來國家的核心競爭力之一。
在企業(yè)管理理論中,SWOT分析法是一種基本的分析方法。SWOT是 Strength、Weakness、Threat、Opportunity四個英文單詞的首字母的矩陣排列順序。人們常常用它來系統(tǒng)分析一個企業(yè)自身的競爭優(yōu)勢、競爭劣勢、可能機會和潛在威脅,從而使該企業(yè)的戰(zhàn)略定位、發(fā)展規(guī)劃與其內部資源和外部環(huán)境相匹配。本文把契合企業(yè)的SWOT分析方法應用到圖書館這一公益事業(yè)上,主要基于后者在大數據沖擊下所處獨特環(huán)境及其特殊性質。
在大數據時代,“從數據中獲取價值”的理念逐漸深入人心,這直接催生出了一大批通過專門從事大數據存儲、獲取、分析、挖掘等服務業(yè)務而獲利的產業(yè)。它們的崛起,必將打破圖書館過去對于知識信息管理的絕對“壟斷”地位,使知識服務系統(tǒng)所蘊含的四個因素即知識供應者、知識運營商、知識受眾和知識服務本身之間的相互獨立性得到充分展現[4]。人們發(fā)現圖書館不再是獲取信息資源的唯一入口,為圖書館用戶流失打開了 “閘門”。大數據產業(yè)利用技術優(yōu)勢和專業(yè)優(yōu)勢確立的“量身定制”服務模式,還將進一步加劇圖書館用戶流失趨勢,這主要表現在:第一,大數據技術開發(fā)產業(yè)意味著為人們提供更為方便快捷的一站式搜索引擎、分析手段和挖掘工具,從而更大限度地奪取用戶。第二,大數據運營產業(yè)充分利用信息情報處理的專業(yè)優(yōu)勢,通過對特定的非結構化數據進行科學抓取、分析、挖掘和轉換,以完整的知識形式呈現給有相關需求的用戶,從而最大限度地吸引用戶??梢?,大數據不僅是對圖書館的軟硬件設施提出了挑戰(zhàn),而且更致命的是動搖了圖書館的生存論基礎。
圖書館要擺脫生存論危機,必須設法把讀者留在圖書館和它的主頁上,這完全顛覆了圖書館與讀者之間的傳統(tǒng)關系,使圖書館具有了企業(yè)的某些特征——我們完全可把圖書館比作商家,把讀者比作消費者,把文獻資源看作是產品[5];圖書館運作也應像企業(yè)一樣,努力打造精品和提供優(yōu)質服務,最大限度地爭取客戶。
圖書館要想快速實現軟硬件設施升級換代難度極大。大數據時代始終貫穿著“數據無限多與人類掌控能力有限性”之間的矛盾關系,要解決它不可能一蹴而就。很多圖情研究者主張通過應用現有的大數據技術來建構 “圖書館大數據體系”,這種觀點在實踐上是有害的。暫且不說大數據技術引進成本高昂,就是大數據技術本身也并不成熟。筆者并非拒斥大數據技術,而是強調在采用大數據技術之前必須充分考慮可靠性、易用性和隱性成本方面,如果盲目跟風,可能會帶來“將來技術升級換代產生額外成本”的風險。
圖書館要想很快提高圖書館員的大數據處理能力的想法也不現實。大數據處理能力表現在數據獲取、存儲、分析、挖掘、數據等綜合能力上。圖書館員要實現向“數據館員”角色轉變,必須努力成為交叉性、復合型人才,而這樣的人才在全世界都是稀缺資源。另外,圖書館作為政府主導下的公益型事業(yè),在大數據服務上會面臨館員內驅力不足的問題。
圖書館的大數據學科體系尚未建立。大數據對圖書館事業(yè)產生沖擊的同時,必然也會對圖書館學產生影響。圖情界應該從大數據基礎理論和應用實踐維度展開學科基本問題、學科領域拓展及交叉學科等方面研究[6]。但是,從當前來看,相關研究主要集中在IT業(yè)及延伸領域,其中,工程技術研究領先于信息學科研究,而信息學科研究又超前于知識服務體系研究。這意味著,知識服務體系研究目前還被排除在大數據研究之外。圖書館的大數據學科研究不興,圖書館也就對發(fā)展方向、體系建構和觀念轉變毫無頭緒。
多年的信息化建設讓圖書館已經具備了一定的大數據特征。我國近年頒布的一系列信息政策、行業(yè)法規(guī)、技術標準,為圖書館全面推進信息化建設提供強有力的制度保障,圖書館門戶網站建設、特色數據庫建設和數字化平臺建設基本完成。這為大數據體系建設提供了物質基礎、IT架構和實踐經驗等方面的先決條件。整體來講,圖書館處理大數據的能力和水平不高,但是經過大數據時代的洗禮,還是有巨大潛力可挖。
圖書館界已經圍繞大數據問題展開了一系列研究,而且呈現出方興未艾的趨勢。研究者們在大數據成因、學術傳播變遷、數據存儲、數據分析、數據挖掘、知識服務等方面的不懈探索,必將為圖書館的大數據學科建設奠定堅實的基礎。
目前,大數據還沒有改變圖書館信息管理上的主導地位。相比其他機構,圖書館不僅具有文獻資源優(yōu)勢,而且在管理結構數據方面居于領先地位——非結構數據如果不能轉化或改造為結構數據,始終不會發(fā)揮其潛在價值。這意味著,圖書館在大數據應用鏈條“下游”的基礎非常牢固,只需要考慮如何把業(yè)務延伸到上游領域。此外,圖書館還存儲了大量讀者用戶的借閱日志和行為數據,充分挖掘這些非結構數據的價值,圖書館能夠有針對性地搭建“圖書館—客戶”的服務營銷模式。挖掘非結構數據的價值是大數據產業(yè)的精髓,圖書館通過對OPAC數據的分析,不僅可以幫助采訪人員了解館藏資源利用情況,還可幫助館員掌握讀者需求趨勢與館藏資源的匹配度,更有利圖書館管理者合理制定館藏建設政策。
圖情研究者在談論大數據對圖書館的影響之時,一般都歸結為圖書館在大數據技術要求上有差距,而很少意識到大數據產業(yè)對圖書館生存論造成的嚴重沖擊。在大數據產業(yè)的兩大板塊中,真正給圖書館帶來威脅的是 “大數據運營產業(yè)”,即眾多的信息服務機構。在IT巨頭的“技術堡壘”面前,信息服務機構與圖書館是處于同一技術水平。兩者之間的唯一的差距不過是前者在數據處理和數據服務方面做得更專業(yè)以及由此延伸展開的“量身定制”服務。在大數據時代背景下,圖書館的傳統(tǒng)服務理念、業(yè)務模式、服務水平,已經不能滿足讀者方便、快捷、及時獲取信息的需求,因而才遭遇貢獻邊緣化、價值質疑、服務理念滯后等多重危機。與此同時,信息服務機構 “乘虛而入”,通過個性化、專業(yè)化、動態(tài)化的新型服務,讓用戶免去收集、整理、分析數據的能力欠缺和勞役之苦,從而日益“吞噬”著圖書館的傳統(tǒng)用戶。
圖書館要想擺脫生存危機,在“大數據技術開發(fā)”上著力似乎不太可能,只能在具體服務上做得更優(yōu)秀,亦即提供所謂的“知識服務”?!爸R服務”是我國圖書館界學者為應對大數據挑戰(zhàn)而提出的一種新型服務模式,它強調圖書館員的服務應該以“嵌入”方式融入每一個用戶的專業(yè)背景、信息需求、數據選擇之中,進而提供能解決用戶疑問的知識。顯而易見,“知識服務”的確是一種全新的服務理念,若能推廣實施,必將促進服務方向、手段、途徑、范圍等全方位改進,當然也能很好地吸引用戶。一言蔽之,重視讀者需求,積極引進新的技術為他們提供便捷的服務,圖書館才能在社會找準位置并不斷發(fā)展。
圖書館開展知識服務具有信息服務機構無可比擬的優(yōu)勢。首先,圖書館是情報信息人才的主要聚集地之一;其次,圖書館還擁有高比例的用戶;最后,圖書館人最擅長的就是信息管理和組織,只要調整思路,就能在知識服務領域大展身手??傊?,圖書館在專業(yè)服務方面大有潛力可挖,只是需要考驗圖書館管理者的智慧:如何才能充分發(fā)揮各種優(yōu)勢并把它們結合起來?怎樣才能因地制宜地進行知識服務運行系統(tǒng)的頂層設計?
建構大數據學科體系對圖書館發(fā)展具有強烈的導向作用,圖書館應該積極參與。美國的“大數據研究和發(fā)展計劃”就把圖書館作為重要組成部分,要求它們“提高從大數據中訪問、組織、收集、發(fā)現信息的工具和技術水平”和 “提供大數據歸檔、保存、傳播和數據基礎設施服務”[7]。相比國外圖書館,國內圖書館在這方面動作不大。圖書館應該圍繞大數據的基礎理論和應用實踐展開圖書情報學研究,理論研究焦點在數據分析方法(如:用戶行為智能預測、社交網絡分析、移動互聯數據分析)、知識服務搜索引擎、網絡信息計量學、文獻深度分析可行性等方面。此外,由于大數據的理論研究與實踐應用緊密相連,所以圖書館的館藏資源優(yōu)化方案、用戶服務模式、圖書管理決策、館員業(yè)務培訓、基礎設施更新等也是圖書館大數據實踐研究的應有之義。圖書館界如果不能形成學科研究自覺,就不可能把握大數據技術發(fā)展的前沿動態(tài)、知識服務發(fā)展的必然趨勢,從而喪失快速調整方向的良好機遇。
在大數據時代,提高數據掌控能力主要依賴大數據技術的突破。由于受人力、物力、財力瓶頸的限制,圖書館全面研發(fā)、引進高新技術既不現實也不明智,但這并不意味著圖書館應該拒斥大數據技術。圖書館在大數據技術研究和嘗試上必須要形成“全體動員”的局面,最優(yōu)化的技術路線是在圖書館聯盟統(tǒng)籌安排之下,分派試點調試技術,逐步推廣成熟技術。總而言之,圖書館的價值體現在服務中,而信息技術既決定著服務的深度,也影響著組織結構和運營成本。
圖書館要想吸引用戶,必須在大數據應用鏈條的“上游”與其他信息服務機構展開競爭。過去,圖書館業(yè)務主要集中在“下游”,即信息資源的組織、保存和查閱。在大數據時代,圖書館不可能存儲所有數據,而只能根據讀者的需求趨勢去整合和發(fā)現資源,從而預先設計解決用戶困惑的方案。這要求圖書館把業(yè)務重點放在館員、用戶的行為數據的分析上,以及針對特定尋求的價值數據的抓取、存儲、挖掘、推送上[8]。圖書館業(yè)務向上游轉移,要求改變圖書館以“文獻”為中心的傳統(tǒng)業(yè)務架構,轉而以“用戶”為中心開展服務,從而實現業(yè)務與服務的無縫對接。這說明,大數據并非要終結圖書館的信息服務使命,而是在新的技術條件下推動技術與人文、業(yè)務與服務的有機融合,從而實現信息服務業(yè)務的完善和提升。
大數據時代,圖書館的核心競爭力不是館藏資源、建筑設施,而是數據處理能力以及深度服務能力。從“數據—知識”傳遞鏈條上看,圖書館只是一個“樞紐站”,但是由于它包含有加工、創(chuàng)作和服務等多道“工序”,所以能產生“數據增值”功效。從字面上看,“知識服務”不足以描述圖書館的這些新功能,但比較傳統(tǒng)的“知識—知識”服務流程,后者的服務思維是“出現問題—邏輯分析—找出因果關系—提出解決方案”,而前者的服務思維是“收集相關數據—深度分析—找出相互關系—提出優(yōu)化方案,使用戶的解決方案從成功躍至卓越”[9]。兩種思維透露出來的根本差別就是 “是否以用戶需求位為中心”。只有把握了讀者的變化性、差異性的知識需求,圖書館才能真正“嵌入”到用戶的學習、工作或研究中,從而有針對性地展開個性化服務。大數據技術為新型的知識服務提供了技術支撐,圖書館應該充分利用它們去挖掘和分析隱含在讀者行為中的非結構數據,尋求他們的隱性訴求,預測他們的行為趨勢,進而達到改進、優(yōu)化和擴展圖書館的館藏資源和服務模式。從這個意義上講,推行知識服務不是圖書館“被大數據化”,反而是為其主動實現大數據化提供了契機,從而達到圖書館對內控制 (館藏結構和管理決策)和對外互動(信息技術和讀者用戶)的雙重優(yōu)化。
[1]Big Data.[EB/OL].[2015-03-01].http://www.gartner.com/itglossary/big-data/.
[2]Big data.[EB/OL].[2015-03-01].http://en.wikipedia.org/wiki/Big_data/.
[3]THE DIGITAL UNIVERSE IN 2020:Big Data,Bigger Digital Shadows,and Biggest Growth in the Far East[EB/OL].[2015-03-03].http://www.emc.com/collateral/analyst-reports/idc-the-digital-universe-in-2020.pdf.
[4]張興旺.圖書館大數據體系構建的學術環(huán)境和戰(zhàn)略思考[J].情報資料工作,2013(2):12-17.
[5]張國杰.大數據視角下圖書館服務發(fā)展走向及策略研究[J].圖書館工作與究,2014(6):8-12.
[6]郭向東,陳軍.甘肅省市縣圖書館信息化建設現狀調研與分析[J].圖書與情報,2010(3):77-81.
[7]OBAMA ADMINISTRATION UNVEILS“BIG DATA”INITIATIVE:ANNOUNCES$200 MILLION IN NEW R&D INVESTMENTS[EB/OL].[2015-02-23]https://www.whitehouse.gov/sites/default/files/microsites/ostp/big_data_press_release.pdf.
[8]王天泥.大數據視角下圖書館的發(fā)展對策[J].圖書館學刊,2013(3):42-44.
[9]王天泥.知識咨詢:大數據時代圖書館的知識服務增長點[J].圖書與情報,2013(2):74-77.