朱華順
(東莞理工學(xué)院 圖書館,廣東東莞,523808)
?
大數(shù)據(jù)下的圖書館專利信息服務(wù)思考
朱華順
(東莞理工學(xué)院圖書館,廣東東莞,523808)
摘要:介紹了大數(shù)據(jù)的含義、基本特征和對圖書館行業(yè)的積極影響以及目前多個行業(yè)的大數(shù)據(jù)運(yùn)用情況,進(jìn)一步指出圖書館已經(jīng)初步具備應(yīng)用大數(shù)據(jù)的基礎(chǔ)。然后分析了圖書館專利服務(wù)現(xiàn)狀,指出大數(shù)據(jù)對于圖書館而言,機(jī)遇大于挑戰(zhàn)。最后提出圖書館應(yīng)當(dāng)積極應(yīng)用大數(shù)據(jù)來改進(jìn)專利信息服務(wù),例如構(gòu)建一站式專利信息服務(wù)平臺等。
關(guān)鍵詞:大數(shù)據(jù);圖書館;專利信息服務(wù);專利信息集成
1大數(shù)據(jù)與圖書館
大數(shù)據(jù)作為一種新事物,與歷史上很多新技術(shù),在其誕生初期,并沒有一個清晰而又明確的定義。綜合目前可獲取的資料來看,大數(shù)據(jù)是一種行業(yè)理念或發(fā)展趨勢。維基百科對大數(shù)據(jù)的定義是“所涉及的數(shù)據(jù)量規(guī)模巨大到無法通過人工,在合理時間內(nèi)達(dá)到截取、管理、處理、并整理成為人類所能解讀的信息”,這些信息由巨型數(shù)據(jù)集組成,大小從兆字節(jié)(TB)到十兆億字節(jié)(PB)不等。大數(shù)據(jù)的特征主要有Volume(海量)、Velocity(快速)、Variety(多樣)、Value(價值)和Veracity(真實(shí))等[1]。
當(dāng)前,圖書館運(yùn)營過程中所產(chǎn)生的數(shù)據(jù)來源包括RFID 射頻數(shù)據(jù)、傳感器數(shù)據(jù)、社交網(wǎng)絡(luò)交互數(shù)據(jù)、移動互聯(lián)數(shù)據(jù)等,這些數(shù)據(jù)已經(jīng)初步具備大數(shù)據(jù)的特征,加以分析處理可以有效豐富圖書館的館藏信息資源。此外,大數(shù)據(jù)借助計(jì)算機(jī)技術(shù)對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、比對、解析得出分析結(jié)果,一定程度上提高了數(shù)據(jù)分析的科學(xué)性和準(zhǔn)確性。將大數(shù)據(jù)分析技術(shù)應(yīng)用到圖書館,可以更加精準(zhǔn)地分析挖掘用戶的行為。
2改進(jìn)圖書館專利服務(wù)的思考
目前國內(nèi)部分高校圖書館開展的專利信息服務(wù),多從專利說明書、權(quán)利要求書等簡單內(nèi)容展開,與用戶對于專利高尖端的技術(shù)要求有一定的距離。隨著信息網(wǎng)絡(luò)的發(fā)展,用戶通過網(wǎng)絡(luò),特別是一些專業(yè)知識產(chǎn)權(quán)網(wǎng)站即可獲取專利說明書、權(quán)利要求書等淺層次的專利信息內(nèi)容。那么對于用戶來說,既然可以通過網(wǎng)絡(luò)查找到所需內(nèi)容,似乎沒有必要去圖書館尋求專利信息內(nèi)容,而對于圖書館而言,既然用戶需求不大,那么似乎就沒必要花費(fèi)過多的時間和精力去提升專利信息服務(wù)。對于雙方來說,這都不是一種“雙贏”的結(jié)果。因?yàn)橛脩粲捎谌鄙傧鄳?yīng)的專業(yè)知識,在網(wǎng)上檢索得到的很可能只是淺層次的專利信息內(nèi)容;而對于圖書館,對專利信息服務(wù)投入的逐步缺失,最終會導(dǎo)致圖書館慢慢退出這一領(lǐng)域的市場。除了淺層次的專利信息內(nèi)容,用戶對于深層次的專利信息內(nèi)容,例如專利信息專題培訓(xùn)、專利信息分析與研究、專利預(yù)警、專利咨詢、專利侵權(quán)等服務(wù)同樣有著巨大的需求。圖書館可以發(fā)揮如下兩方面優(yōu)勢,滿足用戶對于專利信息的深層次內(nèi)容。
1)數(shù)字資源優(yōu)勢。除了免費(fèi)專利檢索數(shù)據(jù)庫,包括中國專利局專利檢索、世界知識產(chǎn)權(quán)數(shù)據(jù)庫、美國專利數(shù)據(jù)庫、歐洲專利數(shù)據(jù)庫、加拿大專利數(shù)據(jù)庫以及日本、韓國、澳大利亞、印度、港臺新加坡的專利數(shù)據(jù)庫等國內(nèi)外專利數(shù)據(jù)庫;圖書館還有Delphion、Aureka、萬方專利數(shù)據(jù)庫等付費(fèi)專業(yè)數(shù)據(jù)庫。相比較用戶在網(wǎng)絡(luò)上盲目地查找專利信息內(nèi)容,圖書館可以發(fā)揮專業(yè)優(yōu)勢,組織館員利用大數(shù)據(jù)分析技術(shù)對上述專利數(shù)據(jù)庫進(jìn)行整合,為用戶提供深層次的專利信息服務(wù)。
2)人力資源優(yōu)勢。目前國內(nèi)的圖書館館員學(xué)科構(gòu)成呈現(xiàn)多學(xué)科背景趨勢,除了圖書情報專業(yè),計(jì)算機(jī)、經(jīng)濟(jì)學(xué)、法學(xué)、工學(xué)、理學(xué)等其他多種學(xué)科背景的專業(yè)人員都進(jìn)入圖書館。多學(xué)科融合更容易迸發(fā)出思想火花,與知識產(chǎn)權(quán)法跨學(xué)科融合的學(xué)科屬性本身相契合。整合不同學(xué)科背景的館員從事深層次專利信息服務(wù),可以充分發(fā)揮圖書館多學(xué)科背景的人力資源優(yōu)勢。
3大數(shù)據(jù)的行業(yè)應(yīng)用
實(shí)際上,以亞馬遜(Amazon.com)、eBay為代表的大型跨國網(wǎng)絡(luò)公司,已經(jīng)開始運(yùn)用大數(shù)據(jù)來進(jìn)行網(wǎng)站設(shè)計(jì)和產(chǎn)品銷售運(yùn)營。這些公司長期跟蹤影響網(wǎng)站性能的因素,包括界面布局、界面內(nèi)容及其排列順序、上下級類目連貫性等,對用戶的瀏覽記錄進(jìn)行統(tǒng)計(jì)分析以改善網(wǎng)站界面表現(xiàn)[2]。谷歌[3]對其收錄的圖書進(jìn)行掃描,對書本中出現(xiàn)的詞匯進(jìn)行詞頻統(tǒng)計(jì)分析,以分析結(jié)果為基礎(chǔ),證實(shí)了古羅馬與中國經(jīng)貿(mào)往來的交通運(yùn)輸路線。美國金融投資機(jī)構(gòu)Capital One[4],收集用戶持信用卡消費(fèi)的詳細(xì)數(shù)據(jù),對其進(jìn)行整理分析,并以此為基礎(chǔ)為用戶量身定制個人金融理財(cái)產(chǎn)品。據(jù)Capital One創(chuàng)立者之一Nigel Morris介紹,Capital One的財(cái)務(wù)部、計(jì)算機(jī)分析部和市場部每年要開展65 000次實(shí)驗(yàn)來測驗(yàn)新產(chǎn)品對市場的適應(yīng)程度。
不僅僅是網(wǎng)絡(luò)公司,許多實(shí)體銷售商也開始使用大數(shù)據(jù)。英國零售商巨頭Tesco[5]長期收集整理用戶的消費(fèi)數(shù)據(jù),使得該公司長期占據(jù)英國零售業(yè)務(wù)的榜首位置。該公司開展了一個會員計(jì)劃,收集參與該計(jì)劃的近一千萬會員的交易記錄,分析會員的消費(fèi)行為,并以此為依據(jù)推出針對特定消費(fèi)群體的促銷活動,收到了良好的效果。具體做法上,該公司保存并分析了會員的消費(fèi)票據(jù),找出關(guān)聯(lián)度較高的商品,并將這些商品放在相同或者相鄰的柜架上,方便用戶購買。美國汽車生產(chǎn)商福特公司[6],通過分析客戶在社交網(wǎng)站Facebook和Twitter的內(nèi)容來評估用戶對其產(chǎn)品的認(rèn)可度。福特應(yīng)用詞頻分析軟件收集用戶在社交網(wǎng)站上所發(fā)表的關(guān)于福特汽車的內(nèi)容,以“優(yōu)異、良好、中等、一般、不好”等多個級別對評價內(nèi)容進(jìn)行分類,最后推斷出用戶對其產(chǎn)品的認(rèn)可度。而國內(nèi)電商淘寶網(wǎng)[7]也引進(jìn)了大數(shù)據(jù)技術(shù),通過淘寶指數(shù)、流量解析和數(shù)據(jù)魔方三項(xiàng)技術(shù)指標(biāo)來了解市場趨勢變化情況,從而制定競價策略。
近年來,國內(nèi)不少圖書館開始運(yùn)用RFID (Radio Frequency Identification)即無線射頻識別技術(shù),亦是大數(shù)據(jù)應(yīng)用的一種。RFID標(biāo)簽可以為圖書館的館藏資源如圖書、期刊、光盤等存儲一個對應(yīng)的標(biāo)識符號,且此符號與其對應(yīng)的館藏資源之間是唯一對應(yīng)關(guān)系,圖書館可以通過這個標(biāo)識符號對館藏資源進(jìn)行精準(zhǔn)定位和操作管理。
4運(yùn)用大數(shù)據(jù)拓展專利信息服務(wù)
4.1積極應(yīng)用新技術(shù)
信息技術(shù)的發(fā)展對圖書館的影響由來已久,并且新技術(shù)總是可以為圖書館帶來服務(wù)手段的革新。從Web2.0到云計(jì)算再到大數(shù)據(jù),圖書館總是可以緊跟上技術(shù)發(fā)展的腳步。對于圖書館來說,新技術(shù)固然會沖擊圖書館部分的業(yè)務(wù)功能,但是伴隨著挑戰(zhàn)的也是機(jī)遇,利用好大數(shù)據(jù)技術(shù),可以提升圖書館的服務(wù)質(zhì)量,增強(qiáng)圖書館的競爭力。
4.2強(qiáng)化學(xué)科館員培訓(xùn)宣傳
古語云“內(nèi)圣而外王”,對于圖書館工作,首先應(yīng)該明確的是用戶對于專利信息內(nèi)容的需求是多方位和多維度的,其中既包括淺層次需求也包含深層次需求。專利技術(shù),作為推動工業(yè)技術(shù)發(fā)展的重要知識產(chǎn)權(quán)內(nèi)容,具有高尖端的特征。圖書館應(yīng)當(dāng)整理現(xiàn)有人力資源,強(qiáng)化對該領(lǐng)域?qū)W科館員的培訓(xùn),使之滿足用戶的信息需求。在此基礎(chǔ)上,增強(qiáng)宣傳推廣,積極走出去聯(lián)系相關(guān)企業(yè)和個人,宣傳介紹圖書館的專利信息服務(wù)內(nèi)容,使圖書館的專利信息服務(wù)和市場需求較好地融合。
4.3整合資源,增強(qiáng)合作
圖書館可以從如下三方面進(jìn)行專利信息資源整合:(1)圖書館現(xiàn)有資源,(2)與企業(yè)合作共建資源,(3)新建特色資源。部分綜合型專利代理機(jī)構(gòu)面向市場開發(fā)了不少專利服務(wù)項(xiàng)目[8],這些項(xiàng)目既包括面向特定企業(yè)開展專利情報咨詢、專利專題咨詢等,又有企業(yè)自行研發(fā)的專利分析工具和平臺等。圖書館可以以自己現(xiàn)有的專利信息資源為基礎(chǔ)和企業(yè)開展合作,以用戶需求為導(dǎo)向,開發(fā)出特色資源。我校圖書館根據(jù)東莞市鎮(zhèn)街考核和評估實(shí)際需求,組織開發(fā)了面向地方科技管理的專利信息統(tǒng)計(jì)分析軟件PSAS[9],用于定期下發(fā)專利原始數(shù)據(jù)的整理清洗和統(tǒng)計(jì)分析,并為地方科技管理部門提供專利情報服務(wù)。
4.4搭建一站式服務(wù)平臺
一站式專利信息集成服務(wù)平臺是智能搜索的發(fā)展趨勢,未來的專利信息服務(wù)檢索平臺也是如此。根據(jù)校圖書館組織實(shí)施的面向地方科技管理的專利信息服務(wù)實(shí)踐經(jīng)驗(yàn),認(rèn)為專利信息集成服務(wù)平臺可以從如下框架來構(gòu)建。
圖1 一站式專利信息集成服務(wù)平臺功能框架圖
其中,“館藏專利信息資源”功能模塊包含圖書館有專利文獻(xiàn)信息導(dǎo)航、圖書館專利圖書與期刊等研究資料、專利數(shù)據(jù)庫三個方面的資源。專利數(shù)據(jù)庫既包括圖書館現(xiàn)有數(shù)據(jù)庫資源,也包含與企業(yè)合作共建的數(shù)據(jù)庫資源?!皩@?wù)宣傳推廣”主要指的是圖書館面向用戶開展的宣傳推廣活動,包括用戶培訓(xùn)、參考咨詢服務(wù),專利新聞聚合等?!皞€性化服務(wù)”主要指用戶深層次的專利信息需求,包括科技查新、專利法律咨詢、專利信息統(tǒng)計(jì)分析、專利預(yù)警等。
在使用專利信息集成服務(wù)平臺的過程中,用戶的信息需求處于不斷變化之中,可以依次訪問各個功能模塊,自由進(jìn)出服務(wù)平臺(如圖2所示)。采用B/S,即瀏覽器/服務(wù)器(Browser/Server)體系(如圖3所示)構(gòu)架建設(shè)服務(wù)平臺。B/S可以較為簡單地融入因特網(wǎng),用戶只要可以鏈接到因特網(wǎng)即可訪問到服務(wù)平臺。采用PHP+MYSQL或者JAVA+MYSQL數(shù)據(jù)庫方式運(yùn)行并生成相應(yīng)的指令碼語言。
圖2 客戶端系統(tǒng)構(gòu)架
圖3 基于因特網(wǎng)的B/S應(yīng)用模型
4.5面向用戶推送個性化服務(wù)
美國 Hiptype 公司收集用戶上網(wǎng)借閱電子圖書的記錄,分析讀者的閱讀興趣和愛好,并以此為基礎(chǔ)向用戶推送相關(guān)電子圖書[10]。目前國外主流專利數(shù)據(jù)庫都有專利信息分析工具和軟件[11](如表1所示)。如前文所述,經(jīng)過多年的發(fā)展,現(xiàn)在圖書館也已經(jīng)初步具備應(yīng)用大數(shù)據(jù)技術(shù)的數(shù)據(jù)基礎(chǔ)。當(dāng)前圖書館所擁有的讀者借閱記錄、數(shù)據(jù)庫點(diǎn)擊下載記錄、圖書館社交網(wǎng)絡(luò)平臺交互數(shù)據(jù)、用戶移動互聯(lián)數(shù)據(jù)等,都是可以應(yīng)用大數(shù)據(jù)相關(guān)分析技術(shù)進(jìn)行分析統(tǒng)計(jì)的數(shù)據(jù)來源。選取其中與專利信息相關(guān)的內(nèi)容,應(yīng)用大數(shù)據(jù)技術(shù)進(jìn)行分析統(tǒng)計(jì),推出針對特定群體的即時專利信息推送服務(wù),可以增強(qiáng)圖書館在該領(lǐng)域內(nèi)的競爭力。
表1 國外常用專利信息分析軟件
在當(dāng)前建設(shè)法治國家的大背景之下,知識產(chǎn)權(quán)的重要性越發(fā)凸顯,專利作為知識產(chǎn)權(quán)的重要內(nèi)容,其信息服務(wù)需求將越來越大。圖書館擁有數(shù)字資源和人力資源雙重優(yōu)勢,提升服務(wù)意識,整合各方資源,強(qiáng)化服務(wù)隊(duì)伍建設(shè),加強(qiáng)宣傳推廣,提升專利服務(wù)的質(zhì)量和水平,圖書館在未來的專利信息服務(wù)市場中必會有一席之地。
參 考 文 獻(xiàn)
[1]維基百科[EB/OL].[2015-08-08].http://zh.wikipedia.org/wiki/大數(shù)據(jù).
[2]亞馬遜[EB/OL].[2015-08-08].http://www.amazon.com/.
[3]谷歌[EB/OL].[2015-08-08].http://www.google.com/.
[4]美國第一資本[EB/OL].[2015-08-08].https://www.capitalone.com/.
[5]特易購[EB/OL].[2015-08-08].http://www.tesco.com/.
[6]福特[EB/OL].[2015-08-08].http://www.ford.com/.
[7]淘寶[EB/OL].[2015-08-08].http://www.taobao.com/.
[8]楊小鳳.國內(nèi)專利信息服務(wù)體系建設(shè)現(xiàn)狀分析[J].圖書館工作與研究,2013(3):8.
[9]王根.基于地方知識產(chǎn)權(quán)戰(zhàn)略的專利情報分析軟件研究:以東莞市為例[J].情報科學(xué),2011(9):1438-1439.
[10]王玲,李文蘭.市場競爭環(huán)境下高校圖書館專利情報服務(wù)研究:以天津大學(xué)圖書館為例[J].圖書館工作與研究,2013(1):67-69.
[11]尹爽.面向政府專利分析服務(wù)需求的專利分析方法體系構(gòu)建[D].長春:吉林大學(xué),2012:55.
Reflection on Library Patent Information Service Under Big Data
ZHU Huashun
(Library of Dongguan University of Technology, Dongguan 523808, China)
AbstractThe paper introduces the concept, characteristic and impact-on-library of big data, and its use in the current industries, proposing that library has big data foundation, and analyzing the current situation of patent information service at library. As for library, big data is an opportunity other than challenge; library should apply big data to improve its patent information service. Furthermore, the paper suggests some solutions, for example, building one-stop patent information service platform.
Key wordsbig data; library; patent information service; patent information integration
文章編號:1009-0312(2016)01-0010-05
中圖分類號:G306
文獻(xiàn)標(biāo)識碼:A
作者簡介:朱華順(1984—),男,福建漳州人,館員,碩士,主要從事數(shù)字化信息資源管理。
基金項(xiàng)目:2013年東莞市促進(jìn)科技服務(wù)業(yè)發(fā)展計(jì)劃項(xiàng)目“面向地方科技管理的專利信息服務(wù)創(chuàng)新及提升研究”(2013505140);2014年廣東省圖書館科研課題“協(xié)同創(chuàng)新環(huán)境下地方專利信息服務(wù)機(jī)制研究”( GDTK1414)。
收稿日期:2015-9-10