陸雪梅
(江蘇理工學院圖書館,江蘇 常州 213001)
在信息全球化的技術(shù)大變革時期,信息技術(shù)、計算技術(shù)、計算機技術(shù)等在高速更新,計算機在圖書情報界得到更為廣泛的應(yīng)用,計算機輔助情報研究方法的不斷應(yīng)用,促進了圖書館、情報信息機構(gòu)的信息分析、挖掘與獲取,使信息檢索工作得到不斷發(fā)展,為了獲得有效準確的數(shù)據(jù)信息,我們需要進行一種數(shù)據(jù)簡化的分析活動。
面向計算機網(wǎng)絡(luò)系統(tǒng)的專門性情報研究活動日益興盛,發(fā)達國家情報研究工作的一大特色是情報研究工作的自動化程度高,大部分的工作借助于電子計算機完成。除了采用如SPSS、SAS等通用統(tǒng)計分析軟件外,還重視情報研究工作專用軟件的研制和應(yīng)用。如美國巴特爾紀念研究所及其下屬機構(gòu)開發(fā)了專門分析能源消費以及能源對技術(shù)變化影響的INTUM-PC等一系列軟件包;美國陸軍國外科技中心開發(fā)了可將文獻分類、組合、比較、合并、匹配、作圖的自動化分析系統(tǒng)——MCICIS;日本花王公司1993年啟動建設(shè)功能強大的營銷情報系統(tǒng)。[1]因特網(wǎng)已成為西方國家獲得情報研究素材的重要渠道和分析的重要工具。近年來還出現(xiàn)了所謂“數(shù)據(jù)分析”專家,他們?yōu)橛脩籼峁碜詧D書館、計算機文檔或其它數(shù)據(jù)庫的信息來源進行分析和評價服務(wù),這類服務(wù)比一般的文摘或計算機輸出具有更佳的加工深度。[2]
自20世紀80年代初,我國綜合意義上的計算機輔助情報研究工作即開始起步;1985年已有情報部門利用計算機作實時信息處理,進行統(tǒng)計運算類的情報研究。1988年,國家科委和國際應(yīng)用系統(tǒng)分析研究所合作,建成了“整體發(fā)展決策支持系統(tǒng)——山西省案例研究”[3],成為我國情報決策專家系統(tǒng)的重大成果。
20世紀90年代以后,網(wǎng)絡(luò)技術(shù)、聲像技術(shù)、多媒體技術(shù)、數(shù)據(jù)庫技術(shù)逐漸進入情報研究活動過程的各個環(huán)節(jié),豐富了情報研究素材的來源,提高了工作效率和自動化水平,提升了成果的傳遞速度。國內(nèi)也引入了投入產(chǎn)出分析法、層次分析法等定量研究方法,讓計算機來自動處理繁復(fù)的數(shù)據(jù)統(tǒng)計和計算工作,并利用互聯(lián)網(wǎng)快速搜集研究素材和發(fā)布研究成果。
我國防科工委系統(tǒng)開發(fā)使用的“情報研究網(wǎng)絡(luò)環(huán)境下的協(xié)同支撐環(huán)境”,作為“世界國防工業(yè)科技信息數(shù)據(jù)庫系統(tǒng)”中“內(nèi)部工作信息數(shù)據(jù)庫分系統(tǒng)”的一部分。該系統(tǒng)用戶是國防科技情報行業(yè)從事情報研究的廣大情報工作人員。協(xié)助用戶進行情報研究過程中的資料管理,實現(xiàn)內(nèi)部資源共享,并在此基礎(chǔ)上實現(xiàn)信息交流及相應(yīng)的數(shù)據(jù)管理與統(tǒng)計。其功能模塊主要包括個人工作平臺、內(nèi)部資料庫、工作組、工具庫、公告欄,這些模塊實現(xiàn)資源共享和信息交流,供普通情報研究人員使用,但還沒實現(xiàn)協(xié)同工作和知識管理功能;稿箱管理和系統(tǒng)管理模塊實現(xiàn)系統(tǒng)設(shè)置和資料管理,供各級管理者和數(shù)據(jù)審查者使用。其工具庫包括了專業(yè)詞匯管理及網(wǎng)址管理,這兩個管理工具只是一種電子化的中英對照專業(yè)詞典和分類管理的網(wǎng)址庫,并沒有達到智能化搜索、翻譯、加工和分析水平。
中國科技信息研究所也有類似的情報分析平臺,它的功能比國防科工委系統(tǒng)的情報分析平臺多了發(fā)布、文獻計量的功能和一般的統(tǒng)計軟件,同樣也未實現(xiàn)協(xié)同工作和知識管理功能。
計算機網(wǎng)絡(luò)技術(shù)的發(fā)展直接促動了情報研究方法的革新,當前國內(nèi)外情報研究方法體系和分析平臺建設(shè)的發(fā)展趨勢表現(xiàn)為:應(yīng)用計算機網(wǎng)絡(luò)技術(shù),以大型科學技術(shù)文獻數(shù)據(jù)庫為基礎(chǔ)進行知識挖掘方法和軟件工具的研制,以知識管理為目標的情報分析協(xié)同工作平臺。
充分利用以計算機網(wǎng)絡(luò)技術(shù)為核心的現(xiàn)代技術(shù),確立科學的搜集、積累資料與數(shù)據(jù)的程序,大力引進通用的數(shù)據(jù)、信息統(tǒng)計分析軟件,積極開發(fā)情報研究專用軟件。逐步建立情報研究工作專用的數(shù)據(jù)型、事實性和全文型數(shù)據(jù)庫,充分利用各種網(wǎng)絡(luò)信息資源和設(shè)備,以提高情報研究工作效率。采用各種現(xiàn)代化手段和措施對資料、數(shù)據(jù)和其他素材進行聚集、整理,讓專業(yè)人員把更多的時間和精力用于分析問題,提出新思想、新建議,同時,現(xiàn)代化的手段和措施也能直接輔助專業(yè)人員開展分析綜合以“激活知識”,從而提高情報研究成果的層次和精確度。探索應(yīng)用聲像技術(shù)、多媒體技術(shù)、網(wǎng)絡(luò)技術(shù)編制和向用戶傳遞情報研究報告的條件、方法和形式,提高情報研究成果表達的動態(tài)性、多維性和感染力,提高情報研究成果傳遞的速度和效率。
在堅持運用分析、綜合、歸納、類比等邏輯思維方法的基礎(chǔ)上,對于現(xiàn)有的從其他學科移植來的各種定量方法進行必要的改造,使它們能更好地體現(xiàn)情報研究工作的特點和要求。對于情報研究工作特有的文獻計量方法和內(nèi)容分析方法,也要不斷進行優(yōu)化,以提高其精確性。同時,要積極研究定性方法與定量方法相結(jié)合的切入點,積極研究定性、定量方法與計算機技術(shù)聯(lián)姻的可行性和途徑。
在圖書情報研究領(lǐng)域,世界上一些信息管理軟件公司,幫助組織索引、檢索和分類、評注信息,進行數(shù)字圖書館拷貝探測。比如Recommind的應(yīng)用包括高自動化的搜索引擎,分類法管理、開發(fā)應(yīng)用、個性化和再求補法功能以及智能軟件代理功能。WCopyFind是一個調(diào)查文獻文件收藏的規(guī)劃。它析取這些文獻的文本部分,并且審核它們在特定的最小長度短語中適合于匹配的詞。當它找出兩個文件在那些短語中共享了足夠的詞時,WCopyFind就生成html文件。這些報告包含著具有被標著下劃線匹配詞的文獻文本。肯特山脈數(shù)字圖書館實驗室開發(fā)對于探測和分析非常大的文本集合、適用于內(nèi)容管理和知識發(fā)現(xiàn)的技術(shù)。它們聚焦在亞洲人所使用的語言的文獻,特別是漢語和英語文本。Paramedies曾經(jīng)是歐洲委托投資的文本挖掘研究工程的第一個名稱,而且就設(shè)在萊比錫管理學研究生院。這一國際工程的主要目標是使用文本挖掘程序在文本文件中發(fā)現(xiàn)經(jīng)濟相關(guān)知識,該工程聚焦分析文獻收藏。[4]
美國芝加哥大學情報學教授Don.R Swanson創(chuàng)立了一種情報學方法——非相關(guān)文獻知識發(fā)現(xiàn)法,并且設(shè)計了相應(yīng)的人機交互系統(tǒng)Arrowsmith,以幫助使用者更好地發(fā)現(xiàn)這種隱含的關(guān)聯(lián)。Swanson所進行的研究工作應(yīng)用于醫(yī)學領(lǐng)域,隨著Arrowsmith系統(tǒng)功能的不斷改進和增強,它的應(yīng)用范圍在不斷地拓展,現(xiàn)已應(yīng)用于醫(yī)學領(lǐng)域以外的其它領(lǐng)域。另外,受Swanson研究的影響,美國Gordon教授設(shè)計了一個計算機輔助于文獻發(fā)現(xiàn)的查詢方法,提出數(shù)據(jù)庫中的標識頻率和記錄頻率有助于實現(xiàn)文獻的發(fā)現(xiàn);美國Chen進行了“讓文獻互相交談”的計算機模型的創(chuàng)建研究;Cort副教授將Swanson的方法成功應(yīng)用于發(fā)現(xiàn)Wilson人文數(shù)據(jù)庫文獻中的隱含相似性上。[5]
穆迪研究和分析有限責任公司(Mogee Research&Analysis)在把專利和其他技術(shù)數(shù)據(jù)轉(zhuǎn)換為有價值的信息方面是領(lǐng)導(dǎo)和創(chuàng)新者。從1985年以來,他們一直在幫助用戶更好地理解復(fù)雜的、迅速改進的技術(shù)環(huán)境。與他們合作的技術(shù)公司主要負責開發(fā)分析方法,以直接滿足商務(wù)需求和運作的方法。最重要的是他們的方法反映了用戶對全球技術(shù)前景的商務(wù)需要。他們的客戶包括了美國財富500強公司和主要的其他國家公司,也包括美國政府和其國外的代表機構(gòu)。這項專利分析針對技術(shù)許可證,競爭情報,公共政策,研發(fā)管理,專利職務(wù)管理,以及經(jīng)濟開發(fā)來實施的。
該公司開發(fā)的一套分析工具,已經(jīng)在成熟、顯現(xiàn)和成長技術(shù)方面測試了這套工具中的分析方法;而且通過與專家觀點以及其他定量方法的比較,對它進行了驗證。其基于專利的指標有助于衡量技術(shù)活動的水平、技術(shù)結(jié)構(gòu)、生命周期的某個階段、技術(shù)意義、商業(yè)潛力,以及技術(shù)策略。它能幫助用戶掌握技術(shù)、技術(shù)活動以及公司和國家的戰(zhàn)略,發(fā)明者和技術(shù)開發(fā)團隊的情報。該工具能分析取得專利的技術(shù)廣泛譜線,覆蓋了遍布世界,包括美國、日本、歐洲國家和新興工業(yè)化國家的40多個專利權(quán)威發(fā)布的專利,提供常規(guī)的專利統(tǒng)計和專利引文分析,這是用其他方法得不到的獨特分析,比如象國際同族專利分析,同引分析以及技術(shù)地圖;還針對研發(fā)管理、許可證、技術(shù)評估和監(jiān)測、競爭情報、政策分析以及經(jīng)濟開發(fā)來量身定制專利分析;另外,提供對分析結(jié)果的闡釋和對管理的潛在意義。[6]
總之,在大數(shù)據(jù)時代,不論是圖書館還是其他情報信息服務(wù)機構(gòu),應(yīng)該及時應(yīng)用現(xiàn)代情報分析研究方法,解決廣大用戶對復(fù)雜數(shù)據(jù)的存取,根據(jù)用戶的信息檢索系統(tǒng),按用戶需求定制檢索結(jié)果,使更多的用戶能夠在熟悉情報分析方法的基礎(chǔ)上,掌握信息檢索的基本技巧,有效獲取所需的知識信息。
[1]日本花王公司簡介關(guān)于消費者意見[EB/OL].[2014-02 -01].http://www.qqyw f.com/view/b_544121.html.
[2]Ulrike Reinhard.未來數(shù)據(jù)分析專家[EB/OL].[2014-02 -10].http://www.i#cn/article/041919E2013.html.
[3]高洪深.決策支持系統(tǒng)(DSS)案例集[M].北京:清華大學出版社,2008.11.
[4]跨學科研究系列調(diào)查報告選登之一跨學科研究:理論與實踐的發(fā)展[EB/OL].[2014-02-22].http://www.npopss - cn.gov.cn/GB/220182/227704/15318717.html.
[5]Michael D.Gordon,Robert K.Lindsay.Toward Discovery Support Systems:A Replication,Re- Examination,and Extension of Swanson's Work on Literature based Discovery of Connection between Raynaud's and Fish Oil.JASIS,1996,47(2):116 -128.
[6]穆迪投資公司[EB/OL].[2014-02-22].https://www.moodys.com/pages/default_ch.aspx.