王姣 孫林
〔摘要〕以中國知網(CNKI)核心期刊數據庫為數據來源,檢索2005-2015年關于情報分析研究的文獻。清洗數據,采用關鍵詞與時間序列的方法,對這一時期的情報分析相關文獻分類。同時,采用多種分析工具組合使用對高頻關鍵詞做共現(xiàn)分析、聚類分析,構建情報分析研究的知識圖譜。分析發(fā)現(xiàn),我國情報分析呈現(xiàn)出研究多領域合作、系統(tǒng)性分析、處理數據化、網絡化監(jiān)測、情報人員培訓五大特點。
〔關鍵詞〕情報分析;知識圖譜;可視化分析
情報分析的理論和方法是隨著情報分析社會實踐的深入和展開形成的。從認識思維逐步形成研究方法,繼而創(chuàng)造了適用于解決多種實際問題的理論方法[1]。隨著技術的進步,形成了以技術分析與經濟分析相結合的信息預測方法,帶動了系統(tǒng)分析法[2]、數學與計算機技術的聯(lián)合應用,提高復雜系統(tǒng)間的情報分析研究的運算能力,產生了解決綜合性、多目標、非線性、動態(tài)系統(tǒng)分析的方法[3]。
徐芳[4]將情報分析方法歸納為一般情報分析方法、專門情報分析方法和最新情報分析方法三大類。冷伏海[5]從分析單元的角度,將我國情報研究所使用的方法網羅齊全,延用了包昌火[6]的研究階段三分理論。在網絡環(huán)境下,企業(yè)側重描述與其存在利益關系的信息[7](企業(yè)、產品、人物等),這些信息描述了個體活動的某些狀態(tài),為企業(yè)挖掘市場情報提供了第一手的資料[8]。而以資訊、評論、報道等形式存在的信息,冗余程度高、結構組織不完整、準確性差、信息離散等問題,給企業(yè)的市場分析帶來阻礙。因此,如何消除冗余、發(fā)現(xiàn)事件關系、整合信息,成為情報分析研究的新方向[9-10]。
1數據搜集與處理
以情報分析、商情、輿情、數據分析、信息組織、信息分析、Information、Intelligence為主題詞,在核心數據庫,以2005-2015年為時間限制進行檢索關于情報分析的文獻(截止至2015年12月30日)。
按關鍵詞依次檢索、對比后共命中得出2 360篇文獻。將2 360篇文獻導出做去重處理:首先采用SATI題錄分析工具進行機器去重后得出2 355篇文獻;導入Excel中進行人工清洗,在標題列、關鍵詞列、摘要列檢索,出現(xiàn)上述關鍵詞即可作為文獻分析源數據,剔除不相關文獻后得到2 221篇。
將文獻數據轉換為機器識別格式做年發(fā)文量、關鍵詞詞頻統(tǒng)計,關鍵詞聚類,高頻詞共現(xiàn)。進行高頻詞共現(xiàn)處理時,需要對關鍵詞做清洗與合并同義關鍵詞的處理。因此,對得到的關鍵詞進行頻次統(tǒng)計,機器去除重復項之后共得到800個關鍵詞。使用Pajek網絡生成工具按照共現(xiàn)形式生成關鍵詞共現(xiàn)矩陣,之后使用VOSviewer對關鍵詞共現(xiàn)矩陣構建知識圖譜。
1發(fā)文量統(tǒng)計
對年發(fā)文量統(tǒng)計,做出圖1。經過文獻統(tǒng)計發(fā)現(xiàn)情報分析一直受學者的廣泛關注,2005-2015年呈持續(xù)上升趨勢,特別是在2011年之后增幅明顯上升。2010-2011年增幅較小。因此以2011年為臨界點,對本年文獻進行研究后將情報分析分為兩個階段:第一階段以2005-2010年的情報理論研究;第二階段以2011-2015年的網絡輿情研究兩個階段,兩者之間的區(qū)別為信息是否以網絡為主要來源。
2關鍵詞統(tǒng)計
對得到的800個關鍵詞做頻次統(tǒng)計,并選擇前200個關鍵詞做同義詞合并(見表1)。對高頻關鍵詞做共現(xiàn)可視化,通過調整閾值確定最佳圖譜(如圖2)。結合關鍵詞詞頻表與共現(xiàn)可視化發(fā)現(xiàn)情報分析研究內部有很強的關聯(lián)性,特別是競爭情報研究方向。如:圖書館、企業(yè)兩類研究機構,由競爭情報緊密聯(lián)系起來。競爭情報是情報分析研究的核心區(qū),專利研究、搜索方法、分析方法是該區(qū)域的主要方向。網絡輿情研究起步較晚,2005年數據挖掘與專利情報的研究,幫助企業(yè)充分利用網絡信息,為企業(yè)競爭提供情報服務。在競爭情報工作開展的同時也開始關注情報工作人員培養(yǎng)狀況和機構建設的工作。
圖2CNKI中情報分析關鍵詞聚類關系圖(閾值≥4)表1CNKI中情報分析文獻關鍵詞頻次表
關鍵詞頻次關鍵詞頻次情報分析503數據挖掘52競爭情報279協(xié)同研究50信息分析240輿情分析46高校圖書館170知識組織42專利情報90網絡情報35企業(yè)競爭情報87知識管理32公安情報78競爭情報系統(tǒng)30數據分析70大數據22專利分析71競爭對手20信息服務70情報工作17科技成果報告63情報搜集16情報研究57技術競爭情報142分析結果
結合發(fā)文量與關鍵詞分析可知,每年有較多學者在研究情報分析方法理論,在應用上整合了與當時環(huán)境相匹配的技術性支持。起初專利分析在企業(yè)競爭的研究中推動了技術專利研究向企業(yè)情報領域發(fā)展蔓延[11-12],隨后計量方法在企業(yè)競爭研究中引起了新關注[13]。到2011年大數據思想與數據挖掘初具規(guī)模[14],帶動了競爭情報與情報分析在市場經濟中研究的新課題[15]。在聚類圖譜中,可將情報分析看成是以知識服務為目的,以數據分析為手段的知識加工。
2知識服務
2 1拓寬領域
在圖2的基礎上,繼續(xù)調節(jié)閾值發(fā)現(xiàn)情報分析適用于很多領域,農畜牧業(yè)、生物制藥、工業(yè)競爭、圖書館等各行各業(yè)都可以成為服務的主體(如圖3所示)。特別是公安情報、軍事情報領域的研究更是情報的核心領域。在公安情報理論的系統(tǒng)研究上增加犯罪情報研究,結合網絡擴大信息的收集覆蓋[16]。在這期間也出現(xiàn)了關于公共機構情報研究、公益事業(yè)情報研究兩個方向[17]。行政機構、軍事機構也在進行情報機構的持續(xù)研究,側重新方法、新技術的應用[18]。
2情報理論研究
情報是針對特定事物的、具有特殊價值的信息產品和知識。圖2可以將情報分析研究分為3個部分:圖書館研究、政企研究、網絡研究。李新華在“90年代我國情報學研究的觀念轉變”一文中提出了關于情報觀念的Information與Intelligent兩個概念[19],之后出現(xiàn)了Intelligent文獻研究,關于新型理論的實踐逐漸展開。使用新理論對國家的戰(zhàn)略研究、軍事能力檢驗、新型信息系統(tǒng)搭建,為情報事業(yè)的建設提供較好的理論依據的同時,也帶動了實踐的進步[20]。
2方法融合
在關鍵詞統(tǒng)計時發(fā)現(xiàn)許多方法理論的文獻。在情報分析模式變革提出后,產生以社會網絡、專利分析軟件圖3研究內容可視化圖譜(頻次≥5)
Innography為主的情報分析方法[21]。這些分析軟件是基于SWOT與PEST分析的相關理論基礎,或者是以這兩個理論為基礎在計算機平臺上融合,形成更加人性化的分析工具[22]。這些工具計算能力、邏輯結構復雜度都有明顯提高,特別是在數據分析、模型分析方面具有明顯優(yōu)勢。以數據挖掘為集合的方法體系將傳統(tǒng)思想與現(xiàn)代化技術融合,是知識服務方式的進一步改進。在數據挖掘的同時,也會搜集挖掘過程中產生的信息,對現(xiàn)有方法進行完善[23]。
2輿情研究
2由靜至動
圖2可以看出,網絡輿情是研究的熱點。傳統(tǒng)的數據來源面臨兩大問題:一是以調查問卷、采訪、科學期刊等信息為代表的靜態(tài)數據;二是以網絡數據為代表的冗余程度高、排列混亂、處理麻煩的動態(tài)數據。在自動篩選、排序工具研發(fā)成功,網絡數據已然成為情報研究來源的重要組成部分[24]。網頁數據具有規(guī)模宏大、異構性、自治性、動態(tài)變化等特點,對網頁數據集成極具挑戰(zhàn)。單一的淺層網絡分析已經不能滿足用戶的需求,需要進行深入的網絡分析[25]。深層數據發(fā)現(xiàn)是目前較為流行的分析方法,該理論不僅推動實踐,也推動軟件開發(fā)與量化思想的發(fā)展[26]。
2過程研究
網絡數據更新快,時效性相對以往較長,可以給服務對象提供相對較長的時間做準備,達到規(guī)避風險的目的[27]。為有效地利用這些信息,需要從多個不同的信息源中將網頁內容爬取下來,并且整理存儲,這個過程稱為數據收集[28]。輿情研究是一個持續(xù)的動態(tài)性研究,往往需要對某一課題進行跟蹤分析。但是,網絡中新聞、政策類信息時效性較長,特別是國家提出的一些政策。以這些為主題的信息也是研究人員關注的(如圖4所示),如科技情報、科技發(fā)展戰(zhàn)略、網絡輿論引導等問題。當然在網絡輿情研究中也有對社會關系網絡、人際關系網絡理論的應用,實現(xiàn)網絡信息分類,解決網絡引發(fā)的連帶問題[29]。圖4網絡輿情研究圖譜
2數據挖掘技術
深度網頁增量爬取服務推出后,情報分析量化實證研究成為網絡分析的主要途徑[30]。目前,情報分析的軟件數量在增加,基礎分析軟件為微軟公司的Excel、SQL,以及IBM公司的SPSS為代表,可以進行規(guī)模稍大的數據分析[31]。網絡輿情監(jiān)測是一個動態(tài)的、實時數據監(jiān)測,建立在信息系統(tǒng)數據庫基礎上,需要較高的技術支持。同時,數據挖掘是以關聯(lián)思想為主線,以詞語單元為節(jié)點,以空間結構與數學算法為手段集成的系統(tǒng)[32]。數據挖掘技術分為搜索引擎、數據抓取、系統(tǒng)歸類、數據描述、知識呈現(xiàn)五大模塊。
3圖書館研究
圖書館與競爭情報研究之間的相關性較低,對該類呈現(xiàn)如圖5。圖書情報機構是情報工作開展的核心機構,是以文獻工作開展為主要目的的圖書情報服務[33]。對該類文獻分析發(fā)現(xiàn),現(xiàn)代化圖書館采用專業(yè)化的服務模式,對用戶進行需求分析,建立完善的圖書館工作體系[34]。在圖5中圖書情報人員、圖書情報工作、圖書情報服務之間具有密切聯(lián)系。該類機構與企業(yè)性質機構差別較大,同時在總體上與企業(yè)有著密切的合作關系。某些機構開始采用企業(yè)的模式對圖書館進行現(xiàn)代化改造,實現(xiàn)共贏的目的。
3我國情報分析研究熱點
對情報分析文獻統(tǒng)計之后得出,2005-2015年我國關于情報分析研究的一些現(xiàn)象,提出關于分析方法集成的一些看法,同時提出關于情報分析向技術化轉變與網絡分析人員綜合化培訓的一些觀點。
3多領域合作
社會信息化的發(fā)展使情報分析的主體向社會各層滲透,不僅是政府企業(yè),像個人投資這樣面向個人也成為熱點。情報分析的領域不再局限于政治、軍事,已經向經濟、法律、環(huán)境、教育、公共事業(yè)、管理事業(yè)等領域延伸。這就要求情報分析人員在具體的情報分析工作中建立起從政治、軍事、科技、外交等領域綜合協(xié)調和持續(xù)發(fā)展的角度來使得內容更加綜合。在第二節(jié)分析的過程中發(fā)現(xiàn)對情報研究的主體沒有明確的要求,情報工作的核心是實現(xiàn)知識的發(fā)現(xiàn)。在發(fā)現(xiàn)知識的過程中需要融入多領域信源,采用多領域的工作方法,融合多領域的分析思維。
信息技術,特別是網絡,使得情報分析的領域擴大,在進行數據分析的時候,許多數據集合都是來源于國外。一些大型數據庫也加入到國際交流的環(huán)境中,數據的國際化交融帶來的是情報分析的國際交流合作。各國共同面對的全球性質的問題,例如環(huán)境問題、公益事業(yè)、城市建設、人口發(fā)展等一些國際性的項目促進合作化。
2系統(tǒng)分析
網絡與計算機的使用,使得情報分析方法在軟件平臺上組合在一起。同時SWOT與PEST同知識管理工具相集成,得出知識管理服務。集成后的情報分析方法可以將分析的過程同實際工作流程結合起來,圍繞情報分析系統(tǒng)功能的要求,根據情報對象的特點選擇適當的方式進行情報分析,進而提高了分析結果的科學性和準確性。多種軟件集成使用產生的結果也是更加直觀、準確,加入社會化的元素,使得結果的呈現(xiàn)形式便于接受。
3數據化處理
信息技術與網絡技術的發(fā)展為情報服務提供了強有力的技術和方法的支撐。目前,情報分析活動已經開始利用計算機智能系統(tǒng),在軟件層面上實現(xiàn)人機結合,從而提高了工作效率?,F(xiàn)代情報分析與技術的融合,一方面提高了分析的能力,優(yōu)化咨詢結果;另一方面也會促進分析軟件的開發(fā),刺激新行業(yè)快速發(fā)展。定量分析研究的方法逐漸增多,尤其是出現(xiàn)了一些非線性領域的研究方法。定性分析側重干物理模型的建立和數據意義的闡明,定性分析固然能把握情報研究的重心和方向,但要進一步從數量上說明問題,達到情報分析研究的精確化、科學化和抽象化,還需要定量分析。
4網絡輿情
計算機網絡應用的深入,使情報分析研究方法的實施逐步向網絡過渡。網絡為情報分析研究提供了大量的數據來源,各種方法軟件包為定量方法的實施掃清了障礙。依托網絡背景的情報分析正被廣泛關注,企業(yè)、學術機構、政府部門,甚至是一些個體都在積極的利用網絡搭建自身的數據庫。網絡用戶群體也在不斷的增加,特別是移動端用戶,終端軟件開發(fā)帶來了海量的數據種類,給網絡情報分析帶來巨大的商機。如何將海量數據結構化以及結構化數據正被廣泛關注。
5情報人員
情報分析活動是一項綜合性很強的工作,對于從業(yè)人員的素質要求非常高。情報分析本身的特性決定其不可能降低對從業(yè)人員的素質要求,更不能排斥特定專業(yè)的人才,并不限于某一個特定專業(yè),而是廣泛的吸收各個領域的專家或者經驗豐富的人員。在情報分析人員管理方面,普遍采用認證的方法來確定從業(yè)人員的不同專業(yè)層次??v向以能力和經驗為標準,橫向以專業(yè)領域為標準,實施專業(yè)化管理。這種縱橫交錯的從業(yè)人員體系架構,基本上規(guī)范了情報分析行業(yè)的就業(yè)市場,同時對于情報分析人才也是一種指導。
4結語
我國情報分析理論領域主要的研究方向是情報學與圖書館學領域的專利情報與競爭情報,研究機構以高校與圖書館為核心。應用領域研究主要表現(xiàn)在企業(yè)決策、技術路線、預測發(fā)展等方面。情報分析所使用的理論與方法工具不斷創(chuàng)新,在此過程中,也逐漸形成了情報分析方法和專有工具,這些方法和工具的運用更加豐富了情報分析領域。網絡情報分析被各行各業(yè)關注,為情報事業(yè)提供了發(fā)展的機會。
參考文獻
[1]遲玉琢.2013年我國情報學研究進展[J].山東圖書館學刊,2014,(6):8-13.
[2]李紅,朱玉奴,繆家鼎.基于專利情報分析和對比的高校技術創(chuàng)新評價研究——以浙江大學為例[J].情報理論與實踐,2015,(5):100-104.
[3]黃玲.網絡環(huán)境下提高醫(yī)學科技查新質量的探討[J].科技情報開發(fā)與經濟,2009,(9):107-108.
[4]徐芳.情報分析方法研究進展[J].情報理論與實踐,2009,(8):121-124.
[5]冷伏海,馮璐.情報研究方法發(fā)展現(xiàn)狀與趨勢[J].圖書情報工作,2009,(2):29-33.
[6]包昌火,王秀玲,李艷.中國情報研究發(fā)展紀實[J].情報理論與實踐,2010,(1):1-3.
[7]李國秋,呂斌.預測市場——一種情報分析研究的新方法[J].情報雜志,2014,(1):11-15.
[8]王中晶.網絡環(huán)境下企業(yè)競爭情報的收集[J].科技情報開發(fā)與經濟,2012,(16):89-91.
[9]孫建軍,柯青.不完全信息環(huán)境下的情報分析方法——情景分析法及其在情報研究中的應用[J].圖書情報工作,2007,(2):63-66,120.
[10]侯麗,李亞子.情報分析方法與情報分析軟件的適用性探討[J].情報科學,2014,(4):114-121.
[11]魏衍亮.專利生態(tài)圖引導競爭策略——基于必要技術的專利情報分析[J].中國發(fā)明與專利,2007,(5):76-78.
[12]王慶民.專利信息的情報功能和專利情報分析[J].現(xiàn)代情報,2007,(7):223-225.
[13]朱偉珠,李春發(fā).我國生態(tài)城市研究領域的熱點與發(fā)展趨勢[J].城市問題,2013,(8):26-31.
[14]王卓君.基于分類數據挖掘技術的情報分析系統(tǒng)研究[J].情報雜志,2011,(1):115-122,141.
[15]劉毅.基于大數據的科技競爭情報服務市場化運營路徑探索[J].廣東科技,2014,(20):1-2.
[16]馬忠紅.我國犯罪情報分析研判研究述評[J].中國人民公安大學學報:社會科學版,2011,(4):75-83.
[17]曾怡.我國公益型競爭情報服務探索[J].情報探索,2009,(5):43-44.
[18]趙凡.國外咨詢情報機構戰(zhàn)略情報分析方法比較研究[J].情報雜志,2008,(3):132-134,141.
[19]李新華.90年代我國情報學研究的觀念轉變[J].情報科學,2000,(1):85-86,90.
[20]洪勇,李英敏.基于專利耦合的企業(yè)間技術相似性可視化研究[J].科學學研究,2013,(7):1013-1021.
[21]劉玉琴,彭茂祥.國內外專利分析工具比較研究[J].情報理論與實踐,2012,(9):120-124.
[22]李星,謝武.基于SWOT的競爭態(tài)勢模糊評價[J].產業(yè)與科技論壇,2008,(12):125-126,72.
[23]文志信,單潔.基于數據挖掘思想的情報發(fā)現(xiàn)模式初探[J].情報雜志,2009,28:55-58.
[24]晏創(chuàng)業(yè),張玉峰.智能檢索中的網絡數據挖掘技術探索[J].中國圖書館學報,2002,(3):48-50.
[25]王立紅.面向領域的Web數據集成中數據抽取的研究[D].濟南:山東大學,2009:22-33.
[26]黃秋艷.基于主題的增量網頁并行爬取問題研究[D].濟南:山東大學,2013:37-44.
[27]商宏娟.淺談我國網絡輿情監(jiān)測行業(yè)的現(xiàn)狀及問題[J].新聞研究導刊,2016,(1):195,215.
[28]孫培梁,林楓,昌志瀧.大數據時代的政府網絡輿情監(jiān)測系統(tǒng)研究[J].數字技術與應用,2014,(3):78-79.
[29]佟暉.論網絡輿情的引導[J].北京人民警察學院學報,2010,(6):60-64.
[30]姚偉,劉麗敏,張亮,等.網絡輿情分析監(jiān)測人員與技術的協(xié)同研究[J].情報雜志,2014,(12):160-164,153.
[31]塞沃爾(Thelwall,M.).鏈接分析信息科學的研究方法[M].孫建軍,等譯.南京:東南大學出版社,2009:20-28.
[32]金學慧,劉細文.國內外典型競爭情報系統(tǒng)軟件功能的差異性分析[J].情報雜志,2009,28(9):102-106.
[33]梁戰(zhàn)平.情報學和情報工作的發(fā)展趨勢[J].圖書情報工作,2009,(2):5-7.
[34]劉錚.圖書館工作在解決社會熱點問題中的作用[J].圖書情報工作,2010,(11):8-10,20.