鄢章華,張鶴冰
(哈爾濱商業(yè)大學 管理學院,黑龍江 哈爾濱 150028)
供應鏈風險管理一直都是供應鏈管理的重要內容,也是供應鏈學術領域關注的焦點。大量學者針對供應鏈風險進行了研究,涉及到的研究領域、關注點也千差萬別[1-4]。本文擬采用知識圖譜作為基本工具,展示數(shù)據(jù)可視化在供應鏈風險領域的基本應用。
知識圖譜(Mapping Knowledge Domain)是指用可視化技術來發(fā)現(xiàn)、描述、分析以及最終展示數(shù)據(jù)或文本之間的相互關系,通過有效地組織、存儲、管理和更新大規(guī)模的知識,進行高效的推理計算和問題求解[5]。知識圖譜的分析方法是綜合運用統(tǒng)計學、應用數(shù)學、計算機科學、信息科學、文獻計量學等多學科理論和方法的過程[6]。知識圖譜分析的基本流程包括:數(shù)據(jù)檢索、數(shù)據(jù)預處理、構建關系矩陣網(wǎng)絡、規(guī)范化處理、可視化數(shù)據(jù)、知識圖譜參數(shù)調整、知識圖譜結果解讀等方面[7]。常用的工具包括:Pajek、Citespace II、UCINET、Bibexcel、Gephi、VOSviewer、VantagePoint、Network WorkbenchTool、Sci2Tool、In-SPIRE、SciMAT、Histcite等[8]。
知識圖譜被廣泛應用于研究學科和知識領域的發(fā)展變化情況,通過知識圖譜能展示發(fā)展趨勢和研究進展,識別研究熱點和前沿,找到核心作者群、研究機構間的關系[9],具有重要的研究價值。如廉同輝等利用知識圖譜,對旅游學科的研究熱點、代表性人物、研究機構間的關系以及高被引論文的特征等進行了分析,發(fā)現(xiàn)熱點主要集中在旅游資源、生態(tài)旅游、旅游開發(fā)、旅游經(jīng)濟等方面,研究機構之間的合作不太緊密,高被引文獻主要來源于旅游與地理類期刊等,為后續(xù)的研究開展提供了參考[10]。趙鑫等基于2000-2011年間CSSCI收錄法學來源期刊中關鍵詞的共現(xiàn)情況,結合知識圖譜,直觀展現(xiàn)了我國法學研究的動態(tài)演化過程和該領域的知識結構[11]。曹樹金等對知識圖譜本身的相關研究進行了梳理,找出了該領域發(fā)展歷史上的重要理論核心人物和團隊以及該領域的技術發(fā)展軌跡,為當前和今后基于知識圖譜的可視化研究提供了理論基礎[12]。張毅恒等將知識圖譜方法應用于我國體育產(chǎn)業(yè)中,基于以核心期刊組成的數(shù)據(jù),分析了體育產(chǎn)業(yè)與相關產(chǎn)業(yè)的融合發(fā)展[13]。
從目前的研究可以看出,在以文獻為基礎構建知識圖譜的過程中,基于關鍵詞構建共詞網(wǎng)絡是最為普遍和有效的一種方式。但如果只考慮關鍵詞間連線的有無,而忽略了連線的權重,將影響共詞網(wǎng)絡分析結果的可靠性[14]。此外,結合共現(xiàn)頻率,對作者進行共詞分析,也能在一定程度上反映出領域內的研究社群,有助于合作者的選擇,但目前的研究對此還鮮有涉及。因此,為了明確我國供應鏈風險相關研究的發(fā)展現(xiàn)狀和趨勢,擬通過可視化技術對研究現(xiàn)狀進行總體描述,通過構建作者和關鍵詞的共詞網(wǎng)絡,生成相應的知識圖譜,找出供應鏈風險管理領域的基本脈絡,為后續(xù)相關研究的定位、研究路徑的選擇提供決策參考。
可視化的工具非常多,出于靈活性和便利性等方面的考慮[8],本文選擇使用Gephi。Gephi是免費的可視化工具,支持的數(shù)據(jù)格式包括CSV、Spreadsheet(Excel)等,盡管在數(shù)據(jù)的預處理功能方面有所欠缺,但通過Spreadsheet(Excel)與ACCESS的數(shù)據(jù)轉換,可以使用數(shù)據(jù)庫的SQL命令,對數(shù)據(jù)實現(xiàn)靈活、自定義化、功能強大的預處理,這種方式往往比其它可視化工具自帶的數(shù)據(jù)預處理功能更有效。而Gephi自身在數(shù)據(jù)的可視化方面,已經(jīng)內嵌了多個布局模型,被譽為“數(shù)據(jù)可視化領域的Photoshop”,能滿足多方面的可視化的需求和后期對圖譜優(yōu)化調整的要求。因此,本文選擇Gephi0.9.1作為復雜網(wǎng)絡圖的可視化工具,使用EXCEL作為數(shù)據(jù)轉換和簡單圖表的繪制工具,使用ACCESS作為數(shù)據(jù)預處理的工具,旨在運用可視化技術分析當前我國供應鏈風險的研究進展,進而為后續(xù)研究提供參考。
依據(jù)數(shù)據(jù)可視化流程,筆者首先以“供應鏈風險”為檢索內容在CNKI的期刊庫中進行搜索,具體數(shù)據(jù)獲取方式見表1。2018年3月20日檢索結果共有2 629項,其中,期刊成果1 892項,核心期刊成果730項,中文社會科學引文索引(CSSCI)成果193項(CSSCI檢索會有延遲)。
表1 數(shù)據(jù)獲取方式
對于所收集到的數(shù)據(jù),根據(jù)數(shù)據(jù)內容的特點,借助于SQL命令,在ACCESS數(shù)據(jù)庫中主要從以下幾個方面進行子數(shù)據(jù)的預處理:
(1)刪除關鍵信息不完整的文獻。由于所獲取的數(shù)據(jù)是通過CNKI平臺查詢并導出的,部分文獻存在關鍵信息不完整的現(xiàn)象,包括作者、發(fā)表時間、成果名稱、出版物(期刊)、摘要、作者單位等,對于能通過在線軟件自動補全信息的文獻進行了保留,不能進行信息補全的進行了剔除。
(2)對于不屬于成果范疇的文獻,如期刊征稿信息、期刊投稿說明等,通過作者信息數(shù)據(jù)與“本刊”、“編者”、“說明”等內容的模糊匹配進行了剔除。
(3)對關鍵詞進行了查重,針對不同用詞表示同一概念的現(xiàn)象,將關鍵詞統(tǒng)一采用出現(xiàn)頻率最高的關鍵詞代替。
(4)由于成果歸屬地一般按照省和直轄市進行統(tǒng)計,而在成果中往往不會規(guī)范地給出省或直轄市的信息,為此,將省(直轄市)及其下屬的市進行整理,生成新的數(shù)據(jù)庫表,通過該表中的數(shù)據(jù)與作者的單位和作者的通訊地址進行模糊匹配,以實現(xiàn)成果的空間歸屬。
以文獻為基礎,作者和關鍵詞都可以生成共詞網(wǎng)絡,下面以關鍵詞為例說明生成網(wǎng)絡關系矩陣的過程。
由于每項成果的關鍵詞數(shù)量各不相同,關鍵詞較少的一般為3個,關鍵詞較多的多達10個,且在ACCESS數(shù)據(jù)表中,關鍵詞為一個字段,通過SQL命令不便拆分。轉而將數(shù)據(jù)導出到EXCEL中,通過分列功能將關鍵詞一列根據(jù)“;”、“,”等分隔符進行拆分,將列名分別定義為“keywords1”、“keywords2”、…、“keywords10”,再將數(shù)據(jù)導回至ACCESS數(shù)據(jù)表。分別抽取“keywords1”、“keywords2”、…、“keywords10”中非空的數(shù)據(jù)與文獻的其它關鍵信息,形成關鍵詞與文獻間的關系表?;谖墨I進行關鍵詞的笛卡爾積,建立起基于文獻的兩兩關鍵詞間的關系,形成基于文獻的共詞網(wǎng)絡[15],生成的結果包括文獻的其它關鍵信息(不含關鍵詞字段)和兩列關鍵詞(兩列關鍵詞間的笛卡爾積,字段名定義為:關鍵詞1和關鍵詞2)。考慮到關鍵詞1和關鍵詞2間的關系應屬于無方向關系,即其它數(shù)據(jù)相同的情況下,關鍵詞1和關鍵詞2的關系對分別為:(A,B),(B,A)的關系應算作相同的關系。因此,根據(jù)關鍵詞1和關鍵詞2間的大小關系,對關系對進行調整。調整規(guī)則為:如果關鍵詞1<=關鍵詞2,不作改變;如果關鍵詞1>關鍵詞2,交換關鍵詞1與關鍵詞2的數(shù)據(jù)。
基于以上關鍵詞1與關鍵詞2間的成對出現(xiàn)頻率,生成共詞網(wǎng)絡的權重(字段名定義為”weight”,并增加一列,字段名定義為:TYPE,統(tǒng)一取值為“undirected”,以保障數(shù)據(jù)能導入到Gephi中并生成無向圖)。至此,數(shù)據(jù)處理部分完成。
根據(jù)收集到的供應鏈風險相關成果,成果的時間分布情況如圖1所示,自從2001年以來,供應鏈風險受到越來越廣泛的關注,研究成果數(shù)也迅速增加,在2008年以后一直處于較高的水平,并在2013-2014年間達到頂峰,此后的研究成果數(shù)開始逐漸下降,說明該領域已經(jīng)較為成熟。
圖1 供應鏈風險管理成果的時間分布
除時間分布外,考慮到地域差異,我們進一步分析了供應鏈風險研究成果的空間分布,分布的熱力圖如圖2所示。由于高校在科研成果貢獻方面起著重要的作用,通過收集整理各省、直轄市的高校數(shù)量數(shù)據(jù),見表2,并計算高校數(shù)量與成果數(shù)量間的相關性,得到相關系數(shù)為0.596,說明高校數(shù)量與成果數(shù)量間具有較高的相關性,為直觀體現(xiàn)這種相關性,我國各省、直轄市高校分布的熱力圖如圖3所示。
圖2 供應鏈風險管理成果熱力圖
表2 我國各省、直轄市的高校數(shù)
圖3 我國高校分布的熱力圖
從圖2、圖3可以看出,一方面,供應鏈風險研究的成果在地域上具有明顯的集聚特征,東部經(jīng)濟發(fā)達的沿海省市明顯高于西部省市;另一方面,東部省市的成果數(shù)量也具有較大差異,成果主要集中在長三角、珠三角和京津冀地區(qū),這與高校在這些區(qū)域的集聚類似。此外,個別省市的研究成果與周邊省市相比,明顯低于(如湖南、江西、河南)或明顯高于周邊省市(如湖北),且這種強烈的對比關系與高校數(shù)量關系不大。但總體上看,高校數(shù)量與供應鏈風險研究成果之間相關性較高。
將前期數(shù)據(jù)處理的結果(邊和邊的權重數(shù)據(jù))導入到Gephi中,Gephi會自動建立結點信息,形成初步的網(wǎng)絡圖。在此基礎上,采用力引導布局進行圖譜的生成,進一步調整網(wǎng)絡圖顯示的參數(shù)(包括結點和邊的標簽大小調整,結點大小和邊精細,非重疊布局調整多重心引力模型調整)和整體布局的縮放等,最終從作者關聯(lián)和關鍵詞關聯(lián)兩個維度生成可視化的知識圖譜,分別如圖4、圖5所示。
根據(jù)作者在供應鏈風險領域的論文數(shù)量和作者間的合作頻次,構建作者合作關系的知識圖譜,如圖4所示。
圖4 作者合作關系的知識圖譜
從圖4可以看出,在供應鏈風險研究方面,作者間的合作關系存在明顯的社群現(xiàn)象,較具代表性的包括(就目前收集到的CNKI的數(shù)據(jù)而言):季建華、劉永勝團隊,張智勇、楊磊團隊,唐小我、倪得兵團隊,齊二石、晚春東團隊,張圣忠、趙道致團隊,黎繼子、劉春玲、曹曉剛和陳成組成的團隊,施國洪、陳敬賢團隊,史成東、關志民團隊等。從學者個人研究成果看,顏波、孫浩、劉偉堅、寧忠、孟志堅等學者在該領域也有相當數(shù)量的成果。此外,由于所構建的作者知識圖譜為矢量圖,可以進一步放大,以展示出更多的細節(jié)信息,通過以上的作者知識圖譜,領域內的學者能更直觀、方便地尋找合作伙伴,追蹤研究趨勢,使自己的研究向主流研究內容靠近,同時也推動了供應鏈風險研究領域的創(chuàng)新,因而具有極其重要的作用。
基于供應鏈風險相關研究成果中關鍵詞成對出現(xiàn)的關系(共詞網(wǎng)絡),構建關鍵詞的知識圖譜,如圖5所示。從總體上看,現(xiàn)有關于供應鏈風險的研究,采用最多、共現(xiàn)頻率最高的關鍵詞是:風險管理、風險、供應鏈以及供應鏈風險。在研究過程中,涉及到最為頻繁的風險包括:信用風險、道德風險、信息風險、采購風險、合作風險、操作風險、違約風險、中斷風險、價格風險、匯率風險、財務風險、融資風險、組織風險、突發(fā)風險等。最常研究的風險管理過程包括:風險識別、風險分析、風險評估、風險傳導、風險預警、風險控制、風險防范等。在風險評價和風險評估的過程中,最常用到的方法包括:模糊綜合評價法、層次分析法、貝葉斯網(wǎng)絡法、系統(tǒng)動力學方法等。通過對局部網(wǎng)絡的進一步放大,一方面,有利于發(fā)掘與該知識點相關的信息,通過知識點間的連接,可以形成新的研究路徑;另一方面,對于提高研究者對該領域前沿問題的研究關注度起到重要的參考作用。
圖5 關鍵詞共詞網(wǎng)絡的知識圖譜
本文基于CNKI上供應鏈風險相關研究成果的數(shù)據(jù),對研究成果進行了可視化呈現(xiàn)和分析。從總體上看,經(jīng)過一段時間的發(fā)展,我國供應鏈風險研究成果的數(shù)量逐漸趨于穩(wěn)定,但研究成果數(shù)量具有明顯的地域性差異,這在很大程度上受各省、市高校數(shù)量差異的影響。利用供應鏈風險研究成果的作者和關鍵詞信息,構建了作者關系和關鍵詞的共詞網(wǎng)絡,從研究人員和研究領域兩個維度給出了我國供應鏈風險研究的現(xiàn)狀。通過作者關系的知識圖譜,找出了我國供應鏈風險管理領域的科研團隊和代表性人物,對于尋找合作伙伴具有一定的參考價值。通過關鍵詞的知識圖譜,一方面給出了供應鏈風險研究的主要脈絡,另一方面從圖譜的邊緣,也可以進一步尋找潛在的研究方向。由于基于關鍵詞的共詞網(wǎng)絡暫時無法反映關鍵詞在內涵上的層次結構和隸屬關系,暫時無法體現(xiàn)出研究內容的包含關系,這也是本文的不足之處,在后續(xù)的研究中,將進一步豐富關鍵詞間的結構關系,使所得的知識圖譜質量更高,表達出更為豐富的信息。
[]
[1]徐緒松,曾學工,鄭小京.供應鏈風險管理研究綜述—風險識別[J].技術經(jīng)濟,2013,(5):78-86.
[2]晚春東,王雅林,齊二石.供應鏈系統(tǒng)風險識別與評估研究綜述[J].哈爾濱工業(yè)大學學報(社會科學版),2007,(6):93-98.
[3]周艷菊,邱莞華,王宗潤.供應鏈風險管理研究進展的綜述與分析[J].系統(tǒng)工程,2006,(3):1-7.
[4]李雷鳴,劉丙泉.供應鏈中斷風險管理研究現(xiàn)狀綜述[J].科技管理研究,2010,(14):236-239.
[5]曹倩,趙一鳴.知識圖譜的技術實現(xiàn)流程及相關應用[J].情報理論與實踐,2015,38(12):127-132.
[6]秦長江,侯漢清.知識圖譜—信息管理與知識管理的新領域[J].大學圖書館學報,2009,(1):30-37.
[7]Cobo M J,López-Herrera A G,Herrera-Viedma E,et al.Science mapping software tools:Review,analysis,and cooperative study among tools[J].Journal of the American Society for Information Science&Technology,2011,62(7):1 382-1 402.
[8]肖明,邱小花,黃界,等.知識圖譜工具比較研究[J].圖書館雜志,2013,(3):61-69.
[9]胡澤文,孫建軍,武夷山.國內知識圖譜應用研究綜述[J].圖書情報工作,2013,(3):131-137.
[10]廉同輝,余菜花,宗乾進,等.基于 CSSCI的2000-2010年旅游學科研究知識圖譜分析[J].旅游學刊,2013,(3):114-119.
[11]趙鑫,梁艷,程川.我國法學研究熱點知識圖譜分析—基于CSSCI(2000-2011年)[J].西南民族大學學報(人文社會科學版),2014,(7):226-231.
[12]曹樹金,吳育冰,韋景竹,等.知識圖譜研究的脈絡、流派與趨勢—基于SSCI與CSSCI期刊論文的計量與可視化[J].中國圖書館學報,2015,(5):16-34.
[13]張毅恒,柳鳴毅.基于知識圖譜的中國體育產(chǎn)業(yè)研究可視化分析[J].中國體育科技,2016,(1):24-29.
[14]鐘鎮(zhèn).知識圖譜分析方法的可靠性檢驗研究—以共詞分析為例[J].科學學研究,2015,(5):647-653.
[15]魏瑞斌.基于共詞網(wǎng)絡的學術期刊知識圖譜構建[J].情報雜志,2011,(10):36-42.