張濤 李鳳軒
摘要:基于公共文化領域CNKI歷年數(shù)據(jù)庫的期刊論文數(shù)據(jù),構建作者外在合作網(wǎng)絡矩陣與潛在合作網(wǎng)絡矩陣,以社會網(wǎng)絡分析法為主,結合文獻計量、作者關鍵詞耦合分析、因子分析等方法,從合作度、合作率、子網(wǎng)絡、網(wǎng)絡密度、中心性、小團體等方面進行深入研究,并進一步對作者潛在合作網(wǎng)絡中的小團體研究內容進行聚類。
關鍵詞:公共文化;社會網(wǎng)絡分析;潛在合作網(wǎng)絡;作者關鍵詞耦合分析
中圖分類號:G353.1?文獻標識碼:A
DOI:10.13897/j.cnki.hbkjty.2020.0105
科學研究的成果通常以學術論文的方式呈現(xiàn),科研人員之間的合作往往體現(xiàn)在學術論文的署名上,因此,學術論文的署名是科研人員合作關系的重要表現(xiàn)。從類型上來看,合作可以分為外在合作和潛在合作,若合作者均直接在文章中署名,他們的合作關系稱為外在合作網(wǎng)絡;若不同作者均擁有相同的文章關鍵詞,則表示他們有合作的可能,這種隱藏在背后的合作關系稱為潛在合作網(wǎng)絡[1]。通過潛在合作網(wǎng)絡的研究,一方面我們能夠基于研究內容對作者進行聚類,另一方面我們能發(fā)現(xiàn)潛在的合作者,為該領域的合作方向提供參考意見。
作者關鍵詞耦合分析法是指利用作者文獻中關鍵詞耦合強度分析作者之間關系的一種方法[2],它能夠更加客觀、直接地了解科研人員研究內容和學術關系,更適合揭示同一領域內作者之間隱含的學術關系。目前,大多數(shù)研究集中于外在合作網(wǎng)絡,僅有部分學者在知識管理[3]、數(shù)字圖書館[4]、計算機科學[5]、圖數(shù)情報學[6]等領域,運用作者關鍵詞耦合分析法研究作者潛在合作網(wǎng)絡。近年來,公共文化領域一直是研究熱點,作者眾多,發(fā)文量逐年攀升,但是對該領域作者潛在合作網(wǎng)絡的研究還未涉及,因此,本研究基于公共文化領域CNKI數(shù)據(jù)庫的期刊論文數(shù)據(jù),構建作者外在合作網(wǎng)絡矩陣,利用社會網(wǎng)絡分析法對子網(wǎng)絡、網(wǎng)絡密度、中心性、小團體等進行分析;通過作者關鍵詞耦合分析法構建作者潛在合作網(wǎng)絡矩陣,并利用因子分析法,結合社會網(wǎng)絡分析,研究潛在合作網(wǎng)絡學術小團體,有利于加強公共文化領域的學術溝通與知識共享。
1?數(shù)據(jù)來源與研究方法
數(shù)據(jù)樣本來自CNKI中國知網(wǎng)期刊數(shù)據(jù)庫,在2020年3月初以“公共文化”為主題詞進行檢索,且限定在CSSCI、核心期刊范圍內,共檢索到3 878篇文章。其中去除缺少作者、關鍵詞的232篇論文,去除作者為本刊編輯部、本報記者以及評論、報道等非學術文獻9篇,最后得到3 637篇期刊論文。它們分屬于322個學術期刊,收錄時間從1994年到2020年,已有26年的學術積累。
本研究主要采用社會網(wǎng)絡分析法及共詞法對我國公共文化領域進行分析,具體方法如下:首先利用EXCEL對數(shù)據(jù)進行預處理,得到作者合作的基本情況,然后根據(jù)普賴斯定律確定核心作者條件及人數(shù),最后以作者關鍵詞耦合分析、因子分析為依據(jù),制作作者外在合作網(wǎng)絡矩陣、作者潛在合作網(wǎng)絡矩陣,并導入UCINET中進行社會網(wǎng)絡分析。
2?數(shù)據(jù)分析
2.1?作者總體情況分析
在3 637篇論文中合著論文有1 390篇,約占論文總數(shù)的38%,其中合著人數(shù)最多的是10人;所有文獻共涉及2 907位作者,其中合著的639位作者,約占作者總數(shù)的22%。對作者合作分析指標主要以合作度和合作率為主,本研究采用劉志輝的研究方法進行測算[7],國內公共文化領域合作度約為1.53,合作率約為0.38,整體合作程度較低。論文合作情況如下:獨著論文占比62%,2人合著論文占比28%,3人合著論文占比7%,4人合著論文占比2%,5人及以上合著論文占比1%。
2.2?核心作者群選取
關于共線網(wǎng)絡中的作者闕值選取,目前常見的做法是依據(jù)普賴斯定律,在1969年發(fā)表的《小科學,大科學》一書中,普賴斯指出:撰寫全部論文一般的高產(chǎn)作者的數(shù)量等于全部科學作者總數(shù)的平方根。根據(jù)普賴斯定律,在公共文化領域現(xiàn)有2 907位作者,前54位應為高產(chǎn)作者,約為發(fā)文量7篇的作者[8]。核心作者是在該領域獲得較多學術成果的人,普賴斯定律也有另一種計算方式,公式為,M為該領域核心作者中最低產(chǎn)作者的發(fā)文數(shù),N為所統(tǒng)計年限最高產(chǎn)作者的論文數(shù),發(fā)文數(shù)達到M值可確定為核心作者[9]??缕綖楣参幕I域最高產(chǎn)作者,發(fā)文量達到54篇,因此高于5.5篇的為核心作者。綜上所述,選定發(fā)文量大于或等于6篇的作者進入核心作者群,共有77位。
2.3?核心作者群外在網(wǎng)絡分析
首先,依據(jù)社會網(wǎng)絡分析法,在EXCEL中編制VBA程序,構建77×77的矩陣,然后導入Netdraw進行可視化分析,繪制作者外在合作關系網(wǎng)絡圖,如圖1所示。該合作網(wǎng)絡由45位作者組成14個具有合作關系的子網(wǎng),缺乏大型互通網(wǎng)絡。進一步分析子網(wǎng)類型,可以發(fā)現(xiàn)四種典型的合作類型,即單點型、雙核型、中心型、橋梁型。單點型是指獨立發(fā)表文章,未與他人合作的核心作者,在77×77的矩陣中有32個為孤立點,表明32位作者與其他核心作者群的作者并無合作關系;雙核型是指僅兩人共同合作發(fā)表論文而形成的子網(wǎng)絡,共有6個;核心型是指網(wǎng)絡中有一個最大頂點,呈中心向外擴散,并與其他頂點相連,其中以柯平為核心的網(wǎng)絡最為典型;橋梁型是指某一個或幾個頂點為子網(wǎng)中的連接點,其中以鄭建明、傅才武為連接點的子網(wǎng)最為典型。此外,作者外在合作網(wǎng)絡圖中,每一個頂點代表一位研究者,頂點越大代表該核心作者發(fā)文量越高;頂點之間的連線越粗,表明作者之間的合作程度越深,共同發(fā)表文章的數(shù)量越多;其中葉南客與顏玉凡線條最粗,合作次數(shù)達到12次。
其次,將作者外在合作網(wǎng)絡矩陣導入UCINET,進行中心性分析(點度中心度、接近中心度、中間中心度)、網(wǎng)絡密度分析以及凝聚子群分析。
(1)網(wǎng)絡密度分析。網(wǎng)絡密度反映了不同作者關聯(lián)關系的疏密程度,網(wǎng)絡密度過低則表示該領域作者間的科研合作較少。經(jīng)測算,核心作者群網(wǎng)絡密度為0.0126,整體網(wǎng)絡密度較低,結構相對松散,不同作者間的合作強度較弱,而且發(fā)文量高的作者相對合作伙伴較為固定,這可能與作者間的地理位置差異以及工作單位不同,導致無法有效擴展新的合作伙伴有關。
(2)中心性分析包含度數(shù)中心度、接近中心度、中間中心度。度數(shù)中心度越高,說明該核心作者越接近網(wǎng)絡的中心位置;接近中心度是以距離為判斷標準,與其他作者越接近則中心度越高,反之越低。中間中心度反映的是網(wǎng)絡的集權程度[10]。通過對核心作者群中心性的測算,得到結果如表1所示,因篇幅有限,故選取前10位作者的結果進行展示。
在核心作者外在網(wǎng)絡中心性測度中,柯平教授與20人有合作關系,在全部作者網(wǎng)絡中,與68人有合作關系,發(fā)文集中在圖書情報領域,因此,柯平教授度數(shù)中心性最大。同時,他又是接近中心度最大的作者,往往接近中心度數(shù)大的作者具有較高的學術地位,與其他學者的連通距離越近。鄭建明、傅才武等人擁有較高的中間中心度,在合作網(wǎng)絡中具有較大的控制能力,經(jīng)過他們可以與更多的作者連通,這也與圖1的分析結果相一致。
(3)凝聚子群分析。在小團體分析中,常常用n-clique分析對小團體進行聚類,將在距離為n以內可以達到的節(jié)點視為一個小團體[11]。當n值為2,最小節(jié)點數(shù)為3時,在網(wǎng)絡中可發(fā)現(xiàn)10個小團體,將重復出現(xiàn)在多個團體的作者進行合并,進一步得到8個小團體,如表2所示。
2.4?核心作者群潛在網(wǎng)絡關系挖掘
外在合作網(wǎng)絡分析是基于核心作者已發(fā)表的
論文而建立的合作關系,是實際已經(jīng)發(fā)生合作關系的網(wǎng)絡。但是,在現(xiàn)實中有很多作者有著相似的研究領域或者研究內容,由于受限于時間、地理位置等因素無法合作,他們之間存在著潛在的合作網(wǎng)絡,需要進一步挖掘。本研究借鑒作者關鍵詞耦合分析法[5],制作潛在合作網(wǎng)絡矩陣,將矩陣導入UCINET,繪制作者潛在合作關系網(wǎng)絡圖。首先,分析不同作者的潛在合作關系,包括合作強度、合作領域等;其次,進行網(wǎng)絡密度及中心性分析;最后,利用SPSS提取公因子,將因子分析后的矩陣進行可視化,并分析其中的小團體構成。
(1)根據(jù)作者關鍵詞分析法制作潛在合作網(wǎng)絡矩陣。過多的關鍵詞并不利于潛在關系的挖掘,再結合前文對核心作者認定的限定條件,本研究按照以下標準構造公共文化領域作者關鍵詞耦合矩陣:關鍵詞詞頻要大于或等于10次;發(fā)文量大于或等于6篇的核心作者。根據(jù)以上標準,共有68位作者符合要求,因此,構建68×68的潛在合作網(wǎng)絡矩陣。
(2)將矩陣導入Netdraw,繪制作者潛在合作關系網(wǎng)絡圖,如圖2所示。通過關鍵詞的關聯(lián),合作網(wǎng)絡將具有相同研究方向的作者聯(lián)系在一起,作者間的連線從合作發(fā)表的關系變成相同研究方向的關系,連線越粗代表潛在合作關系越強。
通過選取關鍵詞關聯(lián)次數(shù)最多的7位作者,總結得到高強度潛在合作關系表,如表3所示。其中柯平與李國新之間的潛在合作度最強,達到15次;柯平與傅才武、李國新、王世偉、金武剛、吳建中,傅才武與陳波,李國新與金武剛研究方向存在相似性,潛在合作網(wǎng)絡可以進一步挖掘,合作領域集中在圖書館、公共文化服務、文化建設等相關方面;李國新與金武剛在現(xiàn)實中有合作關系,已發(fā)文2篇,其余作者可能由于信息的不暢通、缺乏交流機會等原因,外在合作網(wǎng)絡關系還未建立。
潛在合作網(wǎng)絡密度及中心性分析。潛在合作網(wǎng)絡密度為0.6932,相比于作者外在合作網(wǎng)絡密度有大幅度提升,是外在合作網(wǎng)絡的55倍,表明核心作者現(xiàn)有合作并不充分,仍有廣泛的合作潛力。進一步對潛在合作網(wǎng)絡測算度數(shù)中心度、接近中心度、中間中心度,前10名作者如表4所示。從度數(shù)中心度來看,柯平位列第一,與外在合作網(wǎng)絡一致,表明他的外在和潛在合作網(wǎng)絡都很廣泛,合作領域與更多人有交集;從接近中心度來看,李國新位列第一,李國新在外在合作網(wǎng)絡中的接近中心度并不在前10名,表明在潛在合作網(wǎng)絡中,他與其他作者距離最近,更容易與其他作者產(chǎn)生便捷的溝通交流;從中間中心度來看,同樣是李國新的潛在中介性最強,說明他在公共文化領域有控制能力。
小團體分析。通過用n-clique分析對小團體進行聚類,發(fā)現(xiàn)分布過于分散,這表明涉及到潛在合作網(wǎng)絡時,團體集聚程度不明顯。在n- clique分析中,n值越小,最小團體數(shù)量越大,則條件越嚴格,將會分成眾多的小團體,不利于深入分析[12]。所以,進一步借鑒D.Z.Zhao的方法[13],對潛在合作網(wǎng)絡采用因子分析聚類,然后對其結果進行可視化處理。通過SPSS處理,共提取11個公因子,累計貢獻率為75.887%,將成分矩陣導入UCINET,設定載荷閾值為0.2以上,繼而用Netdraw制作作者潛在合作關系因子分析圖,如圖3所示。
在圖3中,圓形節(jié)點表示作者,方形節(jié)點表示因子,方形節(jié)點大小表示所有作者對該因子載荷值的大小。進一步對12個公因子匯總得到4個研究主題,第一類以陳波、柯平、李國新、陳立旭等人為代表,這一類群體人數(shù)最多,研究最為密切,主要以文化事業(yè)、公共圖書館、公共文化服務體系為主;第二類主題主要以數(shù)字文化服務、圖書館建設為主,主要代表是肖希明、張靖、完顏鄧鄧、楊玉麟等;第三類小團體以魏大威、王錳、戴艷清、韋楠華等人為主,主要研究領域為用戶需求、用戶服務等;第四類以文化體制改革、文化產(chǎn)業(yè)為研究對象,代表學者有鄭曉幸、張良、胡惠林等。雖然按照研究方向區(qū)分了4類作者,但各類之間并不是孤立的,一些作者涉及較多的細分領域,表明他們在學術界有著重要地位和影響力。在公共文化領域,圖書館是重要的組成部分,數(shù)字文化服務是最新的發(fā)展趨勢,文化產(chǎn)業(yè)可有效助力公共文化的傳播與發(fā)展,因此以上分類基本符合對公共文化領域的認知,這也再次證明了作者關鍵詞耦合分析法在挖掘潛在合作關系和分析學術共同體中的應用價值。
3?結語
通過對自1994年以來,我國公共文化領域的3 637篇論文數(shù)據(jù),構建外在合作網(wǎng)絡矩陣和潛在合作網(wǎng)絡矩陣,結合社會網(wǎng)絡分析法,從子網(wǎng)絡、網(wǎng)絡密度、中心性、小團體等方面進行分析,主要得出以下結論:
(1)在核心作者外在合作網(wǎng)絡中,由45位作者組成14個具有合作關系的子網(wǎng),子網(wǎng)包含四種典型類型,即單點型、雙核型、中心型、橋梁型;外在合作網(wǎng)絡整體網(wǎng)絡密度較低,結構相對松散,不同作者間的合作強度較弱;柯平度數(shù)中心性與接近中心度最大,合作關系最為廣泛,鄭建明、傅才武中間中心度較高,在合作網(wǎng)絡中具有較大的控制能力;小團體可分為8個,各團體間合作較少,合作關系主要以工作單位為主。
(2)在公共文化領域,很多作者間存在研究的相似性,但是受限于一些因素,并未建立現(xiàn)實中的合作關系,因此,通過作者關鍵詞耦合分析,進而挖掘作者間潛在合作關系。在潛在合作網(wǎng)絡中,柯平與李國新之間的潛在合作度最強,李國新與金武剛不僅具有潛在合作關系,而且在現(xiàn)實中已經(jīng)建立合作關系,其余作者可能由于信息的不暢通、缺乏交流機會等原因,外在合作網(wǎng)絡關系還未建立;潛在合作網(wǎng)絡密度相比于作者外在合作網(wǎng)絡密度有大幅度提升,是外在合作網(wǎng)絡的55倍;從度數(shù)中心度來看,柯平在外在與潛在合作網(wǎng)絡均位列第一,李國新是接近中心度與中間中心度的第一,表明他中介性最強,與其他作者連通距離較近;通過對SPSS提取的公因子聚類,將潛在合作網(wǎng)絡的小團體分為四大類主題,分別是公共圖書館、數(shù)字文化服務、用戶文化需求、文化產(chǎn)業(yè)等。
從作者的外在合作關系來看,師生之間的合作關系較為普遍,高水平學者間的合作關系反而較弱,這樣會缺乏研究的持續(xù)性,作者潛在合作網(wǎng)絡也恰恰體現(xiàn)了這點。本研究將具有相似研究內容的作者假定為合作關系,但是,他們之間可能還存在著競爭關系。另外,部分核心作者在網(wǎng)絡中為孤立點,但不代表它們與非核心作者沒有合作關系,這些都是今后研究要進一步考慮的因素。
參考文獻
[1]邱均平,王菲菲.基于SNA的國內競爭情報領域作者合作關系研究[J].圖書館論壇,2010,30(6):34-40,134.
[2]劉 蓓,袁 毅,Boutin E.社會網(wǎng)絡分析法在論文合作網(wǎng)中的應用研究[J].情報學報,2008,27(3):407-417.
[3]邱均平,劉國徽.基于社會網(wǎng)絡和關鍵詞分析的作者合作研究——以國內知識管理領域為例[J].情報科學,2014,32(6):3-7,13.
[4]李愛明,社會網(wǎng)絡視角下的國內數(shù)字圖書館領域作者合作關系研究[J].情報科學,2013,31(11):57-63.
[5]劉小慧,李長玲,劉運梅,等.基于作者—核心關鍵詞2-模網(wǎng)絡的潛在跨學科合作組合識別——以圖書情報學與計算機科學為例[J].情報理論與實踐,2018,41(2):105-110.
[6]李長玲,馮志剛,劉運梅,等.基于引文網(wǎng)絡的潛在跨學科合作者識別——以圖書情報學為例[J].情報資料工作, 2018(3):93-98.
[7]劉志輝,張志強.作者關鍵詞耦合分析方法及實證研究[J].情報學報,2010,29(2):268-275.
[8]婁燕.我國競爭情報研究的統(tǒng)計與分析[J].情報雜志,2001(10):15-16.
[9]李小霞.近年來國內洛特卡定律研究綜述[J].科技情報開發(fā)與經(jīng)濟,2005(13):27-28.
[10]付允.牛文元,汪云林,等.科學學領域作者合作網(wǎng)絡分析——以《科研管理》(2004-2008)為例[J].科研管理,2009,30(3):41- 46.
[11]邱均平,王菲菲.基于CSSCI的國內情報學領域作者共被引分析[J].情報學報,2012(1):104-112.
[12]羅家德.社會網(wǎng)分析講義[M].北京:社會科學文獻出版社,2005:150-161.
[13]Dangzhi Zhao,Andreas Strotmann.Evolution of Research Activities and Intellectual Influences in Information Science 1996-2005:Introducing Author Bibliographic-Coupling Analysis[J].Journal of the American Society for Information Science and Technology,2008,59(13):2070-2086.
作者簡介:張濤(1993-),男,中國海洋大學管理學院博士研究生。研究方向:文化產(chǎn)業(yè)。
李鳳軒(1990-),男,碩士,山東大學人文社會科學青島研究院科員。研究方向:旅游產(chǎn)業(yè)。
(收稿日期:2020-07-22?責任編輯:孫?煒)