王富強(qiáng),韓宇平,王 朋,王 靜
(華北水利水電大學(xué)水利學(xué)院,河南鄭州 450045)
水資源學(xué)研究的關(guān)鍵詞共詞聚類分析
王富強(qiáng),韓宇平,王 朋,王 靜
(華北水利水電大學(xué)水利學(xué)院,河南鄭州 450045)
以中國(guó)知網(wǎng)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)中2003—2012年的水資源學(xué)科核心期刊論文為基礎(chǔ),采用Bibexcel統(tǒng)計(jì)關(guān)鍵詞頻次,采用Ucinet和Netdraw繪制共詞網(wǎng)絡(luò),運(yùn)用SPSS進(jìn)行共詞聚類分析與多維尺度分析,研究高頻關(guān)鍵詞之間的內(nèi)在聯(lián)系,評(píng)述水資源學(xué)科的研究熱點(diǎn)與研究現(xiàn)狀。研究結(jié)果表明,水資源學(xué)科在研究過(guò)程中形成了水資源可持續(xù)利用、社會(huì)可持續(xù)、水資源系統(tǒng)和水資源管理四大類群體,并且四者之間具有較強(qiáng)的關(guān)聯(lián)性。
水資源;關(guān)鍵詞;共詞聚類分析;共詞強(qiáng)度;共詞矩陣
隨著期刊數(shù)量的增長(zhǎng)與學(xué)科的細(xì)化發(fā)展,科技文獻(xiàn)數(shù)量增長(zhǎng)迅速,這給學(xué)者的研究工作帶來(lái)了極大便利,相應(yīng)地對(duì)文獻(xiàn)的管理與分析利用也有了更高要求[1]。隨著信息技術(shù)的發(fā)展、應(yīng)用和開辟,有必要整理與審視某一學(xué)科的研究熱點(diǎn)與研究現(xiàn)狀,以促進(jìn)該學(xué)科的進(jìn)一步發(fā)展,近幾年運(yùn)用文獻(xiàn)計(jì)量學(xué)研究學(xué)科的發(fā)展已成為一種不可或缺的手段。自2003年以來(lái),水資源的期刊論文數(shù)量增加顯著,但是運(yùn)用文獻(xiàn)計(jì)量學(xué)來(lái)研究水資源學(xué)科的研究熱點(diǎn)與研究現(xiàn)狀的相關(guān)論文還沒(méi)有見到,本文嘗試以中國(guó)知網(wǎng)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)在2003—2012年的相關(guān)論文為基礎(chǔ),采用共詞聚類分析法來(lái)探討水資源學(xué)科的研究熱點(diǎn)與研究現(xiàn)狀,為該學(xué)科的建設(shè)和發(fā)展提供參考。
共詞聚類分析法屬于一種內(nèi)容分析法,主要統(tǒng)計(jì)一組詞中兩兩同時(shí)出現(xiàn)于一篇文獻(xiàn)的頻次(共詞強(qiáng)度),以這種共現(xiàn)頻次反映這些詞之間的關(guān)聯(lián)程度,兩個(gè)詞的共詞強(qiáng)度越高,則它們之間的關(guān)聯(lián)越緊密[2]。關(guān)鍵詞是文獻(xiàn)檢索標(biāo)識(shí),是表達(dá)文獻(xiàn)主題概念的自然語(yǔ)言詞匯,能夠簡(jiǎn)單、直接、全面地概括文獻(xiàn)的核心研究?jī)?nèi)容。高頻關(guān)鍵詞可以反映學(xué)科的研究熱點(diǎn),而關(guān)鍵詞的變化也可以在一定程度上反映學(xué)科的發(fā)展趨勢(shì)[3]。關(guān)鍵詞共現(xiàn)分析法是指兩個(gè)關(guān)鍵詞同時(shí)出現(xiàn)在一篇文章中的頻次,反映了這兩個(gè)關(guān)鍵詞之間的關(guān)聯(lián)性,關(guān)聯(lián)性強(qiáng)的關(guān)鍵詞代表了學(xué)科研究的核心問(wèn)題和熱點(diǎn)問(wèn)題[4]。本文采用文獻(xiàn)計(jì)量軟件Bibexcel統(tǒng)計(jì)關(guān)鍵詞頻次、使用Ucinet和Netdraw繪制共詞網(wǎng)絡(luò),同時(shí)利用SPSS軟件進(jìn)行共詞聚類分析以及多維尺度分析,并與共詞網(wǎng)絡(luò)進(jìn)行對(duì)比,來(lái)揭示水資源領(lǐng)域的研究熱點(diǎn)和研究現(xiàn)狀。
在中國(guó)知網(wǎng)中輸入“水資源”進(jìn)行主題檢索,限定為核心期刊檢索,檢索時(shí)間為2003—2012年,共檢索出符合條件的期刊論文15090篇,論文數(shù)量年度分布如表1所示。
表1 水資源學(xué)科期刊論文數(shù)量年度分布
由表1可以看出,在2003—2008年間水資源學(xué)科的核心期刊論文數(shù)量不斷增加,在2008年以后,論文數(shù)量維持在1800篇左右,比較穩(wěn)定。對(duì)表1中的論文,依據(jù)關(guān)鍵詞、主題以及文章標(biāo)題來(lái)排除與水資源學(xué)科相關(guān)性較小的論文。由于在一些論文中關(guān)鍵詞的表述不太規(guī)范,本文對(duì)于部分同義詞和近義詞進(jìn)行了合并處理,如將水資源承載力、水資源承載能力、承載能力合并為水資源承載力;將水資源配置、水資源優(yōu)化配置合并為水資源配置等。使用Bibexcel統(tǒng)計(jì)2003—2012年與水資源學(xué)科相關(guān)性較大的期刊論文3 314篇,其中關(guān)鍵詞共4 737個(gè),頻次大于10的有174個(gè),頻次大于20的有63個(gè)。去除頻次最高的關(guān)鍵詞“水資源”,剩余62個(gè)關(guān)鍵詞在一定程度上反映了水資源學(xué)科研究的核心問(wèn)題與熱點(diǎn)問(wèn)題,關(guān)鍵詞頻次的降序排列如表2所示。
從表2可以看出,近10年的水資源研究現(xiàn)狀是:①關(guān)于水資源承載力、水資源配置的文獻(xiàn)較多,一直是研究熱點(diǎn),這與中國(guó)的水資源短缺有很大關(guān)系;②水資源可持續(xù)利用與可持續(xù)發(fā)展出現(xiàn)也較為頻繁,這與社會(huì)可持續(xù)發(fā)展理念具有緊密的關(guān)聯(lián)性,因此研究較多;③氣候變化出現(xiàn)了105次,通過(guò)查閱文獻(xiàn)發(fā)現(xiàn),國(guó)內(nèi)關(guān)于氣候變化對(duì)水資源影響的研究起步較晚,但發(fā)展較快;④從水權(quán)、水價(jià)等關(guān)鍵詞發(fā)現(xiàn)對(duì)于水資源經(jīng)濟(jì)學(xué)的研究也較多;⑤水資源學(xué)科的主要研究方法有層次分析法、遺傳算法、主成分分析法等,其中越來(lái)越多的借助GIS來(lái)研究水資源;⑥虛擬水作為水資源一個(gè)新興的研究方向得到了較多的關(guān)注;⑦黃河流域和長(zhǎng)江流域是水資源研究的典型區(qū)域,出現(xiàn)頻次較高。
高頻關(guān)鍵詞在一定程度上代表了水資源學(xué)科的研究熱點(diǎn)和研究方向,但僅按出現(xiàn)頻次對(duì)這些詞進(jìn)行線性排列,還不能全面反映它們之間的關(guān)系,需要進(jìn)行共詞分析。首先采用Bibexcel構(gòu)建共詞矩陣,對(duì)以高頻關(guān)鍵詞進(jìn)行兩兩配對(duì),統(tǒng)計(jì)它們?cè)? 314篇文獻(xiàn)中共現(xiàn)頻次,形成62×62的共詞矩陣,主對(duì)角線的數(shù)據(jù)為該詞出現(xiàn)的頻次,非主對(duì)角線上的數(shù)據(jù)表示兩個(gè)關(guān)鍵詞共同出現(xiàn)在同一篇論文中的頻次,部分?jǐn)?shù)據(jù)如表3所示。
表2 水資源學(xué)科高頻關(guān)鍵詞
表3 部分高頻關(guān)鍵詞共詞矩陣
多元統(tǒng)計(jì)分析方法對(duì)矩陣的數(shù)據(jù)結(jié)構(gòu)有不同的要求,為了統(tǒng)計(jì)分析方便,本文將共詞矩陣轉(zhuǎn)化為相關(guān)和相異矩陣。由于關(guān)鍵詞的頻次懸殊,共詞矩陣中數(shù)據(jù)相差也比較大,為了消除頻次懸殊造成的影響,可以用式(1)計(jì)算得Ochiia系數(shù),從而得到共詞相異矩陣。
圖1 高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)可視圖
式中:y為Ochiia系數(shù);xAB為A、B兩詞同時(shí)出現(xiàn)的頻次;xA、xB分別為A詞、B詞出現(xiàn)的次數(shù)。
為了呈現(xiàn)關(guān)鍵詞之間的內(nèi)在相關(guān)關(guān)系,需要借助共詞網(wǎng)絡(luò)與多元統(tǒng)計(jì)分析方法來(lái)揭示這些關(guān)鍵詞之間的關(guān)系以及它們所反映的研究主題。根據(jù)高頻關(guān)鍵詞共詞矩陣,利用Ucinet將共現(xiàn)矩陣轉(zhuǎn)化為.##h的文件,用Netdraw繪制共詞網(wǎng)絡(luò)圖譜,得到高頻關(guān)鍵詞共詞網(wǎng)絡(luò)可視圖,如圖1所示。
圖1中節(jié)點(diǎn)越大表示其中心度越高,是網(wǎng)絡(luò)中最重要的節(jié)點(diǎn)。節(jié)點(diǎn)之間連線的粗細(xì)表示兩組關(guān)鍵詞出現(xiàn)頻次的高低,頻次越高,關(guān)鍵詞之間關(guān)系越密切。由圖1可以看出,水資源配置、可持續(xù)利用、可持續(xù)發(fā)展處于網(wǎng)絡(luò)的中心位置,其中心度最大,在一定程度上也反映了水資源學(xué)科的主要研究?jī)?nèi)容與研究主題,圍繞它們形成了水資源保護(hù)、水資源短缺、水資源利用、水污染、氣候變化、生態(tài)環(huán)境等研究熱點(diǎn)結(jié)構(gòu),它們之間具有緊密的關(guān)聯(lián)性。另外,黃河流域、長(zhǎng)江流域與其他關(guān)鍵詞之間的連線較密且較粗,共現(xiàn)的頻次較高,關(guān)系較為緊密,它們是近10年來(lái)水資源研究的主要區(qū)域。
以共詞矩陣為基礎(chǔ),采用聚類分析法對(duì)高頻關(guān)鍵詞之間的連接強(qiáng)度進(jìn)行分析。聚類分析法是根據(jù)事物本身的特性研究個(gè)體分類的統(tǒng)計(jì)方法,它基于數(shù)據(jù)的相似性分類,將當(dāng)前最緊密的對(duì)象合并為一類,直到所有個(gè)體聚為一個(gè)大類[5]。聚類分析的基本思想是認(rèn)為研究的變量之間存在著程度不同的相似性(親疏關(guān)系),可根據(jù)一批研究對(duì)象的多個(gè)變量指標(biāo),具體找出一些能夠測(cè)度這些變量指標(biāo)之間相似程度的統(tǒng)計(jì)量,以這些統(tǒng)計(jì)量為劃分依據(jù),把一些相似程度較大的變量聚合為一類,關(guān)系密切的聚合到一個(gè)小的分類單位,關(guān)系疏遠(yuǎn)的聚合到一個(gè)大的分類單位,直到把所有的變量都聚合完畢,把不同的類型一一劃出來(lái),形成一個(gè)由小到大的分類系統(tǒng)[6]。在對(duì)關(guān)鍵詞進(jìn)行聚類時(shí),首先將每一個(gè)關(guān)鍵詞看成獨(dú)立的一類,把最近的兩類合并,然后重新計(jì)算類與類之間的距離,再把距離最近的兩類合并,每一步減少一類,一直持續(xù)到所有的關(guān)鍵詞歸為一類[7]。以公式(1)構(gòu)造的相異矩陣為基礎(chǔ),運(yùn)用SPSS進(jìn)行共詞聚類分析,得出共詞聚類冰掛圖和樹形圖,如圖2和圖3所示。
結(jié)合圖2與圖3,可以將高頻關(guān)鍵詞劃分為4個(gè)主要的聚類群體,如表4所示。高頻關(guān)鍵詞聚類群體劃分的依據(jù)是關(guān)鍵詞的共詞頻次,首先將關(guān)系密切的關(guān)鍵詞進(jìn)行聚類,最后形成大的聚類群體。
由表4可以看出,群體1涉及的內(nèi)容較多,既有虛擬水、氣候變化,又有水資源開發(fā)利用、水經(jīng)濟(jì)和生態(tài)環(huán)境等,經(jīng)過(guò)文獻(xiàn)分析,可以把群體1的主要研究方向歸納為水資源的可持續(xù)利用。群體2涉及的內(nèi)容包含水資源評(píng)價(jià)、節(jié)水灌溉、城市化、水環(huán)境、節(jié)水等,主要研究水資源的可持續(xù)利用支撐經(jīng)濟(jì)社會(huì)的可持續(xù)發(fā)展。群體3涉及水資源供需平衡、水資源價(jià)值、水資源短缺、人類活動(dòng)、水資源承載力等內(nèi)容,從水資源系統(tǒng)的視角進(jìn)行水資源研究。群體4涉及灌區(qū)、南水北調(diào)、黃河流域、水資源量等內(nèi)容,以流域水資源管理為基礎(chǔ)進(jìn)行研究。
圖2 共詞聚類分析冰掛圖
圖3 層次聚類分析樹狀圖
表4 高頻關(guān)鍵詞聚類群體劃分
為了更好的顯示關(guān)鍵詞的聚類群體,采用SPSS中的多維尺度分析功能來(lái)構(gòu)建多維尺度可視化圖譜,從多維尺度分析結(jié)果可以直觀、形象地看出關(guān)鍵詞的聚類群體,結(jié)果如圖4所示。
圖4 多維尺度分析結(jié)果
圖4較好地顯示了關(guān)鍵詞聚類群體結(jié)果,與圖2、圖3的共詞聚類結(jié)果基本一致,根據(jù)每個(gè)群體在坐標(biāo)中的位置(即歐幾里得距離),可以看出各類群體間的緊密程度,群體1、群體2、群體4聯(lián)系較為緊密,由圖2、圖3的分析可知,水資源可持續(xù)利用、社會(huì)可持續(xù)發(fā)展和水資源管理是緊密相關(guān)的,三者是水資源研究的主要目的與方向;群體3則與群體1、群體2存在聯(lián)系,水資源系統(tǒng)與水資源可持續(xù)利用、社會(huì)可持續(xù)發(fā)展互相影響,許多文章是從水資源系統(tǒng)的視角進(jìn)行水資源研究的。
a.水資源學(xué)科的主要研究熱點(diǎn)集中于水資源配置、水資源承載力、可持續(xù)利用、可持續(xù)發(fā)展、水資源管理,圍繞著這幾個(gè)研究熱點(diǎn)形成了水資源學(xué)科新的研究視角。
b.基于共詞網(wǎng)絡(luò)分析可知,水資源配置、可持續(xù)利用、可持續(xù)發(fā)展、水資源承載力、水資源管理處于核心位置,是最重要的研究熱點(diǎn)方向,在其研究基礎(chǔ)上形成了水資源保護(hù)、水資源短缺、水資源利用、水污染、氣候變化、生態(tài)環(huán)境等研究熱點(diǎn)結(jié)構(gòu),它們之間的關(guān)聯(lián)性較為緊密。
c.基于共詞聚類分析與多維尺度分析可知,水資源學(xué)科在研究過(guò)程中形成了水資源可持續(xù)利用、社會(huì)可持續(xù)、水資源系統(tǒng)、水資源管理4大類群體,四者之間顯現(xiàn)出一定的相關(guān)性,相互存在聯(lián)系。
[1]任智軍,朱東華,謝菲.科技文本的可視化分析研究[J].北京理工大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2007,9(1):13-17. (REN Zhijun,ZHU Donghua,XIE Fei.The visualization analysis of scientific text[J].Journal of Beijing Institute of Technology:Social Sciences Edition,2007,9(1):13-17. (in Chinese))
[2]FRY J,TALJA F.The intellectual and social organization of academic fields and the shaping of digital resources[J]. Journal of Information Science,2007,33(2):115.
[3]尹相旭,張更平,李曉菲.基于關(guān)鍵詞統(tǒng)計(jì)的情報(bào)學(xué)研究現(xiàn)狀分析[J].情報(bào)雜志,2009,28(11):38-41.(YIN Xiangxu,ZHANG Gengping,LI Xiaofei.A research situation analysis ofinformation sciencesbased on key words statistics[J].Journal of Information,2009,28(11):38-41. (in Chinese))
[4]舒瑯.基于社會(huì)網(wǎng)絡(luò)分析的項(xiàng)目管理學(xué)科熱點(diǎn)和主流知識(shí)群的研究[D].杭州:浙江大學(xué),2010.
[5]李長(zhǎng)玲,支嶺,紀(jì)雪梅,等.我國(guó)情報(bào)學(xué)研究進(jìn)展:基于期刊論文關(guān)鍵詞的統(tǒng)計(jì)分析[J].圖書情報(bào)工作,2010,54 (24):31-36.(LI Changling,ZHI Ling,JI Xuemei,et al. Trend analysis on information science based on keyword statistics[J].Library and Information Service,2010,54 (24):31-36.(in Chinese))
[6]曹玲,楊靜,夏嚴(yán).國(guó)內(nèi)競(jìng)爭(zhēng)情報(bào)領(lǐng)域研究論文的共詞聚類分析[J].情報(bào)科學(xué),2010,28(6):923-925.(CAO Ling,YANG Jing,XIA Yan.Co-word clustered analysis of competitive intelligence dissertations in China[J]. Information Science,2010,28(6):923-925.(in Chinese))
[7]許振亮,劉則淵,侯海燕,等.中國(guó)技術(shù)創(chuàng)新理論研究前沿共詞知識(shí)圖譜分析[J].圖書情報(bào)工作,2009,53(6): 46-49.(XU Zhenliang,LIU Zeyuan,HOU Haiyan,et al. Knowledge mapping of the theory fronts of China technology innovation:based on the view of author co-cited[J]. Library and Information Service,2009,53(6):46-49.(in Chinese))
Co-word cluster analysis of keywords in water resources science research//
WANG Fuqiang,HAN Yuping,WANG Peng,WANG Jing
(North China University of Water Conservancy and Electric Power,Zhengzhou 450045,China)
Cluster analysis and multivariate statistics analysis for the co-words are performed taking into account the keywords in core journal papers on water resources issued in China Academic Journal Network Publishing Database(CAJD) during 2003 to 2012.Further,the keyword frequency counted by Bibexcel,co-word network set up by Ucinet and Netdraw, co-word clustering analysis and multidimensional scaling analysis by SPSS,internal relations among high frequency keywords were studied.Additionally,the research focus and research status were analyzed.The results show that in the course of water resources science research four major communities of water resources research are developed:sustainable utilization,social sustainable development,water resources system and water resources management.Furthermore,these four major communities are greatly related with each other.
water resources;keyword;co-word cluster analysis;co-word intensity;co-word matrix
TV213.4;G353.1
:A
:1006-7647(2014)04-0029-05
10.3880/j.issn.1006-7647.2014.04.007
2013-0627 編輯:周紅梅)
《2014年聯(lián)合國(guó)世界水資源開發(fā)報(bào)告》簡(jiǎn)介
(楚行軍供稿)
國(guó)家自然科學(xué)基金(51279063,51379078);教育部新世紀(jì)優(yōu)秀人才支持計(jì)劃(NCET-13-0794)
王富強(qiáng)(1979—),男,河南濟(jì)源人,博士,副教授,主要從事水文學(xué)及水資源研究。E-mail:fortunewang@163.com
韓宇平(1975—),男,寧夏彭陽(yáng)人,博士,教授,主要從事水文學(xué)及水資源研究。E-mail:hanyp@ncwu.edu.cn
2014年3月,聯(lián)合國(guó)教科文組織出版了《2014年聯(lián)合國(guó)世界水資源開發(fā)報(bào)告》(The United Nations World Water Development Report 2014),由聯(lián)合國(guó)糧食及農(nóng)業(yè)組織、聯(lián)合國(guó)環(huán)境規(guī)劃署、聯(lián)合國(guó)人類住區(qū)規(guī)劃署、聯(lián)合國(guó)工業(yè)發(fā)展組織和世界銀行分別負(fù)責(zé)論證和起草該報(bào)告的不同分支主題,同時(shí)該報(bào)告還受益于聯(lián)合國(guó)水機(jī)制眾多正式成員及合作伙伴的相關(guān)工作成果?!?014年聯(lián)合國(guó)世界水資源開發(fā)報(bào)告》分為兩卷:第1卷是“水資源和能源”,宏觀探討目前及今后一段時(shí)期人類在水資源開發(fā)、利用和管理中存在的一些問(wèn)題及其與能源之間的復(fù)雜關(guān)系;第2卷是“直面挑戰(zhàn)”,提供來(lái)自全球的13個(gè)案例,介紹各地在應(yīng)對(duì)水資源和能源問(wèn)題中的一些典型做法。編者致力于提供一個(gè)以基本事實(shí)為依據(jù)、以均衡中立為價(jià)值導(dǎo)向的綜合報(bào)告,期望其能夠代表當(dāng)前人類對(duì)水資源和能源認(rèn)識(shí)的最新水平,呼吁加強(qiáng)水資源和能源的綜合管理,弱化經(jīng)濟(jì)增長(zhǎng)對(duì)水資源的依賴,改善經(jīng)濟(jì)發(fā)展的可持續(xù)性。這是聯(lián)合國(guó)推出的第15份《聯(lián)合國(guó)世界水資源開發(fā)報(bào)告》,也是首次以年度報(bào)告的形式編撰,同時(shí)《聯(lián)合國(guó)世界水資源開發(fā)報(bào)告》的年度主題將與世界水日的主題相一致,以相應(yīng)擴(kuò)大宣傳活動(dòng)的影響力。