毛文山 ,趙紅莉 ,蔣云鐘 ,段 浩 ,郝 震 ,5
(1.蘭州交通大學(xué) 測(cè)繪與地理信息學(xué)院,甘肅 蘭州 730070;2.地理國(guó)情監(jiān)測(cè)技術(shù)應(yīng)用國(guó)家地方聯(lián)合工程研究中心,甘肅 蘭州 730070;3.甘肅省地理國(guó)情監(jiān)測(cè)工程實(shí)驗(yàn)室,甘肅 蘭州 730070;4.中國(guó)水利水電科學(xué)研究院 水資源研究所,北京 100038;5.大連理工大學(xué) 建設(shè)與工程學(xué)部,遼寧 大連 116024)
隨著經(jīng)濟(jì)社會(huì)的高速發(fā)展,水生態(tài)環(huán)境問(wèn)題成為21世紀(jì)全世界面臨的新的重大挑戰(zhàn),黨的十八大明確提出推進(jìn)水生態(tài)文明建設(shè),加強(qiáng)污染治理,持續(xù)改善生態(tài)環(huán)境質(zhì)量?!端母锇l(fā)展“十三五”規(guī)劃》開展全國(guó)105個(gè)水生態(tài)文明城市建設(shè)試點(diǎn)工作,以加快推進(jìn)水生態(tài)文明建設(shè)。水生態(tài)環(huán)境成為政府和學(xué)術(shù)界關(guān)注的焦點(diǎn)[1]。對(duì)水生態(tài)環(huán)境領(lǐng)域內(nèi)的研究主題、研究熱點(diǎn)、研究前沿進(jìn)行梳理,以知識(shí)圖譜的方式展現(xiàn),可為水生態(tài)文明領(lǐng)域的研究與建設(shè)提供參考。
以往關(guān)于科學(xué)知識(shí)圖譜的分析大都建立在對(duì)大量文獻(xiàn)量化分析的基礎(chǔ)上,但在數(shù)據(jù)采集和分析內(nèi)容的選擇上存在較強(qiáng)的主觀性[2]。自2006年以來(lái),在科學(xué)計(jì)量學(xué)、數(shù)據(jù)可視化、知識(shí)圖譜構(gòu)建與應(yīng)用等一系列領(lǐng)域發(fā)展背景下,以CiteSpace、VOSviewer等為主流的信息可視化軟件,實(shí)現(xiàn)某研究領(lǐng)域內(nèi)熱點(diǎn)主題、知識(shí)演進(jìn)等的可視化,為學(xué)者后續(xù)研究提供了知識(shí)儲(chǔ)備和創(chuàng)新轉(zhuǎn)向,在眾多研究領(lǐng)域中得到了廣泛應(yīng)用。目前利用科學(xué)知識(shí)圖譜進(jìn)行計(jì)量分析的領(lǐng)域主要有金融證券、生物醫(yī)療、圖書情報(bào)等[3],水生態(tài)環(huán)境領(lǐng)域研究起步較晚且數(shù)量少。Xiong等4]以定量研究代替定性分析的方法對(duì)文獻(xiàn)進(jìn)行關(guān)鍵詞分析,總結(jié)出不同時(shí)期的水政策影響下,水文化變遷的階段性特點(diǎn)、水利開發(fā)階段及水文極端事件的協(xié)同性特征;胡秀芳等[5]以定性和定量分析相結(jié)合的方法繪制出生態(tài)安全研究知識(shí)圖譜,梳理出研究主題、經(jīng)歷發(fā)展階段、影響生態(tài)安全研究的階段和未來(lái)研究方向;許振亮等[6]以關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)的視角,采用社會(huì)網(wǎng)絡(luò)分析方法,揭示了國(guó)際生態(tài)城市研究前沿的知識(shí)結(jié)構(gòu)變化;林卓等[7]通過(guò)關(guān)鍵詞共現(xiàn)分析出生態(tài)資產(chǎn)/價(jià)值研究領(lǐng)域的熱點(diǎn)與發(fā)展趨勢(shì),明確了生態(tài)資產(chǎn)/價(jià)值的研究界限,生態(tài)資產(chǎn)變化的內(nèi)在機(jī)制是生態(tài)資產(chǎn)研究未來(lái)趨勢(shì)的切入點(diǎn);伍新木等[8]利用CiteSpace中探測(cè)詞頻突發(fā)增長(zhǎng)的突現(xiàn)詞功能,繪制出國(guó)內(nèi)水資源管理研究領(lǐng)域前沿知識(shí)圖譜,分析出各研究階段及未來(lái)一段時(shí)間的關(guān)注熱點(diǎn)。這些研究成果對(duì)水生態(tài)環(huán)境研究知識(shí)圖譜的構(gòu)建與應(yīng)用提供了案例參考,但仍需做進(jìn)一步調(diào)整:①生成表征不同研究?jī)?nèi)容的知識(shí)圖譜,需選取合適的分析對(duì)象;②中文文獻(xiàn)研究主題的識(shí)別需選取合適的分析對(duì)象和方法,避免以關(guān)鍵詞共現(xiàn)聚類分析或英文文獻(xiàn)共被引分析方式代替。
國(guó)內(nèi)關(guān)于水生態(tài)環(huán)境研究知識(shí)圖譜分析較為少見(jiàn),以及不同分析方法在分析對(duì)象選擇上存在一定的局限性。本文采用定性分析和定量研究相結(jié)合的信息分析方法,針對(duì)不同研究視角的知識(shí)單元,選擇合適的分析方法,選取主題詞、關(guān)鍵詞和名詞短語(yǔ)作為分析對(duì)象,選取共詞矩陣分析、共現(xiàn)聚類分析和突變檢測(cè)分析作為相對(duì)應(yīng)的分析方法,對(duì)水生態(tài)環(huán)境領(lǐng)域內(nèi)的權(quán)威文獻(xiàn)數(shù)據(jù)進(jìn)行分析,通過(guò)提取聚類標(biāo)簽和附加時(shí)間標(biāo)簽,繪制出研究主題、研究熱點(diǎn)和研究前沿三類科學(xué)知識(shí)圖譜,選取相對(duì)應(yīng)的指標(biāo)用于分析和評(píng)價(jià),客觀揭示主題漂移規(guī)律、熱點(diǎn)聚類分布和前沿研究趨勢(shì),為該領(lǐng)域繼續(xù)深入相關(guān)研究的科研人員提供知識(shí)參考和新的研究思路。
2.1 文獻(xiàn)數(shù)據(jù)來(lái)源本文選擇中國(guó)知識(shí)基礎(chǔ)設(shè)施工程(簡(jiǎn)稱“CNKI”)權(quán)威數(shù)據(jù)庫(kù)作為數(shù)據(jù)來(lái)源,以CNKI檢索采集的文獻(xiàn)數(shù)據(jù)作為水生態(tài)環(huán)境研究知識(shí)圖譜構(gòu)建的實(shí)驗(yàn)數(shù)據(jù)。考慮到國(guó)內(nèi)數(shù)據(jù)庫(kù)存在檢索方式和數(shù)據(jù)格式上的差異性,本文采用六元組檢索模型在CNKI上進(jìn)行數(shù)據(jù)采集檢索,六元組模型包含檢索式、檢索字段、檢索模式、時(shí)間跨度、文獻(xiàn)類型、數(shù)據(jù)來(lái)源六方面的檢索設(shè)定。利用六元組模型構(gòu)建本文的檢索策略(表1)。
國(guó)內(nèi)水生態(tài)環(huán)境研究是在水環(huán)境和水生態(tài)領(lǐng)域探索的基礎(chǔ)上發(fā)展而來(lái),包括:水質(zhì)評(píng)價(jià)、生態(tài)水文、生態(tài)需水、流域生態(tài)、淡水生態(tài)等研究?jī)?nèi)容,由此確定中文文獻(xiàn)數(shù)據(jù)的檢索式為:TS1=“水環(huán)境保護(hù)or水生態(tài)保護(hù)與修復(fù)or生態(tài)需水or流域生態(tài)or水生態(tài)環(huán)境管理or流域生態(tài)環(huán)境改善or生態(tài)水文”,TS2=“水污染or水資源保護(hù)or海綿城市or河流生態(tài)or河口近岸海域生態(tài)or湖沼濕地生態(tài)or坡面生態(tài)or水土保持”,根據(jù)TS1對(duì)CNKI進(jìn)行主題(Topic)檢索,可保證查全率,根據(jù)TS2對(duì)CNKI進(jìn)行“篇名(Title)or關(guān)鍵詞(Keywords)or摘要(Abstract)”檢索,可保證查準(zhǔn)率,對(duì)檢索條目進(jìn)行檢查,去除報(bào)告、新聞、會(huì)議通知等不相關(guān)條目。
2.2 知識(shí)圖譜構(gòu)建方法知識(shí)圖譜(Knowledge Graph)以特定知識(shí)領(lǐng)域?yàn)閷?duì)象,顯示知識(shí)發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一種圖形,具有“圖”和“譜”雙重性質(zhì)與特征:既是可視化的知識(shí)圖形,又是序列化的知識(shí)譜系,本質(zhì)上是具有屬性的實(shí)體通過(guò)關(guān)系鏈接,由“點(diǎn)-邊”組成的大規(guī)模網(wǎng)絡(luò)圖,其中,節(jié)點(diǎn)表示概念/實(shí)體,邊表示概念/實(shí)體間的語(yǔ)義關(guān)系[9]。本文知識(shí)圖譜是水生態(tài)環(huán)境知識(shí)工程的形式化表達(dá),以知識(shí)網(wǎng)絡(luò)形態(tài)展現(xiàn)該領(lǐng)域的類別、實(shí)體、屬性或關(guān)系關(guān)聯(lián),顯示該研究領(lǐng)域中各知識(shí)單元或知識(shí)群之間網(wǎng)絡(luò)、結(jié)構(gòu)、交叉、演化或衍生等諸多復(fù)雜的關(guān)系,實(shí)現(xiàn)事實(shí)型知識(shí)和過(guò)程型知識(shí)的陳述,形成對(duì)水生態(tài)環(huán)境知識(shí)的專業(yè)性認(rèn)識(shí)。核心是建立水生態(tài)環(huán)境知識(shí)庫(kù),然后通過(guò)引文分析、聚類分析生成特定的知識(shí)語(yǔ)義網(wǎng),最終具備對(duì)主題詞、關(guān)鍵詞和名詞短語(yǔ)等文獻(xiàn)關(guān)鍵要素進(jìn)行大規(guī)模實(shí)時(shí)關(guān)聯(lián)和特征分析的能力[10]。其中,“節(jié)點(diǎn)”表示水生態(tài)環(huán)境類別、主題及對(duì)應(yīng)的屬性值,“邊”表示的關(guān)系包括:“類別-類別”、“類別-主題”、“主題-主題”、“主題-屬性”和“屬性-屬性”。
表1 中文文獻(xiàn)檢索六元組模型
水生態(tài)環(huán)境知識(shí)圖譜的構(gòu)建分為數(shù)據(jù)模式層定義與數(shù)據(jù)層構(gòu)建兩部分。數(shù)據(jù)模式層定義研究領(lǐng)域的知識(shí)類別、主題(實(shí)體)、屬性或關(guān)系關(guān)聯(lián)等,本文在對(duì)數(shù)據(jù)模式層的定義上,采用CNKI標(biāo)引的文獻(xiàn)字段規(guī)則來(lái)識(shí)別文獻(xiàn)中的類別和主題(實(shí)體)、關(guān)系和屬性等[11],數(shù)據(jù)模式層對(duì)文獻(xiàn)字段識(shí)別規(guī)則的定義如表2所示;數(shù)據(jù)層建設(shè)包括:知識(shí)獲取、知識(shí)融合、知識(shí)存儲(chǔ)、知識(shí)推理、知識(shí)更新5個(gè)階段(圖1)。
表2 數(shù)據(jù)模式層定義的文獻(xiàn)字段識(shí)別規(guī)則
圖1 水生態(tài)環(huán)境研究知識(shí)圖譜數(shù)據(jù)層構(gòu)建流程
(1)知識(shí)獲取。從采集的文獻(xiàn)中抽取知識(shí),包括實(shí)體、屬性和屬性值、關(guān)系,首先,實(shí)體抽取根據(jù)數(shù)據(jù)模式層定義的文獻(xiàn)字段識(shí)別規(guī)則識(shí)別出命名實(shí)體(分布在標(biāo)題、關(guān)鍵詞、摘要中的主題詞、關(guān)鍵詞和名詞短語(yǔ))[12];其次,屬性和屬性值抽取是為每個(gè)研究類別構(gòu)造屬性列表,并為研究類別中的實(shí)體附加屬性值(各命名實(shí)體的出現(xiàn)時(shí)間、分布時(shí)段、出現(xiàn)頻次等)[13];最后,關(guān)系抽取是施引文獻(xiàn)和被引文獻(xiàn)之間引文關(guān)系和相似性關(guān)系的抽取[14],引文關(guān)系包括共現(xiàn)關(guān)系和共引關(guān)系(圖2),相似性關(guān)系包括字符相似、屬性相似和結(jié)構(gòu)相似。
(2)知識(shí)融合。知識(shí)融合包括數(shù)據(jù)模式層、數(shù)據(jù)層的融合[15],數(shù)據(jù)模式層融合是根據(jù)數(shù)據(jù)模式層定義的文獻(xiàn)字段識(shí)別規(guī)則建立數(shù)據(jù)映射時(shí),通過(guò)設(shè)置合并規(guī)則來(lái)確保數(shù)據(jù)的統(tǒng)一;數(shù)據(jù)層融合包括實(shí)體合并、實(shí)體屬性與關(guān)系的合并、屬性值的規(guī)范化[16],其中,實(shí)體合并是將具有歧義的實(shí)體指稱項(xiàng)鏈接到文獻(xiàn)字段識(shí)別規(guī)則中的符號(hào)項(xiàng),實(shí)現(xiàn)實(shí)體消歧,實(shí)體屬性與關(guān)系的合并是更新具有時(shí)態(tài)特性的屬性,將再次出現(xiàn)的實(shí)體并入該實(shí)體首次出現(xiàn)的時(shí)段屬性中。
(3)知識(shí)存儲(chǔ)。融合后的知識(shí)通過(guò)建立圖數(shù)據(jù)庫(kù)中概念和文獻(xiàn)字段識(shí)別規(guī)則的映射關(guān)系實(shí)現(xiàn)存儲(chǔ)和查詢,實(shí)體查詢及重要性排序是通過(guò)計(jì)算實(shí)體屬性與關(guān)系的相關(guān)度來(lái)實(shí)現(xiàn)[17]。
圖2 引文關(guān)系網(wǎng)絡(luò)
(4)知識(shí)推理。首先,基于文獻(xiàn)字段識(shí)別規(guī)則進(jìn)行引文分析和相似性分析,再對(duì)分析結(jié)果進(jìn)行聚類分析,采用面向引文網(wǎng)絡(luò)鏈接關(guān)系的聚類,避免由節(jié)點(diǎn)屬性聚類引起的局部最優(yōu)缺陷,形成關(guān)系網(wǎng)絡(luò),提取隱含的知識(shí)和關(guān)系[18];其次,對(duì)聚類結(jié)果進(jìn)行網(wǎng)絡(luò)剪枝,尋徑網(wǎng)絡(luò)算法(Pathfinder)對(duì)每一時(shí)段的網(wǎng)絡(luò)結(jié)構(gòu)和整體網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行剪枝,獲得最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu),最后,使用LLR(Log-Likelihood Ratio)算法提取優(yōu)化后的網(wǎng)絡(luò)結(jié)構(gòu)標(biāo)簽,得到的聚類標(biāo)簽會(huì)有效減少重復(fù)項(xiàng)[3]。
(5)知識(shí)更新。隨時(shí)間變化,水生態(tài)環(huán)境知識(shí)會(huì)發(fā)生不斷變化,對(duì)新發(fā)表的相關(guān)文獻(xiàn)再次進(jìn)行知識(shí)抽取和知識(shí)融合,完成領(lǐng)域中知識(shí)類別、主題(實(shí)體)、屬性或關(guān)系關(guān)聯(lián)的周期性更新,最后將其存入水生態(tài)環(huán)境知識(shí)庫(kù)。
2.3 研究方法和分析指標(biāo)選取本文采用定性分析與定量研究相結(jié)合的信息分析方法,對(duì)經(jīng)六元組模型檢索整理后的文獻(xiàn)數(shù)據(jù)進(jìn)行知識(shí)圖譜構(gòu)建和分析。選取發(fā)文量、學(xué)科、主題詞、關(guān)鍵詞和名詞短語(yǔ)作為研究對(duì)象,進(jìn)行時(shí)序分布、學(xué)科分布、研究主題、研究熱點(diǎn)、研究前沿等五個(gè)方面的特征分析,形成對(duì)水生態(tài)環(huán)境研究領(lǐng)域發(fā)展變化的初步認(rèn)知:①時(shí)序分析。對(duì)發(fā)文量按時(shí)序進(jìn)行統(tǒng)計(jì)分析,根據(jù)不同時(shí)段發(fā)文量的變化趨勢(shì),分析研究重心的轉(zhuǎn)移特征,探究1992—2017年不同時(shí)段內(nèi)水生態(tài)環(huán)境研究的發(fā)展變化及其影響因素;②學(xué)科分析。對(duì)水生態(tài)環(huán)境研究的學(xué)科分布進(jìn)行統(tǒng)計(jì)分析,揭示該領(lǐng)域權(quán)威文獻(xiàn)的研究層次、學(xué)科分布現(xiàn)狀和研究主題在學(xué)科中的受關(guān)注程度;③研究主題分析。借助共被引形成的主題相似性思想,建立主題詞兩兩共被引矩陣,聚類分析生成的主題詞譜系圖反映主題之間的親疏關(guān)系,多維尺度分析生成的多維尺度圖反映主題知識(shí)結(jié)構(gòu)特征和核心主題內(nèi)容,進(jìn)一步揭示不同主題詞相互影響下的時(shí)段分布特征,加上時(shí)間標(biāo)簽,探究不同時(shí)段以主題詞為主要表征方式的主題漂移特點(diǎn)[19-20];④研究熱點(diǎn)分析。關(guān)鍵詞共現(xiàn)聚類分析生成研究熱點(diǎn)圖譜,通過(guò)對(duì)整體網(wǎng)絡(luò)、聚類子網(wǎng)絡(luò)的橫向和縱向分析,探究不同時(shí)段內(nèi)由各研究熱點(diǎn)聚類生成的知識(shí)群組;⑤研究前沿分析。研究領(lǐng)域內(nèi)的最新演變趨勢(shì)和相互影響,通過(guò)Kleinberg突變檢測(cè)算法的研究前沿分析,探究不同時(shí)段下的研究前沿及未來(lái)研究方向。本文提出面向水生態(tài)環(huán)境研究領(lǐng)域的知識(shí)分析框架(圖3),考慮領(lǐng)域?qū)I(yè)知識(shí)的所有表征方式,主要通過(guò)詞間關(guān)系的數(shù)據(jù)挖掘進(jìn)行知識(shí)發(fā)現(xiàn),為將來(lái)更深入的信息挖掘提供一些借鑒。
從發(fā)文量探究國(guó)內(nèi)水生態(tài)環(huán)境研究的時(shí)序分布特征及同國(guó)際間的區(qū)別,從學(xué)科分類分布揭示國(guó)內(nèi)水生態(tài)環(huán)境研究的科學(xué)領(lǐng)域結(jié)構(gòu),完成該研究領(lǐng)域的宏觀分析。其次,從微觀視角出發(fā),主題詞共詞矩陣分析確定該研究領(lǐng)域的主題知識(shí)結(jié)構(gòu),通過(guò)多維尺度分析,進(jìn)一步揭示研究主題之間的親疏關(guān)系和研究主題所處的發(fā)展階段;關(guān)鍵詞共現(xiàn)聚類分析則從復(fù)雜、整體上按聚類的時(shí)段分布和聚類之間的關(guān)聯(lián)程度,展現(xiàn)研究領(lǐng)域的熱點(diǎn)知識(shí)結(jié)構(gòu),每個(gè)時(shí)段局部的典型聚類分析,得到其研究熱點(diǎn)。最后,研究前沿分析是從特殊視角出發(fā),以時(shí)區(qū)視圖的方式反映各個(gè)子領(lǐng)域發(fā)展演進(jìn)的時(shí)間跨度和下階段的研究方向。
圖3 水生態(tài)環(huán)境知識(shí)量化分析流程
表3 知識(shí)圖譜分析指標(biāo)說(shuō)明
本文選取文獻(xiàn)量、學(xué)科分類作為水生態(tài)環(huán)境研究統(tǒng)計(jì)分析的指標(biāo)。以研究主題、研究熱點(diǎn)、研究前沿分析為例,進(jìn)行水生態(tài)環(huán)境研究知識(shí)圖譜的應(yīng)用研究。選取主題詞、關(guān)鍵詞和名詞短語(yǔ)作為知識(shí)圖譜分析的具體對(duì)象,探索研究主題、研究熱點(diǎn)和研究前沿。相關(guān)分析評(píng)價(jià)指標(biāo)選取說(shuō)明(表3):
(1)研究主題。主題詞是文獻(xiàn)核心內(nèi)容的高度概括,反映某研究領(lǐng)域的研究方向。確定受控的、被統(tǒng)一標(biāo)引的主題詞作為共詞矩陣分析的基本單元,其在檢索平臺(tái)規(guī)范化處理之后在檢索性能方面優(yōu)于關(guān)鍵詞[5,20]。選取主題詞的被引詞頻作為研究主題的分析指標(biāo),被引詞頻記錄一組主題詞被同一篇或同一組文獻(xiàn)引證的次數(shù),以測(cè)度之間的依賴關(guān)系。研究主題知識(shí)圖譜的評(píng)價(jià)指標(biāo)選取,主題詞R型因子分析的載荷系數(shù)反映研究主題的顯著程度,因子得分(貢獻(xiàn)率、方差累計(jì)貢獻(xiàn)率≥60%)確定研究主題分類。相關(guān)系數(shù)度量主題詞之間的相似性,各研究主題分支聚類時(shí),合并兩個(gè)相關(guān)系數(shù)最大的類。熵值和基于類的F值用于評(píng)價(jià)、驗(yàn)證單個(gè)或整個(gè)聚類結(jié)果[21]。擬合度量值Stress確定維度數(shù),值越小,說(shuō)明模型適合度越高,效度估計(jì)值RSQ越大,說(shuō)明分布在戰(zhàn)略坐標(biāo)中各主題詞間的距離與實(shí)際輸入距離(被引詞頻)越合適,Stress和RSQ確定水生態(tài)環(huán)境研究領(lǐng)域內(nèi)的核心研究主題和研究主題整體網(wǎng)絡(luò)結(jié)構(gòu)。
其中,主題詞提取通過(guò)源文獻(xiàn)共被引檢索手段,對(duì)1992—2017年國(guó)內(nèi)水生態(tài)環(huán)境文獻(xiàn)數(shù)據(jù)中的主題詞歸納整理,獲得961個(gè),利用《水利水電科技主題詞表》、《水利水電工程技術(shù)術(shù)語(yǔ)》(SL 26-2012)等中出現(xiàn)的科技主題詞,對(duì)語(yǔ)料庫(kù)中的文獻(xiàn)進(jìn)行分詞,分詞結(jié)果數(shù)據(jù)清洗后,借助TF-IDF計(jì)算方法從文獻(xiàn)中提取反映不同時(shí)段知識(shí)群組研究特色的高頻主題詞,時(shí)段高頻主題詞的提取結(jié)果為:
其中:
式中:TF(x)為主題詞在某時(shí)段中的詞頻;IDF(x)為主題詞在全時(shí)段中的詞頻,IDF(X )為平滑處理后主題詞在全時(shí)段中的詞頻;N(x)為原始主題詞表中某主題詞的時(shí)段詞頻,N為整個(gè)時(shí)段的主題詞總數(shù)。
為防止新主題詞(N(x)=0)的出現(xiàn),常用的IDF通過(guò)式(2b)進(jìn)行平滑處理。該矩陣為鄰近矩陣,對(duì)角線值取該主題詞與其它主題詞共被引頻次最高值+1表示,為測(cè)度多個(gè)研究主題之間的相似性,且保證共被引矩陣中0存在條件下的穩(wěn)定性,原矩陣系統(tǒng)聚類方法為:組間連接法,將共被引矩陣轉(zhuǎn)化為Pearson’s相關(guān)系數(shù)矩陣,并進(jìn)行標(biāo)準(zhǔn)化處理。假設(shè)主題詞的聚類結(jié)果為C={C1,C2,…,Cm}(1 ≤i<m ),m是樣本 個(gè)數(shù),人工判 定主題 結(jié)構(gòu)為 P={P1,P2,…,Pn}(1 ≤j≤n),n是數(shù)據(jù)分析指標(biāo),則可計(jì)算C中每一個(gè)聚類Ci的熵值:
對(duì)每一個(gè)聚類Ci存在:表示在人工判定主題范圍內(nèi)循環(huán)一次后聚類Ci的最大值,計(jì)算最終F值:
(2)研究熱點(diǎn)。關(guān)鍵詞是文章的核心議題,關(guān)鍵詞共現(xiàn)(Keyword Co-appearance Analysis,KCA)網(wǎng)絡(luò)揭示某一領(lǐng)域當(dāng)前及過(guò)去產(chǎn)生的熱點(diǎn)研究[22]。選取關(guān)鍵詞的共現(xiàn)詞頻、出現(xiàn)年份和分布時(shí)段作為研究熱點(diǎn)的分析指標(biāo),共現(xiàn)詞頻記錄一組關(guān)鍵詞在同組文獻(xiàn)中出現(xiàn)的次數(shù),以測(cè)度之間的耦合關(guān)系。研究熱點(diǎn)知識(shí)圖譜的評(píng)價(jià)指標(biāo)包括:①圖譜整體網(wǎng)絡(luò)結(jié)構(gòu)的評(píng)價(jià)指標(biāo):節(jié)點(diǎn)數(shù)、連線數(shù)和密度,用來(lái)描述網(wǎng)絡(luò)鏈接程度;②圖譜聚類指標(biāo):聚類模塊值(Modularity,Q值),Q>0.3認(rèn)為圖譜聚類結(jié)構(gòu)明顯,聚類平均輪廓值(Silhouette,S值),S>0.5認(rèn)為聚類合理,S>0.7認(rèn)為聚類具有較高的可信度;③圖譜節(jié)點(diǎn)指標(biāo):結(jié)構(gòu)洞、中心性和突現(xiàn)度,突現(xiàn)度是一定時(shí)間段內(nèi)關(guān)鍵詞的頻次變化率較高,預(yù)示著研究熱點(diǎn)的轉(zhuǎn)變[23],借助社會(huì)網(wǎng)絡(luò)分析(Social Network Analysis,SNA)中不同個(gè)體構(gòu)成整體網(wǎng)絡(luò)的結(jié)構(gòu)及相互關(guān)系概念,構(gòu)建的“結(jié)構(gòu)洞+中心性”分析體系可研究知識(shí)實(shí)體的關(guān)系鏈接及結(jié)構(gòu)[24]。
式中:i、 j、q為節(jié)點(diǎn),P為節(jié)點(diǎn)間連接關(guān)系的權(quán)重比例,C為所求節(jié)點(diǎn)的限制度指標(biāo),g為節(jié)點(diǎn)之間存在的捷徑數(shù),C(n)為所求節(jié)點(diǎn)的中介中心度指標(biāo)。
(3)研究前沿。名詞短語(yǔ)反映某研究領(lǐng)域中未來(lái)研究熱點(diǎn)問(wèn)題的新動(dòng)向,為研究者提供該學(xué)科領(lǐng)域的最新演化動(dòng)態(tài)[27]。選取名詞短語(yǔ)的詞頻、頻次變化率、出現(xiàn)年份和分布時(shí)段作為研究前沿的分析指標(biāo),頻次變化率較高的名詞短語(yǔ)可反映當(dāng)前時(shí)期領(lǐng)域中的關(guān)鍵研究。研究前沿知識(shí)圖譜的評(píng)價(jià)指標(biāo)包括:信息熵、中心性和突現(xiàn)度,信息熵是對(duì)研究前沿中知識(shí)變化不確定性的一種度量,根據(jù)整個(gè)時(shí)期累積的詞匯量進(jìn)行回顧性計(jì)算,預(yù)示著領(lǐng)域前沿研究總體格局改變的必要性,若分析指標(biāo)的信息熵越小,表明指標(biāo)值變異程度越大,指標(biāo)所提供的信息量越多,相應(yīng)權(quán)重越大,在綜合評(píng)價(jià)中該分析指標(biāo)所起作用越大。
3.1 水生態(tài)環(huán)境研究統(tǒng)計(jì)分析
3.1.1 文獻(xiàn)量時(shí)序分布特征 為比較國(guó)內(nèi)水生態(tài)環(huán)境研究發(fā)展同國(guó)際間的差距,本文另統(tǒng)計(jì)了中文社會(huì)科學(xué)引文索引數(shù)據(jù)庫(kù)(簡(jiǎn)稱“CSSCI”)和WOS(Web of Science)中水生態(tài)環(huán)境研究主題的發(fā)文量。圖4是體現(xiàn)文獻(xiàn)量時(shí)序分布特點(diǎn)和變化規(guī)律的時(shí)序分布圖。從水生態(tài)環(huán)境研究領(lǐng)域文獻(xiàn)發(fā)布的年代來(lái)看,國(guó)內(nèi)進(jìn)展符合“Shneider四階段理論”[28],WOS與CNKI、CSSCI在發(fā)文量及變化趨勢(shì)上存在明顯差異,前者處于穩(wěn)步提升階段,CNKI波動(dòng)較大,在2014年停止增長(zhǎng),之后處于波動(dòng)狀態(tài);CSSCI則一直處于持平階段,表明在水生態(tài)環(huán)境研究領(lǐng)域中國(guó)內(nèi)與國(guó)際研究進(jìn)展存在較大差距,國(guó)內(nèi)該研究領(lǐng)域地位的提升未來(lái)需更深入的研究積累,其中的科技類研究發(fā)展進(jìn)程豐富,而人文社科類研究達(dá)到飽和狀態(tài)。通過(guò)指數(shù)曲線回歸模型對(duì)累計(jì)百分比進(jìn)行偏差分析,y=0.0116e0.1856x(R2=0.9538)表明曲線與數(shù)據(jù)線擬合效果較好,表明該領(lǐng)域總體發(fā)文量呈現(xiàn)指數(shù)式增長(zhǎng)規(guī)律,說(shuō)明水生態(tài)環(huán)境研究逐漸受到國(guó)內(nèi)眾多學(xué)者的關(guān)注和重視。
圖4 水生態(tài)環(huán)境研究領(lǐng)域中外文文獻(xiàn)時(shí)序分布
國(guó)內(nèi)水生態(tài)環(huán)境研究由1970年代末水資源研究擴(kuò)展至1980年代初水環(huán)境保護(hù)研究演變而來(lái),依據(jù)圖2該研究領(lǐng)域發(fā)展歷程大致分為3個(gè)階段:①1992—2004年是水生態(tài)環(huán)境研究的萌芽起步階段,國(guó)內(nèi)學(xué)者在傳統(tǒng)水資源研究的基礎(chǔ)上,逐步開展水環(huán)境保護(hù)方面的研究,主要是全國(guó)城市飲用水水源地安全保障規(guī)劃提出了調(diào)查評(píng)價(jià)的理論方法和技術(shù)體系,解決了水源地保護(hù)中存在的監(jiān)控及標(biāo)識(shí)等若干關(guān)鍵技術(shù)問(wèn)題[29]。該階段文獻(xiàn)發(fā)表較少但研究范圍不斷擴(kuò)大,其理論體系不斷完善,相關(guān)研究逐步開展,已引起相關(guān)領(lǐng)域研究學(xué)者的關(guān)注;②2004—2012年處于曲折增長(zhǎng)階段,是我國(guó)生態(tài)需水研究、生態(tài)水文研究、典型地區(qū)流域水循環(huán)過(guò)程中水文水資源的生態(tài)效應(yīng)研究的高峰期。為緩解我國(guó)干旱西北地區(qū)水資源供需矛盾,開展了以生態(tài)需水計(jì)算方法為主的生態(tài)需水及生態(tài)水文理論及技術(shù)研究[30]。1980年代至1990年代初水土保持的減水減沙效應(yīng)研究為水土保持的水資源和水環(huán)境效應(yīng)研究(2005—2007)提供了理論支撐,形成了面向水生態(tài)與環(huán)境多任務(wù)需求的水土保持規(guī)劃理論及技術(shù)體系,自此國(guó)內(nèi)生態(tài)需水研究及探索流域生態(tài)水文規(guī)律為主的基礎(chǔ)研究已基本成型[31-32]。2009年CNKI趨勢(shì)線出現(xiàn)波動(dòng),國(guó)內(nèi)水生態(tài)環(huán)境研究以支撐流域水資源調(diào)配與管理的生態(tài)環(huán)境需求為前提,轉(zhuǎn)向流域生態(tài)環(huán)境相關(guān)的計(jì)算及工程技術(shù)研究;③2012—2017年該領(lǐng)域呈現(xiàn)迅速繁榮態(tài)勢(shì),該階段主要面向水生態(tài)環(huán)境保護(hù)和修復(fù)的理論及技術(shù)應(yīng)用研究。開展了針對(duì)不同地貌類型區(qū)域的植被恢復(fù)、修復(fù)技術(shù)及產(chǎn)生的水文效應(yīng)研究[33];關(guān)注點(diǎn)轉(zhuǎn)向河流生態(tài)健康評(píng)價(jià)理論、水生態(tài)環(huán)境保護(hù)與修復(fù)等方面,促進(jìn)了生態(tài)水利的提出(2012年)和發(fā)展,面向最嚴(yán)格水資源管理制度下的水資源論證技術(shù)得以完善[34]。2015年《水污染防治行動(dòng)計(jì)劃》發(fā)布,旨在解決我國(guó)面臨的水生態(tài)環(huán)境問(wèn)題,也是CNKI趨勢(shì)線從2014年開始呈波浪式變化的主要原因,說(shuō)明當(dāng)前水生態(tài)環(huán)境研究需擴(kuò)展研究思路,提高創(chuàng)新力度。黨的十八大提出水生態(tài)文明建設(shè),水生態(tài)環(huán)境研究領(lǐng)域從支撐水生態(tài)環(huán)境管理為目標(biāo)的應(yīng)用技術(shù)研究轉(zhuǎn)向促進(jìn)流域生態(tài)環(huán)境改善為前提的工程實(shí)踐研究,國(guó)內(nèi)水生態(tài)環(huán)境研究進(jìn)入全新階段。研究領(lǐng)域呈現(xiàn)出以生態(tài)水利相關(guān)理論與實(shí)踐研究為基礎(chǔ),以國(guó)內(nèi)水生態(tài)環(huán)境問(wèn)題和國(guó)家關(guān)于水生態(tài)環(huán)境恢復(fù)與建設(shè)的戰(zhàn)略方針為導(dǎo)向的特征[35-36]。
3.1.2 學(xué)科分類分布特征 對(duì)國(guó)內(nèi)水生態(tài)環(huán)境研究文獻(xiàn)統(tǒng)計(jì)分類,得到其學(xué)科分類分布圖(圖5)。左側(cè)是其施引文獻(xiàn)所在的學(xué)科分布,主要學(xué)科:環(huán)境科學(xué)與資源利用(28.13%)、生態(tài)(15.30%)、水利水電工程(13.59%)、城鄉(xiāng)規(guī)劃與市政(12.08%)、資源科學(xué)(9.87%)、農(nóng)業(yè)經(jīng)濟(jì)(7.01%)、建筑科學(xué)與工程(4.37%)、農(nóng)業(yè)資源與環(huán)境(2.90%)等,表明水生態(tài)環(huán)境研究的領(lǐng)域應(yīng)用。右側(cè)是對(duì)應(yīng)被引文獻(xiàn)所在的學(xué)科分布,其引用的主要學(xué)科具體為環(huán)境科學(xué)、水資源研究、自然資源學(xué)、生態(tài)學(xué)、生物學(xué)(水生物學(xué))等,表明水生態(tài)環(huán)境研究的研究基礎(chǔ),水生態(tài)環(huán)境是多學(xué)科共同關(guān)注的研究。當(dāng)前水生態(tài)環(huán)境研究的期刊來(lái)源中共30個(gè)研究子學(xué)科左右,主要集中于地理環(huán)境(9.39%)、流域生態(tài)(8.18%)、水環(huán)境保護(hù)(7.15%)、生態(tài)補(bǔ)償(6.83%)、生態(tài)環(huán)境(6.23%)、水資源(5.89%)、水生態(tài)文明建設(shè)(3.92%)、可持續(xù)性發(fā)展(3.65%)、水生態(tài)(3.37%)、生態(tài)補(bǔ)償機(jī)制(2.48%)等,同時(shí),該領(lǐng)域研究具有理論基礎(chǔ)研究向應(yīng)用技術(shù)和工程實(shí)踐轉(zhuǎn)型的特征,呈現(xiàn)多學(xué)科交叉。
圖5 水生態(tài)環(huán)境研究文獻(xiàn)學(xué)科分類分布
3.2 基于主題詞共詞矩陣分析的研究主題識(shí)別通過(guò)主題詞提取方法獲得49個(gè)時(shí)段高頻主題詞作為分析對(duì)象(表4),通過(guò)這些主題詞之間的被引詞頻構(gòu)建49×49共被引矩陣,即因子模型,因子分析確定研究分支數(shù)后,轉(zhuǎn)化為Pearson’s相關(guān)系數(shù)矩陣,作為系統(tǒng)聚類分析、多維尺度分析的基礎(chǔ),綜上,繪制水生態(tài)環(huán)境研究領(lǐng)域中研究主題的知識(shí)圖譜。
因子分析是在少損失信息或盡可能不損失信息的情況下,將多個(gè)變量指標(biāo)降維為少數(shù)幾個(gè)因子的多元統(tǒng)計(jì)分析方法。主題詞共詞矩陣(49×49)下的R型因子分析,提取到12個(gè)因子,每個(gè)主題載荷系數(shù)的大小表示該主題在各個(gè)因子中的載荷程度,值越高表示主題研究在水生態(tài)環(huán)境領(lǐng)域的顯著程度越強(qiáng)。15個(gè)主題詞在單個(gè)因子中具有較高的負(fù)載值(得分≥±0.60以上),特別是“指標(biāo)體系”(因子1)和“生態(tài)需水”(因子3)各自連接的分支5和分支3研究在該領(lǐng)域有顯著體現(xiàn)(得分≥±0.70以上),12個(gè)主題詞在組間連接下的多個(gè)研究分支中具有顯著體現(xiàn)(得分≥±0.40以上),如流域治理、生態(tài)補(bǔ)償機(jī)制、水利水電工程等。其中,累積貢獻(xiàn)率約78.067%的總方差存在12個(gè)潛在因子,前7個(gè)主因子累計(jì)貢獻(xiàn)率為62.900%且取值均大于1,表示其所代表的主題是水生態(tài)環(huán)境研究領(lǐng)域的主要研究方向,貢獻(xiàn)率依次為:18.888%、10.975%、8.180%、7.780%、6.621%、5.935%、4.521%,說(shuō)明主題詞共被引矩陣降維至12,能表達(dá)整體信息的78.067%。借助因子分析結(jié)果,結(jié)合聚類分析中的R型聚類方法進(jìn)行共引聚類分析,得到主題詞聚類分析譜系圖(圖6),縱軸為各研究主題詞,反映研究?jī)?nèi)容親疏關(guān)系的主題詞相互連接,譜系圖更揭示了水生態(tài)環(huán)境領(lǐng)域中各研究分支之間的內(nèi)在關(guān)聯(lián)及歸屬層次,每個(gè)研究分支由不同親屬關(guān)系的研究主題聚合而成。計(jì)算Pearson’s相關(guān)系數(shù)的聚類評(píng)價(jià)指標(biāo)的平均得分,熵值為0.3917,基于類的F值為0.7145,熵值較小,基于類的F較大,說(shuō)明聚類結(jié)果較為合理;同時(shí),與因子分析結(jié)果相比有較高的一致性,圖中虛線為各主題詞聚類最優(yōu)解。綜合因子得分≥±0.40的12個(gè)潛在因子,根據(jù)聚類結(jié)果可解釋水生態(tài)環(huán)境領(lǐng)域中存在12個(gè)研究分支:分支1,水資源保護(hù)科學(xué)的理論方法及技術(shù)研究;分支2,面向流域(區(qū)域)的水功能區(qū)劃研究;分支3,不同典型區(qū)域下的生態(tài)需水計(jì)算模型及生態(tài)水文研究;分支4,水生態(tài)保護(hù)和修復(fù)的理論及技術(shù)研究;分支5,評(píng)價(jià)指標(biāo)體系研究;分支6,流域生態(tài)水文規(guī)律及作用機(jī)理研究;分支7,水生態(tài)環(huán)境管理理論及技術(shù)研究;分支8,流域生態(tài)環(huán)境污染治理及修復(fù)研究;分支9,生態(tài)環(huán)境保護(hù)與修復(fù)研究;分支10,水利水電工程和生態(tài)水利研究;分支11,水生態(tài)文明城市和海綿城市研究;分支12,水資源管理理論及技術(shù)研究。
以沈陽(yáng)主城區(qū)不同空間布局的448個(gè)小區(qū)的房?jī)r(jià)進(jìn)行回歸分析。首先,進(jìn)行了經(jīng)典線性回歸模型(OLS)的估算,計(jì)算OLS結(jié)果如表1所示。
表4 1992—2017年國(guó)內(nèi)水生態(tài)環(huán)境研究時(shí)段高頻主題詞
因子分析和聚類分析從微觀視角探究了主題詞之間的內(nèi)在關(guān)聯(lián)程度,而多維尺度分析以向心度和密度為參數(shù)繪制的主題知識(shí)圖譜從宏觀角度探究了主題集群間的相似性[37],圖7中各主題詞(點(diǎn))的相關(guān)位置及距離反映了該領(lǐng)域各主題的集群關(guān)系,主題詞間距離越近,關(guān)系越緊密,反之關(guān)系越疏遠(yuǎn)。其中,Stress值是0.12394,Stress優(yōu)劣尺度評(píng)價(jià):12.4%≤15%,近似程度為滿意,值較小,表明觀察數(shù)據(jù)與分析結(jié)果擬合較好,說(shuō)明模型擬合度較高,RSQ值為0.99118,接近于1,表示圖中各點(diǎn)構(gòu)形距離與輸入實(shí)際距離匹配度較高,二者反映出各主題間的相互影響強(qiáng)度較高,聯(lián)系強(qiáng)度緊密。坐標(biāo)橫軸為向心度,表示各主題詞間相互影響強(qiáng)度,縱軸為密度,表示水生態(tài)環(huán)境研究領(lǐng)域內(nèi)部聯(lián)系強(qiáng)度,I象限內(nèi)各主題詞在流域生態(tài)需水及生態(tài)水文研究方向上都有體現(xiàn),流域生態(tài)環(huán)境、不同修復(fù)措施下的水環(huán)境效應(yīng)機(jī)理等研究主題處于“次核心”地位,理論成果發(fā)展較成熟,且研究主題間存在較高的交叉度;Ⅱ象限內(nèi)主題領(lǐng)域內(nèi)部聯(lián)系緊密,各主題詞表現(xiàn)于整個(gè)水生態(tài)環(huán)境領(lǐng)域的“核心”地位,共同構(gòu)成了水生態(tài)環(huán)境管理下的應(yīng)用技術(shù)研究方向,水功能區(qū)劃、最嚴(yán)格水資源管理制度下的水資源論證技術(shù)、水利工程環(huán)境影響評(píng)價(jià)、水資源保護(hù)技術(shù)等研究主題間的關(guān)聯(lián)程度較高,理論及技術(shù)成果較為成熟;Ⅲ象限內(nèi)主題領(lǐng)域結(jié)構(gòu)松散,各主題詞定位于生態(tài)環(huán)境應(yīng)用研究方向中,水生態(tài)系統(tǒng)保護(hù)與修復(fù)、水資源論證、水生態(tài)文明建設(shè)等研究主題關(guān)聯(lián)度較低,且發(fā)展不成熟,處于研究領(lǐng)域的“邊緣”地帶,表明上述研究具有較大的發(fā)展空間;Ⅳ象限內(nèi)各主題詞聚類到流域生態(tài)環(huán)境改善研究方向,水土保持、面源污染治理等研究主題下的相關(guān)理論研究成果處于“核心”地位,但以此為基礎(chǔ)的工程實(shí)踐技術(shù)仍不成熟,需不斷創(chuàng)新。
圖6 主題詞聚類分析譜系圖
圖7 研究主題知識(shí)圖譜
3.3 基于關(guān)鍵詞共現(xiàn)聚類分析的研究熱點(diǎn)辨識(shí)經(jīng)尋徑網(wǎng)絡(luò)(Pathfinder)算法修剪的水生態(tài)環(huán)境研究熱點(diǎn)知識(shí)圖譜保留了最重要的節(jié)點(diǎn)關(guān)聯(lián),將致密冗余的原網(wǎng)絡(luò)簡(jiǎn)化為表達(dá)清晰研究熱點(diǎn)聚類結(jié)構(gòu)的最有效網(wǎng)絡(luò),其中節(jié)點(diǎn)半徑、顏色深淺和連線距離、密度反映了關(guān)鍵詞的出現(xiàn)頻率、被引年份和關(guān)鍵詞的直接、間接聯(lián)系(圖8)。共現(xiàn)網(wǎng)絡(luò)存在428個(gè)節(jié)點(diǎn),529條連線,密度為0.0058,說(shuō)明網(wǎng)絡(luò)鏈接程度緊密,各主題詞間共現(xiàn)程度較高。Q值為0.8499,說(shuō)明熱點(diǎn)研究聚類效果明顯,S值為0.6328,說(shuō)明研究熱點(diǎn)的同質(zhì)性較高,呈現(xiàn)較集中化的特點(diǎn)。圖8中明顯的關(guān)鍵節(jié)點(diǎn)為:水環(huán)境、海綿城市、生態(tài)補(bǔ)償、流域、水資源、生態(tài)環(huán)境等,即出現(xiàn)的高頻熱點(diǎn)詞;突變強(qiáng)度較大的關(guān)鍵詞有13個(gè):生態(tài)補(bǔ)償(Burst=50.2362)、低影響開發(fā)(Burst=43.8269)、流域(Burst=24.944)、水生態(tài)文明(Burst=22.473)、年徑流總量控制率(Burst=18.4514)、濕地(Burst=18.3414)、生態(tài)補(bǔ)償機(jī)制(Burst=17.7084)、生態(tài)系統(tǒng)服務(wù)(Burst=16.0453)、生態(tài)需水(Burst=15.0045)、生態(tài)補(bǔ)償標(biāo)準(zhǔn)(Burst=14.433)、生態(tài)恢復(fù)(Burst=13.7246)、生態(tài)水文(Burst=13.3648)、流域生態(tài)補(bǔ)償(Burst=13.3148),這些關(guān)鍵詞出現(xiàn)頻次增長(zhǎng)較快,且主要分布于2008—2017年,是該領(lǐng)域亟需解決也是學(xué)者關(guān)注的熱點(diǎn)問(wèn)題。此外,海綿城市、低影響開發(fā)、雨洪管理、城市內(nèi)澇及水生態(tài)文明是2013年后出現(xiàn)的新研究熱點(diǎn)。經(jīng)“Circle Packing Of Clusters”方法生成13個(gè)子聚類,分別對(duì)應(yīng)圖8中13個(gè)凝聚子群,凝聚子群在水生態(tài)環(huán)境領(lǐng)域中體現(xiàn)出一定的生命周期和多元化特征,依次為:(1)水環(huán)境知識(shí)群組(1992—2017年),在傳統(tǒng)水資源研究基礎(chǔ)上拓展,包括水質(zhì)評(píng)價(jià)、生態(tài)需水等熱點(diǎn);(2)水資源污染及治理知識(shí)群組(1996—2013年),為構(gòu)建健康河流理論體系奠基,包括小流域、綜合治理等熱點(diǎn);(3)生態(tài)系統(tǒng)及水土保持措施知識(shí)群組(1994—2016年),促進(jìn)流域尺度下的水土資源開發(fā)研究,包括水土流失、水源地水質(zhì)等熱點(diǎn);(4)水資源污染治理知識(shí)群組(1996—2013年),是生態(tài)環(huán)境研究出現(xiàn)的萌芽,包括:岸邊污染帶、對(duì)策等熱點(diǎn);(5)生態(tài)環(huán)境及生態(tài)經(jīng)濟(jì)系統(tǒng)知識(shí)群組(1993—2013年),水生態(tài)環(huán)境研究為工程水利逐步定位,包括質(zhì)量、可持續(xù)發(fā)展等熱點(diǎn);(6)流域生態(tài)及生態(tài)需水知識(shí)群組(1997—2014年),研究成果在水資源和水工程規(guī)劃中發(fā)揮了關(guān)鍵性作用,包括水生態(tài)系統(tǒng)、河流生態(tài)等熱點(diǎn);(7)生態(tài)補(bǔ)償及指標(biāo)體系知識(shí)群組(1994—2012年),包括生態(tài)承載力、補(bǔ)償標(biāo)準(zhǔn)等熱點(diǎn);(8)生態(tài)補(bǔ)償機(jī)制及生態(tài)修復(fù)知識(shí)群組(1997—2011年),水生態(tài)修復(fù)為水生態(tài)文明的發(fā)展提供了契機(jī),包括土地利用、生態(tài)安全等熱點(diǎn);(9)生態(tài)系統(tǒng)服務(wù)及生態(tài)足跡知識(shí)群組(1997—2012年),包括水生態(tài)足跡等熱點(diǎn);(10)海綿城市知識(shí)群組(2014—2017年),其是城市水生態(tài)環(huán)境的范疇,包括低影響開發(fā)、年徑流總量控制率等熱點(diǎn);(11)水生態(tài)文明知識(shí)群組(1998—2016年),為水生態(tài)文明試點(diǎn)建設(shè)提供了指導(dǎo),包括指標(biāo)評(píng)價(jià)體系等;(12)低影響開發(fā)知識(shí)群組(2014—2016年);包括城市內(nèi)澇、雨水花園等;(13)生態(tài)水利工程知識(shí)群組(2005—2017年),流域生態(tài)環(huán)境改善及恢復(fù)下的理論及技術(shù)實(shí)踐,包括濕地、面源污染治理、流域綜合規(guī)劃等。由此看出,國(guó)內(nèi)水生態(tài)環(huán)境領(lǐng)域具有較好的水環(huán)境保護(hù)、特定領(lǐng)域下的生態(tài)需水、面向生態(tài)環(huán)境的水生態(tài)保護(hù)與修復(fù)等理論及技術(shù)研究基礎(chǔ),以滿足水資源管理和調(diào)配的生態(tài)環(huán)境為前提,發(fā)展流域生態(tài)環(huán)境下的計(jì)算及工程應(yīng)用研究、水生態(tài)文明建設(shè)、海綿城市已成為目前研究熱點(diǎn),因此圖譜呈現(xiàn)多中心交叉的枝狀分布特點(diǎn)。
通過(guò)“結(jié)構(gòu)洞+中心性”分析體系,得到1992—2017年水生態(tài)環(huán)境領(lǐng)域內(nèi)按時(shí)序凸顯的關(guān)鍵詞表(表5),圖8中,“水資源”節(jié)點(diǎn)q是“生態(tài)補(bǔ)償”節(jié)點(diǎn)i和“流域”節(jié)點(diǎn) j的共同鄰接點(diǎn),Pij是“生態(tài)補(bǔ)償”節(jié)點(diǎn)i的所有鄰接點(diǎn)中“流域”節(jié)點(diǎn)j所占的權(quán)重比例,Ci即為“生態(tài)補(bǔ)償”節(jié)點(diǎn)i的限制度指標(biāo);圖8中,“流域”節(jié)點(diǎn) j和“水資源”節(jié)點(diǎn)k之間存在捷徑數(shù) gjk,且兩者之間存在經(jīng)過(guò)“水環(huán)境”節(jié)點(diǎn)i的捷徑數(shù)為為“水環(huán)境”節(jié)點(diǎn)i控制此兩節(jié)點(diǎn)的聯(lián)接能力,即為中介中心度指標(biāo)。圖8中角標(biāo)明顯的節(jié)點(diǎn),對(duì)應(yīng)表5內(nèi)容,在水生態(tài)環(huán)境領(lǐng)域中,水環(huán)境、海綿城市、生態(tài)補(bǔ)償、水資源、流域、生態(tài)環(huán)境和水生態(tài)是學(xué)者關(guān)注的研究熱點(diǎn)的集中體現(xiàn)。
圖8 研究熱點(diǎn)知識(shí)圖譜
表5 1992—2017年國(guó)內(nèi)水生態(tài)環(huán)境領(lǐng)域研究熱點(diǎn)關(guān)鍵詞(頻次≥100)
3.4 基于Kleinberg突變檢測(cè)算法的研究前沿分析通過(guò)Kleinberg突變檢測(cè)算法從標(biāo)題和摘要中探測(cè)出按詞頻時(shí)間分布的詞頻和頻次變化率均高的名詞短語(yǔ)(Noun Phrases),將追蹤到的名詞短語(yǔ)根據(jù)主題進(jìn)行歸納,得到反映研究前沿趨勢(shì)變化的信息熵圖(圖9),對(duì)應(yīng)1999年至2010年上半年,突出顯示了連續(xù)和陡峭的熵值增加,不確定性的顯著增加是新興宏觀性質(zhì)的體現(xiàn),即水生態(tài)環(huán)境領(lǐng)域的研究重心發(fā)生變化,預(yù)示著新研究?jī)?nèi)容的注入。圖10是研究前沿的樣點(diǎn)分布趨勢(shì)圖,樣點(diǎn)位置顯示在XY平面中,每個(gè)樣點(diǎn)的感興趣屬性值通過(guò)Z軸豎線高度表示,利用全局多項(xiàng)式的內(nèi)插方法擬合樣點(diǎn)趨勢(shì)面,探測(cè)縱向趨勢(shì)(X軸)和維度趨勢(shì)(Y軸)發(fā)現(xiàn),樣點(diǎn)分布趨勢(shì)與研究前沿信息熵的變化趨勢(shì)相一致,樣點(diǎn)分布趨勢(shì)圖中的峰谷基本定格了前沿研究的具體類型,根據(jù)首次被引用的時(shí)間,2000年時(shí)區(qū)中的文獻(xiàn)最少,1999年、2001年時(shí)區(qū)次之,表明該領(lǐng)域處于低谷時(shí)期,其余時(shí)區(qū)是該領(lǐng)域發(fā)展的較繁榮時(shí)期。1992年、1993年時(shí)區(qū)與1994—1999年間各個(gè)時(shí)區(qū)中的節(jié)點(diǎn)的連線關(guān)系密集,表明1992年、1993年與1994—1999年間各個(gè)時(shí)間段的傳承關(guān)系較強(qiáng),與此后各個(gè)時(shí)區(qū)的傳承關(guān)系較弱,2000—2017年間各個(gè)時(shí)區(qū)的傳承關(guān)系主要來(lái)源于1996年、1998年、1999年3個(gè)時(shí)區(qū),其中1998年時(shí)區(qū)對(duì)各個(gè)時(shí)區(qū)的傳承關(guān)系最強(qiáng),且影響至今,說(shuō)明水生態(tài)環(huán)境研究前沿的時(shí)變特征。
圖9 研究前沿信息熵圖
圖10 研究前沿樣點(diǎn)分布趨勢(shì)圖
對(duì)生成時(shí)區(qū)視圖前的整體網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行社會(huì)網(wǎng)絡(luò)分析,自動(dòng)聚類的網(wǎng)絡(luò)存在475個(gè)節(jié)點(diǎn),1082條連線,密度為0.0096,將名詞短語(yǔ)作為網(wǎng)絡(luò)節(jié)點(diǎn),名詞短語(yǔ)之間的共現(xiàn)關(guān)系作為節(jié)點(diǎn)連線,節(jié)點(diǎn)越大越接近中心地位,屬于前沿研究,統(tǒng)計(jì)具有中心性和突現(xiàn)度的名詞短語(yǔ),如表6所示。
生成包含表6中名詞短語(yǔ)的研究前沿知識(shí)圖譜(圖11),反映前沿知識(shí)演進(jìn)的時(shí)區(qū)視圖,以時(shí)區(qū)視圖的可視化方式描繪水生態(tài)環(huán)境研究在時(shí)間跨度上的過(guò)渡本質(zhì)、演變趨勢(shì)和相互影響。參考圖9和圖10,水生態(tài)環(huán)境領(lǐng)域研究前沿顯著表現(xiàn)為3個(gè)研究階段。1992—1998年,初期研究主要體現(xiàn)為具體案例(飲水安全問(wèn)題、西北地區(qū)生態(tài)需水研究等)和發(fā)展完善水資源、水工程的理論及技術(shù)實(shí)踐研究,表征該階段研究前沿的名詞短語(yǔ)包括:水環(huán)境、生態(tài)環(huán)境、水土流失、質(zhì)量評(píng)價(jià)、水污染、水土保持、生態(tài)經(jīng)濟(jì)系統(tǒng)等,中心性為0.27的“水環(huán)境”是初期各研究分支的根節(jié)點(diǎn),“生態(tài)環(huán)境”、“水土保持”、“水土流失”、“生態(tài)服務(wù)”及水庫(kù)個(gè)案研究成為該領(lǐng)域早期受關(guān)注程度較高的前沿研究分支,呈現(xiàn)出較高的突現(xiàn)度。1999—2011年,該階段突現(xiàn)出較多的名詞短語(yǔ),多個(gè)研究集群中呈現(xiàn)出中心性和突現(xiàn)度的集中分布,在1992—1998年研究基礎(chǔ)上,水生態(tài)環(huán)境領(lǐng)域衍生出多個(gè)新的前沿研究分支,表征該活躍階段研究前沿的名詞短語(yǔ)包括:生態(tài)需水、生態(tài)用水、生態(tài)恢復(fù)、生態(tài)水文過(guò)程、健康風(fēng)險(xiǎn)評(píng)價(jià)、生態(tài)系統(tǒng)健康、生態(tài)水文學(xué)等,其中面向具體流域的生態(tài)系統(tǒng)研究集群、以生態(tài)補(bǔ)償為核心的研究集群和面向生態(tài)環(huán)境問(wèn)題的水生態(tài)保護(hù)與修復(fù)、生態(tài)系統(tǒng)服務(wù)研究集群拓展力度較大,表明該研究領(lǐng)域進(jìn)入活躍期,各研究分支轉(zhuǎn)向應(yīng)用研究,趨向具體化。2012—2017年,水生態(tài)環(huán)境領(lǐng)域前沿研究的瓶頸期,海綿城市、流域尺度下水土資源合理開發(fā)及水生態(tài)文明建設(shè)等經(jīng)濟(jì)思想,生態(tài)水文學(xué)等新興學(xué)科的交叉引進(jìn),既注重坡面植被、河流水系、湖沼濕地、河口近岸海域等流域水循環(huán)耦合生態(tài)系統(tǒng)的生態(tài)水文規(guī)律基礎(chǔ)研究,也偏向于管理和改善水、流域生態(tài)環(huán)境的工程應(yīng)用研究,表征研究前沿的名詞短語(yǔ)包括:水生態(tài)文明、海綿城市建設(shè)、風(fēng)景園林、生態(tài)系統(tǒng)服務(wù)、生態(tài)環(huán)境需水量、景觀格局、生態(tài)健康、生態(tài)系統(tǒng)服務(wù)價(jià)值、評(píng)價(jià)指標(biāo)體系、徑流總量控制(年徑流總量控制率)、水生態(tài)承載力、風(fēng)景園林、生態(tài)安全等,水生態(tài)文明、低影響開發(fā)、海綿城市建設(shè)和面向最嚴(yán)格水資源管理的水資源論證技術(shù)具有較高的突現(xiàn)度和一定的中心性,成為當(dāng)前和未來(lái)一段時(shí)間內(nèi)的前沿研究分支。
表6 1992—2017年國(guó)內(nèi)水生態(tài)環(huán)境領(lǐng)域研究前沿名詞短語(yǔ)
圖11 研究前沿知識(shí)圖譜
本文以CNKI文獻(xiàn)檢索引擎為數(shù)據(jù)來(lái)源,通過(guò)構(gòu)建水生態(tài)環(huán)境研究知識(shí)圖譜,進(jìn)行行業(yè)知識(shí)挖掘。以CiteSpace、SPSS為支撐工具,從知識(shí)圖譜視角出發(fā),采用定性分析和定量研究相結(jié)合的方法,對(duì)1992—2017年國(guó)內(nèi)水生態(tài)環(huán)境主題文獻(xiàn)數(shù)據(jù)進(jìn)行多方位分析。研究結(jié)果表明,國(guó)內(nèi)水生態(tài)環(huán)境研究發(fā)展符合“Shneider四階段理論”描述,本文構(gòu)建的“文獻(xiàn)量時(shí)序分析&學(xué)科分析(宏觀)→主題詞共詞矩陣分析(微觀、直觀)→關(guān)鍵詞共現(xiàn)聚類分析(復(fù)雜、整體)&典型聚類分析(局部)→名詞短語(yǔ)突變檢測(cè)分析(特殊)”信息分析方法是合理有效的。
本文以統(tǒng)計(jì)分析方式分析了國(guó)內(nèi)水生態(tài)環(huán)境研究的發(fā)展現(xiàn)狀,以知識(shí)圖譜方式分析了國(guó)內(nèi)水生態(tài)環(huán)境領(lǐng)域的研究主題、研究熱點(diǎn)和研究前沿,研究發(fā)現(xiàn):
(1)國(guó)內(nèi)水生態(tài)環(huán)境研究發(fā)展水平同國(guó)際間存在一定差距,發(fā)展效率較低,主要受國(guó)內(nèi)水生態(tài)環(huán)境問(wèn)題和國(guó)家關(guān)于水生態(tài)環(huán)境政策方針的影響,近十多年來(lái),該領(lǐng)域?qū)W者對(duì)水生態(tài)環(huán)境的研究興趣增長(zhǎng)較顯著,引發(fā)了較多新的研究創(chuàng)新點(diǎn)。
(2)國(guó)內(nèi)水生態(tài)環(huán)境研究在多個(gè)領(lǐng)域內(nèi)備受關(guān)注,且在環(huán)境科學(xué)與資源利用、生態(tài)、水利水電工程、城鄉(xiāng)規(guī)劃與市政中受關(guān)注程度較高,說(shuō)明水生態(tài)環(huán)境研究呈現(xiàn)多研究目標(biāo)、多研究層面、多研究學(xué)科交叉融合的復(fù)雜特征。
(3)研究主題演進(jìn)路徑明確,分為三個(gè)階段:①1980年代初,開展針對(duì)飲水安全問(wèn)題的水環(huán)境保護(hù)研究;②90年代末,開展面向水資源和水工程規(guī)劃的生態(tài)需水研究;③自2009年開始,開展促進(jìn)生態(tài)水利發(fā)展的生態(tài)環(huán)境應(yīng)用研究。各階段熱點(diǎn)主題豐富明確,發(fā)展較集中,研究主題緊跟與國(guó)內(nèi)水生態(tài)環(huán)境相關(guān)的時(shí)政熱點(diǎn)問(wèn)題,具有充足的政策導(dǎo)向性。
(4)研究熱點(diǎn)知識(shí)網(wǎng)絡(luò)結(jié)構(gòu)聯(lián)系緊密,時(shí)間維度上具有豐富的進(jìn)程特征,圖譜中各階段有明確突出的研究熱點(diǎn),且集群化程度較高,說(shuō)明水生態(tài)環(huán)境研究領(lǐng)域內(nèi)有較好的研究氛圍。
(5)各時(shí)段研究前沿脈絡(luò)清晰,有較強(qiáng)的繼承關(guān)系且彼此聯(lián)系緊密,核心演變路徑體現(xiàn)為:“流域生態(tài)水文規(guī)律研究→水生態(tài)環(huán)境管理技術(shù)研究→流域生態(tài)環(huán)境改善、恢復(fù)研究”,以支撐流域水資源調(diào)配管理的生態(tài)環(huán)境需求為前提,促進(jìn)生態(tài)水利、水生態(tài)文明建設(shè)、流域生態(tài)環(huán)境相關(guān)的計(jì)算及工程技術(shù)等研究,表示國(guó)內(nèi)水生態(tài)環(huán)境研究從宏觀、共性的理論研究正轉(zhuǎn)向以此為基礎(chǔ)的區(qū)域、特性的工程技術(shù)應(yīng)用研究。
目前,以科研論文為媒介的科學(xué)知識(shí)圖譜已成為研究領(lǐng)域中知識(shí)發(fā)現(xiàn)的重要方式,能夠?qū)^(guò)去的事實(shí)型知識(shí)和過(guò)程型知識(shí)進(jìn)行陳述,但由于缺少語(yǔ)義關(guān)系的解析和梳理,所以對(duì)文獻(xiàn)要素進(jìn)行大規(guī)模實(shí)時(shí)關(guān)聯(lián)和特征分析的推理能力仍比較薄弱。下一步將以詞句、詞篇關(guān)系的數(shù)據(jù)挖掘方式探索水生態(tài)環(huán)境研究領(lǐng)域內(nèi)的新知識(shí),以提升水利信息化的專業(yè)性。