王夢琦,陳 東
(安徽建筑大學 土木工程學院,安徽 合肥 230601)
Intel公司估算從人類社會產生開始至2003年,整個人類社會產生了5 EB的數據資料,在此后的將近十年間數據量增長至2.72 ZB,是2003年數據量的500倍,并且Intel公司預估此后每兩年數據量便成倍增長。隨著數據量的高速增長,人工處理數據變得越來越困難,人工智能成為處理數據的高效率手段。人工神經網絡隨著人工智能的興起逐漸成為研究熱點,其在結構上模仿人腦的神經元網絡行為特征,具有強大的自主學習能力、尋找最優(yōu)解的能力和存儲功能,能夠解決許多復雜的非線性映射問題,被廣泛應用于多個領域[1]。神經網絡最早被應用于建筑結構損傷識別,之后逐漸被用在建筑結構中。謝金豪等[2]將單一的BP神經網絡預測模型與經過GAP優(yōu)化后的神經網絡預測模型運用于工程造價中。楊鑠等[3]將神經網絡應用于建筑結構損傷識別中。劉媛媛等[4]將數值模擬與BP神經網絡相結合,提出了一種新思路。林申正等[5]通過BIM技術測算的結果輸入神經網絡,建立了建筑成本控制模型。NEIRA P[6]等將神經網絡應用于混凝土抗壓強度預測中。目前國內外學者將神經網絡廣泛應用于實驗研究中,但缺乏對整個學科研究進程和研究前景的總結和歸納,而傳統的文獻歸納法有效率低、傾向性強、缺乏系統性等缺點?,F代化的文獻分析和歸納對各個學科的發(fā)展至關重要。本文通過CiteSpace6.1R2可視化分析軟件對2009—2022年的Web of Science(WOS)數據庫文獻和中國知網(CNKI)數據庫文獻進行統計分析。分別對其作者合作網絡、關鍵詞和時區(qū)圖進行可視化分析,旨在梳理國內外神經網絡在建筑領域內的研究進展和趨勢,以期為相關領域研究提供參考。
應用CiteSpace軟件對WOS和CNKI中的核心期刊進行檢索。在WOS中以“neural network”為主題進行檢索,之后對文獻進行篩選、去重處理,最終得到1 843篇關于神經網絡在建筑領域的有效文獻。在CNKI中,以“神經網絡”為關鍵詞進行搜索,去掉除建筑科學與工程學科的其他文獻,去掉學位論文、專利、報紙、會議等,得到1 643篇核心期刊相關文獻。將所得文獻進行去重處理,最終得到1 621篇有效文獻。
表1 數據來源
通過文獻計量學的方法分析神經網絡在建筑領域的研究現狀。文獻計量學是以文獻為研究對象,集數學、統計學和文獻學為一體,研究某學術領域的發(fā)展歷程、研究熱點以及未來的研究趨勢[7]。先將WOS數據庫和CNKI數據庫里面的相關文獻分別保存為純文本格式和Refworks格式,然后運用CiteSpace軟件對保存的文獻進行數據轉換處理以及可視化分析[8],最后通過可視化分析得到5個知識圖譜(見圖1)。本文在知識圖譜的基礎上分析神經網絡在建筑領域的研究現狀以及未來的研究趨勢。
圖1 研究方法流程圖
對WOS和CNKI數據庫中近13年的相關文獻發(fā)文量進行分析,可以反映出該學科領域在這一時間段的研究熱點(見圖2)。
圖2 建筑領域的神經網絡研究發(fā)文量
由圖2可知,國內外關于建筑領域的神經網絡的相關文獻在2009—2022年整體呈現上升趨勢。其中,國外相關文獻在2009—2017年呈穩(wěn)定增長趨勢,2020—2021年發(fā)文量從287篇增長到450篇,呈大幅增長趨勢。國內相關文獻整體呈穩(wěn)定增長趨勢。由此可以看出近幾年神經網絡在建筑領域內的發(fā)展受到了廣大學者的關注,成為研究熱點之一。
作者共現網絡能夠反映該研究領域內作者的交流合作情況。網絡密度能夠反映作者的合作情況,網絡密度越高,作者間的合作越密切[9]。國內作者共現分析圖譜、國外作者共現分析圖譜分別如圖3、圖4所示。在CNKI作者共現分析圖譜中,“N=467,E=203”,說明該圖譜中共有467個節(jié)點,203條網絡連接。節(jié)點的大小與作者的發(fā)文量相對應,發(fā)文量越多,節(jié)點越大。節(jié)點間連接線的粗細表示作者間合作強度的大小。203條網絡連接則表示203個作者之間存在合作關系,但是網絡密度只有0.001 9,說明作者在神經網絡研究中合作總體較少,但是周世玉、劉曉平、周玉成、杜光月、曹正彬之間有較多研究領域的合作,其研究合作主要集中于利用神經網絡的預測算法,對木質地板的蓄熱性能提供依據[10-11]。李琦在圖中是較大的橙色節(jié)點,但是節(jié)點附近沒有邊線,說明李琦發(fā)表的研究成果較多但合作較為分散,不夠密切。在WOS作者共現分析圖譜中共有520個節(jié)點,596條網絡鏈接,網絡密度為0.004 4。說明596個作者之間存在合作關系,并且比國內作者合作更加緊密,很少有獨立發(fā)表的研究成果。
圖3 CNKI作者共現分析圖譜
圖4 WOS作者共現分析圖譜
國家和機構在該領域文獻的發(fā)表在一定程度上可以反映一個國家和機構在該研究領域的重要性和影響力,國家之間的相互交流可以促進大規(guī)模的科技創(chuàng)新和突破[12]。本文對相關文獻發(fā)文的國家和機構進行統計和可視化分析,得到圖5、圖6以及表2。由表2可以看出中國和美國的發(fā)文量明顯高于其他國家,但中國發(fā)文的中心性很低,說明發(fā)表的文章影響力不大[13]。其他國家按發(fā)文量依次遞減(見表2)。
圖5 國家合作網絡
圖6 國外機構合作網絡
表2 排名前十的發(fā)文國家和發(fā)文機構中心性分布表
在合作機構方面,發(fā)文量最多的是代爾夫特理工大學(Delft Univ Technol),中心性最強的是南洋理工大學(Nanyang Technol Univ)和伊朗科技大學(Iran Univ Sci &Technol)。機構合作網絡圖譜整體的合作密度為0.003 5,合作程度較低,總體呈現以代爾夫特理工大學、南洋理工大學、同濟大學、東南大學等幾個綜合實力較強的單位為中心的合作關系,其中以同濟大學為中心的合作網絡的次節(jié)點為武漢大學、諾森比亞大學等知名大學。
2.4.1 關鍵詞共現分析
關鍵詞是一篇論文的核心概況。關鍵詞共現的頻次能說明該文獻集所代表的學科中各主題之間的聯系[14]。利用CiteSpace軟件對選中的文獻進行關鍵詞共現、聚類分析,能夠有效地了解到該領域的研究熱點。繪制關鍵詞共現圖譜和關鍵詞聚類圖譜分別如圖7和圖8所示。
圖7 CNKI關鍵詞共現圖譜
圖8 WOS關鍵詞共現圖譜
在CNKI關鍵詞共現圖譜中,共有473個節(jié)點,400條網絡鏈接,密度為0.003 6。
在WOS關鍵詞共現圖譜中,共有608個節(jié)點、960條網絡鏈接,密度為0.005 2。國內大多將神經網絡用于識別建筑的損傷,國外卻較少??偟膩碚f,國內外建筑領域的神經網絡研究大體相似。
2.4.2 關鍵詞聚類分析
對國內外建筑領域關于神經網絡的文獻進行聚類[9]。選擇顯示前8個聚類,聚類編號越小說明聚類的效果越好,中心性越強[14]。國內關鍵詞聚類圖譜見圖9,國外關鍵詞聚類圖譜見圖10。
圖9 CNKI關鍵詞聚類分析圖譜
圖10 WOS關鍵詞聚類分析圖譜
在CNKI關鍵詞聚類圖譜中,共有473個節(jié)點、400條網絡鏈接,密度為0.003 6。聚類模塊值Q=0.874 1,Q>0.3說明該聚類可視化較好;輪廓性指標S=0.969 8,S>0.5說明該聚類是合理的;若S>0.7說明該聚類是高效率并且令人信服的[14]。前8個聚類依次是“神經網絡”“遺傳算法”“變形預測”“預測”“仿真”“時間序列”“BP網絡”“目標檢測”,結合聚類信息和圖譜可以看出國內神經網絡在建筑中發(fā)揮的作用主要是預測和檢測,例如預測建筑能耗模型、預測施工進度模型等以及檢測混凝土裂縫和孔洞、檢測鋼筋混凝土的腐蝕程度等。
在WOS關鍵詞聚類圖譜中,共有608個節(jié)點,960條網絡鏈接,密度為0.005 2。聚類模塊值Q=0.809 2,平均輪廓S=0.923 4,與國內文獻相比,Q值和S值較小,但Q值仍大于0.32,S值大于0.7,表明聚類結果可信。前8個聚類依次是“structural health monitoring”“machine learning”“artificial intelligence”“wave overtopping”“system”“rainfall-runoff modeling”“reinforcement intelligence”“artificial neural networks”。可以看出國外建筑領域的神經網絡通常用于結構的健康監(jiān)測、結構的損傷識別以及流域降雨徑流、城市雨水徑流和河水徑流等。
2.4.3 研究前沿分析
通過CiteSpace中的“Burst Terms”對國內外文獻進行關鍵詞突發(fā)性算法分析,得到了國內外關鍵詞突現圖。國內關鍵詞突現如圖11所示,國外關鍵詞突現如圖12所示。由圖11可以看出,2009年國內將神經網絡多用于預測[15]和邊坡[16]方面;2018年“機器學習”開始突現,強度為6.59;2019年“深度學習”開始突現,強度為19.73,增長了將近3倍?!皺C器學習”和“深度學習”成為國內建筑領域神經網絡發(fā)展的轉折點。在這之前,神經網絡主要用于預測、識別結構損傷、對工程結構進行健康監(jiān)測以及對工程的造價進行預測等[17]。“機器學習”開始突現于2018年,至今尚未結束,是突現時間最長的詞,說明機器學習在近年來一直受到廣泛的關注。由圖12可以看出2009年國外就已經出現了神經網絡,比國內出現早。早期國外多將神經網絡用于識別、預測降雨徑流、河流流量和橋墩周圍的局部沖刷。中后期強度較大的關鍵詞是“genetic algorithm”,是國外建筑領域神經網絡發(fā)展的轉折點。在這之后,神經網絡的研究開始傾向于遺傳算法[18]、粒子群算法[19]、全局優(yōu)化[20]、海岸建筑[21]等方面。
圖11 CNKI關鍵詞突現圖
圖12 WOS關鍵詞突現圖
基于CiteSpace計量分析軟件,通過對2009—2022年CNKI和WOS中收錄的3 464篇文獻的年發(fā)文量、作者的合作關系、研究現狀、研究熱點和研究趨勢進行計量分析,可以得出:
(1)2009—2022年國內外在建筑領域內以神經網絡為主題的相關文獻發(fā)文量總體呈上升趨勢,并且國外近三年增幅巨大,說明目前該研究領域在國外受到廣泛關注。國內該領域的研究學者雖然較多,但是各個學者之間的合作較少,而國外研究學者之間有較密切的合作關系,并且發(fā)文量也較多。未來國內研究學者應該進一步加強團隊間的合作。
(2)各國的相關學者對于神經網絡的研究和發(fā)展都做出了重大的貢獻,其中美國、中國、英國等國學者的研究成果最豐富。在國際交流方面,國外在神經網絡研究領域的合作與交流較為密切,而我國與其他國家的交流相對較少,還需要加強國際合作與交流。
(3)神經網絡、預測、遺傳算法等關鍵詞出現頻率較高,說明當前研究熱點主要集中在這些方面。通過關鍵詞突現分析可以看出,近幾年國內外的研究主要集中在人工智能方向,這些研究方向可能仍然是未來的研究重點。