李美凝 趙雄虎 景民昌 王 飛
1. 中國(guó)石油大學(xué)(北京)圖書館, 北京 102249; 2. 中國(guó)石油大學(xué)(北京)石油工程學(xué)院, 北京 102249
石油作為人類社會(huì)能源的重要組成部分,在世界經(jīng)濟(jì)的發(fā)展、人類社會(huì)生活與文明中占有極其重要的地位。石油前沿領(lǐng)域的占領(lǐng)程度關(guān)系到國(guó)家在國(guó)際競(jìng)爭(zhēng)中的優(yōu)勢(shì)和地位。石油工程是石油領(lǐng)域最具代表性的工程技術(shù),是一種運(yùn)用科學(xué)的理論、方法、技術(shù)與裝備高效地鉆探地下油氣資源、最大限度并經(jīng)濟(jì)有效地將地層中的油氣開采到地面,安全地對(duì)油氣進(jìn)行分離、計(jì)量與儲(chǔ)運(yùn)的工程技術(shù)[1]。因此,針對(duì)石油能源領(lǐng)域,開展石油工程研究熱點(diǎn)和研究前沿的探索,對(duì)促進(jìn)石油工業(yè)可持續(xù)發(fā)展具有重要意義。
近年來(lái)文獻(xiàn)計(jì)量學(xué)技術(shù)迅速發(fā)展,為論文數(shù)據(jù)可視化研究提供了有效的途徑,文獻(xiàn)計(jì)量學(xué)具有處理文獻(xiàn)量大、直觀可視化、分析角度多樣、數(shù)據(jù)分析結(jié)果可信度高等優(yōu)勢(shì)特點(diǎn),彌補(bǔ)了傳統(tǒng)文獻(xiàn)綜述研究參考文獻(xiàn)量少、只能定性歸納和分析、客觀性較弱等不足[2]。社會(huì)網(wǎng)絡(luò)分析方法是對(duì)各種不同單元的社會(huì)結(jié)構(gòu)及其屬性進(jìn)行分析的方法,能夠可視化合作網(wǎng)絡(luò)、引文網(wǎng)絡(luò)以及主題關(guān)聯(lián)網(wǎng)絡(luò)等,為領(lǐng)域主題發(fā)現(xiàn)、領(lǐng)域結(jié)構(gòu)挖掘和技術(shù)預(yù)測(cè)等提供重要途徑[3]。目前,基于文獻(xiàn)計(jì)量學(xué)和社會(huì)網(wǎng)絡(luò)方法的數(shù)據(jù)可視化技術(shù)已經(jīng)在不同領(lǐng)域被廣泛應(yīng)用[4-5],如鄭江平等[6]基于可視化軟件進(jìn)行了食品科學(xué)領(lǐng)域國(guó)際論文合作的文獻(xiàn)計(jì)量分析;曾碩勛等[7]利用可視化軟件形成了材料科學(xué)研究熱點(diǎn)及其相關(guān)研究領(lǐng)域可視化知識(shí)圖譜;欒春娟等[8]通過(guò)文獻(xiàn)共被引和高頻關(guān)鍵詞分析對(duì)基因操作技術(shù)進(jìn)行國(guó)際前沿分析,得到基因操作技術(shù)領(lǐng)域的經(jīng)典文獻(xiàn)和研究熱點(diǎn)關(guān)鍵詞。文獻(xiàn)計(jì)量學(xué)和社會(huì)網(wǎng)絡(luò)方法的數(shù)據(jù)可視化技術(shù)已經(jīng)成為探索領(lǐng)域研究熱點(diǎn)和分析領(lǐng)域現(xiàn)狀、熱點(diǎn)及前沿問題的重要方法。
本文以Web of Science核心合集數(shù)據(jù)庫(kù)作為數(shù)據(jù)來(lái)源,從文獻(xiàn)計(jì)量學(xué)角度和社會(huì)網(wǎng)絡(luò)分析方法入手,對(duì)2008-2018年全球石油工程領(lǐng)域的文獻(xiàn)進(jìn)行統(tǒng)計(jì),以期用定量化、可視化的手段,梳理近10年間該領(lǐng)域的發(fā)展態(tài)勢(shì)及研究熱點(diǎn),全面揭示石油工程領(lǐng)域的研究進(jìn)展和國(guó)際競(jìng)爭(zhēng)力,為該領(lǐng)域科研人員和科研機(jī)構(gòu)把握領(lǐng)域走向、洞悉未來(lái)研究熱點(diǎn)等提供科研參考。
本文選擇Web of Science核心合集數(shù)據(jù)庫(kù)的251個(gè)領(lǐng)域分類中的石油工程類(engineering petroleum)作為數(shù)據(jù)源。在Science Citation Index Expanded(SCI-E)數(shù)據(jù)庫(kù)中檢索2008-2018年相關(guān)論文21 082篇,文獻(xiàn)類型包括學(xué)術(shù)論文(article)和研究綜述(review)。對(duì)Web of Science中的數(shù)據(jù)采用“全記錄與引用的參考文獻(xiàn)”的“UTF-8”格式導(dǎo)出,對(duì)原始數(shù)據(jù)進(jìn)行清洗,包括去重、去空白等操作之后,總計(jì)得到論文17 656篇,形成最終的分析數(shù)據(jù)。
本文采用文獻(xiàn)計(jì)量分析中的共詞分析法(Co-word analysis)作為研究方法。共詞分析法是內(nèi)容分析法的一種,該方法不僅考慮了詞組在文本中出現(xiàn)的頻數(shù),而且通過(guò)詞語(yǔ)的共現(xiàn)建立起詞組之間的親疏關(guān)系。主要通過(guò)統(tǒng)計(jì)相同或不同類型的知識(shí)單元(包括作者、關(guān)鍵詞、機(jī)構(gòu)、參考文獻(xiàn)等)在同一篇文獻(xiàn)中出現(xiàn)的次數(shù),構(gòu)建不同知識(shí)單元的共現(xiàn)頻數(shù)矩陣,通過(guò)網(wǎng)絡(luò)化的方式進(jìn)行表示,最終通過(guò)一定的算法比較清晰地劃分出網(wǎng)絡(luò)節(jié)點(diǎn)的群組結(jié)構(gòu),以知識(shí)圖譜的形式展示文獻(xiàn)中知識(shí)單元的聯(lián)系程度,從而判斷出研究領(lǐng)域的變化情況[9-11]。文中借助Vosviewer和Gephi軟件進(jìn)行該方法的實(shí)現(xiàn)和可視化展示,本文研究方法見圖1。
圖1 石油工程的文獻(xiàn)計(jì)量學(xué)研究方法示意圖Fig.1 Sketch of bibliometrics research methods in petroleum engineering
石油工程領(lǐng)域從2008-2018年的論文總體產(chǎn)出情況見圖2,發(fā)文量指每年發(fā)表論文的總數(shù),被引量指當(dāng)年所發(fā)表的論文在目前時(shí)間節(jié)點(diǎn)上被引用次數(shù)的多少。整
圖2 石油工程的發(fā)文量和被引量(2008-2018)示意圖Fig.2 The publication volume and citation volume of petroleum engineering(2008-2018)
體上,發(fā)文量都是隨著時(shí)間的增加而增加,被引量都是隨著時(shí)間的增加而減少。具體如下:全球發(fā)文量從2008年開始至2010年略有下滑,而從2011年開始,呈現(xiàn)緩慢增長(zhǎng)趨勢(shì),年均增長(zhǎng)率為6.7%,最高達(dá)到16%。中國(guó)發(fā)文量從2008年開始一直呈現(xiàn)增長(zhǎng)的趨勢(shì),年均增長(zhǎng)率為17.9%,最高達(dá)到36%。隨著時(shí)間的累計(jì),全球被引量從2008年開始出現(xiàn)鋸齒狀波動(dòng),在2015年開始逐年大幅度下降;而中國(guó)的被引量則從2008年至2011年緩慢增長(zhǎng),隨后大幅增長(zhǎng),直到2015年開始下降,主要是和被引頻數(shù)的時(shí)間屬性相關(guān)。
石油工程領(lǐng)域主要研究?jī)?nèi)容為油氣鉆探、開采、集輸?shù)仁凸I(yè)過(guò)程。該領(lǐng)域內(nèi)容廣泛,涉及力學(xué)、化學(xué)、機(jī)械、數(shù)學(xué)等多個(gè)領(lǐng)域的基礎(chǔ)理論和現(xiàn)代技術(shù)[12],其發(fā)表論文的雜志也很多,國(guó)內(nèi)石油院校及相關(guān)科研單位研究人員普遍認(rèn)可的石油工程SCI收錄期刊主要有26種,而國(guó)外石油院校所發(fā)表論文涉及期刊更廣泛[13]。其中Web of Science核心合集數(shù)據(jù)庫(kù)中關(guān)于石油工程的分類,每年都會(huì)有微小變化,但SCI-E石油工程類別中的論文主要發(fā)表在20類國(guó)內(nèi)外主要被認(rèn)可期刊上,見表1。
表1 2008-2018年石油工程方向的期刊列表
研究石油工程的作者共有36 362位,其中發(fā)文多于1篇的作者有10 558人,占總作者數(shù)的29%。根據(jù)文獻(xiàn)計(jì)量學(xué)的普賴斯定律[14],領(lǐng)域中核心作者的最低發(fā)文數(shù)量應(yīng)滿足如下公式:
(1)
式中:nmax為最高產(chǎn)作者的發(fā)文數(shù)量,篇;m為核心作者發(fā)文數(shù)量,篇。
由式(1)可以計(jì)算出石油工程領(lǐng)域核心作者的最低發(fā)文量為8篇,即發(fā)文量在8以上的作者為石油工程的核心作者,共790位,占總作者數(shù)的2.17%,此處核心作者包括獨(dú)作者、第一作者、合作者等。由于核心作者數(shù)量較多,表2僅列出了石油工程發(fā)文量超過(guò)30篇的作者,共20名。根據(jù)數(shù)據(jù)顯示,這20位核心作者共計(jì)發(fā)表文章882篇,總共被引次數(shù)為5 404,作者來(lái)源最多的是俄羅斯(310篇)、美國(guó)(227篇)、中國(guó)(140篇)。
表2 全球石油工程發(fā)文量在30篇以上的核心作者(僅限選定期刊)
科技論文產(chǎn)出的國(guó)家和機(jī)構(gòu)分析利用研究人員快速地辨識(shí)全球重要研究力量的分布,對(duì)科學(xué)研究成果的吸收和科學(xué)研究合作有重要的指導(dǎo)意義。[15]石油工程的研究覆蓋111個(gè)國(guó)家/地區(qū),發(fā)文量在10篇以上的國(guó)家和地區(qū)有66個(gè)。其中,中國(guó)(4 947篇)、美國(guó)(3 009篇)、俄羅斯(1 688篇)和伊朗(1 420篇)發(fā)文量最高,石油工程文獻(xiàn)的研究國(guó)家分布也顯示了這些國(guó)家對(duì)該領(lǐng)域的重視程度。
進(jìn)一步統(tǒng)計(jì)石油工程文獻(xiàn)的發(fā)文機(jī)構(gòu),從5 053個(gè)機(jī)構(gòu)中選擇最小發(fā)文量為8篇的機(jī)構(gòu),總共490個(gè)機(jī)構(gòu),進(jìn)行分析合作網(wǎng)絡(luò)展示見圖3,節(jié)點(diǎn)表示不同的發(fā)文機(jī)構(gòu),節(jié)點(diǎn)大小代表發(fā)文量的多少,節(jié)點(diǎn)越大,發(fā)文量越多;不同的顏色代表不同的聚類,同一顏色表明該聚類中的機(jī)構(gòu)聯(lián)系比較緊密;在社會(huì)合作網(wǎng)絡(luò)中,兩個(gè)機(jī)構(gòu)連線越多,表示機(jī)構(gòu)和其他機(jī)構(gòu)之間的直接合作越多。節(jié)點(diǎn)在圖中的位置由其社會(huì)網(wǎng)絡(luò)屬性中的中心度決定,網(wǎng)絡(luò)內(nèi)節(jié)點(diǎn)之間的遠(yuǎn)近可反映主題內(nèi)容的親疏關(guān)系[16-17]。節(jié)點(diǎn)之間的距離代表了不同節(jié)點(diǎn)的相似度,相似度越高,節(jié)點(diǎn)之間的距離越短,越容易形成聚類。
圖3 全球石油工程領(lǐng)域機(jī)構(gòu)合作網(wǎng)絡(luò)圖Fig.3 Global network of petroleum engineering institutions
首先,機(jī)構(gòu)合作網(wǎng)絡(luò)圖中有5個(gè)比較明顯的聚類集,分別為中國(guó)簇集、美國(guó)簇集、伊朗簇集、俄羅斯簇集以及英國(guó)簇集。其中以德克薩斯奧斯汀分校為代表的美國(guó)簇集位于網(wǎng)絡(luò)圖的正中間,且與其他節(jié)點(diǎn)之間的連線比較多,說(shuō)明與其他機(jī)構(gòu)的合作比較密切,合作機(jī)構(gòu)范圍比較廣泛,位于石油工程的領(lǐng)軍位置。而以俄羅斯科學(xué)院為代表的俄羅斯簇集位置相對(duì)比較孤立,位于網(wǎng)絡(luò)圖的右側(cè),說(shuō)明其與全球其他機(jī)構(gòu)的合作比較少。其次,從單獨(dú)機(jī)構(gòu)節(jié)點(diǎn)分析,中國(guó)石油大學(xué)(北京)的節(jié)點(diǎn)最大,說(shuō)明其發(fā)文量最多,居全球之首(1 199篇),中國(guó)石油(1 050篇)、中國(guó)石化(816篇)緊隨其后,具體見表3。
表3 全球石油工程機(jī)構(gòu)按照發(fā)文量的排名表(發(fā)文量TOP 25)(限所選期刊)
關(guān)鍵詞是文章研究?jī)?nèi)容和研究主題的集中體現(xiàn),對(duì)關(guān)鍵詞的分析,有利于挖掘領(lǐng)域或?qū)I(yè)方向最核心的研究?jī)?nèi)容,以及研究主題的發(fā)展態(tài)勢(shì)[18]。本文熱點(diǎn)主題的分析從關(guān)鍵詞頻數(shù)和關(guān)鍵詞中介中心度兩個(gè)角度進(jìn)行考量:關(guān)鍵詞頻數(shù)指關(guān)鍵詞出現(xiàn)的次數(shù),體現(xiàn)相關(guān)研究的成果數(shù)量;一個(gè)關(guān)鍵詞中介中心度越高,說(shuō)明該關(guān)鍵詞對(duì)整個(gè)網(wǎng)絡(luò)資源的控制能力就越強(qiáng),即認(rèn)為其代表的研究領(lǐng)域比較關(guān)鍵[19]。對(duì)關(guān)鍵詞頻數(shù)排名前20的關(guān)鍵詞計(jì)算其中介中心度,按照其重要性依次為重油、提高采收率、滲透率、稠油、數(shù)值模擬、流變學(xué)、水力壓裂、水平井、頁(yè)巖氣、催化劑、瀝青質(zhì)、脫硫作用、人工神經(jīng)網(wǎng)絡(luò)以及水驅(qū)等。
對(duì)文章作者提供的22 254個(gè)關(guān)鍵詞進(jìn)行分析,選擇最少出現(xiàn)次數(shù)為12次的658個(gè)關(guān)鍵詞進(jìn)行聚類分析,繪制出全球石油工程研究主題聚類時(shí)間線圖,見圖4。不同的顏色代表不同的聚類集,同一顏色表明該聚類中的關(guān)鍵詞相互聯(lián)系比較緊密。每個(gè)聚類內(nèi)部按主題出現(xiàn)的平均年份沿縱軸從下到上進(jìn)行排列,各聚類之間則沿橫軸按照不同聚類集合從左到右進(jìn)行排列,節(jié)點(diǎn)大小代表關(guān)鍵詞頻數(shù),節(jié)點(diǎn)越大說(shuō)明出現(xiàn)次數(shù)越多。
圖4中,橫向上是不同關(guān)鍵詞形成的聚類簇,可以看出具有比較明顯的8個(gè)聚類集合,橫向上從左到右依次為:原油脫硫,瀝青質(zhì)和稠油,水力壓裂,提高采收率技術(shù),頁(yè)巖油或者油頁(yè)巖,數(shù)值模擬,注水、注二氧化碳,重油開發(fā)??v向上,隨著時(shí)間的增加,致密油藏壓裂,機(jī)器學(xué)習(xí)與支持向量機(jī),油頁(yè)巖熱解,膜分離、過(guò)渡金屬,致密砂巖壓裂,EOR用納米粒子、乳狀液穩(wěn)定性,多相流計(jì)算流體力學(xué)等詞是較新出現(xiàn)的關(guān)鍵詞,認(rèn)為其代表的研究領(lǐng)域具有一定前沿性。
圖4 全球石油工程關(guān)鍵詞時(shí)間線圖(2008-2018)Fig.4 Time map of global petroleum engineering keywords (2008-2018)
目前對(duì)前沿主題的識(shí)別方法都強(qiáng)調(diào)主題距離當(dāng)前的時(shí)間要近、影響力要大[20],但領(lǐng)域研究前沿在核心論文數(shù)和總被引頻次上會(huì)相對(duì)較小,本研究中采用主題平均時(shí)間方法和主題詞增長(zhǎng)率方法對(duì)前沿主題進(jìn)行綜合識(shí)別。
主題平均時(shí)間方法認(rèn)為如果一個(gè)主題在某個(gè)時(shí)間范圍內(nèi),平均時(shí)間距離現(xiàn)在越近,那么該主題就很可能是石油工程所關(guān)注的前沿主題。但實(shí)際中,發(fā)現(xiàn)石油工程主題的平均時(shí)間比較集中,主題頻數(shù)的大小與主題的平均年份不相關(guān),為了識(shí)別新興前沿,選擇主題平均時(shí)間大于或等于2016年的詞,得到石油工程領(lǐng)域前20的前沿主題詞,見如圖5。
文獻(xiàn)關(guān)鍵詞出現(xiàn)頻數(shù)可以反映相關(guān)內(nèi)容的重要程度,但會(huì)忽略一些出現(xiàn)頻數(shù)不高但是前沿的主題,而主題詞增長(zhǎng)率可以彌補(bǔ)前沿關(guān)鍵詞出現(xiàn)次數(shù)少、被引頻數(shù)少的缺點(diǎn)。因此,對(duì)以上得到的重要前沿主題詞,進(jìn)行2019年增長(zhǎng)率計(jì)算,具體見表5。
圖5 石油工程領(lǐng)域前沿主題詞的頻次時(shí)間分布圖Fig.5 Frequency time distribution of petroleum engineering frontier keywords
表5 石油工程領(lǐng)域前沿主題的2019年增長(zhǎng)率表(TOP 10)
研究發(fā)現(xiàn)致密油藏、機(jī)器學(xué)習(xí)、預(yù)測(cè)模型、致密砂巖、井漏、自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)都是增長(zhǎng)率較高的主題詞。其中機(jī)器學(xué)習(xí)的增長(zhǎng)率最快,同時(shí)分析2008-2018年之間發(fā)表的17篇關(guān)于機(jī)器學(xué)習(xí)的論文,發(fā)現(xiàn)中國(guó)發(fā)文量占比35%,且2019年機(jī)器學(xué)習(xí)的論文篇數(shù)迅速增長(zhǎng),2013年伊朗的波斯灣大學(xué)(Persian Gulf Univ)最早將機(jī)器學(xué)習(xí)應(yīng)用于稠油研究,國(guó)內(nèi)中國(guó)地質(zhì)大學(xué)于2015年將機(jī)器學(xué)習(xí)應(yīng)用于測(cè)井解釋。綜上認(rèn)為機(jī)器學(xué)習(xí)是近年快速發(fā)展的研究方向。尤其隨著大數(shù)據(jù)時(shí)代的來(lái)臨,計(jì)算機(jī)技術(shù)的快速發(fā)展,人工智能等前沿領(lǐng)域滲入到油氣行業(yè)已是大勢(shì)所趨,未來(lái)我國(guó)石油研究者要對(duì)新興產(chǎn)業(yè)引起足夠重視,在交叉領(lǐng)域方面投入更多時(shí)間和精力,才能占領(lǐng)科學(xué)前沿。
通過(guò)對(duì)石油工程領(lǐng)域SCI-E相關(guān)論文的文獻(xiàn)計(jì)量學(xué)分析,得出以下結(jié)論。
1)2008-2018年,石油工程的研究論文總體上呈穩(wěn)步增長(zhǎng)的趨勢(shì)。發(fā)文量最多的國(guó)家是中國(guó),其次為美國(guó)和俄羅斯,中國(guó)學(xué)者與機(jī)構(gòu)在石油工程領(lǐng)域的國(guó)際影響力大幅提高。
2)石油工程領(lǐng)域研究關(guān)注點(diǎn)已逐步從常規(guī)資源轉(zhuǎn)向了非常規(guī)資源的開發(fā),當(dāng)前研究熱點(diǎn)主要為提高采收率、水力壓裂、非常規(guī)油氣資源、重油開發(fā)、油藏?cái)?shù)值模擬以及原油脫硫。其中非常規(guī)油氣資源中的頁(yè)巖油氣相關(guān)的研究最多,影響力也最大。
3)石油工程未來(lái)前沿?zé)狳c(diǎn)突顯出兩個(gè)方面,分別是非常規(guī)油氣藏開發(fā)和機(jī)器學(xué)習(xí)。隨著技術(shù)的進(jìn)步,非常規(guī)資源的開采技術(shù)也亟需完善,將成為持續(xù)的研究熱點(diǎn)。而隨著AI人工智能和大數(shù)據(jù)的推廣,必然會(huì)在將來(lái)很大程度地影響石油工程技術(shù)發(fā)展,因此兩者的交叉領(lǐng)域?qū)⑹橇硪粋€(gè)研究前沿?zé)狳c(diǎn)。
本研究也存在一些局限:石油工程領(lǐng)域的研究熱點(diǎn)與前沿中,大多數(shù)主題詞都是關(guān)于油氣田開發(fā)方向,而關(guān)于油氣井工程與油氣儲(chǔ)運(yùn)方向的較少,分析認(rèn)為是由于SCI-E中石油工程一類所包含期刊的局限性造成的;石油工程的數(shù)據(jù)類型是多種多樣,就科技文本類型而言,就包含了科技論文、專著、專利、管理制度、法律法規(guī)等,但本文僅選擇了影響力較高期刊的article和review作為文本類型。石油工程作為一個(gè)工科領(lǐng)域,涉及的領(lǐng)域方向較多,發(fā)表論文的期刊也較廣,不可能窮盡,但以行業(yè)內(nèi)的主要刊物作為研究對(duì)象,其結(jié)果仍然具有積極意義,今后的研究中將采用更科學(xué)有效的方法對(duì)數(shù)據(jù)源進(jìn)行探討,以確保結(jié)果的有效性。