• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      滑動時間窗視角下科學基金研究前沿探測

      2015-03-22 00:45:00,,
      中華醫(yī)學圖書情報雜志 2015年10期
      關鍵詞:共詞山丘類群

      ,,

      研究前沿是某領域處于先鋒地位的研究內(nèi)容。想要更好地理解當下和未來的研究趨勢,需要時刻關注領域的研究前沿。

      國家自然科學基金作為我國支持基礎研究的主要渠道,自成立20多年來,在推動我國自然科學基礎研究的發(fā)展,促進基礎學科建設,發(fā)現(xiàn)、培養(yǎng)優(yōu)秀科技人才等方面取得了巨大成果。因此,國家自然科學基金的資助情況在一定程度上可反映出某領域的前沿熱點和發(fā)展趨勢。科技文獻是基金項目的成果,因此從基金資助層面探測研究前沿,能夠盡早識別領域的發(fā)展動向。

      然而,在探測研究前沿的過程中,研究時間窗的劃定是一個關鍵問題。大部分研究者傾向于根據(jù)主觀判斷選擇固定的研究時間窗,但固定時間窗不能很好地反映領域的動態(tài)變化,因此有研究人員開始傾向于選擇滑動時間窗探索研究前沿的演化[1]。本文采用互相重疊的5個滑動時間窗,通過實施共詞聚類方法來探測腫瘤領域的研究前沿,追蹤領域前沿的產(chǎn)生、發(fā)展、衰退和消失,以科學基金項目信息作為分析對象,采用基于滑動時間窗的主題時間序列分析方法探測該領域的研究前沿。

      1 研究前沿概述

      1965年,普賴斯就提出了研究前沿的概念[2],之后不同學者對研究前沿的概念內(nèi)涵進行了不同的定義和詮釋[3-7]。1974年,Small和Griffith參考Price的研究前沿的定義提出了用共被引聚類分析得到的高被引文獻簇能很好地表征研究前沿[3]。1994 年 ,Garfield 提出研究前沿是隨著領域的發(fā)展而不斷產(chǎn)生的新分支,通過 ISI 的研究工具可以跟蹤前沿的生長期和衰退期[4]。同年,Persson 提出了研究領域結構由知識基礎和前沿組成,被引用的文獻構成知識基礎,引用知識基礎的文獻為研究前沿[5]。2003年,Morris將前沿定義為傾向于引用固定的、時間不變的基礎文獻的文獻聚類,采用時間線可視化方法研究了炭疽研究相關文獻所體現(xiàn)出來的相關科學研究的時間變化[6];Chen在CiteSpace II中同樣定義了研究前沿的概念,將其定義為一種新興的趨勢,一組瞬時的概念和潛在的研究問題[7]。

      目前研究前沿的識別方法大體可分為基于引用關系的方法、基于文本內(nèi)容的方法、基于統(tǒng)計學的方法以及混合分析方法四種?;谝藐P系的方法主要是基于共被引、文獻耦合、直接引用的方法,運用引文分析法探測研究前沿已較為成熟,Naoki Shibata等[8]、BoJarneving[9]、Schiebel Edgar[10]分別基于不同的引文類型對研究前沿展開了分析和研究?;谖谋緝?nèi)容的方法主要是基于詞頻、共詞以及文本挖掘自動探測的方法。由于引文的滯后性,許多學者試圖從文本內(nèi)容入手探測更直接、更有說服力、更有價值的研究前沿,如2002年Kleinberg[11]提出基于詞頻變化程度的突發(fā)檢測算法來探測研究前沿,并在2009年被陳超美博士整合到CiteSpaceⅡ軟件中[12]。共詞分析能夠最大程度地發(fā)揮詞頻分析的優(yōu)勢,更深入地挖掘文獻資料,因此越來越多的研究者將目光轉向共詞分析,如An和Qing Qiang Wu[13]、許振亮[14]等運用共詞分析法探測研究前沿?;谖谋就诰蜃詣犹綔y的方法是前沿探測上的一個新趨勢,Pottenger等[15]已進行了相關研究。

      此外,部分學者還采用了因子分析[16]、多維統(tǒng)計分析方法[17]以探測研究前沿?;旌戏治龇椒ㄖ饕菍⒒谝藐P系的方法與基于共詞分析的方法結合起來。Braam等[18]最早提出將詞和共被引結合起來,揭示研究前沿,隨后Besselaar和Heimeriks[19]提出一種詞—引文共現(xiàn)的方法。盡管前沿探測方法多樣,但存在兩個共性的問題:一是主要以分析科技文獻為主,二是大多前沿探測研究選擇固定的時間窗。

      2 研究對象與方法

      2.1 樣本

      筆者利用國家自然科學基金委員會科學基金共享服務網(wǎng)站(http://npd.nsfc.gov.cn/fundingProjectSearchAction.action),檢索申請代碼為H16(腫瘤學),批準年度為2007-2015年間的項目數(shù)據(jù),共5 076條。

      2.2 研究方法

      采用基于滑動時間窗的共詞聚類分析方法,設定2007-2011年、2008-2012年、2009-2013年、2010-2014年4個互相重疊的滑動時間窗。

      共詞聚類分析法的原理是統(tǒng)計1組詞對在同1篇文章中出現(xiàn)的頻次,然后以此為基礎進行聚類分析,其結果可以顯示詞與詞之間的親疏關系,反映這些詞所代表的主題以及學科的結構關系,即所選取的詞對中,兩個詞共同出現(xiàn)的頻率越高,表明這兩個詞的關聯(lián)強度越高,這兩個詞代表的熱點或領域關系越密切[20]。

      共詞聚類分析的步驟分為數(shù)據(jù)的獲取和處理、共詞矩陣的建立,聚類分析、結果可視化展示。筆者采用gCLuto軟件進行聚類分析,相似性度量函數(shù)選擇默認的cosine函數(shù),判別函數(shù)為I2。該軟件可提供四種聚類方法:Repeated Bisection(重復二分法),Direct(直接聚類),Agglomerative(凝聚聚類)和Graph(圖形聚類)。目前,沒有一個既定的規(guī)則來選擇聚類的方法與水平,一般取決于作者對聚類結果的判斷與平衡[21]。在gCLuto軟件的聚類結果報告中包括聚類選擇的方法和一些關于所得類群的統(tǒng)計學指標,見表1。

      表1 聚類參數(shù)對照

      其中類間平均相似度(Esim)越小、類內(nèi)平均相似度(Isim)越大,聚類效果越優(yōu)。分別用四種聚類方法對數(shù)據(jù)集進行聚類,通過比較聚類結果的類間相似度與類內(nèi)相似度來判斷最優(yōu)聚類方法。

      可視化結果通過gCLuto軟件繪制出的山丘圖呈現(xiàn)。可視化山丘用于展示類群的相對相似性、聚類的數(shù)量、類內(nèi)相似性、類內(nèi)標準差,山丘中每個類群被描述為三維地形的一個山丘,山丘的位置、體積、高度和顏色都描繪了相關類群的信息。

      3 結果與分析

      將數(shù)據(jù)集劃分為互相重疊的4個滑動時間窗。使用不同的聚類分析方法對4個數(shù)據(jù)集聚類,選取最優(yōu)聚類方法。對4個時間窗內(nèi)的數(shù)據(jù)進行共詞聚類,分析研究前沿及其演化。

      3.1 聚類效果分析

      Repeated Bisection(重復二分法),Direct(直接聚類),Agglomerative(凝聚聚類)和Graph(圖形聚類)四種聚類方法對不同時間窗數(shù)據(jù)的聚類結果如表2所示。

      表2 4種聚類廣場法的聚類結果

      其中,Agglomerative的類內(nèi)平均相似度(Isim)在2008-2012年、2009-2013年、2010-2014年三個時間窗最高,而其類間平均相似度(Esim)在2007-2011年、2008-2012年、2009-2013年最低;Graph的聚類結果也較為良好,類內(nèi)平均相似度(Isim)在2007-2011年最高,類間平均相似度(Esim)在2010-2014年最低;而Repeated Bisection與Direct的聚類結果較差。

      3.2 研究前沿分析

      通過比較聚類結果的類間相似度與類內(nèi)相似度,發(fā)現(xiàn)Agglomerative的聚類效果最優(yōu)。

      基于gCLuto軟件,采用Agglomerative算法對4個滑動時間窗內(nèi)的數(shù)據(jù)進行共詞聚類分析,并繪制可視化山丘圖,得出2007-2011年的10個研究熱點(圖1)。

      圖1 2007-2011年10個研究熱點的可視化山丘圖

      10個研究熱點的主要內(nèi)容為胃癌中p53蛋白的表達和胃癌細胞的RNA干擾研究,泌尿生殖器腫瘤的分子機制及信號通路,DNA甲基化和microRNA與胰腺癌、宮頸癌發(fā)生的表觀遺傳學機制研究,乳腺癌的EMT轉移、侵襲過程,食管癌抑癌基因異常甲基化;腦膠質(zhì)瘤、骨肉瘤、卵巢癌中腫瘤干細胞的分離,蛋白質(zhì)組學技術篩選鼻咽癌、結腸癌的相關基因,結腸癌信號轉導通路的轉錄調(diào)控研究,肝癌細胞凋亡研究,非小細胞肺癌靶向治療的耐藥機制研究。

      為直觀地顯示各研究熱點直接的關聯(lián),利用gCLuto軟件繪制了可視化山丘圖(圖1)。由圖1可見3,4,8號類群內(nèi)容關聯(lián)較為緊密,并有融合為一個研究主題的趨勢;其他類群相互獨立,聚類結果較理想。

      基于gCLuto軟件的Agglomerative算法,2008-2012年共得到10個研究熱點,詳見圖2。

      圖2 2008-2012年10個研究熱點的可視化山丘圖

      10個研究熱點的主要內(nèi)容為細胞自噬與多發(fā)性骨髓瘤細胞凋亡;針對腫瘤微環(huán)境進行靶向治療(例如宮頸癌、骨肉瘤),前列腺癌、食管癌、鼻咽癌的信號通路研究,肝細胞癌、結直腸癌的microRNA表達研究,胃癌、肺癌的轉移、侵襲,p53基因突變與腫瘤發(fā)生的相關性研究,抑癌基因異常甲基化,肝癌基因治療,腫瘤干細胞的分離及其信號轉導通路研究,乳腺癌EMT轉移。圖2中,3,4號類群較緊密,4,9號峰頂呈紅色,說明其為研究熱點。

      基于gCLuto軟件的Agglomerative算法,2009-2013年同樣共得到10個研究熱點,如圖3所示。

      10個研究熱點的主要內(nèi)容為抑癌基因異常甲基化,非小細胞癌信號通路的基因表達調(diào)控研究,針對腫瘤微環(huán)境對腫瘤干細胞進行靶向治療,肺腫瘤氣管、支氣管轉移,microRNA在基因治療方面的應用,經(jīng)EMT轉移的分子機制,p53基因突變與腫瘤發(fā)生的相關性研究,中樞神經(jīng)系統(tǒng)腫瘤DNA甲基化研究;乳腺癌EMT轉移,細胞自噬與多胃癌細胞凋亡。圖3中只有3,7號類群較獨立,其他類群類間相似度都較大,5,9類群為研究熱點。

      圖3 2009-2013年10個研究熱點的可視化山丘圖

      基于gCLuto軟件的Agglomerative算法,2010-2014年共得到10個研究熱點,詳見圖4。

      10個研究熱點的主要內(nèi)容為肝癌細胞、肝和肝內(nèi)膽管腫瘤細胞抑癌基因異常表達,乳腺腫瘤、前列腺腫瘤的腫瘤微環(huán)境,p53基因突變與肺癌的發(fā)生機制研究,中樞神經(jīng)系統(tǒng)腫瘤、腦膠質(zhì)瘤的腫瘤干細胞分離,肺腫瘤氣管、支氣管轉移,乳腺癌EMT轉移及其腫瘤干細胞研究,前列腺癌、直結腸癌的靶向治療分子機制,非小細胞肺癌細胞凋亡、自噬的信號通路研究,卵巢癌、鼻咽癌腫瘤發(fā)生的信號轉導通路,microRNA在肝癌、胰腺癌基因治療方面的應用。與2009-2013年10個研究熱點的可視化山丘圖相似,圖4中大部分研究類群沒有明顯的界限,僅3,4號類群較獨立,4號類群為該時期的研究熱點。

      圖4 2010-2014年10個研究熱點的可視化山丘圖

      3.3 前沿演化分析

      比較4個滑動時間窗內(nèi)的研究前沿,有的新增了研究內(nèi)容,有的研究重點發(fā)生了轉移。對比4個時期的研究熱點,共有11個研究前沿發(fā)生明顯改變。圖5顯示了不同時間窗內(nèi)各主題的相關文獻數(shù)量。

      圖5 不時時間窗內(nèi)各主題的相關文獻量

      如圖5所示,腫瘤微環(huán)境、中樞神經(jīng)系統(tǒng)腫瘤、肺腫瘤轉移、靶向治療為新的研究前沿。中樞神經(jīng)系統(tǒng)腫瘤的DNA甲基化及其干細胞分離,肺腫瘤經(jīng)氣管支氣管轉移,針對腫瘤微環(huán)境的靶向治療是具體的研究內(nèi)容。腫瘤干細胞的研究規(guī)模不斷增大,其研究重點由腫瘤干細胞的分離、信號轉導逐漸轉移到腫瘤微環(huán)境下腫瘤干細胞的研究。抑癌基因的研究規(guī)模較穩(wěn)定,近年來的研究前沿為肝和肝內(nèi)膽管腫瘤細胞抑癌基因異常表達。非小細胞肺癌的信號通路研究,乳腺癌的EMT轉移及其干細胞研究,腫瘤耐藥機制,p53基因突變與腫瘤發(fā)生機制為當下腫瘤學的研究前沿問題。隨著microRNA的研究規(guī)模逐漸擴大,其研究內(nèi)容由microRNA的表達轉移為在基因治療方面的應用。

      4 結語

      研究前沿探測是一個不斷發(fā)展的研究領域,探測技術層出不窮。筆者針對其共有問題,提出滑動時間窗視角下基于科學基金數(shù)據(jù)的方法來探測研究前沿。而如何從多角度、多層次來判斷一個學科的研究前沿,是后續(xù)努力的方向。

      猜你喜歡
      共詞山丘類群
      荒蕪的山丘城堡
      薏苡種質(zhì)資源ISSR分子標記篩選及親緣關系分析
      基于突變檢測與共詞分析的深閱讀新興趨勢分析
      圖書館建設(2018年5期)2018-07-10 09:46:40
      黑石頂自然保護區(qū)土壤動物功能類群對季節(jié)動態(tài)的響應
      微山丘——Lily Nails美甲店
      越過山丘,依舊是山
      中國三峽(2016年6期)2017-01-15 13:59:17
      山丘上的城市
      基于共詞知識圖譜技術的國內(nèi)VLC可視化研究
      基于關鍵詞共詞分析的我國親子關系熱點研究
      2011年春夏季黃海和東海微型浮游動物類群組成及其攝食的研究
      廊坊市| 贞丰县| 龙山县| 博爱县| 疏附县| 峡江县| 普宁市| 耒阳市| 儋州市| 高平市| 罗定市| 招远市| 南岸区| 普洱| 庐江县| 含山县| 长顺县| 鄂温| 丽水市| 阳春市| 湟源县| 西安市| 台前县| 内丘县| 绥阳县| 筠连县| 都江堰市| 上杭县| 多伦县| 林甸县| 陈巴尔虎旗| 定边县| 潼南县| 西盟| 会理县| 许昌县| 九寨沟县| 萍乡市| 杭州市| 英超| 高台县|