程潔瓊 萬小萍 劉向
摘 要:[目的/意義]技術(shù)軌道可以用于發(fā)現(xiàn)特定技術(shù)領(lǐng)域內(nèi)連續(xù)性和非連續(xù)性的創(chuàng)新變化。[方法/過程]本文提出基于邊鏈接影響力流的主路徑搜索算法,該方法首先采用引文網(wǎng)絡(luò)中影響力傳遞算法對引文網(wǎng)絡(luò)路徑的影響力流進(jìn)行計(jì)量和賦值,然后通過主路徑全局搜索算法得到影響力總和最大的技術(shù)主路徑。[結(jié)果/結(jié)論]相比傳統(tǒng)的主路徑分析方法,該方法對于引文鏈接權(quán)值度量的描述更加明確合理。對海水淡化領(lǐng)域的實(shí)證表明,相比傳統(tǒng)的主路徑分析法,該方法能夠在主路徑中找到更早的起源節(jié)點(diǎn),技術(shù)主路徑的演化過程更加明晰。
關(guān)鍵詞:主路徑分析;技術(shù)路徑;影響力傳遞;PageRank;引證網(wǎng)絡(luò)
DOI:10.3969/j.issn.1008-0821.2019.05.003
〔中圖分類號〕G306 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編號〕1008-0821(2019)05-0024-06
Abstract:[Purpose/Significance]Technological path can be used to discover innovative changes of continuity and discontinuities in specific technological fields.[Method/Process]In this paper,a technological main path searching algorithm based on the influence flow of links in citation network is proposed.Firstly,the influence flow of the citation network path is measured and assigned by the influence transfer between two nodes algorithm in the citation network,and then using the global search method to extract the technology main path with the largest total influence flow is obtained.[Result/Conclusion]Compared with the traditional main path analysis method,this method is clearer and more reasonable for the description of the value of the influence flow in the citation link.We adopt the data in the field of desalination and the results show that compared with the traditional main path analysis method,this method can find the earlier origin node in the main path,and the evolution process of the technical main path is clearer.
Key words:main path analysis;technological path;influence flow;PageRank;citation network
最早由經(jīng)濟(jì)學(xué)家Dosi G提出的技術(shù)路徑又被稱作技術(shù)軌道、技術(shù)演進(jìn)路徑,可用于發(fā)現(xiàn)特定技術(shù)領(lǐng)域內(nèi)連續(xù)性和非連續(xù)性的創(chuàng)新變化[1]。特定領(lǐng)域內(nèi)的技術(shù)突破和革新往往被視為社會變革的基礎(chǔ),通常伴隨著持續(xù)的技術(shù)改進(jìn)以及通過知識傳播衍生出的多條技術(shù)路徑[2]。這些特定領(lǐng)域內(nèi)的原有技術(shù)會通過發(fā)展而不斷的分化和融合,原有技術(shù)雖然最終會被新的技術(shù)所取代,但也會成為這個(gè)領(lǐng)域內(nèi)技術(shù)主路徑上的一個(gè)節(jié)點(diǎn)。
技術(shù)主路徑是技術(shù)發(fā)展的主干,它包含技術(shù)發(fā)展過程中的最關(guān)鍵節(jié)點(diǎn)以及這些關(guān)鍵節(jié)點(diǎn)之間的鏈接關(guān)系。專利文獻(xiàn)包含關(guān)于專利創(chuàng)新的詳細(xì)描述,從中提取出的主路徑更能夠體現(xiàn)技術(shù)的繼承和發(fā)展關(guān)系[3]。2007年,Verspagen B在專利引證網(wǎng)絡(luò)中通過主路徑分析方法得到了燃料電池領(lǐng)域內(nèi)80年代前后不同階段的演進(jìn)主路徑[4],由此開啟了將主路徑的演進(jìn)和專利引證網(wǎng)絡(luò)相結(jié)合的研究。
傳統(tǒng)的主路徑分析的方法主要基于SPx算法獲得,分別是節(jié)點(diǎn)對投影數(shù)(NPPC,Node Pair Projection Count),搜索路徑節(jié)點(diǎn)對(SPLC,Search Path Link Count)和搜索路徑節(jié)點(diǎn)對(SPNP,Search Path Link Count)[5-7]以及搜索路徑數(shù)(SPC,Search Path Count)算法,這4種算法都是基于遍歷計(jì)數(shù)思想將網(wǎng)絡(luò)中的邊賦權(quán)重值[8]。雖然傳統(tǒng)的SPx算法被廣泛應(yīng)用在不同學(xué)科的引文主路徑分析中,但基于邊遍歷賦值的計(jì)算存在以下問題:被引頻次高和參考文獻(xiàn)多的文獻(xiàn)會獲得更多的遍歷計(jì)數(shù),被引頻次高表明受到較多的關(guān)注和肯定,是衡量節(jié)點(diǎn)和邊重要性的主要指標(biāo),然而參考文獻(xiàn)多卻不一定反映經(jīng)由此節(jié)點(diǎn)的邊很重要。同時(shí),被遍歷次數(shù)相同的邊在引證網(wǎng)絡(luò)中的重要性也是不同的,傳統(tǒng)的SPx算法中的邊遍歷思想賦值未考慮邊初始值差異對整個(gè)引證網(wǎng)絡(luò)帶來的影響[9]。
本文提出了一種有別于傳統(tǒng)主路徑的基于邊遍歷計(jì)算權(quán)重值的算法,根據(jù)在專利引證網(wǎng)絡(luò)中影響力由施引專利到被引專利傳遞的思想,提出了邊鏈接影響力流指標(biāo),通過對引文網(wǎng)絡(luò)的每條路徑的影響力流傳遞值計(jì)算賦值,然后采用主路徑全局搜索方法得到影響力流總和最大的技術(shù)主路徑。最后,我們通過實(shí)證比較分析該方法與傳統(tǒng)主路徑分析方法的異同。
1 相關(guān)研究
1.1 主路徑分析
引證關(guān)系往往體現(xiàn)了知識流在網(wǎng)絡(luò)中的流動(dòng)過程[10]。SCI的創(chuàng)始人Garfield E于20世紀(jì)60年代提出引證網(wǎng)絡(luò)(Citation Networks),他指出引證網(wǎng)絡(luò)可以反映出知識的延續(xù)性和繼承性,從而可用于研究科學(xué)知識發(fā)展的歷史、脈絡(luò)和結(jié)構(gòu)[11]。引證網(wǎng)絡(luò)通常由節(jié)點(diǎn)和有向邊表示,有節(jié)點(diǎn)i指向節(jié)點(diǎn)j的有向邊表示節(jié)電i被節(jié)電j引用,如圖1所示。
主路徑分析方法可以發(fā)現(xiàn)隱藏在引證網(wǎng)絡(luò)中的技術(shù)發(fā)展脈絡(luò),找到在某一段時(shí)間內(nèi)對此領(lǐng)域產(chǎn)生特定推動(dòng)作用的節(jié)點(diǎn)。最早的提出者Hummon N P等認(rèn)為主路徑分析可以很好地識別出DNA引證網(wǎng)絡(luò)的重要發(fā)展,并提出3種給引證網(wǎng)絡(luò)的邊賦權(quán)重的算法NPPC、SPLC、SPNP,這3種算法都是通過優(yōu)先搜索(Priority First Search)出引證網(wǎng)絡(luò)中緊密的子網(wǎng)絡(luò),再進(jìn)行窮盡路徑搜索(Exhaustive Path Search)的方法識別出主路徑。
2003年,Batagelj V在前3種遍歷算法基礎(chǔ)上進(jìn)一步將主路徑分析法應(yīng)用于大型引證網(wǎng)絡(luò),提出了SPC算法。SPC算法通過遍歷某條邊所有從源節(jié)點(diǎn)到尾節(jié)點(diǎn)的次數(shù)計(jì)算出這條邊的權(quán)重值。相比于NPPC、SPLC和SPNP,SPC可以更快地計(jì)算出每條邊的權(quán)重,提高了運(yùn)算效率。Choi C等[12]在2009年提出FCNP(Forward Citation Node Pair)算法,通過正向引證關(guān)系將被引用節(jié)點(diǎn)出度值加1的乘積作為邊的FCNP值實(shí)現(xiàn)邊賦值,并將此方法作用于閃存系統(tǒng)網(wǎng)絡(luò)中得到技術(shù)的發(fā)展路徑。Persson O[13]通過在引證網(wǎng)絡(luò)中出現(xiàn)的共現(xiàn)和耦合的關(guān)系提出了WDC(Weighted Direct Citations)和NWDC(Normalized Weighted Direct Citation)方法計(jì)算邊的權(quán)重值,其中WDC為兩個(gè)節(jié)點(diǎn)的直接引證關(guān)系中共同被引和共同引用值的和,而NWDC在WDC的基礎(chǔ)上標(biāo)準(zhǔn)化了共同被引和共同引用值進(jìn)行計(jì)算。主路徑分析除了對算法的研究外,還需要通過合適的搜索方法提取主路徑。Hummon N P等在1989年提出的優(yōu)先搜索又被稱為局域搜索(Local Search),在篩選邊的過程中總是篩選出一個(gè)節(jié)點(diǎn)到另一個(gè)節(jié)點(diǎn)權(quán)重最大的邊。搜索出網(wǎng)絡(luò)內(nèi)擁有最大邊權(quán)重值總和主路徑的全局搜索(Global Search)可避免局域搜索可能帶來局部最優(yōu)問題[14]。但是無論是局域搜索或全局搜索都不可避免地將一些權(quán)重值大的邊篩除出搜索到的主路徑內(nèi),Liu J S等[15]在2012年提出關(guān)鍵路徑搜索(Key-route Search)的概念解決了這一問題。不同于局域搜索和全局搜索結(jié)果通常只為一條主路徑,關(guān)鍵路徑搜索將網(wǎng)絡(luò)中所有重要的邊全都包括在搜索的主路徑中,先找到整個(gè)網(wǎng)絡(luò)中權(quán)重最大的邊再去進(jìn)行局域或全局搜索選擇多條關(guān)鍵路徑。
為發(fā)現(xiàn)技術(shù)路徑的發(fā)展變化和趨勢,主路徑分析被學(xué)者應(yīng)用于各種不同領(lǐng)域的網(wǎng)絡(luò)。Zhu H M等[16]將主路徑分析方法應(yīng)用在線上社交網(wǎng)絡(luò)中,結(jié)果顯示每個(gè)有影響力的用戶都可以通過一條短的主路徑訪問另一個(gè)用戶,主路徑的分布顯示出顯著的社區(qū)效應(yīng)。Hatatchiyski I等[17]通過主路徑分析方法研究了線上學(xué)習(xí)社區(qū)維基學(xué)院中生物和電氣工程兩個(gè)領(lǐng)域內(nèi)的關(guān)鍵主題、對應(yīng)的范圍和結(jié)構(gòu)的發(fā)展,并分析了在線學(xué)習(xí)社區(qū)中協(xié)同知識工具和學(xué)習(xí)過程的關(guān)系。Mina A[18]等人通過對冠狀動(dòng)脈領(lǐng)域美國專利數(shù)據(jù)集統(tǒng)計(jì),揭示了醫(yī)學(xué)領(lǐng)域內(nèi)醫(yī)學(xué)的科學(xué)性和技術(shù)性的共同演進(jìn)。Harris J K等[19]通過主路徑研究了二手煙領(lǐng)域內(nèi)從風(fēng)險(xiǎn)因素的發(fā)現(xiàn)到干預(yù)措施的實(shí)施。
1.2 PageRank算法
PageRank由谷歌公司創(chuàng)始人Page L等于1998年提出,用于衡量www網(wǎng)頁的重要性程度的排序算法。該算法基于這樣的假設(shè):如果一個(gè)網(wǎng)頁被另一個(gè)重要的網(wǎng)頁鏈接,那么此網(wǎng)頁也是一個(gè)重要的網(wǎng)頁[20]。所以PageRank算法的本質(zhì)是根據(jù)網(wǎng)頁之間的相互鏈接對所有網(wǎng)頁的重要性程度進(jìn)行排序。假設(shè)有A、B、C和D4個(gè)網(wǎng)頁,B、C、D網(wǎng)頁分別都指向網(wǎng)頁A,此時(shí)網(wǎng)頁A的PR值為A、B、C3個(gè)網(wǎng)頁的PR值之和,即PR(A)=PR(B)+PR(C)+PR(D)。假設(shè)網(wǎng)頁B也同時(shí)鏈接到另外兩個(gè)網(wǎng)頁,網(wǎng)頁C也鏈接到網(wǎng)頁D,此時(shí)的PR(A)=PR(B)3+PR(C)2+PR(D)。
但是在計(jì)算機(jī)網(wǎng)絡(luò)中同時(shí)存在只對自己出鏈或者沒有出鏈的頁面,為了避免這些特殊頁面導(dǎo)致的PageRank值無法收斂的情況,PageRank算法引入了阻尼系數(shù)q,通常q=0.85,表示隨機(jī)瀏覽頁面的用戶總會以1-q的概率跳轉(zhuǎn)到網(wǎng)絡(luò)中任一個(gè)隨機(jī)的網(wǎng)頁。所以PagreRank算法實(shí)質(zhì)上是一個(gè)隨機(jī)游走過程,若計(jì)算機(jī)網(wǎng)絡(luò)中的有向圖表示為G(V,E),V表示節(jié)點(diǎn)的集合,E表示網(wǎng)絡(luò)中有向邊集合,節(jié)點(diǎn)vi,vj,vk,vh…∈V,eij∈E,eij表示網(wǎng)頁i指向網(wǎng)頁j的有向邊,任意網(wǎng)頁i的PR值可以表示為:
PageRank(i)=q*∑j∈VPR(i)L(i)+1-qN
其中L表示節(jié)點(diǎn)的出鏈數(shù)量,N表示網(wǎng)絡(luò)中節(jié)點(diǎn)的總數(shù)量。PageRank算法至今還被Google當(dāng)作識別重要網(wǎng)頁的標(biāo)志性方法之一[21]。
引證網(wǎng)絡(luò)和WEB網(wǎng)絡(luò)有相似的拓?fù)浣Y(jié)構(gòu),引文關(guān)系和網(wǎng)頁鏈接在本質(zhì)上有相近之處[22],體現(xiàn)的都是相鄰節(jié)點(diǎn)之間的指向關(guān)系和影響作用關(guān)系。PageRank通過網(wǎng)頁之間的鏈接關(guān)系計(jì)算網(wǎng)頁的重要性程度,引文網(wǎng)絡(luò)通過引用鏈接傳遞影響力值,PageRank算法也是本文提出的基于邊鏈接影響力流的路徑搜索的主要原理來源。
2 基于邊鏈接影響力流的路徑搜索
2.1 方法描述
在專利引證網(wǎng)絡(luò)中,施引文獻(xiàn)的影響力越大,被引節(jié)點(diǎn)的影響力也越大;同時(shí),施引文獻(xiàn)的參考文獻(xiàn)越多,每篇參考文獻(xiàn)(被引文獻(xiàn))所分的影響力越少。我們不妨將引用關(guān)系看作是一種投票,施引文獻(xiàn)引證其它文獻(xiàn),相當(dāng)于向那些文獻(xiàn)投票,施引文獻(xiàn)越重要,則其投出的票的重要性也越大;但是,如果施引文獻(xiàn)引證的文獻(xiàn)越多,則每篇被引文獻(xiàn)所分得的票數(shù)越少。節(jié)點(diǎn)的邊鏈接影響力傳遞規(guī)律可以表示為:施引節(jié)點(diǎn)的影響力越大,被引節(jié)點(diǎn)的影響力也越大;節(jié)點(diǎn)的被引次數(shù)越高,節(jié)點(diǎn)的影響力越大;節(jié)點(diǎn)的出邊越多,每條邊分得的影響力越小。
我們把引用鏈接視為節(jié)點(diǎn)影響力的流動(dòng)路徑,施引節(jié)點(diǎn)通過鏈接傳遞部分影響力到被引節(jié)點(diǎn),施引節(jié)點(diǎn)傳遞的影響力的大小與自身的影響力成正比,與自身參考文獻(xiàn)的數(shù)量成反比。而每個(gè)節(jié)點(diǎn)所獲得的影響力來自于其引證節(jié)點(diǎn)所傳遞影響力之和。通過圖1來描述以上關(guān)系:當(dāng)節(jié)點(diǎn)F引用節(jié)點(diǎn)B時(shí),F(xiàn)向B傳遞了一定比例的影響力,鏈接(F,B)上傳遞的影響力與節(jié)點(diǎn)F的影響力成正比,與F的出邊數(shù)量成反比,即節(jié)點(diǎn)F越重要時(shí),被其引節(jié)點(diǎn)A、B、C也越重要,而倘若它引用的節(jié)點(diǎn)過多時(shí),則每個(gè)分支所分得的重要性越少,傳遞的影響力流也越小。
2.2 操作步驟
第一步:數(shù)據(jù)預(yù)處理。處理專利數(shù)據(jù)得到專利網(wǎng)絡(luò)中的每個(gè)專利的專利號,專利引文、發(fā)表年份和專利發(fā)表國家,如表1所示。
第二步:構(gòu)建專利引證網(wǎng)絡(luò)。將收集到的數(shù)據(jù)集以及每個(gè)數(shù)據(jù)的引文文獻(xiàn)通過引證關(guān)系構(gòu)建出本文的專利引證網(wǎng)絡(luò)。
第三步:迭代計(jì)算專利引證網(wǎng)絡(luò)中所有節(jié)點(diǎn)的影響力IF值。首先給引證網(wǎng)絡(luò)內(nèi)的節(jié)點(diǎn)隨機(jī)賦初始值,根據(jù)馬爾可夫收斂定理可知[23],無論專利引證網(wǎng)絡(luò)中的初始值為多少,基于邊鏈接影響力流傳遞算法不斷迭代計(jì)算出的節(jié)點(diǎn)IF值最后都會收斂到一個(gè)穩(wěn)定值。在本文中采用0.5、0.6、0.7、0.8、0.9五個(gè)阻尼系數(shù)進(jìn)行實(shí)驗(yàn),發(fā)現(xiàn)不同的阻尼系數(shù)對應(yīng)的技術(shù)主路徑上的節(jié)點(diǎn)完全重合,所以在本文中不多對算法的阻尼系數(shù)做過多討論。
第四步:根據(jù)專利引證網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)的影響力值IF,計(jì)算專利引證網(wǎng)絡(luò)中所有有向邊的權(quán)重值T(ij),即通過邊鏈接傳遞影響力流的大小。一個(gè)節(jié)點(diǎn)傳遞給被引節(jié)點(diǎn)影響力值被視為同時(shí)均分給多個(gè)被引用節(jié)點(diǎn),表示在引證網(wǎng)絡(luò)中施引節(jié)點(diǎn)對被引節(jié)點(diǎn)無差異地傳遞影響力值,從施引節(jié)點(diǎn)i傳遞到被引節(jié)點(diǎn)j的影響力流可表示為:T(j)=∑j∈VT(ij)=∑j∈VIF(i)L(i)。如圖1所示的引證網(wǎng)絡(luò)圖,將圖中的6個(gè)節(jié)點(diǎn)的關(guān)系看作為投票過程計(jì)算:節(jié)點(diǎn)F引用了節(jié)點(diǎn)B、D、E可以看作是將一票投給了B、D、E的過程,由于只有1票,所以B、D、E分別獲得1/3票。但是節(jié)點(diǎn)B同時(shí)接受了節(jié)點(diǎn)D給它投的1/2票,此時(shí)T(FD)=T(FE)=T(FB)=13IF(F),T(B)=13IF(F)+12IF(D)。而被節(jié)點(diǎn)E引用的節(jié)點(diǎn)只有C一個(gè),則節(jié)點(diǎn)E將1票全部投給了節(jié)點(diǎn)C,即邊鏈接傳遞的影響力流大小為節(jié)點(diǎn)E的影響力值,T(C)=IF(E),傳遞的過程如圖2所示。
第五步:搜索主路徑。本文采用全局搜索的方法,通過篩選出擁有最大邊權(quán)重和的路徑的搜索方法得出研究領(lǐng)域內(nèi)的技術(shù)主路徑。
2.3 實(shí)驗(yàn)數(shù)據(jù)
本文選取海水淡化(Desalt)領(lǐng)域的美國授權(quán)專利進(jìn)行分析。選擇海水淡化作為本文的研究領(lǐng)域的原因,一是由于如今的淡水資源短缺,海水淡化技術(shù)作為提取淡水的下一個(gè)具有前景的方法被相關(guān)科研人員高度重視[24],海水淡化技術(shù)的技術(shù)路徑能夠幫助相關(guān)研究人員理清核心技術(shù)的發(fā)展脈絡(luò),因此對其研究具有一定的理論意義和實(shí)踐意義;二是海水淡化最早可以追溯到公元前1400年[25],在20世紀(jì)80年代海水淡化技術(shù)得到迅速的發(fā)展,這就說明在海水淡化領(lǐng)域內(nèi)已經(jīng)存在著幾十年的技術(shù)積累,專利文獻(xiàn)的數(shù)據(jù)量大,發(fā)現(xiàn)技術(shù)主路徑的演化也會更加明顯。
在美國授權(quán)專利數(shù)據(jù)庫中采用“Desalt*”兩個(gè)搜索詞對專利的標(biāo)題和摘要部分進(jìn)行搜索,最終得出的專利題錄結(jié)果為1 348篇專利文獻(xiàn)。
3 實(shí)驗(yàn)結(jié)果
將本文得到的1 348篇專利文獻(xiàn)和它們的引文構(gòu)成專利引證網(wǎng)絡(luò),然后進(jìn)行兩種方法的對比實(shí)驗(yàn),第一組將按照實(shí)驗(yàn)操作步驟得到基于邊鏈接影響力流傳遞路徑搜索算法的技術(shù)主路徑,第二組采用SPLC算法得到技術(shù)主路徑。
3.1 路徑形態(tài)
實(shí)驗(yàn)結(jié)果如圖3所示,圖3左圖和右圖分別為采用基于邊鏈接影響力流傳遞路徑搜索算法和SPLC算法,再用全局路徑進(jìn)行搜索得到的主路徑。圖3左右兩圖的縱坐標(biāo)表示專利申請年,橫坐標(biāo)沒有特殊意義,圖中的節(jié)點(diǎn)大小表示節(jié)點(diǎn)的被引頻次,邊的粗細(xì)表示邊的權(quán)重值也就是邊鏈接傳遞影響力值的大小。
從路徑形態(tài)對比觀察圖3左右兩種算法進(jìn)行全局搜索得出的主路徑,可以看出采用基于邊鏈接影響力流傳遞路徑搜索算法得到的主路徑的節(jié)點(diǎn)提取會更偏向于老節(jié)點(diǎn),從技術(shù)主路徑顯示看來最早的節(jié)點(diǎn)可以追溯到1948年,而對比右圖中技術(shù)主路徑源節(jié)點(diǎn)申請年對應(yīng)的1978年,足足早40年時(shí)間。同時(shí),對比左右兩圖在整條技術(shù)主路徑中占比最大的路徑(4200550,2446040)和(5366635,5186822)兩條路徑可以看出,左圖兩個(gè)專利的時(shí)間跨度相比右圖專利間跨度大,通過專利的分析得到(4200550,2446040)兩個(gè)專利都為從礦物油中脫鹽工藝,而(5366635,5186822)表示的兩個(gè)專利都涉及渦輪等類似的設(shè)備裝置,說明了實(shí)驗(yàn)的兩個(gè)算法得出的技術(shù)主路徑的重要演化和繼承關(guān)系的偏向性不同。
3.2 路徑內(nèi)容
從專利的內(nèi)容上分析,基于邊鏈接影響力流傳遞路徑搜索得到的主路徑的專利內(nèi)容早期更注重于化學(xué)工藝制備方面,源節(jié)點(diǎn)2446040專利為從原油中脫鹽的工藝制備上,主要集中于從原油中溶解無機(jī)鹽的工藝,到中期的脫鹽技術(shù)演進(jìn)為更為復(fù)雜的工藝制備方法,如4806231專利申請?jiān)谳^高溫度和較大原油比例的鹽水洗滌技術(shù)和5271841專利申請的去苯的方法,而到后期關(guān)于新設(shè)備的技術(shù),專利8747658和專利9410092改進(jìn)的方法都涉及使用帶有堆疊盤式離心機(jī)的分離器來分離乳化油和水。而基于SPLC算法搜索出的技術(shù)主路徑早期工藝制備和基于邊鏈接影響力流傳遞的算法提取的主路徑有很大的不同,分析得到早期的節(jié)點(diǎn)更偏向于物理方面的技術(shù)。主路徑的早期專利4110172、4210494以及4363703涉及的脫鹽技術(shù)都與太陽能或太陽輻射用于蒸發(fā)鹽水技術(shù)相關(guān),到中期階段,專利技術(shù)偏向于設(shè)備裝置方面,從專利5186822到專利6348148都集中于采用帶有驅(qū)動(dòng)加壓的脫鹽設(shè)備進(jìn)行海水淡化。技術(shù)主路徑上的后期的專利采用的設(shè)備和方法都更為專業(yè)和先進(jìn),改進(jìn)和結(jié)合了已有的技術(shù)進(jìn)行演化。
總體來說,基于邊鏈接影響力流傳遞路徑搜索方法得到的主路徑能提取出更早的專利技術(shù),可以追溯到技術(shù)的根源節(jié)點(diǎn)。從內(nèi)容分析可以分析得到海水淡化技術(shù)早期是由從原油中分離雜質(zhì)的技術(shù)中演化出的,而基于SPLC方法得到的主路徑更為集中,源節(jié)點(diǎn)以及主路徑節(jié)點(diǎn)表示的專利技術(shù)直接為海水淡化技術(shù)方法和工藝,技術(shù)的分化和演進(jìn)效果沒有基于邊鏈接技術(shù)影響力流傳遞算法搜索出的主路徑更明顯。相比之下,基于邊鏈接影響力流傳遞路徑搜索算法提取出的技術(shù)主路徑對于理清海水淡化技術(shù)的演化過程的脈絡(luò)更有理論價(jià)值。
4 討 論
4.1 理論貢獻(xiàn)與創(chuàng)新之處
本文將搜集到的海水淡化領(lǐng)域內(nèi)的專利數(shù)據(jù)構(gòu)建專利引證網(wǎng)絡(luò),采用基于邊鏈接影響力流傳遞路徑搜索,用于計(jì)算出每條邊的影響力流傳遞值,再根據(jù)全局搜索方法提取主路徑。
相比傳統(tǒng)的主路徑分析的SPx算法,本文采用的基于邊鏈接影響力流路徑搜索算法有以下3點(diǎn)貢獻(xiàn)和創(chuàng)新之處:1)解決了參考文獻(xiàn)多的文獻(xiàn)更多機(jī)會的出現(xiàn)于主路徑之上的問題。將專利節(jié)點(diǎn)的影響力流的傳遞值作為計(jì)算邊權(quán)重的基礎(chǔ),以邊權(quán)重值在專利引證網(wǎng)絡(luò)中搜索主路徑,避免由于參考文獻(xiàn)引用太多文獻(xiàn)時(shí)導(dǎo)致節(jié)點(diǎn)權(quán)重值大被選入而忽略了每條邊權(quán)重值都很小的矛盾;2)邊權(quán)重的衡量理論的說服力相比邊遍歷計(jì)數(shù)的方法說服力更強(qiáng)。實(shí)驗(yàn)結(jié)果顯示出本文算法能夠追溯到技術(shù)主路徑更早的技術(shù)節(jié)點(diǎn),并且在主路徑上出現(xiàn)的研究領(lǐng)域的技術(shù)范圍全面,技術(shù)演化的內(nèi)容明顯;3)解決了初始值無差異性產(chǎn)生的問題。采用邊鏈接影響力流計(jì)算邊權(quán)重,無論初始值為多少,網(wǎng)絡(luò)中的邊最終會根據(jù)傳遞規(guī)則收斂到固定值,解決了傳統(tǒng)的SPx算法采用的邊遍歷計(jì)數(shù)思想而忽略初始值無差異性帶來的問題。
4.2 局限之處與應(yīng)用范圍
本文基于邊鏈接影響力流傳遞路徑搜索算法的知識流路徑搜索確定技術(shù)主路徑的方法的局限之處主要有以下兩點(diǎn):
1)采用基于邊鏈接影響力流傳遞路徑搜索算法搜索出的專利節(jié)點(diǎn)雖然時(shí)間跨度更大,技術(shù)內(nèi)容的演化強(qiáng)于傳統(tǒng)的主路徑分析法,但根據(jù)圖3中搜索出的專利節(jié)點(diǎn)的大小可以看出采用基于邊鏈接影響力流傳遞路徑搜索算法搜索出的高頻引證次數(shù)的節(jié)點(diǎn)沒有主路徑分析法搜索出的多。雖然專利節(jié)點(diǎn)的引證次數(shù)不能完全說明一個(gè)技術(shù)的影響力程度高低,但是在一定程度說明了用基于邊鏈接影響力流傳遞路徑搜索算法搜索出的專利引證次數(shù)不是最高的。
2)本文通過節(jié)點(diǎn)的大小對逆向基于邊鏈接影響力流傳遞路徑搜索和SPLC算法搜索出的主路徑算法進(jìn)行比較其實(shí)并不全面,一個(gè)節(jié)點(diǎn)的影響力和重要性程度除了被引次數(shù),還與專利的商業(yè)價(jià)值,專利年齡,專利訴訟等指標(biāo)相關(guān)。本文單從節(jié)點(diǎn)的大小只能在一定程度說明兩個(gè)方法的優(yōu)劣性,而對于兩個(gè)方法搜索出的主路徑上節(jié)點(diǎn)的影響力還需要進(jìn)一步研究。
參考文獻(xiàn)
[1]Dosi G.Technological Paradigms and Technological Trajectories:A Suggested Interpretation of the Determinants and Directions of Technical Change[J].Research Policy,1982,11(3):147-162.
[2]Verspagen B.Mapping Technological Trajectories as Patent Cita- tion Networks:A Study on the History of Fuel Cell Research[J].Advance in Complex System,2007,10(1):93-115.
[3]Griliches Z.Patent Statistics as Economic Indicators:A Survey[J].Journal of Economic Literature,1990,28:1661-1707.
[4]Verspagen B.Mapping Technological Trajectories as Patent Citation Networks.A Study on the History of Fuel Cell Research[J].Advances in Complex Systems,2007,10(1):93-115.
[5]Hummon N P,Doreian P.Connectivity in a Citation Network:The Development of DNA Theory[J].Social Networks,1989,11(1):39-63.
[6]Hummon N P,Doreian P.Computational Methods for Social Network Analysis[J].Social Networks,1990,(12):273-288.
[7]Hummon N P,Doreian P,F(xiàn)reeman L C.Analyzing the Structure of the Centrality Productivity Literature Created Between 1948 and 1979[J].Knowledge:Creation,Diffusion,Utilization,1990,11(4):459-480.
[8]Batagelj V.Efficient Algorithms for Citation Network Analysis[J/OL].arXiv,2003:0309023.2018-03-27.
[9]隗玲,方曙.引文網(wǎng)絡(luò)主路徑研究進(jìn)展評述及展望[J].情報(bào)理論與實(shí)踐,2016,(9):128-133.
[10]劉向,馬費(fèi)成.科學(xué)知識網(wǎng)絡(luò)的演化和動(dòng)力-基于科學(xué)引證網(wǎng)絡(luò)的分析[J].管理科學(xué)學(xué)報(bào),2012,15(1):87-94.
[11]Garfielde E.Citation Indexes for Science[J].Science,1965,123(3185):61-21.
[12]Choi C,Park Y.Monitoring the Organic Structure of Technology Based on the Patent Development Paths[J].Technological Forecas- ting and Social Change,2009,76(6):754-768.
[13]Persson O.Identifying Research Themes with Weighted Direct Citation Links[J].Jornal of Informetrics,2010,4(3):415-422.
[14]Kelley,James;Walker,Morgan.Critical-Path Planning and Scheduling.1959,Proceedings of the Eastern Joint Computer Conference.
[15]Liu J S,Lu L Y.An Integrated Approach for Main Path Analysis:Development of the Hirsch Index as an Example[J].Journal of the Association for Information Science and Technology,2012,63(3):528-542.
[16]Zhu H M,Yin X C,Ma J,et al.Identifying the Main Paths of Information Diffusion in Online Scial Networks[J].Physica A:Statistical Mechanics and its Applications.2016,452(15):320-328.
[17]Halatchliyski I,Hecking T,Goehnert T,et al.Analyzing the Main Path of Ideas and Activity of Contributors in an Open Learning Community[J].Journal of Learning Analytics,2014,1(2):72-93.
[18]Mina A,Ramlogan R,Tampubolon G,et al.Mapping Evolutionary Trajectories:Applications to the Growth and Transformation of Medical Knowledge[J].Res.Policy,2007,36(5):789-806.
[19]Harris J K,Luke D A,Zuckerman R B,et al.Forty Years of Secondhand Smoke Research:The Gap Between Discovery and Delivery[J].American Journal of Preventive Medicine,2009,36(6):538-548.
[20]Page L,Brin S.The PageRank Citation Ranking:Bringing Order to the Web[EB/OL].http://www.db.stanford.edu/~backub/PageR anksub.ps,1998-2001.
[21]Franceschet M.PageRank:Standing on the Shoulders of Giants[J].Communications of the ACM,2011,54(6):92-101.
[22]段慶鋒,朱東華,汪學(xué)鋒.基于改進(jìn)PageRank算法的引文文獻(xiàn)排序方法[J].情報(bào)理論與實(shí)踐,2012,(1):115-119.
[23]劉次華.隨機(jī)過程及其應(yīng)用(第3版)[M].北京:高等教育出版社,2004.
[24]鄭智穎,李鳳臣,李倩,等.海水淡化技術(shù)應(yīng)用研究及發(fā)展現(xiàn)狀[J].科學(xué)通報(bào),2016,61(21):2344-2370.
[25]朱淑飛,薛立波,徐子丹.國內(nèi)外海水淡化發(fā)展歷史及現(xiàn)狀分析[J].水處理技術(shù),2014,(7):12-15,23.
(責(zé)任編輯:孫國雷)