宋 凱 朱彥君
(1.武漢大學(xué)信息管理學(xué)院 武漢 430072;2.山東建筑大學(xué)圖書館 濟南 250101)
隨著全球科技產(chǎn)業(yè)轉(zhuǎn)型周期的快速演進,技術(shù)創(chuàng)新成為推動經(jīng)濟發(fā)展、變革產(chǎn)業(yè)格局、轉(zhuǎn)換產(chǎn)業(yè)形態(tài)的重要驅(qū)動力,也是提升國家和企業(yè)技術(shù)競爭力的關(guān)鍵所在。當(dāng)前,科技立國、創(chuàng)新興國成為各國經(jīng)濟發(fā)展的基本戰(zhàn)略,在此背景下,對前沿技術(shù)的探測與識別正逐漸成為影響政府決策和產(chǎn)業(yè)發(fā)展的一個重要的驅(qū)動因素[1]。目前,關(guān)于前沿技術(shù)尚無統(tǒng)一的定義,2006 年我國發(fā)布《國家中長期科學(xué)和技術(shù)發(fā)展規(guī)劃綱要》,將前沿技術(shù)定義為高技術(shù)領(lǐng)域中具有前瞻性、先導(dǎo)性和探索性的重大技術(shù),是未來高技術(shù)更新?lián)Q代和新興產(chǎn)業(yè)發(fā)展的重要基礎(chǔ)[2];劉琦巖等人提出科技前沿是指在某一具體科技領(lǐng)域中具有繼承性、未來性和探索性特征的研究或技術(shù)[3];周萌等人認(rèn)為前沿技術(shù)為某一時間段內(nèi)研究關(guān)注度增加較快,市場潛力已有所顯現(xiàn)的技術(shù)領(lǐng)域[4]。結(jié)合已有定義,本文認(rèn)為前沿技術(shù)是某個時間段內(nèi)某個技術(shù)領(lǐng)域中正在興起并引起研究人員高度關(guān)注的研究主題,能夠指引技術(shù)領(lǐng)域發(fā)展方向,決定技術(shù)領(lǐng)域創(chuàng)新路徑。而專利文獻作為技術(shù)創(chuàng)新成果的重要表現(xiàn)形式,因其含有豐富的技術(shù)信息而被廣泛應(yīng)用于前沿技術(shù)識別的研究工作中[5]。因此,如何通過專利分析進行前沿技術(shù)主題識別,揭示技術(shù)領(lǐng)域發(fā)展趨勢,成為學(xué)術(shù)界和產(chǎn)業(yè)界共同關(guān)注的研究熱點。
本文的研究目標(biāo)是:① 以Z分?jǐn)?shù)表示技術(shù)主題創(chuàng)新度,以Sen's斜率表示技術(shù)主題授權(quán)趨勢,二者融合形成技術(shù)主題前沿度指標(biāo),為識別技術(shù)領(lǐng)域前沿技術(shù)主題提供方法支撐。② 給出技術(shù)主題新穎度和技術(shù)主題關(guān)注度的計算公式,二者融合形成技術(shù)主題趨勢度指標(biāo),并結(jié)合指數(shù)平滑法,對前沿技術(shù)主題未來發(fā)展趨勢進行預(yù)測。③ 采用提出的專利前沿技術(shù)主題識別與趨勢預(yù)測方法,對我國人工智能領(lǐng)域的授權(quán)發(fā)明專利進行實證,為研究人員揭示技術(shù)領(lǐng)域發(fā)展趨勢,規(guī)劃戰(zhàn)略布局提供方法參考和決策支持。
國內(nèi)外學(xué)者們就如何利用專利文獻數(shù)據(jù)高效、準(zhǔn)確地進行技術(shù)主題識別和發(fā)展趨勢預(yù)測展開了大量的研究工作,概括起來主要包括以下四種類型:
一是基于專家評價方法,通常采用同行評議、德爾菲法、層次分析等方法,在專家定性分析的基礎(chǔ)上,以打分方式做出定量評價。如Tseng等提出將情景規(guī)劃法、德爾菲法與技術(shù)替代模型相結(jié)合進行前沿技術(shù)識別[6];魏國平采用問卷調(diào)查和調(diào)研訪談等研究方法,對中國市場上出現(xiàn)或即將出現(xiàn)的新興技術(shù)進行了識別[7];徐璐采用AHP方法與信息熵技術(shù)相融合技術(shù),建立了土石壩危險源識別技術(shù)體系和方法[8];袁思達以“中國未來20年技術(shù)預(yù)見研究”能源技術(shù)領(lǐng)域為例,根據(jù)德爾菲法調(diào)查結(jié)果對共性技術(shù)課題識別進行了研究[9]。
二是基于文獻計量方法,通過獲取專利數(shù)據(jù)集的技術(shù)主題,根據(jù)時間變化等特征識別出前沿技術(shù)主題。如Bengisu結(jié)合時間特征對領(lǐng)域內(nèi)的論文和專利進行分析,識別出了材料科學(xué)與工程的前沿技術(shù)領(lǐng)域[10];Daim等融合專利計量分析、產(chǎn)業(yè)情景分析和增長曲線分析,提出了一種前沿技術(shù)識別模型[11];王吉武等構(gòu)建了新興技術(shù)商業(yè)化潛力評價框架并進行了相應(yīng)的實證研究[12];汪慶等人通過多維度專利指標(biāo)分析的方法識別了創(chuàng)新主體的內(nèi)部核心技術(shù)和優(yōu)勢技術(shù)領(lǐng)域[13]。
三是基于引用特征方法,通過對專利的引文網(wǎng)絡(luò)進行聚類分析,利用文獻之間的引用關(guān)系測度主題的演變路徑和趨勢。如Small等將專利直接引文網(wǎng)絡(luò)和共被引網(wǎng)絡(luò)結(jié)合,通過社區(qū)聚類算法識別出新穎性技術(shù)主題[14];Hsueh等以液晶顯示屏技術(shù)領(lǐng)域為例,將專利引證時間與專利引用關(guān)系相結(jié)合,對該領(lǐng)域的前沿技術(shù)進行了預(yù)測[15];Kim等綜合考慮了專利技術(shù)的相似性和專利共引特征,通過構(gòu)建專利合作網(wǎng)絡(luò),實現(xiàn)了基于專利網(wǎng)絡(luò)分析的前沿技術(shù)識別方法[16];李蓓等人建立了基于專利引用耦合聚類的新興技術(shù)識別模型及其相關(guān)指標(biāo)體系,并對納米技術(shù)領(lǐng)域展開了實證分析[17]。
四是基于文本挖掘方法,隨著數(shù)據(jù)挖掘和文本分析等計算機技術(shù)的發(fā)展,學(xué)者嘗試采用這一類方法進行技術(shù)主題識別和技術(shù)發(fā)展趨勢分析。如Choi等利用SAO結(jié)構(gòu)分析,并結(jié)合社會網(wǎng)絡(luò)分析進行了前沿技術(shù)主題識別[18];Xiao等以固體脂質(zhì)納米粒子領(lǐng)域為例,采用SAO結(jié)構(gòu)分析,結(jié)合技術(shù)路線圖和專家評價對創(chuàng)新技術(shù)進行了探測[19];伊惠芳等結(jié)合 LDA模型和戰(zhàn)略坐標(biāo)圖識別出了石墨烯領(lǐng)域的技術(shù)主題及其結(jié)構(gòu)特征[20];許學(xué)國等人提出了基于深度學(xué)習(xí)的技術(shù)預(yù)測方法,并以機器人領(lǐng)域為例進行了技術(shù)預(yù)測[21]。
分析發(fā)現(xiàn),已有研究分別使用專家評價法、文獻計量法、引用特征法和文本挖掘法,對技術(shù)領(lǐng)域的前沿技術(shù)識別及預(yù)測展開了研究。但專家評價法對專家判斷依賴程度較高,判斷結(jié)果主觀性較強;文獻計量法難以反映技術(shù)發(fā)展的動態(tài)變化;引用特征法存在引用動機判斷及引文時滯性的不足;文本挖掘法在技術(shù)實現(xiàn)上還有諸多完善之處。因此,本文在參考已有研究的基礎(chǔ)上,將技術(shù)主題前沿度和技術(shù)主題趨勢度引入到前沿技術(shù)主題識別中,將文獻計量法、引用特征法和文本挖掘法相結(jié)合,提出專利前沿技術(shù)主題識別與趨勢預(yù)測方法,為技術(shù)管理部門和企業(yè)研究人員有效把握技術(shù)演進態(tài)勢,準(zhǔn)確定位技術(shù)發(fā)展方向,快速做出戰(zhàn)略決策提供實踐參考。
2.1第一階段:技術(shù)主題提取技術(shù)主題提取即提取一個技術(shù)領(lǐng)域涵蓋的技術(shù)主題,在進行專利技術(shù)識別中,專利摘要被普遍作為實驗數(shù)據(jù)進行分析。LDA模型采用高效的概率推斷算法處理大規(guī)模數(shù)據(jù),具有良好的文本潛在主題挖掘能力,因此,本文確定采用LDA模型,從專利摘要中提取技術(shù)領(lǐng)域涵蓋的技術(shù)主題。同時,本文利用R語言中的LDAvis模型進行主題數(shù)量計算,LDAvis 模型能夠基于多維尺度算法將主題識別結(jié)果映射到二維空間中,通過調(diào)整主題數(shù)目、Alpha值和Beta值,當(dāng)主題之間相互獨立、互不交叉,表示對應(yīng)主題模型最優(yōu)。在明確技術(shù)領(lǐng)域涵蓋的主題后,本文采用聚類算法中的K-means實現(xiàn)對專利文本的劃分,為了提高效率,本文將LDA模型和K-means算法融合實現(xiàn)專利文本聚類[22]。
2.2第二階段:前沿技術(shù)主題識別
2.2.1 技術(shù)主題創(chuàng)新度計算 陳子鳳等人指出,基于專利引用的外部知識獲取對創(chuàng)新具有重要影響[23],反之,能夠說明技術(shù)主題的被引用次數(shù)越高,體現(xiàn)了其在所屬技術(shù)領(lǐng)域具有較高創(chuàng)新度,能夠?qū)@谜叩募夹g(shù)創(chuàng)新提供支撐。為了保證創(chuàng)新度計算的合理性和科學(xué)性,本文采用Z分?jǐn)?shù)來表征每個技術(shù)主題的創(chuàng)新度。技術(shù)主題創(chuàng)新度的計算過程如下:
第1步,某一時間段內(nèi),技術(shù)領(lǐng)域A授權(quán)發(fā)明專利數(shù)量為N件,每件專利的被引用次數(shù)集合記為C={c1,c2,c3…cN},則A領(lǐng)域的專利平均被引用次數(shù)為:
(1)
第2步,根據(jù)LDA模型及文本聚類得到的結(jié)果,假設(shè)A領(lǐng)域有S個技術(shù)主題,每個技術(shù)主題下授權(quán)的專利數(shù)量集合記為P= {p1,p2,p3…pS},每個技術(shù)主題下授權(quán)專利的被引用總量記為Y= {y1,y2,y3…yS},則每個技術(shù)主題的平均被引用次數(shù)為:
(2)
第3步,依據(jù)技術(shù)領(lǐng)域平均被引用次數(shù)及每個技術(shù)主題的平均被引用次數(shù),得到A領(lǐng)域技術(shù)主題平均被引用次數(shù)標(biāo)準(zhǔn)差:
(3)
第4步, 得到每個技術(shù)主題的標(biāo)準(zhǔn)分?jǐn)?shù)為:
(4)
2.2.2 技術(shù)主題授權(quán)趨勢計算 技術(shù)主題授權(quán)趨勢分析主要利用技術(shù)主題的逐年授權(quán)量,判斷技術(shù)主題的發(fā)展走向。本文利用Sen's 斜率估計法計算技術(shù)主題的專利授權(quán)量斜率,估計技術(shù)主題的授權(quán)量趨勢幅度。Sen's斜率法的主要計算過程如下:
第1步,A領(lǐng)域的技術(shù)主題B連續(xù)y年的專利授權(quán)量表示為L=(l1,l2,l3…ly),則該技術(shù)主題的斜率為:
(5)
第2步,斜率γ表示專利授權(quán)量的趨勢,當(dāng)γ>0時,B主題下的專利授權(quán)量呈逐年上升趨勢;當(dāng)γ=0時,專利授權(quán)量逐年變化趨勢不明顯;當(dāng)γ<0時,專利授權(quán)量呈逐年下降趨勢。
2.2.3 技術(shù)主題前沿度計算及前沿技術(shù)主題識別 通過以上過程,考慮將技術(shù)主題創(chuàng)新度和技術(shù)主題授權(quán)趨勢融合形成技術(shù)主題前沿度(Technology Topic Frontier Index,TTFI)指標(biāo),并采用熵權(quán)法為二者客觀分配權(quán)重Wz和Wγ,以綜合反映技術(shù)領(lǐng)域的前沿技術(shù)主題。在此基礎(chǔ)上,將技術(shù)創(chuàng)新度和技術(shù)主題授權(quán)趨勢映射到二維空間,通過閾值設(shè)置,將技術(shù)主題類型劃分為前沿技術(shù)主題、過熱技術(shù)主題、冷點技術(shù)主題和潛在技術(shù)主題。技術(shù)主題前沿度的計算公式如下:
TTFIj=Zj*WZ+γj*Wγj∈(1,2,3…S)
(6)
2.3第三階段:前沿技術(shù)主題趨勢預(yù)測
2.3.1 技術(shù)主題新穎度計算 本文技術(shù)主題新穎度(Technology Topic Novelty Index,TTNI)計算參考Tu等人提出的主題新穎度計算方法[24],當(dāng)一個技術(shù)主題開始出現(xiàn)后,隨著時間的推移,專利授權(quán)量越來越多,其新穎性也逐年下降。TTNI計算公式為:
(7)
具體計算過程為,假設(shè)一個技術(shù)主題下的授權(quán)專利,授權(quán)時間周期為2011-2019年,F(xiàn)Y(First Year)為2011,CY(Current Year)為計算當(dāng)前年,則TTNI2011= 1/(2011-2011+1) = 1.000, TTNI2019= 1 / (2019-2011 + 1) =0.111。
2.3.2 技術(shù)主題關(guān)注度計算 李秀霞等人認(rèn)為發(fā)文趨勢反映了學(xué)科主題研究現(xiàn)狀,引文趨勢反映了研究主題被關(guān)注程度,二者結(jié)合,能從研究者和讀者兩個不同視角呈現(xiàn)學(xué)科領(lǐng)域研究主題被研究和被關(guān)注的程度[25]。將此思想引入到技術(shù)領(lǐng)域研究中,技術(shù)主題關(guān)注度(Technology Topic Attention Index,TTAI)是指領(lǐng)域內(nèi)研究者和技術(shù)跟跑者對主題的關(guān)注程度,通過專利被引用次數(shù)和專利授權(quán)量體現(xiàn)。因此,TTAI的計算將綜合考慮專利被引用次數(shù)和專利授權(quán)量,其計算公式為:
j∈(1,2,3…S)
(8)
具體計算過程為:假設(shè)一個技術(shù)主題下的授權(quán)專利,授權(quán)時間周期為2011-2019年,sum_grant(Sj)表示技術(shù)主題Sj從2011-2019年的專利授權(quán)量總和,sum_grant(CY)表示技術(shù)主題Sj從2011年到計算當(dāng)前年的專利授權(quán)量之和;sum_cited(Sj)表示技術(shù)主題Sj從2011-2019年的專利被引用次數(shù)總和,sum_cited(CY)表示技術(shù)主題Sj從2011年到計算當(dāng)前年的專利被引用次數(shù)之和;W1和W2是根據(jù)熵權(quán)法計算的指標(biāo)權(quán)重。
2.3.3 技術(shù)主題趨勢度計算 將TTNI和TTAI融合,形成技術(shù)主題趨勢度指標(biāo)(Technology Topic Trend Index,TTTI),為前沿技術(shù)主題的預(yù)測分析提供數(shù)據(jù)支撐。由于TTNI呈連續(xù)下降趨勢,而TTAI呈上升趨勢,考慮將TTNI和TTAI做乘積處理,以平衡二者之間的相反趨勢,因此,TTTI的計算公式如下:
(9)
2.3.4 指數(shù)平滑預(yù)測 TTTI同時考慮了TTNI和TTAI,能夠綜合反映技術(shù)主題的發(fā)展趨勢,為了能夠?qū)η把丶夹g(shù)主題的未來發(fā)展態(tài)勢進行展示,本文選擇指數(shù)平滑法進行趨勢預(yù)測。指數(shù)平滑法的核心思想是時間序列的態(tài)勢具有穩(wěn)定性或規(guī)則性,時間序列可被合理的順勢推延,最近的過去態(tài)勢,在某種程度上會持續(xù)到最近的未來[26]。指數(shù)平滑法包括一次指數(shù)、二次指數(shù)、三次指數(shù),其中一次指數(shù)和二次指數(shù)對波動性較大的數(shù)據(jù),預(yù)測會產(chǎn)生較大誤差,而三次指數(shù)能夠跟蹤時序的非線性變化趨勢,具有較強的實用性,被廣泛應(yīng)用于各個領(lǐng)域,因此,本文將使用三次指數(shù)平滑預(yù)測,對前沿技術(shù)主題的未來發(fā)展趨勢進行預(yù)測。
3.1數(shù)據(jù)檢索與技術(shù)主題提取本文數(shù)據(jù)來源于Incopat專利數(shù)據(jù)庫,選擇分析的技術(shù)領(lǐng)域為“人工智能”。在數(shù)據(jù)檢索過程中,專利來源選擇為中國發(fā)明授權(quán)專利,檢索式設(shè)置為標(biāo)題/摘要=(“人工智能” or “智能系統(tǒng)” or “物聯(lián)網(wǎng)” or “人機交互” or “智能技術(shù)” or “智能機器人” or “深度學(xué)習(xí)” or “語義網(wǎng)絡(luò)”),時間不限,共檢索到44 893件專利。因為專利被引用次數(shù)是前沿技術(shù)主題識別過程中的重要指標(biāo),因此,去除被引用次數(shù)為0的專利,剩余5 655件專利作為實驗數(shù)據(jù)。
根據(jù)技術(shù)主題的提取流程,當(dāng)主題數(shù)目設(shè)置為14個,Alpha=0.1,Beta=0.2時,基于LDAvis模型呈現(xiàn)的主題可視化結(jié)果,主題數(shù)目最優(yōu)。在確定最優(yōu)模型的基礎(chǔ)上,結(jié)合每個技術(shù)主題下的相關(guān)詞對主題進行概括,并通過文本聚類將每一件專利劃歸到一個技術(shù)主題下。在專利文本聚類后,統(tǒng)計每個技術(shù)主題的專利授權(quán)時間周期,為了保證每個技術(shù)主題的時間周期一致性,便于之后的實驗分析,將每個技術(shù)主題的專利授權(quán)周期統(tǒng)一設(shè)置為2011-2019年,經(jīng)過篩選后,剩余5 619件專利用于人工智能領(lǐng)域前沿技術(shù)主題的識別。
3.2前沿技術(shù)主題識別依據(jù)給出的前沿技術(shù)主題識別流程,通過技術(shù)主題創(chuàng)新度(公式(1)→(4))與授權(quán)量趨勢估計(公式(5))對每個技術(shù)主題進行計算。分析計算結(jié)果發(fā)現(xiàn),人工智能領(lǐng)域涵蓋的14個主題,其γ值均大于0,表明人工智能領(lǐng)域各個技術(shù)主題的專利授權(quán)量均成上升趨勢,體現(xiàn)了學(xué)術(shù)界和產(chǎn)業(yè)界對人工智能領(lǐng)域的持續(xù)關(guān)注。綜合Z分?jǐn)?shù)和γ值計算技術(shù)主題前沿度,通過熵權(quán)法計算得到權(quán)重分別為0.65和0.35,利用公式(6)對人工智能領(lǐng)域下的技術(shù)主題進行排序,結(jié)果見表1。同時,將Z分?jǐn)?shù)與γ值映射到二維空間進行可視化展示,依據(jù)主題位置分布對技術(shù)主題類型進行細粒度劃分,結(jié)果見圖1。
表1 基于熵權(quán)法的技術(shù)主題排序
分析表1發(fā)現(xiàn),將技術(shù)主題前沿度的閾值設(shè)置為3時,“主題5→電動汽車”“主題1→智能家居”“主題12→自動化控制系統(tǒng)”可視為人工智能領(lǐng)域的前沿技術(shù)主題。為了對識別結(jié)果進行驗證,將Z分?jǐn)?shù)與γ值作為坐標(biāo)形成技術(shù)主題空間分布圖,為了讓技術(shù)主題之間的劃分界限明顯,將γ值的閾值設(shè)置為8,Z分?jǐn)?shù)的閾值設(shè)置為0。依據(jù)設(shè)置的閾值進行維度劃分:
圖1 人工智能領(lǐng)域技術(shù)主題空間分布圖
① 第一維度→前沿技術(shù)主題,Z分?jǐn)?shù)>0,γ值>8;② 第二維度→過熱技術(shù)主題,Z分?jǐn)?shù)<0,γ值>8;③ 第三維度→冷點技術(shù)主題,Z分?jǐn)?shù)<0,γ值<8;④ 第四維度→潛在技術(shù)主題,Z分?jǐn)?shù)>0,γ值<8。通過劃分,處于第一維度的前沿技術(shù)主題分別是“主題1→智能家居”“主題5→電動汽車”“主題12→自動化控制系統(tǒng)”,這進一步驗證了技術(shù)主題前沿度的計算結(jié)果,并在此基礎(chǔ)上對其他主題的類型也進行了更細粒度的劃分,為相關(guān)研究者、科技型企業(yè)把握人工智能領(lǐng)域發(fā)展新動向,捕捉技術(shù)發(fā)展趨勢提供了參考指引。
3.3前沿技術(shù)主題趨勢預(yù)測通過以上前沿技術(shù)主題的分析,得到人工智能領(lǐng)域的3個前沿技術(shù)主題,依據(jù)前沿技術(shù)主題趨勢預(yù)測流程,對每個技術(shù)主題進行技術(shù)主題新穎度(公式(7))與技術(shù)主題關(guān)注度(公式(8))的計算,綜合技術(shù)主題新穎度和技術(shù)主題關(guān)注度,利用熵權(quán)法計算得到權(quán)重分別為0.48和0.52。在此基礎(chǔ)上,使用公式(9)計算每個前沿技術(shù)主題的逐年趨勢度,最后利用三次指數(shù)平滑法對前沿技術(shù)主題在2020-2022年的發(fā)展趨勢進行預(yù)測,以均方根誤差(RMSE)和平均絕對誤差(MAE)作為判斷預(yù)測效果的指標(biāo)。主題1、主題5和主題12的趨勢預(yù)測結(jié)果見圖2。
圖2 “主題1”“主題5”“主題12”趨勢預(yù)測圖
依據(jù)三次指數(shù)平滑法對主題1、主題5和主題12的預(yù)測結(jié)果,RMSE和MAE均為0.01,表明預(yù)測效果較好。根據(jù)技術(shù)主題趨勢度的預(yù)測結(jié)果,“主題1→智能家居”呈明顯下降趨勢,自2011年開始,我國智能家居行業(yè)進入融合演變期,在智能控制技術(shù)、智能家居平臺系統(tǒng)等方面取得了快速發(fā)展。雖然智能家居行業(yè)技術(shù)上具有先進性,但實用性差,與市場需求脫節(jié),這也打擊了企業(yè)的持續(xù)創(chuàng)新熱情,一定程度上造成了技術(shù)主題趨勢度呈下降態(tài)勢。但我國智能家居普及率仍有很大增長空間,這也為企業(yè)在智能家居上進行持續(xù)探索提供了動力支撐?!爸黝}5→電動汽車”和“主題12→自動化控制系統(tǒng)”呈明顯上升趨勢,人工智能融入電動汽車實現(xiàn)無人駕駛,已經(jīng)對未來出行方式進行了定義,也吸引了以蔚來、威馬為代表的造車新勢力進行持續(xù)投入研發(fā);而人工智能在工業(yè)制造、基礎(chǔ)設(shè)施建設(shè)的應(yīng)用,對我國實現(xiàn)產(chǎn)業(yè)生態(tài)化、數(shù)字化、智能化具有重要意義。因此,通過以上分析,人工智能領(lǐng)域內(nèi)的“電動汽車”和“自動化控制系統(tǒng)”兩個前沿技術(shù)主題在未來3年仍呈上升態(tài)勢,領(lǐng)域內(nèi)的科技型創(chuàng)新企業(yè)應(yīng)提高關(guān)注度,制定戰(zhàn)略規(guī)劃,而政策制定者和投資機構(gòu)也應(yīng)重視對這兩個技術(shù)主題的科研投入和資源傾斜,推動實現(xiàn)技術(shù)突破與產(chǎn)業(yè)升級。
監(jiān)測技術(shù)前沿變化,識別前沿技術(shù)主題,能夠及時跟蹤技術(shù)發(fā)展動態(tài),盡早捕捉未來發(fā)展契機,對國家資源配置和科研投入以及科技型企業(yè)的未來發(fā)展至關(guān)重要。為了實現(xiàn)此目標(biāo),本文提出了專利前沿技術(shù)主題識別與趨勢預(yù)測方法,以我國人工智能領(lǐng)域的發(fā)明授權(quán)專利進行了方法驗證,主要內(nèi)容總結(jié)如下:
a.在主題提取階段,利用LDA模型提取了人工智能領(lǐng)域涵蓋的14個技術(shù)主題,并結(jié)合K-means算法實現(xiàn)了專利文本聚類。
b.在前沿技術(shù)主題識別階段,以Z分?jǐn)?shù)表征技術(shù)主題創(chuàng)新度,以Sen's斜率估計法計算技術(shù)主題的專利授權(quán)趨勢,采用熵權(quán)法將二者融合形成技術(shù)主題前沿度指標(biāo),實現(xiàn)對人工智能領(lǐng)域技術(shù)主題的排序;進一步將兩個指標(biāo)映射到二維空間,對主題類型進行細粒度的劃分;通過以上過程,分析得到人工智能領(lǐng)域的3個前沿技術(shù)主題。
c.在前沿技術(shù)主題趨勢預(yù)測階段,分別對3個前沿技術(shù)主題的技術(shù)主題新穎度和技術(shù)主題關(guān)注度進行計算,并采用熵權(quán)法將二者融合,形成技術(shù)主題趨勢度指標(biāo);在此基礎(chǔ)上,借助3次指數(shù)平滑法對前沿技術(shù)主題未來3年的發(fā)展趨勢進行預(yù)測。通過方法實證與結(jié)果展示,本文所提方法對政策制定者、科技創(chuàng)新型企業(yè)以及研究人員揭示技術(shù)領(lǐng)域發(fā)展趨勢、制定技術(shù)研發(fā)戰(zhàn)略、尋求技術(shù)發(fā)展機會具有一定的指導(dǎo)意義。
需要說明的是,專利被引用次數(shù)是本文的重要計算指標(biāo),但專利被引用需要經(jīng)過大量時間積淀,存在滯后性,導(dǎo)致本文專利數(shù)據(jù)篩選過程存在不足;此外,學(xué)術(shù)論文也是揭示技術(shù)領(lǐng)域研究前沿的重要數(shù)據(jù)來源,因此本文在數(shù)據(jù)多源性上有待進一步擴充;這些都可能對本文的結(jié)果造成影響,我們將在后續(xù)的研究中加以改進。