馮家琪 王海燕 吳菲菲 黃魯成
(1.中國科學(xué)技術(shù)信息研究所 北京 100038 ;2.北京工業(yè)大學(xué)經(jīng)濟(jì)與管理學(xué)院 北京 100124)
數(shù)字化和信息化浪潮推動了社會經(jīng)濟(jì)的快速發(fā)展,給企業(yè)產(chǎn)品和服務(wù)的更迭帶來更大的挑戰(zhàn)。2011—2022年的《全球創(chuàng)新指數(shù)報告》顯示,中國企業(yè)技術(shù)研發(fā)支出占GDP比重的排名由第35位上升至第13位,單位國內(nèi)生產(chǎn)總值的本國人專利申請數(shù)量也上升至第1位,這表明技術(shù)研發(fā)對于技術(shù)創(chuàng)新有重要的促進(jìn)作用。技術(shù)創(chuàng)新對國家經(jīng)濟(jì)增長、產(chǎn)業(yè)升級與企業(yè)發(fā)展所產(chǎn)生的影響越來遠(yuǎn)大,企業(yè)必須持續(xù)不斷進(jìn)行技術(shù)創(chuàng)新,才能更好實現(xiàn)自身發(fā)展,應(yīng)對不斷變化的市場環(huán)境。信息技術(shù)、數(shù)據(jù)科學(xué)、人工智能的快速發(fā)展,為企業(yè)技術(shù)研發(fā)搭建了新平臺,也使多源異構(gòu)數(shù)據(jù)應(yīng)用于技術(shù)研發(fā)問題分析成為可能,客觀上也提出了如何更好地利用多源數(shù)據(jù)進(jìn)行分析的新要求。企業(yè)如何依據(jù)產(chǎn)業(yè)發(fā)展特征,識別出具有前沿性和創(chuàng)新性的研發(fā)方向,實現(xiàn)高速度高質(zhì)量發(fā)展,是擺在決策者面前亟待解決的問題。技術(shù)標(biāo)準(zhǔn)化可以提高技術(shù)創(chuàng)新的效率,加速科技成果轉(zhuǎn)化速度和質(zhì)量。企業(yè)作為創(chuàng)新主體,需要不斷提升競爭力,而主導(dǎo)和參與標(biāo)準(zhǔn)的制定是企業(yè)增強(qiáng)影響力的重要途徑,將技術(shù)研發(fā)方向與技術(shù)標(biāo)準(zhǔn)化有機(jī)關(guān)聯(lián),可以使企業(yè)研發(fā)決策更具針對性。
隨著企業(yè)技術(shù)的不斷成熟,市場供給和需求也逐漸增加[1],產(chǎn)品逐漸從單一低質(zhì)向多樣優(yōu)質(zhì)發(fā)展,企業(yè)間的市場競爭日益加劇,建立在標(biāo)準(zhǔn)必要專利基礎(chǔ)上的企業(yè)技術(shù)標(biāo)準(zhǔn)出現(xiàn)并不斷更新,企業(yè)研發(fā)處于從技術(shù)到應(yīng)用的演化階段,參與到標(biāo)準(zhǔn)的制定中,把握技術(shù)發(fā)展方向話語權(quán),成為企業(yè)研發(fā)的主要目標(biāo)[2]。標(biāo)準(zhǔn)是對已有技術(shù)的總結(jié)和提煉[3],建立在已經(jīng)應(yīng)用廣泛的技術(shù)上[4],通過引導(dǎo)市場發(fā)展來指引研發(fā)活動的方向[5]。標(biāo)準(zhǔn)作為引導(dǎo)和規(guī)范企業(yè)發(fā)展的依據(jù)[6],不僅是重要的行動指南,也是關(guān)鍵性的創(chuàng)新成果,特別是在技術(shù)快速發(fā)展的時代,企業(yè)競爭已經(jīng)表現(xiàn)為標(biāo)準(zhǔn)的競爭,標(biāo)準(zhǔn)創(chuàng)新決定著企業(yè)未來發(fā)展方向和態(tài)勢[7]。同時標(biāo)準(zhǔn)數(shù)據(jù)可以大大降低統(tǒng)計誤差性和時間滯后性,因此適用于企業(yè)研發(fā)方向的識別研究。目前針對標(biāo)準(zhǔn)文本信息挖掘的研究成果較為豐富,明確了企業(yè)的技術(shù)機(jī)會和方向,但是忽略了標(biāo)準(zhǔn)的數(shù)量、迭代周期階段以及技術(shù)范圍等重要非文本信息。標(biāo)準(zhǔn)具有嚴(yán)格完整的制定體系,每一項標(biāo)準(zhǔn)都需要經(jīng)過委員會共識和ISO成員國嚴(yán)格審查。標(biāo)準(zhǔn)存在現(xiàn)行、即將實施、被替代和已作廢等不同狀態(tài),每一種狀態(tài)的標(biāo)準(zhǔn)代表不同的技術(shù)變革,綜上對標(biāo)準(zhǔn)非文本信息的挖掘?qū)τ谘邪l(fā)方向識別也很重要[8]。本文在現(xiàn)有研究基礎(chǔ)上,利用標(biāo)準(zhǔn)和專利之間的潛在關(guān)聯(lián)關(guān)系,集成標(biāo)準(zhǔn)文本信息及非文本信息識別企業(yè)研發(fā)方向,提高了研發(fā)方向識別的準(zhǔn)確性和可靠性。
研發(fā)方向識別是研發(fā)各方為解決技術(shù)創(chuàng)新問題而確定的共同努力的方向,與企業(yè)自身利益和發(fā)展前景密切相關(guān)。高質(zhì)量的技術(shù)研發(fā)工作對于提升企業(yè)競爭力、 維護(hù)國家產(chǎn)業(yè)技術(shù)安全具有重要意義[9]。目前關(guān)于企業(yè)技術(shù)研發(fā)方向識別的研究主要有將文獻(xiàn)識別出的前沿問題作為企業(yè)技術(shù)研發(fā)方向[10],通過預(yù)測和識別新興技術(shù)判斷企業(yè)技術(shù)研發(fā)方向[11],以專利技術(shù)空白點(diǎn)表征的技術(shù)機(jī)會作為企業(yè)技術(shù)研發(fā)方向[12],從技術(shù)融合視角分析未來技術(shù)發(fā)展趨勢預(yù)測企業(yè)技術(shù)研發(fā)方向[13]?;谖墨I(xiàn)數(shù)據(jù)的研發(fā)方向識別重點(diǎn)關(guān)注現(xiàn)階段基礎(chǔ)科學(xué)研究內(nèi)容,有助于企業(yè)現(xiàn)有技術(shù)方向的布局,但不能明確企業(yè)未來發(fā)展方向;目前新興技術(shù)識別的研究多數(shù)采用的是單一類型的論文數(shù)據(jù)或者專利數(shù)據(jù),單一數(shù)據(jù)源往往會影響新興技術(shù)識別的準(zhǔn)確性和科學(xué)性,進(jìn)而影響研發(fā)方向識別結(jié)果;基于專利數(shù)據(jù)的研發(fā)方向識別明確了企業(yè)技術(shù)發(fā)展水平和技術(shù)改善方向,但是專利數(shù)據(jù)存在一定的滯后性,忽略了具體產(chǎn)品市場發(fā)展的需求特點(diǎn),對產(chǎn)品質(zhì)量水平的提升會產(chǎn)生一定影響;從技術(shù)融合視角分析技術(shù)發(fā)展趨勢的研究主要是從引文網(wǎng)絡(luò)層面、專利指標(biāo)層面或利用專利共性信息進(jìn)行技術(shù)融合分析,覆蓋的技術(shù)領(lǐng)域比較受限,研究方法較為傳統(tǒng)。
技術(shù)標(biāo)準(zhǔn)是一種重要的知識產(chǎn)權(quán)和競爭戰(zhàn)略,目前已有很多學(xué)者對標(biāo)準(zhǔn)的重要性進(jìn)行了分析[14]。關(guān)于技術(shù)標(biāo)準(zhǔn)視角下研發(fā)方向識別的相關(guān)研究大致可以分為兩類:一類是以標(biāo)準(zhǔn)必要專利為契機(jī)分析技術(shù)標(biāo)準(zhǔn)對于研發(fā)方向識別的重要性,將專利納入技術(shù)標(biāo)準(zhǔn)對于技術(shù)發(fā)展和轉(zhuǎn)化有積極的促進(jìn)作用[15],同時有研究發(fā)現(xiàn)技術(shù)標(biāo)準(zhǔn)合作已經(jīng)成為新一輪國際合作的主要類型之一,反映出技術(shù)標(biāo)準(zhǔn)在國際交往間的重要作用[16]。另一類是以技術(shù)標(biāo)準(zhǔn)為研究對象定性分析企業(yè)未來的研發(fā)走向,解決標(biāo)準(zhǔn)空白的預(yù)判問題可以更好的將技術(shù)標(biāo)準(zhǔn)融入企業(yè)研發(fā)戰(zhàn)略的制定過程中[17],隨著技術(shù)標(biāo)準(zhǔn)對技術(shù)創(chuàng)新的推動力越來越大,企業(yè)間競爭的核心逐漸轉(zhuǎn)向技術(shù)標(biāo)準(zhǔn)的競爭[2]。技術(shù)創(chuàng)新對于企業(yè)形成市場競爭新優(yōu)勢,增強(qiáng)發(fā)展的長期動力具有戰(zhàn)略性意義。技術(shù)標(biāo)準(zhǔn)化可以提高技術(shù)創(chuàng)新的效率,加速科技成果的擴(kuò)散,將技術(shù)創(chuàng)新與技術(shù)標(biāo)準(zhǔn)化有效結(jié)合,是對企業(yè)發(fā)展戰(zhàn)略的優(yōu)化和擴(kuò)展[18]。關(guān)于技術(shù)標(biāo)準(zhǔn)化的研究主要集中在以下幾個方面:a.研究技術(shù)標(biāo)準(zhǔn)化進(jìn)程[19],涉及與標(biāo)準(zhǔn)制定相關(guān)的體系制度和法律問題;b.研究技術(shù)標(biāo)準(zhǔn)化在創(chuàng)新技術(shù)轉(zhuǎn)化中的作用[4],重點(diǎn)關(guān)注技術(shù)標(biāo)準(zhǔn)化對企業(yè)生產(chǎn)經(jīng)營過程的影響;c.研究技術(shù)標(biāo)準(zhǔn)化對創(chuàng)新績效的影響[7],認(rèn)為技術(shù)標(biāo)準(zhǔn)化可以正向影響企業(yè)創(chuàng)新績效;d.以技術(shù)標(biāo)準(zhǔn)為導(dǎo)向識別企業(yè)研發(fā)方向[2],主要是利用標(biāo)準(zhǔn)文本信息進(jìn)行研究。
專利數(shù)據(jù)可以明確企業(yè)微觀技術(shù)改善方向,但是專利主要代表研發(fā)初期的研究成果,哪些技術(shù)可以用于特定領(lǐng)域形成新的產(chǎn)品和服務(wù),單獨(dú)從專利本身無法得到解讀,專利成果轉(zhuǎn)化問題也得不到解決。標(biāo)準(zhǔn)數(shù)據(jù)可以在很大程度上降低誤差性和滯后性的影響,有利于技術(shù)標(biāo)準(zhǔn)化這一關(guān)鍵研發(fā)目標(biāo)的實現(xiàn),對于標(biāo)準(zhǔn)空白點(diǎn)的進(jìn)一步分析可以獲取標(biāo)準(zhǔn)版本的更新內(nèi)容,明確企業(yè)未來的發(fā)展方向。專利與技術(shù)標(biāo)準(zhǔn)間存在長期穩(wěn)定的動態(tài)均衡關(guān)系,專利是技術(shù)標(biāo)準(zhǔn)的技術(shù)基礎(chǔ),專利被納入標(biāo)準(zhǔn)會被更為廣泛的使用[18]?;跇?biāo)準(zhǔn)和專利數(shù)據(jù)的企業(yè)技術(shù)研發(fā)方向識別,可以對企業(yè)當(dāng)前技術(shù)發(fā)展水平和未來研發(fā)方向進(jìn)行更好的研判,為企業(yè)獲取市場先發(fā)優(yōu)勢和競爭優(yōu)勢提供支撐?,F(xiàn)有研究更多關(guān)注技術(shù)標(biāo)準(zhǔn)對于技術(shù)創(chuàng)新和研發(fā)的影響,為企業(yè)發(fā)展和進(jìn)行技術(shù)創(chuàng)新提供了很好的指導(dǎo)作用。但是標(biāo)準(zhǔn)本身就是關(guān)鍵性的創(chuàng)新成果,標(biāo)準(zhǔn)文本信息及非文本信息都包含重要價值信息,需要深入挖掘才能全面研究技術(shù)標(biāo)準(zhǔn)化。為此,本文提出一種利用標(biāo)準(zhǔn)和專利數(shù)據(jù)對研發(fā)方向進(jìn)行篩選,集成標(biāo)準(zhǔn)文本信息及非文本信息解決企業(yè)技術(shù)研發(fā)方向識別問題的新方法。
依靠標(biāo)準(zhǔn)和專利數(shù)據(jù)的研發(fā)方向識別研究,既要發(fā)揮企業(yè)的技術(shù)優(yōu)勢,將技術(shù)轉(zhuǎn)化成產(chǎn)品的能力考慮在內(nèi),實現(xiàn)技術(shù)標(biāo)準(zhǔn)化,也要面向多應(yīng)用場景分析,為企業(yè)未來發(fā)展布局。首先以某產(chǎn)業(yè)標(biāo)準(zhǔn)和專利數(shù)據(jù)為數(shù)據(jù)來源,利用文本挖掘算法與GTM模型挖掘文本信息,繪制標(biāo)準(zhǔn)和專利地圖,通過逆映射完成標(biāo)準(zhǔn)空白點(diǎn)的解讀,實現(xiàn)技術(shù)空白點(diǎn)的初步識別;其次運(yùn)用鏈路預(yù)測模型常用相似性指標(biāo)對空白點(diǎn)進(jìn)一步篩選,得到潛在技術(shù)機(jī)會;最后利用標(biāo)準(zhǔn)非文本信息構(gòu)建關(guān)鍵詞創(chuàng)新性評價模型分析每個空白點(diǎn)的創(chuàng)新性和影響程度,從而確定研發(fā)方向。通過鏈路預(yù)測模型相似性指標(biāo)和關(guān)鍵詞創(chuàng)新性評價模型改善了以往簡單運(yùn)用余弦相似度分析相似性和主觀判斷空白點(diǎn)價值的方式,增強(qiáng)了空白點(diǎn)判別的可靠性,從而可以有效識別研發(fā)方向。研究框架如圖1所示。
圖1 基于標(biāo)準(zhǔn)和專利數(shù)據(jù)的企業(yè)技術(shù)研發(fā)方向識別研究框架圖
GTM模型可以將識別出的空白點(diǎn)反向映射到實際數(shù)據(jù)中,從而實現(xiàn)對空白點(diǎn)的解釋[20]。在識別效果和實現(xiàn)效率上都具有優(yōu)勢,克服了主成分分析法(PCA)和自組織神經(jīng)網(wǎng)絡(luò)方法(SOM)主觀解釋地圖的限制。具體分析步驟如下:
第1步,數(shù)據(jù)收集與預(yù)處理。構(gòu)建檢索表達(dá)式在ISO國際標(biāo)準(zhǔn)數(shù)據(jù)庫和Derwent數(shù)據(jù)庫中檢索相關(guān)標(biāo)準(zhǔn)和專利信息,將每條標(biāo)準(zhǔn)和專利的標(biāo)題與摘要合并為一個字段,刪除空值,將經(jīng)過預(yù)處理的標(biāo)準(zhǔn)和專利文本作為研究數(shù)據(jù)集。
第2步,標(biāo)準(zhǔn)和專利文本詞篇矩陣構(gòu)建。標(biāo)準(zhǔn)和專利文本關(guān)鍵詞提取采用TF-IDF方法進(jìn)行預(yù)處理,使用LDA主題模型進(jìn)行技術(shù)主題聚類,兩種方法相結(jié)合可以對文本內(nèi)容進(jìn)行更深入的挖掘,進(jìn)一步提高關(guān)鍵詞對標(biāo)準(zhǔn)和專利文檔的概括精確度。在篩選出最具解釋性和技術(shù)性的關(guān)鍵詞之后,通過VSM模型[21]構(gòu)建關(guān)鍵詞向量,得到關(guān)鍵詞-標(biāo)準(zhǔn)和關(guān)鍵詞-專利兩個詞篇矩陣,并進(jìn)一步將文本關(guān)鍵詞轉(zhuǎn)化成以二進(jìn)制表示的矢量矩陣。
第3步,標(biāo)準(zhǔn)和專利地圖繪制。標(biāo)準(zhǔn)和專利地圖的繪制采用GTM模型,以往研究表明后驗眾數(shù)投影的空白點(diǎn)識別更加清晰。因此,對于標(biāo)準(zhǔn)和專利的可視化,選擇后驗眾數(shù)投影來實現(xiàn)。
第4步,技術(shù)空白點(diǎn)識別。通過逆映射找到空白點(diǎn)及對應(yīng)關(guān)鍵詞的概率表示,并轉(zhuǎn)換為二進(jìn)制值形式。由于技術(shù)標(biāo)準(zhǔn)是針對具有普遍性和重復(fù)性的關(guān)鍵技術(shù)問題制定的最佳解決方案,是成熟技術(shù)、兼容技術(shù)、通用技術(shù),是技術(shù)成果的規(guī)范化和標(biāo)準(zhǔn)化[22],并且在標(biāo)準(zhǔn)內(nèi)容迭代中,前一個標(biāo)準(zhǔn)文本的空白點(diǎn)可能成為下一個新標(biāo)準(zhǔn)內(nèi)容的補(bǔ)充版本,因此對標(biāo)準(zhǔn)空白點(diǎn)所表征技術(shù)空白點(diǎn)的挖掘成為本文的研究重點(diǎn)。
鏈路預(yù)測是通過已知節(jié)點(diǎn)及網(wǎng)絡(luò)結(jié)構(gòu)信息預(yù)測未連接節(jié)點(diǎn)關(guān)聯(lián)的可能性[23]。Byungun Yoon[24]等人提出可以通過關(guān)鍵詞向量建立技術(shù)空白點(diǎn)和現(xiàn)有技術(shù)之間的鏈接關(guān)系,并利用專利數(shù)據(jù)進(jìn)行了驗證。鑒于之前相關(guān)研究在進(jìn)行標(biāo)準(zhǔn)與專利映射時,僅考慮了詞頻,未考慮二者之間潛在關(guān)聯(lián),本文基于 Byungun Yoon 的研究成果,將鏈路預(yù)測用在由標(biāo)準(zhǔn)和專利組成的二模網(wǎng)絡(luò)中。為了更好量化標(biāo)準(zhǔn)與專利之間主題的相似度,選取鏈路預(yù)測常用相似性指標(biāo)進(jìn)行測度,可以更精確地進(jìn)行標(biāo)準(zhǔn)與專利的匹配。具體分析步驟如下:
第1步,關(guān)聯(lián)網(wǎng)絡(luò)建立。將標(biāo)準(zhǔn)空白點(diǎn)及所有專利點(diǎn)都還原成關(guān)鍵詞向量表示的形式,現(xiàn)有專利作為技術(shù)基礎(chǔ)且與技術(shù)機(jī)會緊密關(guān)聯(lián),因此以現(xiàn)有專利為橋梁建立標(biāo)準(zhǔn)空白點(diǎn)與專利點(diǎn)之間的對應(yīng)關(guān)系。當(dāng)標(biāo)準(zhǔn)空白點(diǎn)與現(xiàn)有專利點(diǎn)存在公共關(guān)鍵詞時,即認(rèn)為標(biāo)準(zhǔn)空白點(diǎn)與現(xiàn)有專利點(diǎn)之間存在鏈接,為鄰居關(guān)系。
第2步,相似性指標(biāo)構(gòu)建。選取鏈路預(yù)測常用的兩個相似性指標(biāo)共同鄰居(CN)[25]和Jaccard系數(shù)[26]。根據(jù)本文研究問題添加余弦相似度(CS)、公共關(guān)鍵詞權(quán)重(PK)兩個指標(biāo)。使用余弦相似度[27]來測度標(biāo)準(zhǔn)和專利主題的相似度,計算公式如(1)所示。標(biāo)準(zhǔn)和專利的鏈接關(guān)系是通過關(guān)鍵詞向量構(gòu)建的,因此關(guān)鍵詞對于研究結(jié)果具有重要影響作用,本文選用TF-IDF方法為關(guān)鍵詞賦權(quán)。
(1)
其中,PW,SW分別表示專利與標(biāo)準(zhǔn)文本的詞頻向量,n表示文本的數(shù)量。
第3步,潛在技術(shù)機(jī)會識別。使用熵權(quán)法對各指標(biāo)賦權(quán),通過加權(quán)相似度算法計算匹配得分,即可得到標(biāo)準(zhǔn)空白點(diǎn)與專利點(diǎn)之間存在關(guān)聯(lián)的可能性,將最有可能鏈接的標(biāo)準(zhǔn)空白點(diǎn)與專利點(diǎn)的鏈接視為潛在技術(shù)機(jī)會。
由于標(biāo)準(zhǔn)的數(shù)量、發(fā)展階段、價格等非文本數(shù)據(jù)也包含重要信息,同時研發(fā)需要以創(chuàng)新為中心,也為創(chuàng)新提供支持[28],因此本文構(gòu)建了基于標(biāo)準(zhǔn)綜合信息的技術(shù)關(guān)鍵詞創(chuàng)新性評價模型,通過潛在技術(shù)機(jī)會包含的技術(shù)關(guān)鍵詞創(chuàng)新值之和表征空白點(diǎn)的創(chuàng)新性,將具有高創(chuàng)新性的空白點(diǎn)所代表的潛在技術(shù)機(jī)會確定為研發(fā)方向。本文基于吳菲菲等的研究成果[14],從創(chuàng)新影響力范圍和創(chuàng)造成果新穎性程度兩個角度構(gòu)建關(guān)鍵詞創(chuàng)新性評價模型,各指標(biāo)含義和測量方式見表1。
表1 關(guān)鍵詞創(chuàng)新性評價指標(biāo)
為了更加客觀準(zhǔn)確地評價不同關(guān)鍵詞的影響作用,本文使用變異系數(shù)法對各關(guān)鍵詞的創(chuàng)新性進(jìn)行綜合評價。變異系數(shù)法可以綜合分析各項指標(biāo)所包含的所有信息,消除測量尺度和量綱的影響[29]。在得到每個技術(shù)關(guān)鍵詞的創(chuàng)新性綜合評價值之后,通過計算潛在技術(shù)機(jī)會創(chuàng)新性綜合評價值之和得到各標(biāo)準(zhǔn)空白點(diǎn)的創(chuàng)新性,將具有高創(chuàng)新性的標(biāo)準(zhǔn)空白點(diǎn)表征的技術(shù)機(jī)會確定為企業(yè)的技術(shù)研發(fā)方向。
遠(yuǎn)程醫(yī)療使得醫(yī)療資源得以最大限度地共享和利用,在很大程度上改善了患病人群的生活質(zhì)量和健康程度。新冠疫情給醫(yī)療秩序的穩(wěn)定和患者就醫(yī)保障帶來嚴(yán)峻考驗,遠(yuǎn)程醫(yī)療的開展,有利于提高醫(yī)療資源可及性,帶來更高效的醫(yī)療服務(wù)[30]。遠(yuǎn)程醫(yī)療技術(shù)的發(fā)展相對成熟,并且已經(jīng)形成了很多相應(yīng)的技術(shù)標(biāo)準(zhǔn)。本文以遠(yuǎn)程醫(yī)療產(chǎn)業(yè)的標(biāo)準(zhǔn)和專利數(shù)據(jù)為樣本進(jìn)行研究。ISO是世界上最大的非政府性標(biāo)準(zhǔn)化專門機(jī)構(gòu),所發(fā)布的國際標(biāo)準(zhǔn)更具有代表性和研究價值,以ICS3=35.240.80為檢索條件在ISO國際標(biāo)準(zhǔn)數(shù)據(jù)庫中檢索標(biāo)準(zhǔn)文本;Derwent囊括了不同國家專利局的專利數(shù)據(jù),包含的技術(shù)范圍更加廣泛,潛在技術(shù)機(jī)會識別使用的專利信息在Derwent上檢索。對檢索到的數(shù)據(jù)進(jìn)行初步清洗,最終得到標(biāo)準(zhǔn)文本273篇,專利文本911篇。
因為標(biāo)準(zhǔn)和專利的標(biāo)題和摘要文本中都包含大量的技術(shù)關(guān)鍵詞信息,而且不存在明顯的語義關(guān)系,具有較高的研究價值,因此本文選用關(guān)鍵詞來表征文本所包含的信息。首先,對標(biāo)準(zhǔn)和專利文本進(jìn)行預(yù)處理;其次,利用TF-IDF初步提取標(biāo)準(zhǔn)和專利文本的關(guān)鍵詞,從每篇文本中檢索出15個關(guān)鍵詞。最后,將所有關(guān)鍵詞作為輸入端,基于LDA模型進(jìn)行主題聚類,得到30個基數(shù)詞作為最終關(guān)鍵詞。清洗后的遠(yuǎn)程醫(yī)療產(chǎn)業(yè)標(biāo)準(zhǔn)和專利文本的技術(shù)主題分布情況如表2所示。
表2 遠(yuǎn)程醫(yī)療產(chǎn)業(yè)主題-關(guān)鍵詞分布
根據(jù)關(guān)鍵詞分布情況,將標(biāo)準(zhǔn)和專利文本轉(zhuǎn)換成以二進(jìn)制形式表示的關(guān)鍵詞向量,最終的關(guān)鍵詞向量如表3所示,矩陣中 1表示標(biāo)準(zhǔn)和專利文本中包含該關(guān)鍵詞,0表示不包含。
表3 遠(yuǎn)程醫(yī)療產(chǎn)業(yè)標(biāo)準(zhǔn)和專利關(guān)鍵詞向量
將標(biāo)準(zhǔn)和專利的關(guān)鍵詞向量作為輸入端,由于標(biāo)準(zhǔn)和專利的原始數(shù)據(jù)量存在較大差異,因此二者的GTM模型應(yīng)設(shè)置不同的參數(shù)。標(biāo)準(zhǔn)數(shù)據(jù)設(shè)置81個徑向高斯基函數(shù),每個基函數(shù)的數(shù)據(jù)中心位于一個8*8的正則網(wǎng)格點(diǎn)上;專利數(shù)據(jù)設(shè)置 100個徑向高斯基函數(shù),每個基函數(shù)的數(shù)據(jù)中心位于一個10*10的正則網(wǎng)格點(diǎn)上。通過上述參數(shù)設(shè)置可制作標(biāo)準(zhǔn)與專利地圖,如圖2所示。
圖2 標(biāo)準(zhǔn)地圖(左)和專利地圖(右)
圖2中“★”代表標(biāo)準(zhǔn)和專利空白區(qū)域,由圖可知,標(biāo)準(zhǔn)地圖中共存在20個空白點(diǎn),通過GTM逆向映射將20個標(biāo)準(zhǔn)空白點(diǎn)逆向映射到數(shù)據(jù)空間,還原成關(guān)鍵詞向量,完成對標(biāo)準(zhǔn)空白點(diǎn)的解讀。
GTM模型將標(biāo)準(zhǔn)和專利關(guān)鍵詞映射于各自地圖上,逆映射過程如圖3所示。
圖3 標(biāo)準(zhǔn)(專利)空白點(diǎn)逆向映射過程
潛在技術(shù)機(jī)會的識別通過建立標(biāo)準(zhǔn)空白點(diǎn)與專利的映射來實現(xiàn), 如圖4所示。各標(biāo)準(zhǔn)空白點(diǎn)(與各專利點(diǎn))的關(guān)聯(lián)關(guān)系預(yù)測結(jié)果如表4所示。
表4 各標(biāo)準(zhǔn)空白點(diǎn)預(yù)測結(jié)果
圖4 標(biāo)準(zhǔn)與地圖映射圖
通過閾值設(shè)定選取匹配值大于20的標(biāo)準(zhǔn)空白點(diǎn)所代表的技術(shù)機(jī)會作為潛在技術(shù)機(jī)會,即標(biāo)準(zhǔn)空白點(diǎn)3、標(biāo)準(zhǔn)空白點(diǎn)4、標(biāo)準(zhǔn)空白點(diǎn)2、標(biāo)準(zhǔn)空白點(diǎn)1、標(biāo)準(zhǔn)空白點(diǎn)6、標(biāo)準(zhǔn)空白點(diǎn)7、標(biāo)準(zhǔn)空白點(diǎn)15、標(biāo)準(zhǔn)空白點(diǎn)16、標(biāo)準(zhǔn)空白點(diǎn)12。
通過構(gòu)建的關(guān)鍵詞創(chuàng)新性評價指標(biāo)體系,綜合創(chuàng)新活力、創(chuàng)新質(zhì)量和創(chuàng)新規(guī)模確定30個關(guān)鍵詞的創(chuàng)新性評價值,通過各個標(biāo)準(zhǔn)空白點(diǎn)包含的關(guān)鍵詞創(chuàng)新值之和表征其創(chuàng)新性,最終9個標(biāo)準(zhǔn)空白點(diǎn)的綜合評價結(jié)果如表5所示。
表5 標(biāo)準(zhǔn)空白點(diǎn)的綜合評價結(jié)果
從表5中選取綜合評價值遠(yuǎn)高于其他點(diǎn)的標(biāo)準(zhǔn)空白點(diǎn)所表示的技術(shù)主題作為遠(yuǎn)程醫(yī)療產(chǎn)業(yè)內(nèi)企業(yè)的技術(shù)研發(fā)方向,通過對空白點(diǎn)解讀和對領(lǐng)域知識的研究,最終確定的研發(fā)方向為:K3基于計算機(jī)網(wǎng)絡(luò)平臺的電子健康記錄和在線咨詢技術(shù);K12基于5G和健康關(guān)懷技術(shù)的遠(yuǎn)程醫(yī)療護(hù)理技術(shù)。
普華永道全球醫(yī)療研究院發(fā)布的醫(yī)療行業(yè)熱門趨勢報告中指出,診斷、治療、監(jiān)測設(shè)備在醫(yī)院住院管理系統(tǒng)中自動記錄患者就醫(yī)數(shù)據(jù)可以大大提升醫(yī)院運(yùn)營管理效率,數(shù)字化和互聯(lián)網(wǎng)醫(yī)療被列為國家戰(zhàn)略,應(yīng)該將基于健康關(guān)懷技術(shù)的虛擬護(hù)理納入整體策略,向患者、醫(yī)療機(jī)構(gòu)、醫(yī)生等提供有價值的信息;健康界研究院在2022年關(guān)于中國遠(yuǎn)程醫(yī)療發(fā)展的報告中指出,遠(yuǎn)程會診、遠(yuǎn)程影像、遠(yuǎn)程監(jiān)測等成為5G技術(shù)與遠(yuǎn)程醫(yī)療融合發(fā)展的典型應(yīng)用場景,應(yīng)加強(qiáng)5G技術(shù)、物聯(lián)網(wǎng)等相關(guān)技術(shù)的成熟和融合應(yīng)用;CB INSIGHTS在《2022年遠(yuǎn)程醫(yī)療狀況報告》中強(qiáng)調(diào)應(yīng)該加強(qiáng)對遠(yuǎn)程監(jiān)測、遠(yuǎn)程醫(yī)療護(hù)理、遠(yuǎn)程輔導(dǎo)和咨詢等的建設(shè)和管理。這些研究報告的內(nèi)容有力的支撐了本文遠(yuǎn)程醫(yī)療產(chǎn)業(yè)內(nèi)企業(yè)技術(shù)研發(fā)方向識別的結(jié)果,也很好的驗證了研究方法的可行性和研究結(jié)果的可靠性。
本文從技術(shù)標(biāo)準(zhǔn)化視角出發(fā),以標(biāo)準(zhǔn)和專利數(shù)據(jù)作為研究數(shù)據(jù)源,充分挖掘?qū)@奈谋拘畔ⅰ?biāo)準(zhǔn)的文本和非文本信息,運(yùn)用GTM模型繪制標(biāo)準(zhǔn)地圖和專利地圖識別技術(shù)空白點(diǎn),通過鏈路預(yù)測模型識別潛在技術(shù)機(jī)會,構(gòu)建關(guān)鍵詞創(chuàng)新性評價模型對潛在技術(shù)機(jī)會進(jìn)行綜合評價,將綜合評價值較高的技術(shù)機(jī)會確定為研發(fā)方向,以遠(yuǎn)程醫(yī)療產(chǎn)業(yè)為例進(jìn)行實證研究,并與國際知名行業(yè)報告研究內(nèi)容進(jìn)行匹配分析,驗證了本文所提出方法的可行性,得到的建設(shè)性結(jié)論與建議如下:
a.綜合運(yùn)用標(biāo)準(zhǔn)和專利數(shù)據(jù)可以更好的解決技術(shù)集成轉(zhuǎn)化的關(guān)鍵問題。專利文本中包含了大量技術(shù)信息,有助于對產(chǎn)業(yè)整體技術(shù)布局的了解;標(biāo)準(zhǔn)信息中可以提取出關(guān)鍵性的創(chuàng)新成果,有助于科技成果轉(zhuǎn)化和技術(shù)標(biāo)準(zhǔn)化。充分挖掘標(biāo)準(zhǔn)和專利信息,可以更好的完成技術(shù)集成轉(zhuǎn)化,使得技術(shù)多樣性逐漸標(biāo)準(zhǔn)化,幫助企業(yè)提前布局研發(fā)活動的方向,以便在激烈的市場競爭中獲得有利地位。
b.集成標(biāo)準(zhǔn)文本信息及非文本信息可以進(jìn)一步提升研發(fā)方向識別的效益,同時可以為產(chǎn)業(yè)整體創(chuàng)新發(fā)展和相關(guān)技術(shù)布局提供參考。技術(shù)標(biāo)準(zhǔn)是國家技術(shù)先進(jìn)性競爭和標(biāo)準(zhǔn)話語權(quán)的有效籌碼,應(yīng)該積極關(guān)注和影響數(shù)字經(jīng)濟(jì)相關(guān)的技術(shù)標(biāo)準(zhǔn),對技術(shù)標(biāo)準(zhǔn)所包含的重要信息進(jìn)行充分的研究和挖掘。針對標(biāo)準(zhǔn)文本信息的挖掘明確了企業(yè)的技術(shù)機(jī)會和方向,充分發(fā)揮了企業(yè)的技術(shù)優(yōu)勢,將技術(shù)轉(zhuǎn)化成產(chǎn)品的能力考慮在內(nèi);標(biāo)準(zhǔn)本身就是重要的技術(shù)指南,標(biāo)準(zhǔn)非文本信息也包含重要價值信息,可以用于創(chuàng)新性的測度,實現(xiàn)面向多應(yīng)用場景的分析,可以很好的為企業(yè)未來發(fā)展布局。需要綜合與集成挖掘才能全面研究技術(shù)標(biāo)準(zhǔn)化。
c.新冠疫情的持續(xù)沖擊和日趨嚴(yán)重的人口老齡化問題使得遠(yuǎn)程醫(yī)療技術(shù)需不斷發(fā)展和完善。通過預(yù)測遠(yuǎn)程醫(yī)療產(chǎn)業(yè)內(nèi)企業(yè)的技術(shù)研發(fā)方向,將5G技術(shù)、物聯(lián)網(wǎng)技術(shù)等與遠(yuǎn)程醫(yī)療融合應(yīng)用,進(jìn)一步推動遠(yuǎn)程醫(yī)療護(hù)理、遠(yuǎn)程會診、遠(yuǎn)程影像等應(yīng)用方向的成熟,可以大幅度降低患者的就醫(yī)成本,改善患者的生活質(zhì)量和健康程度,也可以最大限度地共享和利用醫(yī)療資源,大大提升醫(yī)院運(yùn)營管理效率。
d.我國經(jīng)濟(jì)發(fā)展步入新時代,經(jīng)濟(jì)增長正在經(jīng)歷從高速增長向高質(zhì)量發(fā)展的轉(zhuǎn)型,企業(yè)的技術(shù)需求和研發(fā)策略都與產(chǎn)業(yè)發(fā)展的階段存在關(guān)聯(lián)。未來可結(jié)合產(chǎn)業(yè)生命周期不同階段的不同特征針對性選擇數(shù)據(jù)源和研究方法,研究結(jié)果會更加具體和適用。本研究也為產(chǎn)業(yè)內(nèi)企業(yè)尋找合適的研發(fā)合作伙伴進(jìn)行合作研發(fā)奠定了基礎(chǔ)。