尉心淵
(山西大學(xué),太原 030006)
專利是科技進(jìn)步的產(chǎn)物,是科技水平的體現(xiàn)。其所蘊(yùn)含的信息對于科技型企業(yè)的發(fā)展和競爭有非常重要的參考價值,是制定正確的專利戰(zhàn)略、衡量科技進(jìn)步的重要指標(biāo)。誰能最先掌握核心專利,誰就能在市場中占據(jù)主導(dǎo)地位。當(dāng)前,在轉(zhuǎn)化收益普遍不公開的情況下,被引次數(shù)無疑是預(yù)測核心專利的最為重要的指標(biāo)。提前準(zhǔn)確地預(yù)測出某一領(lǐng)域的核心專利,也就可以挖掘出企業(yè)的經(jīng)濟(jì)價值,可以為企業(yè)制定專利戰(zhàn)略、盡早布局技術(shù)研發(fā)或轉(zhuǎn)讓等提供參考。
技術(shù)創(chuàng)新和進(jìn)步促進(jìn)了專利申請量的大幅增加,而核心專利的識別與評估也成為專利計量學(xué)的一個熱門領(lǐng)域?,F(xiàn)有的對于核心專利識別方法的研究有很多,大都是基于專利質(zhì)量評價指標(biāo)來進(jìn)行。在所有指標(biāo)中,專利被引次數(shù)指標(biāo)使用最廣泛。一般而言,被引頻次較高的專利在產(chǎn)業(yè)鏈中所處位置較為關(guān)鍵,在一定程度上反映了專利在某領(lǐng)域研發(fā)中的基礎(chǔ)性、引導(dǎo)性作用。一些專家認(rèn)為,專利的被引頻次是衡量一個專利價值的重要指標(biāo),通過分析專利的被引頻次能夠識別出核心專利。因此,專利的被引頻次可以用做確認(rèn)企業(yè)重要專利及核心技術(shù)的指標(biāo)[1]。有研究表明,專利發(fā)布后幾年的被引頻次服從的偏態(tài)分布與專利質(zhì)量的分布非常相符,被引頻次高的專利就是高質(zhì)量的專利[2]。這說明,研究專利的被引頻次對于核心專利的發(fā)現(xiàn)以及專利價值的預(yù)測有很重要的意義。通過預(yù)測某一專利的被引頻次,衡量該專利的價值程度,可以非常準(zhǔn)確的預(yù)測該專利是否會成為核心專利?,F(xiàn)在專利質(zhì)量評價指標(biāo)的研究較為成熟,常用的指標(biāo)大致可以歸為以下四個方面:(1)被引。主要是考察現(xiàn)有專利被后續(xù)專利的引用情況,一般認(rèn)為某專利被引次數(shù)越多,它對后續(xù)專利的影響越大,越有可能成為核心專利。(2)引用。主要是考量該專利引用已有相關(guān)論文以及與現(xiàn)存科學(xué)知識的關(guān)聯(lián)度,主要指標(biāo)包括科學(xué)關(guān)聯(lián)度、科學(xué)強(qiáng)度等。這方面的指標(biāo)數(shù)值越大,表明該專利跟技術(shù)的聯(lián)系相對緊密。(3)技術(shù)保護(hù)范圍。這類指標(biāo)是發(fā)明人對該專利技術(shù)保護(hù)程度的體現(xiàn),主要有權(quán)利要求數(shù)量、技術(shù)覆蓋范圍等指標(biāo)。專利權(quán)人對該專利越是重視,申請保護(hù)的權(quán)利范圍越廣,說明該專利對技術(shù)發(fā)展越重要。從本質(zhì)上講,這類指標(biāo)最能反映專利質(zhì)量。(4)區(qū)域保護(hù)范圍。該類指標(biāo)主要是考量專利權(quán)人對其專利申請了法律保護(hù)的國別數(shù)。專利族大小指標(biāo)是這個角度的代表,該數(shù)值與專利質(zhì)量為正相關(guān)關(guān)系,說明該指標(biāo)對于專利質(zhì)量衡量有很重要的參考意義。
通過國內(nèi)外研究的分析可以看出,核心專利的識別有一定的研究成果,但是對于專利被引頻次的預(yù)測不夠具體,對于核心專利的研究也有待深入。為了解決這些問題,本文構(gòu)建了一種專利被引頻次的預(yù)測模型,通過分析專利信息以及被引頻次與核心專利之間的關(guān)系,選擇正確的指標(biāo)體系,以確保模型的科學(xué)性和適用性,使用支持向量機(jī)回歸的方法實(shí)現(xiàn)核心專利的預(yù)測,為企業(yè)尋找未來的發(fā)展目標(biāo)、實(shí)現(xiàn)在技術(shù)上的突破提供參考。
回歸分析的關(guān)鍵是變量的選擇,通過具體分析核心專利的影響因素,確定影響被引頻次的因素,正確選擇預(yù)測模型中的變量,綜合分析現(xiàn)有專利質(zhì)量評價指標(biāo)的研究,選擇3個指標(biāo):科學(xué)關(guān)聯(lián)度、權(quán)利要求數(shù)、專利族大小,進(jìn)行模型中指標(biāo)體系的構(gòu)建。本文選擇的3個指標(biāo)是專利指標(biāo)三個方面的代表。雖然其他指標(biāo)對于模型的構(gòu)建也有作用,但相關(guān)性較低,所以選擇了這3個指標(biāo)進(jìn)行指標(biāo)體系的構(gòu)建。
支持向量機(jī)是一種小樣本數(shù)據(jù)的機(jī)器學(xué)習(xí)方法,憑借其極強(qiáng)的泛化能力,可以解決傳統(tǒng)預(yù)測方法面臨的“維數(shù)災(zāi)難”和“過學(xué)習(xí)”等困難[3]。該方法在專利領(lǐng)域有很廣泛的應(yīng)用,徐晟為了對我國專利申請量進(jìn)行預(yù)測,使用支持向量機(jī)進(jìn)行回歸分析,發(fā)現(xiàn)該預(yù)測方法有很高的預(yù)測精度[4]。Fall和Benzineb等以IPC分類號為研究對象,分別對樸素貝葉斯算法、支持向量機(jī)、K近鄰算法進(jìn)行分類運(yùn)算,比較后發(fā)現(xiàn)支持向量機(jī)的分類效果最好[5]。
綜合比較各個核函數(shù)的作用,并結(jié)合專利數(shù)據(jù)的性質(zhì),我們發(fā)現(xiàn)使用Gauss徑向基核函數(shù)對于該模型的構(gòu)建更加合理,模型的預(yù)測結(jié)果比較精確。另外,懲罰系數(shù)和核函數(shù)的參數(shù)使用交叉驗(yàn)證法和網(wǎng)格搜索來進(jìn)一步確定,這兩種方法因其科學(xué)性和準(zhǔn)確性在現(xiàn)有研究中使用較為廣泛。通過使用專利數(shù)據(jù)對模型進(jìn)行驗(yàn)證,我們發(fā)現(xiàn)該模型的預(yù)測準(zhǔn)確率都比較高,可以說明支持向量機(jī)在專利被引頻次預(yù)測以及核心專利發(fā)掘方面有很強(qiáng)的適用性。
通過模型預(yù)測出的核心專利可以實(shí)現(xiàn)產(chǎn)品質(zhì)量的改進(jìn)和服務(wù)水平的提升,加快產(chǎn)品的更新?lián)Q代速度,以獲取更多的經(jīng)濟(jì)利潤。另外,通過核心專利可以精準(zhǔn)監(jiān)控競爭對手的實(shí)力水平,掌控產(chǎn)業(yè)發(fā)展的方向,通過正確布局外圍專利,圍繞核心技術(shù)進(jìn)一步開發(fā)新的外圍技術(shù)和產(chǎn)品,有可能實(shí)現(xiàn)產(chǎn)業(yè)壟斷。
參考文獻(xiàn):
[1]Harhoff D.,Narin F.,Scherer F M.,etal.Citation Frequency and the value of patented inventions[J].The Review of Economics and Statistics,1999,(8):511-515.
[2]萬小麗.專利質(zhì)量指標(biāo)中“被引頻次”的深度剖析[J].情報科學(xué),2014,(1).
[3]Vapnik V.N.An overview of statistical learning theory[J].Neural Networks,IEEE Transactions,1999,(5):988-999.
[4]徐晟,趙惠芳,郭雪松.我國專利申請量的支持向量機(jī)預(yù)測模型研究[J].運(yùn)籌與管理,2007,(5).
[5]Fall C.J.,TorcsvariA,Benzineb K.,etal.Automated categorization in the international patent classification[C]//ACM SIGIR Forum,2003.