劉 澄 雷秋原 張 楠 鮑新中
(1.北京科技大學(xué)經(jīng)濟(jì)管理學(xué)院 北京 100083; 2.北京聯(lián)合大學(xué)管理學(xué)院 北京 100101)
伴隨著經(jīng)濟(jì)全球化進(jìn)程的加快,科學(xué)技術(shù)水平已經(jīng)成為各國核心競爭力的重要體現(xiàn),人類社會(huì)已經(jīng)步入了知識時(shí)代。作為知識時(shí)代最重要的知識產(chǎn)權(quán),專利的重要性受到了越來越多的認(rèn)可。對于專利權(quán)人而言,專利是其智力成果的凝聚;對于企業(yè)而言,專利成為其挖掘發(fā)展?jié)摿?、快速占領(lǐng)市場、獲得經(jīng)濟(jì)利益的載體;而對于國家而言,專利可以增強(qiáng)其科技實(shí)力,無懼競爭者的抗衡。在專利的運(yùn)營和實(shí)施過程中,價(jià)值評估是一個(gè)十分重要的環(huán)節(jié),因此引起了學(xué)者們和業(yè)界相關(guān)人士的關(guān)注。
相較于有形資產(chǎn)在市場上具有明確的市場價(jià)格,專利由于其唯一性特征,并且缺少可供參考的公開交易,其評估難度明顯更大。同時(shí),專利的價(jià)值評估還面臨更多的技術(shù)因素、市場因素和法律因素等不確定性影響,也給專利價(jià)值評估實(shí)踐帶來了更多的復(fù)雜性,這也是學(xué)者們長期以來進(jìn)行相關(guān)研究所要解決的問題。早期的專利價(jià)值評估實(shí)踐借鑒了有形資產(chǎn)價(jià)值評估的經(jīng)驗(yàn),采用了現(xiàn)行市價(jià)法、重置成本法和收益現(xiàn)值法等市場基準(zhǔn)的價(jià)值評估方法。按照我國《資產(chǎn)評估執(zhí)業(yè)準(zhǔn)則——無形資產(chǎn)》第二十一條規(guī)定:“確定無形價(jià)值的評估方法包括市場法、收益法和成本法三種基本方法及其衍生方法”。由于三種基本方法在應(yīng)用中對風(fēng)險(xiǎn)因素的考慮不夠,學(xué)者們提出了基于實(shí)物期權(quán)模型的專利價(jià)值評估方法[1-4]。
以市場為基準(zhǔn)的專利價(jià)值評估方法通過獲取較為完善的市場信息來進(jìn)行價(jià)值確定,但是由于市場信息的不完備,造成這些方法耗時(shí)耗力,且主觀性較強(qiáng)。近些年來,非市場基準(zhǔn)的專利價(jià)值評估方法也被廣泛的應(yīng)用在理論和實(shí)踐當(dāng)中。非市場基準(zhǔn)的專利價(jià)值評估方法的基本思路是,基于公共專利數(shù)據(jù)庫中相關(guān)信息,應(yīng)用實(shí)證研究方法來分析不同信息與專利價(jià)值之間的關(guān)系,在此基礎(chǔ)上,以專利價(jià)值影響因素為變量來構(gòu)建專利價(jià)值評估模型[5]。在運(yùn)用非市場基準(zhǔn)的專利價(jià)值評估方法時(shí),首先要解決的是尋找影響專利價(jià)值的因素,在確定專利價(jià)值影響因素的前提下,建立價(jià)值評估模型。根據(jù)建立專利價(jià)值評估模型的不同方法,非市場基準(zhǔn)的專利價(jià)值評估方法分為模糊綜合評價(jià)法、計(jì)量經(jīng)濟(jì)學(xué)模型法、機(jī)器學(xué)習(xí)與仿真模擬法三類。在應(yīng)用模糊綜合評價(jià)法進(jìn)行專利價(jià)值評估時(shí),學(xué)者們從不同視角建立專利價(jià)值評估綜合指標(biāo)體系,再應(yīng)用各種方法給被評價(jià)專利的每一個(gè)因素賦值,最后得到專利價(jià)值的綜合評價(jià)結(jié)果[6-10]。2002 年,德國慕尼黑大學(xué)的Harhoff教授提出了一種基于計(jì)量經(jīng)濟(jì)模型的專利價(jià)值評估方法并進(jìn)行了實(shí)證研究[11]。該方法以專利價(jià)值估計(jì)值作為因變量,以選取的專利價(jià)值影響因素作為自變量,選取與待評估專利同質(zhì)的樣本,運(yùn)用歷史數(shù)據(jù)進(jìn)行多元回歸分析,在此基礎(chǔ)上建立專利價(jià)值的評估模型。國內(nèi)學(xué)者也運(yùn)用該類方法進(jìn)行了一些探索性研究[12-13]。
近年來隨著人工智能技術(shù)的發(fā)展,有學(xué)者提出了運(yùn)用一些基于機(jī)器學(xué)習(xí)的專利價(jià)值評估方法。這種方法的基本思路是:首先同樣是分析和選擇專利價(jià)值的評估指標(biāo),然后利用機(jī)器學(xué)習(xí)的方法對樣本進(jìn)行訓(xùn)練并測試,從而得到專利價(jià)值評估結(jié)果。學(xué)者們嘗試運(yùn)用分類回歸樹算法[14]、支持向量機(jī)[15]、系統(tǒng)動(dòng)力學(xué)模擬[16]等算法進(jìn)行了一些實(shí)證研究。當(dāng)前專利價(jià)值評估領(lǐng)域,主要應(yīng)用機(jī)器學(xué)習(xí)解決分類問題。 通過一些表現(xiàn)專利價(jià)值的指標(biāo)標(biāo)注專利價(jià)值,使用相關(guān)分類算法構(gòu)建分類模型, 經(jīng)過訓(xùn)練和學(xué)習(xí), 獲取專利價(jià)值評估模型。這種基于機(jī)器學(xué)習(xí)與模擬仿真的專利價(jià)值評估方法在理論上存在一定的可行性,但是實(shí)際應(yīng)用中還需要對相關(guān)指標(biāo)、算法等進(jìn)行進(jìn)一步的完善。因此, 如何科學(xué)合理地選擇價(jià)值指標(biāo), 如何選取合適的算法對于構(gòu)建專利價(jià)值評估模型有重要影響。因此,本文以探究更加可行、準(zhǔn)確度更高的專利價(jià)值評估模型為目標(biāo),應(yīng)用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建專利價(jià)值評估模型。
BP神經(jīng)網(wǎng)絡(luò)作為人工智能領(lǐng)域中的重要組成部分,在各項(xiàng)經(jīng)濟(jì)社會(huì)生活中得到較為廣泛的應(yīng)用[17-19]。 本文將BP神經(jīng)網(wǎng)絡(luò)原理應(yīng)用到專利價(jià)值評估中,同時(shí)考慮到專利價(jià)值影響因素的多元性,在確定輸入層神經(jīng)元時(shí)采用粗糙集理論對專利價(jià)值影響因素進(jìn)行指標(biāo)約簡,建立一個(gè)粗糙集和BP神經(jīng)網(wǎng)絡(luò)相結(jié)合的專利價(jià)值評估模型,并運(yùn)用336條專利轉(zhuǎn)讓數(shù)據(jù)對模型進(jìn)行訓(xùn)練和測試。本文可能的創(chuàng)新點(diǎn)為:(1)指標(biāo)體系創(chuàng)新。在對現(xiàn)有專利價(jià)值評估指標(biāo)體系分析基礎(chǔ)上,新增發(fā)明人相關(guān)指標(biāo),構(gòu)建了包含專利文本特征、專利法律度特征、專利市場關(guān)注度特征、發(fā)明人特征的指標(biāo)體系。(2)研究方法創(chuàng)新。將BP神經(jīng)網(wǎng)絡(luò)引入專利價(jià)值評估領(lǐng)域,構(gòu)建新的專利價(jià)值評估模型??紤]到專利價(jià)值影響因素的多元性,在確定輸入層神經(jīng)元時(shí)采用粗糙集理論對專利價(jià)值指標(biāo)體系進(jìn)行知識約簡。
運(yùn)用BP神經(jīng)網(wǎng)絡(luò)對專利價(jià)值進(jìn)行評估,首先需要確定影響專利價(jià)值的主要因素,建立合理科學(xué)適用的專利價(jià)值評估指標(biāo)體系。在初期構(gòu)建指標(biāo)體系可以盡可能全面考慮影響因素,進(jìn)一步對全部影響因素進(jìn)行分析,將冗余重復(fù)類因素進(jìn)行初選后再細(xì)致優(yōu)選,盡量得到既精簡又全面的影響因素?,F(xiàn)行指標(biāo)初選方法多為文獻(xiàn)法、理論挖掘法、專家打分法等。此三類指標(biāo)篩選方法均有其優(yōu)缺點(diǎn),因而采用單一方法進(jìn)行此初選指標(biāo)存在一定局限,而多種方法結(jié)合可以規(guī)避單方法的缺點(diǎn),進(jìn)而建立更為科學(xué)完善的指標(biāo)體系。對此,本文通過使用文獻(xiàn)法和理論分析方法進(jìn)行初選指標(biāo)。
國內(nèi)外眾多學(xué)者對專利價(jià)值評估模型指標(biāo)體系建立有不同做法。在專利價(jià)值成為研究重點(diǎn)以來,學(xué)者們對影響專利價(jià)值的因素已經(jīng)有一定研究成果,多數(shù)學(xué)者將與專利相關(guān)的要素分成三類,分別是:法律因素、技術(shù)因素和經(jīng)濟(jì)因素[20-22]。在單個(gè)影響因素基礎(chǔ)上,眾多學(xué)者也突破單個(gè)因素的分析,結(jié)合多種因素對專利價(jià)值進(jìn)行研究[23]。20世紀(jì)80年代,美國CHI-Resarch公司構(gòu)建CHI評估指標(biāo)體系,美國聯(lián)邦法院確立佐治亞太平洋指標(biāo)體系。張黎等將影響因素劃分成專利技術(shù)水平、市場價(jià)值、權(quán)利保護(hù)三個(gè)方面建立指標(biāo)體系[24];楊思思等參考《專利價(jià)值分析指標(biāo)體系》并結(jié)合行業(yè)特點(diǎn)選取指標(biāo),構(gòu)建適用性高的專利價(jià)值通用指標(biāo)體系[25]。
眾多國內(nèi)外學(xué)者、機(jī)構(gòu)對專利價(jià)值影響因素的研究也逐漸完善,結(jié)合眾多專門專利相關(guān)數(shù)據(jù)庫的成立與投入使用,現(xiàn)在國內(nèi)外已經(jīng)存在一些現(xiàn)有的針對專利價(jià)值評估的指標(biāo)體系,包括CHI評估指標(biāo)體系、佐治亞太平洋指標(biāo)體系、OECD專利指標(biāo)體系及國家知識產(chǎn)權(quán)局專利指標(biāo)體系等?;谶@些文獻(xiàn)資料,延續(xù)已有的專利文本特征、專利法律度特征、專利市場關(guān)注度特征,并在此基礎(chǔ)上,考慮到當(dāng)前我國進(jìn)入交易或運(yùn)營環(huán)節(jié)、需要進(jìn)行價(jià)值評估的專利大都來源于高校或科研院所的特征,且本文的研究樣本也均是來源于高校和科研院所的專利,從而第一發(fā)明人的職稱、職務(wù)以及其他相關(guān)特征可能會(huì)影響到專利的價(jià)值,因此,本文在初選專利價(jià)值評估指標(biāo)時(shí)增加了發(fā)明人特征的相關(guān)指標(biāo),從而構(gòu)成了由發(fā)明人特征、專利文本特征、專利法律度特征和市場關(guān)注度組成的專利價(jià)值評估初選指標(biāo)體系,如表1所示。
表1 專利價(jià)值評估指標(biāo)體系
發(fā)明人是專利的直接關(guān)聯(lián)者,發(fā)明人能力越強(qiáng)則其創(chuàng)造的專利在顯示市場中可能更具有價(jià)值。如果第一發(fā)明人職務(wù)、職稱高,參與申請的專利數(shù)量可能表明第一發(fā)明人能力強(qiáng),其所研究的專利更具有價(jià)值[26];專利權(quán)發(fā)明人人數(shù)多,可能表明此項(xiàng)專利復(fù)雜程度高、更具創(chuàng)新[23,26];第一發(fā)明人所在單位作為外界環(huán)境也可能對發(fā)明人創(chuàng)造專利有一定影響,如可以提供的材料、場地等支持;發(fā)明人并不是孤軍奮戰(zhàn),除了會(huì)與其他發(fā)明人合作,可能與其他機(jī)構(gòu)或組織合作[27],除具體實(shí)物專利等合作產(chǎn)物的體現(xiàn),還有論文等形式。
專利文本特征中專利度表示主權(quán)項(xiàng)數(shù)量,即界定此項(xiàng)專利受法律保護(hù)的邊界。由此可見,專利度對專利而言是極其重要的核心。在現(xiàn)實(shí)市場中,專利價(jià)值在一定程度上會(huì)受到專利度數(shù)量的影響。專利通過國際專利分類號(IPC)分類,因而不同專利都會(huì)有相應(yīng)的專利分類號,分類號數(shù)量越多則表明該項(xiàng)專利涉及領(lǐng)域?qū)?,本文稱之為技術(shù)寬度,亦稱專利保護(hù)范圍[12,28]。
專利法律度特征中專利的法律狀態(tài)一般有公開、授權(quán)、實(shí)質(zhì)審查,還可能存在終止現(xiàn)象。一般情況下,專利價(jià)值可能伴隨專利的法律狀態(tài)的公開度變化,公開越多,價(jià)值越小。專利在僅部分授權(quán)情形下,會(huì)有一定稀缺獲得其他關(guān)注,并產(chǎn)生增值[12]。專利在專利申請時(shí)按照不同類型有不同壽命期限,自申請日起,發(fā)明專利權(quán)壽命為20年,實(shí)用新型和外觀設(shè)計(jì)專利權(quán)壽命為10年。專利權(quán)需要后續(xù)繳納費(fèi)用維護(hù),否則可能因未繳納年費(fèi)提前終止專利權(quán)。一般而言專利的法律壽命與經(jīng)濟(jì)壽命不能劃等號,一項(xiàng)專利可能因?yàn)榧夹g(shù)等的更新?lián)Q代而提前失去意義。在法律專利壽命期限內(nèi),專利存在時(shí)間或剩余壽命可能對專利價(jià)值也有一定影響,畢竟當(dāng)法律壽命結(jié)束后,專利權(quán)所擁有的法律保護(hù)就消失,如:越接近法律壽命最后期限,專利價(jià)值可能并不會(huì)太高[12,28]。專利存在即可能會(huì)出現(xiàn)法律訴訟等問題,因而在實(shí)際交易過程中被交易方可能會(huì)對該項(xiàng)專利是否訴訟有一定考量[28]。
專利市場關(guān)注度中指標(biāo)包含有專利對其他專利的引用數(shù)量和專利申請成功后被其他專利引用的數(shù)量,通過引用數(shù)量表明對引用專利的認(rèn)可,通過被引次數(shù)表明本項(xiàng)專利的重要度和影響力,這些會(huì)對專利價(jià)值產(chǎn)生一定影響[12,29]。專利在市場內(nèi)的轉(zhuǎn)移,包含有申請權(quán)轉(zhuǎn)移、專利權(quán)轉(zhuǎn)移,有過轉(zhuǎn)移經(jīng)歷的專利可能更為市場所接受與需要,受讓單位、轉(zhuǎn)讓方式、轉(zhuǎn)讓時(shí)間可能都對專利價(jià)值有影響。專利權(quán)同族數(shù)是專利權(quán)持有者在不同國家申請專利,以達(dá)到保護(hù)專利權(quán)的目的[28]。專利價(jià)值越高,則其持有者才會(huì)付出更多成本以尋求更多國家的保護(hù)。
考慮到專利價(jià)值評估初選指標(biāo)可能存在一定的信息冗余,所以這里采用粗糙集理論對指標(biāo)體系進(jìn)行約簡。粗糙集(Rough Set)理論是波蘭學(xué)者Pawlak于1982年提出的一種可以定量分析解決含有不確定、不一致、不完整數(shù)據(jù)的數(shù)據(jù)挖掘工具。通過對數(shù)據(jù)進(jìn)行深度挖掘,發(fā)現(xiàn)內(nèi)在隱含信息,找出數(shù)據(jù)間潛在聯(lián)系,在屬性約簡方面得到了廣泛的應(yīng)用[30-31]。Rosetta軟件是由挪威科技大學(xué)計(jì)算機(jī)與信息科學(xué)系與波蘭華沙大學(xué)數(shù)學(xué)研究所合作共同開發(fā)的一款致力于采用粗糙集進(jìn)行數(shù)據(jù)分析的專用數(shù)學(xué)分析工具。本文采用Rosetta軟件對專利價(jià)值評估初選指標(biāo)進(jìn)行約簡。
2.1原始數(shù)據(jù)的來源本文數(shù)據(jù)主要涉及兩部分:是在現(xiàn)行專利市場中已經(jīng)成功轉(zhuǎn)讓并能準(zhǔn)確獲取轉(zhuǎn)讓價(jià)格的專利申請?zhí)柤皩@D(zhuǎn)讓價(jià)值;依據(jù)指標(biāo)體系搜集專利指標(biāo)數(shù)據(jù)。本文通過專利交易市場獲取專利的最后一次轉(zhuǎn)讓價(jià)格信息,這里以最后一次轉(zhuǎn)讓價(jià)格代替專利價(jià)值作為粗糙集專利價(jià)值評估模型分析的決策屬性。一共收集到336條專利轉(zhuǎn)讓價(jià)值的數(shù)據(jù),通過文獻(xiàn)總結(jié)及專家意見,這里將專利轉(zhuǎn)讓價(jià)值進(jìn)行價(jià)值分級,具體分級對應(yīng)見表2。
表2 專利轉(zhuǎn)讓價(jià)格分級對應(yīng)表
在搜集到336條專利轉(zhuǎn)讓價(jià)值基礎(chǔ)上,通過現(xiàn)有專利數(shù)據(jù)庫:國家知識產(chǎn)權(quán)局官網(wǎng)(http://www.cnipa.gov.cn)及合享新創(chuàng)官網(wǎng)(https://www.incopat.com)逐個(gè)對具體數(shù)據(jù)指標(biāo)信息進(jìn)行檢索收集,官網(wǎng)內(nèi)收錄專利信息全面且詳細(xì)獲得專利指標(biāo)數(shù)據(jù)集合。由于指標(biāo)中含有一些文本指標(biāo)數(shù)據(jù),在提煉規(guī)律并對其進(jìn)行分層,以達(dá)到對獲取的眾多非數(shù)值數(shù)據(jù)進(jìn)行數(shù)值轉(zhuǎn)化,如發(fā)明人職稱按照1-在讀學(xué)生、2-初級職稱、3-中級職稱、4-副高級職稱、5-高級職稱進(jìn)行數(shù)值轉(zhuǎn)化。
本文所使用的專利價(jià)值評估指標(biāo)體系一共23個(gè)指標(biāo),其中需要進(jìn)行數(shù)值轉(zhuǎn)化的指標(biāo)一共7個(gè),分別是:第一發(fā)明人職稱、第一發(fā)明人職務(wù)、第一發(fā)明人所在單位、技術(shù)寬度、專利法律狀態(tài)、專利權(quán)受讓單位、專利轉(zhuǎn)讓方式。其中發(fā)明人職稱按照在讀學(xué)生、初級職稱、中級職稱、副高級職稱、高級職稱進(jìn)行數(shù)值轉(zhuǎn)化;第一發(fā)明人職務(wù)按照有無職務(wù)數(shù)值轉(zhuǎn)化;技術(shù)寬度數(shù)值轉(zhuǎn)化是指專利的IPC分類號前4位的個(gè)數(shù);專利法律狀態(tài)是對未繳年費(fèi)專利權(quán)終止、實(shí)質(zhì)審查、授權(quán)三種狀態(tài)的數(shù)值轉(zhuǎn)化;專利轉(zhuǎn)讓方式有兩種分別是專利權(quán)轉(zhuǎn)讓與專利申請權(quán)轉(zhuǎn)讓。
本文選取數(shù)據(jù)共336條,將全部樣本數(shù)據(jù)分為訓(xùn)練集和測試集,將全部336條數(shù)據(jù)進(jìn)行隨機(jī)采樣,分為272+64,本文選用272條樣本數(shù)據(jù)作為訓(xùn)練集,剩余64條數(shù)據(jù)作為測試集。訓(xùn)練集論域?yàn)閁train={X1,X2,…,X272},其中X1,X2,…,X272分別表示272條專利數(shù)據(jù),測試集Utest={X273,X332,…,X336},X273,X332,…,X336表示64條訓(xùn)練集數(shù)據(jù)。所在行所有數(shù)值為各指標(biāo)數(shù)據(jù)。C={C1,C2,…,C23}是條件屬性集,D={D}是決策屬性集,則初始決策表為A={C,D}。
2.2原始數(shù)據(jù)的補(bǔ)齊及離散化將272條訓(xùn)練集數(shù)據(jù)放置在同一Excel工作表中,通過Rosetta軟件機(jī)器數(shù)據(jù)源讀入訓(xùn)練集,構(gòu)建決策表。因?yàn)楸疚臄?shù)據(jù)缺失項(xiàng)在進(jìn)行軟件訓(xùn)練前已經(jīng)做了剔除,則并不含有缺失值,因而無需通過軟件進(jìn)行數(shù)據(jù)預(yù)處理,也就是數(shù)據(jù)補(bǔ)齊,對此通過現(xiàn)有訓(xùn)練決策表進(jìn)行離散化。通過Rosetta中Boolean、MDL、Equal Frequency、Na?ve、Semi-na?ve算法分別進(jìn)行離散化,得出斷點(diǎn)數(shù),并選取斷點(diǎn)數(shù)最少算法作為本文離散化算法。將訓(xùn)練決策表采用五種算法計(jì)算分別離散化斷點(diǎn)數(shù),結(jié)果見表3。
表3 五種算法離散化斷點(diǎn)結(jié)果
由表3中五種離散化算法得出的斷點(diǎn)數(shù)明顯Boolean算法斷點(diǎn)數(shù)少,斷點(diǎn)以簡便為佳,對此本文選擇Boolean算法進(jìn)行離散化,得到離散化條件屬性量化參數(shù)見表4。
表4 條件屬性量化參數(shù)表
2.3決策表屬性約簡依據(jù)上述采用Boolean算法進(jìn)行離散化后的決策表進(jìn)行下一步屬性約簡。屬性約簡是粗糙集算法核心內(nèi)容,本文采用遺傳算法進(jìn)行屬性約簡,主要約簡方法有:Genetic algorithm、Johnson's algorithm及Holte's 1R三種約簡算法。將通過離散化后的決策表進(jìn)行Rosetta軟件三種算法約簡,具體約簡個(gè)數(shù)及包含屬性個(gè)數(shù)結(jié)果見表5。
表5 三種算法屬性約簡結(jié)果
通過表5可以看出Holte's 1R算法并沒有約簡,條件屬性保持仍在23個(gè),因而排除Holte's 1R算法。比對三種算法對指標(biāo)約簡,支持度均為100條件下,Johnson's算法約簡個(gè)數(shù)最少。本文選擇Johnson's算法約簡后的專利價(jià)值評估指標(biāo)體系,見表6。
表6 基于Johnson's算法生成的約簡指標(biāo)對照
3.1 BP神經(jīng)網(wǎng)絡(luò)的基本原理BP神經(jīng)網(wǎng)絡(luò),又稱誤差反向傳播神經(jīng)網(wǎng)絡(luò),是神經(jīng)網(wǎng)絡(luò)中學(xué)者研究最多、使用范圍最大的一種。BP神經(jīng)網(wǎng)絡(luò)是通過輸入后所得出的輸出值與實(shí)際值差額平方和,不斷調(diào)解隱含層數(shù)值使其最小的學(xué)習(xí)型算法[18-19]。BP神經(jīng)基本結(jié)構(gòu)與神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)一致,均包含有輸入層、隱含層與輸出層,其中隱含層并不一定唯一,可能存在一個(gè)或多個(gè)隱含層。各層與相鄰層各個(gè)神經(jīng)元均連接,但同一層神經(jīng)元間不連接[18]。
BP神經(jīng)網(wǎng)絡(luò)的操作步驟較為固定,主要有兩種操作,其一:為正向傳播,主要是通過輸入層進(jìn)入隱含層計(jì)算,在經(jīng)過輸出層進(jìn)行數(shù)值輸出;其二:為反向調(diào)節(jié),在經(jīng)過正向操作后最后的輸出值沒有達(dá)到預(yù)判,差額數(shù)值過大,可以通過反向操作,依據(jù)實(shí)際輸出值與預(yù)判值間的差額以調(diào)節(jié)指標(biāo)屬性的權(quán)重與閾值,再次傳到輸入值,直至差額減小至誤差范圍內(nèi)以結(jié)束最終學(xué)習(xí)[18-19]。正向傳播過程中各層神經(jīng)元只會(huì)受到上一層神經(jīng)元影響。經(jīng)過已有數(shù)據(jù)進(jìn)行不斷學(xué)習(xí)訓(xùn)練,以找到輸入值與輸出值間聯(lián)系,使得實(shí)際中眾多問題得到解決。
3.2數(shù)據(jù)預(yù)處理BP神經(jīng)網(wǎng)絡(luò)可以做非線性輸入輸出,因而可以直接對現(xiàn)有數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí),但通過適當(dāng)?shù)臄?shù)據(jù)處理能夠提升運(yùn)行效率及精確度。因而對現(xiàn)有數(shù)據(jù)進(jìn)行預(yù)處理——?dú)w一化,顧名思義歸一化就是通過標(biāo)準(zhǔn)化將數(shù)據(jù)呈現(xiàn)0-1正態(tài)分布,以達(dá)到避免數(shù)據(jù)大的變動(dòng)范圍對結(jié)果影響。
本文使用Z-Score標(biāo)準(zhǔn)化方法對訓(xùn)練集與測試集數(shù)據(jù)進(jìn)行歸一化。Z-Score標(biāo)準(zhǔn)化方法的計(jì)算公式為:
z=(x-μ)/σ
(1)
公式中z表示歸一化的最終結(jié)果,x表示數(shù)據(jù)值,μ是均值,σ是標(biāo)準(zhǔn)差。z的具體量表示原數(shù)值與均值間差值,可能為負(fù)值。
對數(shù)據(jù)進(jìn)行預(yù)處理有以下優(yōu)點(diǎn):能夠減弱或消除量綱對結(jié)果的影響,使運(yùn)行速度增加,避免過于擬合。
3.3模型構(gòu)建與訓(xùn)練本文采用Python軟件進(jìn)行神經(jīng)網(wǎng)絡(luò)專利價(jià)值評估模型構(gòu)建。對參數(shù)設(shè)定:
總之,德國雙元制高等職業(yè)教育模式內(nèi)涵豐富、特點(diǎn)突出,其中有許多值得我們借鑒的經(jīng)驗(yàn),我們應(yīng)該有針對性的學(xué)習(xí),以便能夠提高我國高等職業(yè)教育的水平,為“中國制造2025”培養(yǎng)更多的高素質(zhì)應(yīng)用技術(shù)人才,助力中國從制造業(yè)大國向制造業(yè)強(qiáng)國的轉(zhuǎn)變。
(1)神經(jīng)網(wǎng)絡(luò)層數(shù)確定。BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包含有輸入層、隱含層與輸出層,隱含層數(shù)量可能不唯一。在通過Python進(jìn)行多次測試,隱含層數(shù)量在3個(gè),模型準(zhǔn)確率高。因而本文采用五層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行訓(xùn)練學(xué)習(xí),即包含有三個(gè)隱含層。
(2)輸入層神經(jīng)元個(gè)數(shù)確定。在上文對指標(biāo)篩選選擇中粗糙集的指標(biāo)篩選具有一定優(yōu)勢,因而本文在基于BP神經(jīng)網(wǎng)絡(luò)構(gòu)建專利價(jià)值評估模型操作過程中,使用經(jīng)過粗糙集采用Johnson's算法知識約簡后的12個(gè)指標(biāo)進(jìn)行操作,因而BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中輸入層神經(jīng)元個(gè)數(shù)有12個(gè)。
(3)輸出層神經(jīng)元個(gè)數(shù)確定。本文是對專利價(jià)值進(jìn)行評估,因而輸出層神經(jīng)元僅有一個(gè)輸出值就是專利價(jià)值。故輸出層神經(jīng)元個(gè)數(shù)有且僅有一個(gè)。
(4)隱含層神經(jīng)元個(gè)數(shù)確定。通過不斷修改各隱含層神經(jīng)元個(gè)數(shù)進(jìn)行測試,對比不同個(gè)數(shù)條件下模型的準(zhǔn)確率,保留相對較好且較為穩(wěn)定的參數(shù),最終得到3個(gè)隱含層的神經(jīng)元個(gè)數(shù)分別為16、32、16。
(5)選擇誤差目標(biāo)值。在實(shí)際利用神經(jīng)網(wǎng)絡(luò)進(jìn)行模型構(gòu)建過程中,實(shí)際值與輸出值可能是存在一定差額的,而且利用神經(jīng)網(wǎng)絡(luò)也是允許誤差存在的。一般在實(shí)際操作過程中的誤差目標(biāo)值要根據(jù)問題是否有較高的規(guī)律性,如果規(guī)律性較強(qiáng)則誤差目標(biāo)值精度較高,一般在10-4到10-6間;如果規(guī)律性較低,誤差目標(biāo)值精度就會(huì)有所降低,一般在10-2。仔細(xì)考慮多方因素,為保證精度較高、運(yùn)算效率在同準(zhǔn)確度條件下達(dá)到最高,這里選用10-4作為模型誤差目標(biāo)值。
(6)選擇激活函數(shù)。目前神經(jīng)網(wǎng)絡(luò)選用激活函數(shù)多為Sigmoid函數(shù),Sigmoid函數(shù)又具體分為Log-Sigmoid函數(shù)與Tan-Sigmoid函數(shù)。本文選擇Tan-Sigmoid函數(shù)作為輸入層與隱含層的激活函數(shù)。
(7)最大訓(xùn)練次數(shù)確定。通過軟件對訓(xùn)練集訓(xùn)練可能訓(xùn)練時(shí)間過長,才達(dá)到設(shè)定的誤差目標(biāo)值,也可能存在達(dá)不到設(shè)定值,因而需要提前設(shè)定最大訓(xùn)練次數(shù)以避免時(shí)間過長或達(dá)不到情況出現(xiàn),本文設(shè)定最大訓(xùn)練次數(shù)為2 000。
本次通過BP神經(jīng)網(wǎng)絡(luò)構(gòu)建的專利價(jià)值評估模型,依據(jù)上述參數(shù)設(shè)定具體為:神經(jīng)網(wǎng)絡(luò)層數(shù)5層、輸入層神經(jīng)元23個(gè)、輸出神經(jīng)元1個(gè)、隱含層神經(jīng)元分別為16、32、16個(gè);誤差目標(biāo)值10-4、激活函數(shù)Tan-Sigmoid函數(shù)、最大訓(xùn)練次數(shù)2 000。
在上述參數(shù)設(shè)定下,通過Python軟件進(jìn)行訓(xùn)練,神經(jīng)網(wǎng)絡(luò)系統(tǒng)在內(nèi)部進(jìn)行訓(xùn)練學(xué)習(xí),調(diào)整權(quán)重或閾值,構(gòu)建評估模型及價(jià)值輸出。本文所用BP神經(jīng)網(wǎng)絡(luò)模型如圖1所示。
圖1 基于BP神經(jīng)網(wǎng)絡(luò)專利價(jià)值評估模型
輸入層神經(jīng)元特征重要度列示情況見圖2,圖中柱形長度代表特征重要度。特征重要度從大到小列示見表7。
圖2 輸入層神經(jīng)元特征重要度列示情況
表7 特征重要度從大到小列示
針對訓(xùn)練集通過訓(xùn)練學(xué)習(xí)所得到的模型,在對訓(xùn)練集本身進(jìn)行預(yù)測,所得準(zhǔn)確率為81.39%。
3.4模型測試?yán)靡陨纤贸龅膶@麅r(jià)值評估模型對64條測試集數(shù)據(jù)進(jìn)行測試,預(yù)測結(jié)果與實(shí)際值比對情況如表8所示。
通過表8的測試集檢驗(yàn),表明通過BP神經(jīng)網(wǎng)絡(luò)構(gòu)建的專利價(jià)值評估模型對專利價(jià)值預(yù)測有較高的可信度,預(yù)測專利價(jià)值等級在64條測試集中有12條實(shí)際與預(yù)測不符,預(yù)測準(zhǔn)確52例,準(zhǔn)確率為81.25%。
表8 專利預(yù)測值與實(shí)際值對照表
BP神經(jīng)網(wǎng)絡(luò)的應(yīng)用較為成熟,且具有自適應(yīng)性、非線性、容錯(cuò)性及計(jì)算并行性特點(diǎn)。通過對同樣336條數(shù)據(jù)進(jìn)行訓(xùn)練集與測試集劃分后,對數(shù)據(jù)預(yù)處理歸一化消除量綱對結(jié)果的影響。接著通過Python軟件設(shè)置參數(shù)結(jié)果為:神經(jīng)網(wǎng)絡(luò)層數(shù)5層、輸入層神經(jīng)元23個(gè)、輸出神經(jīng)元1個(gè)、隱含層神經(jīng)元分別為16、32、16個(gè);誤差目標(biāo)值10-4、激活函數(shù)Tan-Sigmoid函數(shù)、最大訓(xùn)練次數(shù)2000。再對訓(xùn)練集進(jìn)行學(xué)習(xí)訓(xùn)練,輸入層神經(jīng)元特征重要度從大到小排列為:第一發(fā)明人合作機(jī)構(gòu)數(shù)、專利發(fā)明人人數(shù)、專利權(quán)轉(zhuǎn)讓時(shí)間、第一發(fā)明人合作論文次數(shù)、技術(shù)寬度、專利轉(zhuǎn)讓方式、專利度、第一發(fā)明人職稱、引用次數(shù)、專利存在時(shí)間、第一發(fā)明人職務(wù)、第一發(fā)明人參與申請的專利數(shù)量。針對訓(xùn)練集搜尋訓(xùn)練所得的模型,對訓(xùn)練集本身預(yù)測準(zhǔn)確率為81.39%。用訓(xùn)練所得模型對測試集數(shù)據(jù)進(jìn)行檢驗(yàn),預(yù)測準(zhǔn)確率81.25%。
不論是傳統(tǒng)方法下的市場法、成本法、收益法以及實(shí)物期權(quán)法,還是非市場基準(zhǔn)評估方法中的模糊綜合評價(jià)法、計(jì)量經(jīng)濟(jì)模型方法,在專利價(jià)值評估中都存在一定的缺陷,而人工智能技術(shù)的運(yùn)用尚需要不斷對指標(biāo)選擇和算法進(jìn)行完善。本文依據(jù)現(xiàn)有336條專利轉(zhuǎn)讓數(shù)據(jù)樣本,結(jié)合眾多影響因素構(gòu)建指標(biāo)體系,采用粗糙集理論進(jìn)行屬性約簡,并采用BP神經(jīng)網(wǎng)絡(luò)理論,構(gòu)建基于粗糙集和BP神經(jīng)網(wǎng)絡(luò)專利價(jià)值評估模型,并對專利樣本數(shù)據(jù)進(jìn)行了訓(xùn)練集與測試集劃分,進(jìn)行實(shí)證研究。研究結(jié)果表明:
(1)專利文本特征、法律度特征、市場關(guān)注度特征是專利價(jià)值的重要影響因素。對于高校、科研院所的專利成果來說,其專利的價(jià)值與發(fā)明人的特征也有一定的相關(guān)性,包括第一發(fā)明人的職稱、職務(wù)、參與申請的專利數(shù)量、合作機(jī)構(gòu)數(shù)、合作論文次數(shù)以及專利發(fā)明人的數(shù)量等。
(2)粗糙集理論相對于其他評估方法具有不需要先驗(yàn)知識來定量分析解決含有不確定、不一致、不完整數(shù)據(jù)的數(shù)據(jù)挖掘問題,因而可以很好地適應(yīng)專利價(jià)值不確定性因素多的特點(diǎn),運(yùn)用粗糙集理論可以對專利價(jià)值評估指標(biāo)體系進(jìn)行約簡。在實(shí)際應(yīng)用過程中,Boolean算法與Johnson's算法可以較好解決決策表中離散化與屬性約簡問題。
(3)基于約簡后的專利價(jià)值評估指標(biāo)體系,運(yùn)用BP神經(jīng)網(wǎng)絡(luò)原理構(gòu)建專利價(jià)值評估模型,通過自我學(xué)習(xí)訓(xùn)練和檢驗(yàn)測試,發(fā)現(xiàn)模型運(yùn)用相對簡單,對測試集進(jìn)行檢驗(yàn)測試所得的預(yù)測準(zhǔn)確率81.25%,表明通過BP神經(jīng)網(wǎng)絡(luò)構(gòu)建的專利價(jià)值評估模型在實(shí)際市場條件中較為適用可靠。
本文主要是粗糙集與BP神經(jīng)網(wǎng)絡(luò)兩種方法結(jié)合,由于多方面的制約,還存在有不足之處,在各方面研究深度和廣度比較有限,有待于在以后的學(xué)習(xí)中不斷改進(jìn)完善:①樣本問題:由于專利轉(zhuǎn)讓價(jià)值的數(shù)據(jù)獲取較難,搜集到的336條數(shù)據(jù)涉及領(lǐng)域太廣,可能影響專利價(jià)值評估模型實(shí)際操作;②指標(biāo)問題:受限于我國專利信息公開市場有限,有一些相關(guān)影響因素不能直觀找到具體數(shù)據(jù),還有些指標(biāo)不能量化,因而在指標(biāo)選取方面有一定制約。