劉玉林 劉超 高蕾
【摘? ?要】? ?在專(zhuān)利網(wǎng)絡(luò)研究中,通過(guò)設(shè)定閾值構(gòu)建無(wú)權(quán)無(wú)向網(wǎng)絡(luò)并將其用于專(zhuān)利內(nèi)容分析的方法得到廣泛研究,但其中閾值設(shè)定隨意性大、主觀性強(qiáng),最優(yōu)閾值的選擇和閾值優(yōu)化往往是非常困難的事情。鑒于此,提出一種基于加權(quán)網(wǎng)絡(luò)分析專(zhuān)利技術(shù)主題的方法,該方法將專(zhuān)利文本相似度設(shè)定為邊的權(quán)重,從而構(gòu)建專(zhuān)利加權(quán)網(wǎng)絡(luò),通過(guò)網(wǎng)絡(luò)特性分析技術(shù)主題的發(fā)展。以中國(guó)電商發(fā)明專(zhuān)利為例,研究表明:(1)通過(guò)專(zhuān)利加權(quán)網(wǎng)絡(luò)節(jié)點(diǎn)單位權(quán)重及其分布,發(fā)現(xiàn)電商專(zhuān)利技術(shù)主題凝聚性不強(qiáng);(2)通過(guò)節(jié)點(diǎn)強(qiáng)度指標(biāo),發(fā)現(xiàn)電商數(shù)據(jù)分析類(lèi)專(zhuān)利已經(jīng)成為研究熱點(diǎn);(3)通過(guò)權(quán)重篩選,發(fā)現(xiàn)一個(gè)風(fēng)箏型聚集社團(tuán),該社團(tuán)特性顯示電商專(zhuān)利發(fā)展有一個(gè)局部突出的技術(shù)點(diǎn)。案例研究進(jìn)一步表明專(zhuān)利加權(quán)網(wǎng)絡(luò)的優(yōu)勢(shì)在于將文本相似度引入專(zhuān)利網(wǎng)絡(luò)構(gòu)建中,以權(quán)重角度分析專(zhuān)利之間的確定關(guān)系,從而發(fā)現(xiàn)更多的網(wǎng)絡(luò)特性,揭示專(zhuān)利技術(shù)主題的發(fā)展。
【關(guān)鍵詞】? ?閾值;專(zhuān)利加權(quán)網(wǎng)絡(luò);權(quán)重;技術(shù)主題
Analysis of Patent Technology Themes Based on Weighted Network
Liu Yulin 1,2 , Liu Chao2, Gao Lei2
(1. Nanjing University of Aeronautics and Astronautics, Nanjing 211106, China;
2. Anhui Business College, Wuhu 241002, China)
【Abstract】? ? The method of constructing unauthorized and undirected networks by setting thresholds has been widely studied in the research of patent networks. However, the threshold setting is arbitrary and subjective, both the selection of the optimal threshold and threshold optimization are very difficult to carry out. In view of this, a method of analyzing patent technology themes based on weighted network is proposed. This method sets the patent text similarity as the weight of edges, thereby constructing a patent weighted network and analyzing the development of patent technology themes through network characteristics. Taking Chinese e-commerce invention patents as the study case, the research shows that: (1) the cohesion of e-commerce patent technology themes is not strong from the research of unit weights and their distributions of patent weighted network nodes; (2)the e-commerce data analysis patents have become a research hotspot from the study of node strength indicators; (3)through weight screening, the research finds a kite-type agglomeration community whose characteristics show that there is a local outstanding technical point in the development of e-commerce patents. The case study further shows that the advantage of the patent weighted network is to introduce text similarity into the construction of the patent network, and to analyze the definite relationship between patents from the perspective of weight, so as to discover more network characteristics and reveal the development of patent technology themes.
【Key words】? ? ?threshold; patent weighted network; weight; technology themes
〔中圖分類(lèi)號(hào)〕? G203? ? ? ? ? ? ? ? ? ? ? ? ? ?〔文獻(xiàn)標(biāo)識(shí)碼〕? A ? ? ? ? ? ? ?〔文章編號(hào)〕 1674 - 3229(2022)01- 0014 - 06
0? ? ?引言
在技術(shù)挖掘、技術(shù)機(jī)會(huì)發(fā)現(xiàn)、技術(shù)空缺識(shí)別等領(lǐng)域,專(zhuān)利分析一直以來(lái)都是最有用的工具[1-3]。在專(zhuān)利分析中,對(duì)技術(shù)主題進(jìn)行分析能夠把握技術(shù)發(fā)展前沿和動(dòng)態(tài),提供技術(shù)研發(fā)投資管理等方面的有效建議。對(duì)技術(shù)主題分析而言,基于專(zhuān)利名稱(chēng)、摘要、權(quán)利要求、描述等文本數(shù)據(jù),結(jié)合文本挖掘和復(fù)雜網(wǎng)絡(luò)等進(jìn)行專(zhuān)利網(wǎng)絡(luò)構(gòu)建與分析,成為當(dāng)前專(zhuān)利分析和技術(shù)主題挖掘研究的熱點(diǎn)。
當(dāng)然,在專(zhuān)利網(wǎng)絡(luò)的構(gòu)建中,通常將專(zhuān)利作為節(jié)點(diǎn),將專(zhuān)利之間確定的相似性關(guān)系作為邊,從而構(gòu)建一種用于專(zhuān)利內(nèi)容分析的無(wú)權(quán)無(wú)向網(wǎng)絡(luò)。在衡量專(zhuān)利之間確定的相似性關(guān)系時(shí),往往設(shè)定一個(gè)相似度閾值,當(dāng)專(zhuān)利文獻(xiàn)之間的相似性值大于或等于閾值時(shí),認(rèn)為專(zhuān)利之間存在連接關(guān)系,當(dāng)專(zhuān)利之間的相似性值小于閾值時(shí),認(rèn)為專(zhuān)利之間不存在連接關(guān)系。但閾值的設(shè)定是一個(gè)主觀的、反復(fù)試驗(yàn)的任務(wù)[3],閾值沒(méi)有固定值,會(huì)根據(jù)專(zhuān)利技術(shù)領(lǐng)域不同發(fā)生變化,最優(yōu)閾值的選擇和閾值優(yōu)化往往是非常困難的事情[4]。因此,本文通過(guò)將專(zhuān)利之間的相似性值設(shè)為權(quán)重,以此構(gòu)建專(zhuān)利加權(quán)網(wǎng)絡(luò),并基于專(zhuān)利加權(quán)網(wǎng)絡(luò)對(duì)技術(shù)主題進(jìn)行挖掘,從而為技術(shù)主題分析提供一種新的分析方法,為專(zhuān)利分析拓展新的研究思路。
1? ? ?文獻(xiàn)回顧
在專(zhuān)利網(wǎng)絡(luò)分析中,通過(guò)設(shè)定閾值,對(duì)專(zhuān)利內(nèi)容之間的相似度值二元化,從而構(gòu)建專(zhuān)利無(wú)權(quán)網(wǎng)絡(luò)進(jìn)行技術(shù)分析,是當(dāng)前學(xué)者常用的研究方法[3-5]。因?yàn)橐坏┐_定了閾值,就可以很容易地將相似矩陣轉(zhuǎn)換為鄰接矩陣,從而構(gòu)建專(zhuān)利無(wú)權(quán)網(wǎng)絡(luò) [6]。Lee P C等學(xué)者認(rèn)為專(zhuān)利無(wú)權(quán)網(wǎng)絡(luò)的形成,關(guān)鍵在于閾值的選取,不同的閾值會(huì)導(dǎo)致不同的網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)屬性[6]。Yoon J等學(xué)者認(rèn)為盡管閾值的測(cè)定是一個(gè)試錯(cuò)的過(guò)程,甚至不同專(zhuān)利數(shù)據(jù)集可能給定不同的截止值,但專(zhuān)家們必須選擇一個(gè)合理的閾值才能更好地利用網(wǎng)絡(luò)可視化[7]。菅利榮等學(xué)者認(rèn)為閾值的設(shè)定考慮兩方面因素,一是國(guó)家、行業(yè)或者企業(yè)在專(zhuān)利機(jī)會(huì)開(kāi)發(fā)和比較時(shí)的研究需要,二是網(wǎng)絡(luò)節(jié)點(diǎn)關(guān)系規(guī)律性和圖形規(guī)模適度性的需要[8]。Yoon B等學(xué)者認(rèn)為分析人員必須選擇一個(gè)合理的值,使網(wǎng)絡(luò)的結(jié)構(gòu)變得清晰可見(jiàn)[3]。但在現(xiàn)有研究中最佳閾值的確定是一件非常困難的事情。Yoon B等學(xué)者認(rèn)為閾值的確定本質(zhì)上是一個(gè)主觀的、反復(fù)試驗(yàn)的任務(wù)[3]。Lee P C等學(xué)者認(rèn)為傳統(tǒng)的確定閾值的方法需要反復(fù)多次,并且過(guò)于任意和主觀[6]。Niemann H等學(xué)者認(rèn)為由于專(zhuān)利的語(yǔ)言因技術(shù)領(lǐng)域的不同而不同,而且相似度值也因技術(shù)領(lǐng)域的不同而不同,因此閾值沒(méi)有絕對(duì)值[9]。Zanin M等學(xué)者嘗試使用多個(gè)閾值來(lái)生成不同級(jí)別的專(zhuān)利無(wú)權(quán)網(wǎng)絡(luò)[5]。Lee P C等學(xué)者認(rèn)為作為表示整體網(wǎng)絡(luò)行為的最優(yōu)閾值,該閾值是通過(guò)選擇不同閾值生成的知識(shí)網(wǎng)絡(luò)之間的最大匹配,認(rèn)為在文獻(xiàn)計(jì)量學(xué)分析中,閾值可以是一個(gè)任意值[6]。Lee P C、Yoon B和Park Y等學(xué)者通常建議使用多個(gè)值進(jìn)行敏感性分析,然后考慮網(wǎng)絡(luò)結(jié)構(gòu)是否能夠合理可視化,從而選擇任意的閾值[3,6]。Lee P C等學(xué)者認(rèn)為不同的數(shù)據(jù)源和代表研究興趣的關(guān)鍵字集會(huì)導(dǎo)致不同的閾值,閾值應(yīng)該是基于任務(wù)和案例的因變量,沒(méi)有可以普遍應(yīng)用的閾值,最好的閾值總是未知的[6]。
綜上所述,閾值設(shè)定存在著主觀性和任意性,在此基礎(chǔ)上構(gòu)建的專(zhuān)利無(wú)權(quán)網(wǎng)絡(luò)往往以偏概全,甚至可能產(chǎn)生錯(cuò)誤的分析結(jié)果。將專(zhuān)利之間文本相似度值作為權(quán)重、從而構(gòu)建專(zhuān)利加權(quán)網(wǎng)絡(luò)是一種有效的避免閾值主觀設(shè)定,挖掘更多專(zhuān)利分析價(jià)值和開(kāi)展專(zhuān)利主題分析的方法。因此,本文提出一種專(zhuān)利加權(quán)網(wǎng)絡(luò)的構(gòu)建方法,將專(zhuān)利文本相似度值作為權(quán)重構(gòu)建專(zhuān)利加權(quán)網(wǎng)絡(luò),并根據(jù)網(wǎng)絡(luò)特性分析專(zhuān)利技術(shù)主題,能夠?yàn)閷?zhuān)利分析學(xué)者和企業(yè)專(zhuān)利決策人員提供更多參考建議。
2? ? ?研究方法
2.1? ?專(zhuān)利加權(quán)網(wǎng)絡(luò)
加權(quán)網(wǎng)絡(luò)是指網(wǎng)絡(luò)中節(jié)點(diǎn)之間連接的邊是有權(quán)重的。對(duì)于專(zhuān)利加權(quán)網(wǎng)絡(luò)而言,首先要確定權(quán)重的賦予方式,即通過(guò)相似權(quán)和相異權(quán)賦予權(quán)重值。在專(zhuān)利分析中,相似權(quán)通??梢允墙Y(jié)構(gòu)相似性、路徑相似性和內(nèi)容相似性,相異權(quán)可以是距離相異性等[10]。在本文中,將專(zhuān)利文本相似度值作為權(quán)重,是一種基于相似權(quán)而構(gòu)建專(zhuān)利加權(quán)網(wǎng)絡(luò)的方法[11]。專(zhuān)利加權(quán)網(wǎng)絡(luò)的可視化形式如圖1(a)中所示,專(zhuān)利節(jié)點(diǎn)邊上的數(shù)值為專(zhuān)利之間的權(quán)重,該權(quán)重為根據(jù)專(zhuān)利文本計(jì)算出來(lái)的相似度值。
專(zhuān)利加權(quán)網(wǎng)絡(luò)和專(zhuān)利無(wú)權(quán)網(wǎng)絡(luò)之間可以相互轉(zhuǎn)化,其中通過(guò)設(shè)定閾值,專(zhuān)利加權(quán)網(wǎng)絡(luò)可以直接方便地轉(zhuǎn)化為專(zhuān)利無(wú)權(quán)網(wǎng)絡(luò),該過(guò)程稱(chēng)為閾值化[11]。在圖1(a)中,將閾值設(shè)定為0.6,就變?yōu)閳D1(b)的專(zhuān)利無(wú)權(quán)網(wǎng)絡(luò)。但是,將專(zhuān)利無(wú)權(quán)網(wǎng)絡(luò)變?yōu)閷?zhuān)利加權(quán)網(wǎng)絡(luò)的過(guò)程更復(fù)雜,需要對(duì)專(zhuān)利之間的邊進(jìn)行含義分析、量化和計(jì)算權(quán)重值等過(guò)程,甚至在某些信息不足的情況下,無(wú)法完成轉(zhuǎn)化工作。
2.2? ?加權(quán)網(wǎng)絡(luò)特性
2.2.1? ?節(jié)點(diǎn)強(qiáng)度S
對(duì)于專(zhuān)利加權(quán)網(wǎng)絡(luò)[G]及其權(quán)值矩陣[W=wij]而言,節(jié)點(diǎn)度[kij]的概念可以延伸為節(jié)點(diǎn)強(qiáng)度[Si][11],計(jì)算公式如(1)所示:
[Si=j=1Nwij]? ? (1)
其中,[N]為網(wǎng)絡(luò)中節(jié)點(diǎn)數(shù),當(dāng)某兩個(gè)節(jié)點(diǎn)沒(méi)有邊相連時(shí),定義[wij]為[0]。節(jié)點(diǎn)強(qiáng)度[Si]蘊(yùn)含節(jié)點(diǎn)度[ki]和邊權(quán)值[wij]綜合特征,是節(jié)點(diǎn)局部信息的有效表達(dá)方式[10]。
2.2.2? ?單位權(quán)重及其分布
單位權(quán)重[Ui]是指該節(jié)點(diǎn)所有邊的平均權(quán)重值,計(jì)算公式如(2)所示:
[Ui=siki]? ? ? (2)
其中,單位權(quán)重刻畫(huà)的是節(jié)點(diǎn)連邊的平均權(quán)重情況。
在專(zhuān)利加權(quán)網(wǎng)絡(luò)[G]中,權(quán)重分布是衡量權(quán)重分布程度的重要指標(biāo),權(quán)重分布差異性可以用[Yi]來(lái)刻畫(huà),計(jì)算公式如(3)所示:
[Yi=j=1Nwijsi2]? ? ? (3)
2.3? ?余弦相似度
計(jì)算專(zhuān)利文本相似性的方法有很多,比如Dice系數(shù)、Jaccard系數(shù)和余弦相似度,前兩個(gè)度量針對(duì)關(guān)鍵字進(jìn)行計(jì)算,余弦相似度對(duì)術(shù)語(yǔ)向量(文檔)之間的夾角進(jìn)行計(jì)算[6]。目前,基于余弦相似度的計(jì)算方法是比較常用的方法,Song K等學(xué)者在研究3D汽車(chē)行業(yè)技術(shù)挖掘時(shí),認(rèn)為余弦相似度是一種測(cè)量?jī)蓚€(gè)向量余弦角相似度的方法??梢允褂眠@種方法計(jì)算技術(shù)間的相似度,技術(shù)間相似度的結(jié)果取值范圍為0-1[12]。
常見(jiàn)的余弦相似度是通過(guò)求兩個(gè)向量的余弦角來(lái)計(jì)算的,常見(jiàn)公式如(4)所示:
[A=wPA1,wPA2,wPA3,…,wPAn]
[B=wPB1,wPB2,wPB3,…,wPBn]
[cosA,B=∑wPAi×wPBiwPAi2×wPBi2]? ? ? ? ? (4)
其中,[A]、[B]分別為權(quán)重所組成的一維向量,向量中權(quán)重來(lái)源于專(zhuān)利文本特征在專(zhuān)利中的權(quán)值[6]。
3? ? ?實(shí)證分析
選擇中國(guó)電子商務(wù)發(fā)明專(zhuān)利作為實(shí)證案例,通過(guò)構(gòu)建中國(guó)電商專(zhuān)利加權(quán)網(wǎng)絡(luò),基于加權(quán)網(wǎng)絡(luò)的特性分析中國(guó)電商專(zhuān)利技術(shù)主題發(fā)展現(xiàn)狀,以此揭示專(zhuān)利加權(quán)網(wǎng)絡(luò)在專(zhuān)利技術(shù)主題分析中的應(yīng)用。
3.1? ?數(shù)據(jù)源
在中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局網(wǎng)站,采用關(guān)鍵詞查找方式,關(guān)鍵詞為“電子商務(wù)”或“電商”,將時(shí)間跨度定為1996-2018年,共采集到已有授權(quán)的發(fā)明專(zhuān)利101條數(shù)據(jù),數(shù)據(jù)特征維度包括專(zhuān)利號(hào)、專(zhuān)利名稱(chēng)、發(fā)明人、代理人、文件下發(fā)時(shí)間、摘要等,其中專(zhuān)利號(hào)、專(zhuān)利名稱(chēng)、摘要等特征經(jīng)過(guò)人工核實(shí)校對(duì),數(shù)據(jù)無(wú)誤且無(wú)缺失。需要說(shuō)明的是,時(shí)間跨度中1996年為電子商務(wù)發(fā)明專(zhuān)利首次出現(xiàn)的時(shí)間,截止時(shí)間定為2018年,主要考慮發(fā)明專(zhuān)利的授權(quán)時(shí)間比較長(zhǎng),存在發(fā)明專(zhuān)利申請(qǐng)超過(guò)3年尚未獲得授權(quán)的情況。
3.2? ?專(zhuān)利加權(quán)網(wǎng)絡(luò)構(gòu)建
3.2.1? ?專(zhuān)利文本相似度計(jì)算
在專(zhuān)利中,專(zhuān)利名稱(chēng)、摘要、權(quán)利要求書(shū)和描述等含有大量的技術(shù)知識(shí)和信息,是專(zhuān)利文本內(nèi)容的主要表現(xiàn)形式,利用文本挖掘技術(shù)從專(zhuān)利文本中提取特征、衡量專(zhuān)利相似性,成為學(xué)者專(zhuān)利挖掘的有效分析方法。Madani F等學(xué)者對(duì)專(zhuān)利分析方法的時(shí)間演化分析表明專(zhuān)利內(nèi)容分析已經(jīng)成為新的專(zhuān)利分析研究熱點(diǎn)方法[4]。
在本文中,選擇專(zhuān)利摘要作為專(zhuān)利文本特征提取對(duì)象,從專(zhuān)利摘要中提取屬性-功能關(guān)鍵詞組合作為專(zhuān)利內(nèi)容特征,構(gòu)建專(zhuān)利文獻(xiàn)與屬性-功能向量空間,并基于余弦相似度(見(jiàn)公式4)計(jì)算專(zhuān)利文獻(xiàn)之間的相似度,得到專(zhuān)利相似度值,見(jiàn)表1,其中專(zhuān)利文本特征的選取和文本相似度計(jì)算方法借鑒相關(guān)文獻(xiàn)[8, 13]。
3.2.2? ?專(zhuān)利加權(quán)網(wǎng)絡(luò)生成
將專(zhuān)利作為節(jié)點(diǎn),文本相似度值設(shè)置為邊的權(quán)重,構(gòu)建專(zhuān)利加權(quán)網(wǎng)絡(luò),并將相關(guān)數(shù)據(jù)導(dǎo)入gephi中制作專(zhuān)利加權(quán)網(wǎng)絡(luò)圖,如圖2所示。
在圖2中,專(zhuān)利節(jié)點(diǎn)之間通過(guò)邊連接,邊中間數(shù)值為專(zhuān)利文本相似度值,即權(quán)重值。如果專(zhuān)利相似度值為0,則專(zhuān)利節(jié)點(diǎn)之間沒(méi)有邊連接,此時(shí)定義權(quán)重值為0。在圖2中沒(méi)有邊連接的專(zhuān)利節(jié)點(diǎn)對(duì)數(shù)量為191。
3.3? ?專(zhuān)利技術(shù)主題分析
3.3.1? ?技術(shù)主題凝聚性分析
在Python中根據(jù)公式(2)對(duì)專(zhuān)利加權(quán)網(wǎng)絡(luò)的節(jié)點(diǎn)單位權(quán)重進(jìn)行統(tǒng)計(jì),并將單位權(quán)重繪制成散點(diǎn)圖,如圖3所示,其中橫坐標(biāo)為節(jié)點(diǎn)序號(hào),縱坐標(biāo)為節(jié)點(diǎn)對(duì)應(yīng)的單位權(quán)重值。由圖3可見(jiàn),專(zhuān)利節(jié)點(diǎn)的單位權(quán)重基本介于0-0.3之間,總體上數(shù)值偏小,說(shuō)明在已授權(quán)的中國(guó)電商發(fā)明專(zhuān)利上,專(zhuān)利文本相似度較低,表現(xiàn)出較大差異性。同時(shí),根據(jù)公式(3)進(jìn)一步統(tǒng)計(jì)權(quán)重分布差異性Yi值,Yi值中最大值為0.028,最小值為0.012,表明在所有專(zhuān)利節(jié)點(diǎn)上均表現(xiàn)出權(quán)重分布較小的差異性。上述專(zhuān)利加權(quán)網(wǎng)絡(luò)單位權(quán)重分布的特性說(shuō)明我國(guó)電商專(zhuān)利發(fā)展“各有特色,百花齊放”,呈現(xiàn)與眾不同的特色。同時(shí),也說(shuō)明在已授權(quán)的中國(guó)電商發(fā)明專(zhuān)利中尚未凝聚出特別突出的集中主題,因此,中國(guó)電商發(fā)明專(zhuān)利技術(shù)主題凝聚性不強(qiáng)[14]。
3.3.2? ?技術(shù)主題熱點(diǎn)性分析
通過(guò)中心性識(shí)別關(guān)鍵節(jié)點(diǎn)從而發(fā)現(xiàn)技術(shù)主題的熱點(diǎn),一直是專(zhuān)利網(wǎng)絡(luò)中的常用方法。其中無(wú)權(quán)網(wǎng)絡(luò)通常使用度中心性、介數(shù)中心性、接近中心性和特征向量中心性等方法識(shí)別關(guān)鍵節(jié)點(diǎn),但在加權(quán)網(wǎng)絡(luò)中,邊的權(quán)重成為衡量節(jié)點(diǎn)連接關(guān)系的重要指標(biāo),關(guān)鍵節(jié)點(diǎn)的識(shí)別要充分考慮邊的權(quán)重因素。通過(guò)公式(1)計(jì)算圖3中節(jié)點(diǎn)強(qiáng)度,排序后將節(jié)點(diǎn)強(qiáng)度在前10位的節(jié)點(diǎn)制作柱狀圖,如圖4所示。
圖4顯示排名前兩位的節(jié)點(diǎn)為CH15、CH6,該節(jié)點(diǎn)分別為雅虎公司和泰康亞洲(北京)科技有限公司所有,兩家公司均為美國(guó)企業(yè),并且兩項(xiàng)專(zhuān)利均為G06F17類(lèi)。經(jīng)過(guò)IPC查詢(xún)G06F17類(lèi)專(zhuān)利為電數(shù)字?jǐn)?shù)據(jù)處理,其中特別強(qiáng)調(diào)適用于特定功能的數(shù)字計(jì)算設(shè)備、數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法,該發(fā)現(xiàn)進(jìn)一步說(shuō)明數(shù)據(jù)處理成為發(fā)明專(zhuān)利申請(qǐng)領(lǐng)域的熱點(diǎn)。同時(shí)需要強(qiáng)調(diào)的是該熱點(diǎn)專(zhuān)利均為美國(guó)公司在中國(guó)申報(bào),是一種跨國(guó)專(zhuān)利行為。Moussa B等學(xué)者研究表明隨著全球化的到來(lái)和各國(guó)間金融經(jīng)濟(jì)的互動(dòng),國(guó)際專(zhuān)利行為已經(jīng)變?yōu)槠毡楝F(xiàn)象[15]。因此,美國(guó)企業(yè)在中國(guó)申請(qǐng)電商專(zhuān)利表現(xiàn)出較高的節(jié)點(diǎn)強(qiáng)度,值得引起我國(guó)電商企業(yè)和研究者對(duì)該領(lǐng)域知識(shí)產(chǎn)權(quán)的重視。
中國(guó)電商企業(yè)阿里巴巴集團(tuán)控股有限公司在電商發(fā)明專(zhuān)利中的成績(jī)也不甘示弱,在前10的關(guān)鍵節(jié)點(diǎn)中有3項(xiàng)發(fā)明專(zhuān)利,分別為節(jié)點(diǎn)強(qiáng)度排序第4、5、7的節(jié)點(diǎn)CH38、CH41和CH43,專(zhuān)利領(lǐng)域均為G06Q30類(lèi),經(jīng)過(guò)IPC查詢(xún)G06Q30類(lèi)專(zhuān)利為電商購(gòu)物類(lèi)計(jì)算、推算和計(jì)數(shù)等,均屬于電商數(shù)據(jù)分析類(lèi)。該發(fā)現(xiàn)進(jìn)一步佐證和增強(qiáng)了電商數(shù)據(jù)分析類(lèi)發(fā)明專(zhuān)利是目前電商發(fā)明專(zhuān)利研究的熱點(diǎn)。其中特別強(qiáng)調(diào)的是,節(jié)點(diǎn)CH41的專(zhuān)利名稱(chēng)為“一種基于用戶(hù)行為的電子商務(wù)信息推薦方法與裝置”,說(shuō)明阿里巴巴集團(tuán)不但在數(shù)據(jù)分析上開(kāi)展了研究,也同步推進(jìn)了數(shù)據(jù)分析結(jié)果的應(yīng)用與顧客選擇研究。
在排名前10的節(jié)點(diǎn)中僅有第10位節(jié)點(diǎn)CH50是非G06類(lèi)專(zhuān)利,節(jié)點(diǎn)CH50為方正國(guó)際軟件(北京)有限公司2013年申請(qǐng)的H04電通信技術(shù)類(lèi)發(fā)明專(zhuān)利,說(shuō)明非電商數(shù)據(jù)分析類(lèi)專(zhuān)利也是一些企業(yè)的研究范疇和申報(bào)意向,但已經(jīng)退出技術(shù)主題的熱點(diǎn)研究領(lǐng)域。
3.3.3? ?技術(shù)主題局部趨勢(shì)性分析
在專(zhuān)利加權(quán)網(wǎng)絡(luò)中,設(shè)定一個(gè)權(quán)重閾值,篩選出高權(quán)重連接,從而發(fā)現(xiàn)高度相似的局部技術(shù)社團(tuán),并剖析該社團(tuán)的拓?fù)湫再|(zhì),有利于深度分析局部技術(shù)趨勢(shì)的發(fā)展。在圖3的專(zhuān)利加權(quán)網(wǎng)絡(luò)中,為了識(shí)別高度相似的局部聚集社團(tuán),將權(quán)閾值設(shè)定為0.7,設(shè)定完成后,計(jì)算節(jié)點(diǎn)度,篩選度高的節(jié)點(diǎn),發(fā)現(xiàn)一個(gè)風(fēng)箏型聚集社團(tuán),如圖5所示。
圖5顯示,在風(fēng)箏型聚集社團(tuán)的頭部結(jié)構(gòu)中,形成一個(gè)全局耦合網(wǎng)絡(luò),網(wǎng)絡(luò)密度為1,節(jié)點(diǎn)之間兩兩連接,邊的權(quán)重均超過(guò)0.7,說(shuō)明在頭部結(jié)構(gòu)的節(jié)點(diǎn)專(zhuān)利高文本相似,主題突出。在“風(fēng)箏”型聚集社團(tuán)的尾部結(jié)構(gòu)中,僅有1個(gè)節(jié)點(diǎn)CH38,該節(jié)點(diǎn)僅與頭部節(jié)點(diǎn)CH41相連,形成權(quán)重為0.71的高文本相似性,但未與頭部其他三個(gè)節(jié)點(diǎn)專(zhuān)利相連[16]。
通過(guò)IPC專(zhuān)利分類(lèi)號(hào)分析發(fā)現(xiàn),頭部結(jié)構(gòu)中節(jié)點(diǎn)CH37、CH41、CH67和CH84和尾部結(jié)構(gòu)中節(jié)點(diǎn)CH38,IPC專(zhuān)利分類(lèi)號(hào)均為G06Q30類(lèi),即為電商購(gòu)物類(lèi)計(jì)算、推算和計(jì)數(shù)等,均屬于電商數(shù)據(jù)分析類(lèi)。此時(shí)進(jìn)一步通過(guò)專(zhuān)利文本分析,CH38比較側(cè)重于電商買(mǎi)家數(shù)據(jù)的分析,而CH37、CH67和CH84則側(cè)重于電商網(wǎng)頁(yè)數(shù)據(jù)的分析,其中CH41為電商網(wǎng)頁(yè)數(shù)據(jù)和買(mǎi)家數(shù)據(jù)的交叉研究,因此,CH41節(jié)點(diǎn)與CH38節(jié)點(diǎn)在文本上有高相似性,也同時(shí)與CH37、CH67和CH84在文本上有高相似性,但CH38節(jié)點(diǎn)與CH37、CH67和CH84未出現(xiàn)高文本相似性。
通過(guò)專(zhuān)利申報(bào)單位分析,風(fēng)箏型聚集社團(tuán)中5個(gè)節(jié)點(diǎn)專(zhuān)利均為中國(guó)企事業(yè)單位申報(bào)。但申報(bào)的類(lèi)型不同,CH37節(jié)點(diǎn)為紐海信息技術(shù)(上海)有限公司申報(bào),該公司的主營(yíng)范圍為計(jì)算機(jī)軟硬件的研發(fā)和設(shè)計(jì);CH38和CH41節(jié)點(diǎn)專(zhuān)利為阿里巴巴集團(tuán)控股有限公司申報(bào),該公司的主營(yíng)范圍為網(wǎng)絡(luò)購(gòu)物和數(shù)據(jù)分析等;CH67為浙江大學(xué)申報(bào),浙江大學(xué)為我國(guó)著名且世界一流大學(xué);CH84節(jié)點(diǎn)為深圳先進(jìn)技術(shù)研究院申報(bào),該研究院隸屬中國(guó)科學(xué)院,是研究超算和信息技術(shù)的專(zhuān)業(yè)研究院。從申報(bào)單位屬性看,包括研究性企業(yè)、實(shí)踐性公司、著名大學(xué)和專(zhuān)業(yè)研究院,雖然申報(bào)單位屬性不同,但在電商專(zhuān)利申報(bào)類(lèi)型上趨向一致,均聚焦在G06Q30電商數(shù)據(jù)分析類(lèi),說(shuō)明電商數(shù)據(jù)分析類(lèi)專(zhuān)利已經(jīng)成為技術(shù)發(fā)展趨勢(shì),符合社會(huì)廣泛需求。
在風(fēng)箏型聚集社團(tuán)中,5個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)強(qiáng)度均處于前列,其中CH38、CH41和CH67都位列節(jié)點(diǎn)強(qiáng)度前10,CH37和CH84也都大于18,高節(jié)點(diǎn)強(qiáng)度進(jìn)一步說(shuō)明風(fēng)箏型聚集社團(tuán)不僅結(jié)構(gòu)緊密、主題突出、凝聚性強(qiáng),而且在整個(gè)專(zhuān)利加權(quán)網(wǎng)絡(luò)中也處于熱點(diǎn)位置,對(duì)其他節(jié)點(diǎn)有著重要的影響力。
4? ? ? 結(jié)論與討論
本文以1996-2018年我國(guó)電商發(fā)明專(zhuān)利數(shù)據(jù)為樣本,通過(guò)將專(zhuān)利文本相似度設(shè)定為權(quán)重,從而構(gòu)建專(zhuān)利加權(quán)網(wǎng)絡(luò),并對(duì)其進(jìn)行網(wǎng)絡(luò)特性分析,具體包括單位權(quán)重、節(jié)點(diǎn)強(qiáng)度和關(guān)鍵社團(tuán)等。通過(guò)分析發(fā)現(xiàn)專(zhuān)利技術(shù)主題的凝聚性、熱點(diǎn)和趨勢(shì),從而有以下結(jié)論:首先,我國(guó)電商專(zhuān)利發(fā)展呈現(xiàn)“各有特色,百花齊放”,整體技術(shù)主題凝聚性不強(qiáng);其次,美國(guó)公司在中國(guó)專(zhuān)利申報(bào)的跨國(guó)性專(zhuān)利行為已經(jīng)形成突出影響,中國(guó)阿里巴巴集團(tuán)在電商專(zhuān)利熱點(diǎn)的影響力緊隨其后,綜合分析發(fā)現(xiàn)電商數(shù)據(jù)分析類(lèi)專(zhuān)利已經(jīng)成為專(zhuān)利研究和申報(bào)的熱點(diǎn);最后,中國(guó)電商專(zhuān)利有一個(gè)局部社團(tuán),即風(fēng)箏型聚集社團(tuán)。在風(fēng)箏型網(wǎng)絡(luò)社團(tuán)的頭部中,專(zhuān)利高度相似,兩兩連接呈現(xiàn)全局耦合網(wǎng)絡(luò),尾部也表現(xiàn)出技術(shù)主題的尾隨性,整個(gè)社團(tuán)專(zhuān)利均為電商數(shù)據(jù)分析類(lèi),說(shuō)明中國(guó)電商專(zhuān)利的發(fā)展呈現(xiàn)數(shù)據(jù)分析趨勢(shì)。
本研究中專(zhuān)利加權(quán)網(wǎng)絡(luò)的優(yōu)勢(shì)在于將文本相似度作為權(quán)重引入專(zhuān)利網(wǎng)絡(luò)構(gòu)建中,以權(quán)重角度分析專(zhuān)利之間的確定關(guān)系,從而發(fā)現(xiàn)更多的網(wǎng)絡(luò)特性,揭示專(zhuān)利技術(shù)主題的發(fā)展。同時(shí),案例研究表明通過(guò)對(duì)專(zhuān)利加權(quán)網(wǎng)絡(luò)中單位權(quán)重及其分布、節(jié)點(diǎn)強(qiáng)度、關(guān)鍵社團(tuán)等網(wǎng)絡(luò)特性分析,對(duì)揭示專(zhuān)利技術(shù)主題發(fā)展有著重要的幫助。當(dāng)然,本研究也有不足之處,對(duì)專(zhuān)利加權(quán)網(wǎng)絡(luò)中的技術(shù)主題凝聚性沒(méi)有數(shù)量指標(biāo)性的算法,以致主題凝聚性強(qiáng)度難于量化;專(zhuān)利屬性中時(shí)間沒(méi)有納入分析維度,致使技術(shù)主題發(fā)展的時(shí)序性難以把握等。因此,專(zhuān)利加權(quán)網(wǎng)絡(luò)未來(lái)的發(fā)展在于進(jìn)一步深化專(zhuān)利加權(quán)網(wǎng)絡(luò)的網(wǎng)絡(luò)特性分析和量化,綜合考慮時(shí)間維度,深度挖掘基于專(zhuān)利加權(quán)網(wǎng)絡(luò)的技術(shù)主題分析優(yōu)勢(shì)。
[參考文獻(xiàn)]
[1] Abbas A , Zhang L, Khan S U. A literature review on the state-of-the-art in patent analysis[J]. World Patent Information, 2014, 37:3-13.
[2] Sun H, Geng Y, Hu L, et al. Measuring China's new energy vehicle patents: A social network analysis approach[J]. Energy, 2018, 153:685-693.
[3] Yoon B, Park Y. A text-mining-based patent network: Analytical tool for high-technology trend[J]. The Journal of High Technology Management Research, 2004, 15(1):37-50.
[4] Madani F, Weber C. The evolution of patent mining: Applying bibliometrics analysis and keyword network analysis[J]. World Patent Information, 2016, 46:32-48.
[5] Zanin M, Papo D, Sousa P A , et al. Combining complex networks and data mining: Why and how[J]. Physics Reports, 2016,635 :1-44.
[6] Lee P C, Su H N, Chan T Y. Assessment of ontology-based knowledge network formation by Vector-Space Model[J]. Scientometrics, 2010, 85(3):689-703.
[7] Yoon J, Kim K. An analysis of property-function based patent networks for strategic R&D planning in fast-moving industries: The case of silicon-based thin film solar cells[J]. Expert Systems with Applications, 2012, 39(9):7709-7717.
[8] 劉玉林,菅利榮. 基于文本挖掘和復(fù)雜網(wǎng)絡(luò)的中美電商專(zhuān)利比較研究[J]. 情報(bào)雜志,2019,38(6):72-79.
[9] Niemann H, Moehrle M G, Frischkorn J. Use of a new patent text-mining and visualization method for identifying patenting patterns over time: Concept, method and test application[J].Technological Forecasting and Social Change,2017, 115:210-220.
[10] 姚尊強(qiáng),尚可可,許小可.加權(quán)網(wǎng)絡(luò)的常用統(tǒng)計(jì)量[J].上海理工大學(xué)學(xué)報(bào), 2012,34(1):18-26.
[11] 汪小帆,李翔,陳關(guān)榮.網(wǎng)絡(luò)科學(xué)導(dǎo)論[M].北京: 高等教育出版社, 2012:38-43.
[12] Song K, Kim K S, Lee S . Discovering new technology opportunities based on patents: Text-mining and F-term analysis[J]. Technovation, 2017, 60-61:1-14.
[13] 荀雪蓮,王曉寧.基于中文摘要關(guān)鍵詞的畢業(yè)論文質(zhì)量評(píng)價(jià)系統(tǒng)[J]. 廊坊師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2019,19(4):30-32.
[14] 田柳,狄增如,姚虹.權(quán)重分布對(duì)加權(quán)網(wǎng)絡(luò)效率的影響[J].物理學(xué)報(bào), 2011,60(2):807-812.
[15] Moussa B, Varsakelis N C. International patenting: An application of network analysis[J]. The Journal of Economic Asymmetries, 2017,15:48-55.
[16] 周莉,劉苗,周蕊格,等. 基于專(zhuān)利文本挖掘的科技文化產(chǎn)業(yè)技術(shù)發(fā)展趨勢(shì)研究[J].科技進(jìn)步與對(duì)策,2019,36(23):69-75.
廊坊師范學(xué)院學(xué)報(bào)(自然科學(xué)版)2022年1期