• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于投融資和專(zhuān)利融合的投資方向發(fā)現(xiàn)模型

      2022-06-14 09:22:34黃葆春
      情報(bào)工程 2022年2期
      關(guān)鍵詞:投融資科創(chuàng)賽道

      黃葆春

      國(guó)家知識(shí)產(chǎn)權(quán)局專(zhuān)利局自動(dòng)化部 北京 100088

      引言

      硬科技概念正在被人們所熟知,具有較高技術(shù)門(mén)檻和技術(shù)壁壘的硬科技越來(lái)越受到資本的關(guān)注。硬科技類(lèi)型企業(yè)具有高技術(shù)壁壘、高研發(fā)投入、高學(xué)歷的管理層以及低營(yíng)銷(xiāo)投入的特點(diǎn)。硬科技行業(yè)將是未來(lái)一段時(shí)間內(nèi)的投資熱點(diǎn)。

      隨著科創(chuàng)投資時(shí)代的來(lái)臨,科學(xué)技術(shù)對(duì)投融資事件的影響越來(lái)越大,所有投資機(jī)構(gòu)都在努力發(fā)現(xiàn)具有高新技術(shù)的公司和研發(fā)團(tuán)隊(duì)。對(duì)科技資源進(jìn)行檢測(cè),分析評(píng)價(jià)科學(xué)技術(shù)發(fā)展的狀態(tài)和趨勢(shì),選擇合理優(yōu)先投資的科技領(lǐng)域、合理配置投資資金、有效開(kāi)展科創(chuàng)投資的方法和途徑已經(jīng)成為國(guó)內(nèi)投資機(jī)構(gòu)普遍關(guān)注的熱點(diǎn)。投融資數(shù)據(jù)是資本的表現(xiàn)形式,專(zhuān)利文獻(xiàn)是技術(shù)創(chuàng)新成果的表現(xiàn)形式。隨著科技、資本與產(chǎn)業(yè)融合發(fā)展,投融資數(shù)據(jù)與專(zhuān)利文獻(xiàn)之間相互參考與相互作用的價(jià)值日益凸顯,兩者之間的有效鏈接除了有助于用戶便捷、高效的獲取科技文獻(xiàn)信息外,還能加強(qiáng)技術(shù)創(chuàng)新成果和資本之間的聯(lián)系,有助于實(shí)現(xiàn)科創(chuàng)投資的目的。然而,當(dāng)前的文獻(xiàn)服務(wù)體系中,投融資數(shù)據(jù)與專(zhuān)利文獻(xiàn)資源表現(xiàn)出明顯的局部有序但整體無(wú)序的孤島特征,目前,研究人員也進(jìn)行了一些關(guān)于海量信息分析及機(jī)會(huì)發(fā)現(xiàn)的研究[1]。傳統(tǒng)的研究主要是基于情景分析法[2]、德?tīng)柗品╗3]、AHP(層次分析法)[4]等方法進(jìn)行信息分析和結(jié)論演繹。上述方法基于非系統(tǒng)過(guò)程,并依靠專(zhuān)家的主觀意見(jiàn)。為了克服上述方法的缺陷,研究者提出了一些系統(tǒng)性的客觀的方法,例 如FUSE(Foresight and Understanding from Scientific Exposition)[5],CUBIST(Combining and Uniting Business Intelligence with Semantic Technology)[6],用于技術(shù)管理的文本挖掘軟件(VantagePoint)[7],KISTI的信息分析和科學(xué)技術(shù)領(lǐng)域機(jī)會(huì)發(fā)現(xiàn)的InSciTe[8,9],任智軍等探索了基于數(shù)據(jù)挖掘的技術(shù)機(jī)會(huì)發(fā)現(xiàn)[10]等。但國(guó)內(nèi)學(xué)者大都局限于將投融資數(shù)據(jù)或者專(zhuān)利數(shù)據(jù)進(jìn)行單獨(dú)研究,將結(jié)論進(jìn)行綜合分析,這樣以單一視角和不全數(shù)據(jù)進(jìn)行的分析得到的結(jié)果相對(duì)比較片面。

      因此,投融資數(shù)據(jù)和專(zhuān)利數(shù)據(jù)的融合分析對(duì)于理解資本和技術(shù)之間的聯(lián)系、提高實(shí)現(xiàn)科創(chuàng)投資和技術(shù)創(chuàng)新方向有著重要的意義,而且大量的實(shí)證研究也表明這兩種資源的集成揭示分析有助于理解技術(shù)發(fā)展趨勢(shì)、產(chǎn)業(yè)資本技術(shù)關(guān)系等。因此,研究如何進(jìn)行投融資數(shù)據(jù)和專(zhuān)利數(shù)據(jù)整合,同時(shí)改變現(xiàn)有數(shù)據(jù)孤島式的深加工的加工方式,形成投融資數(shù)據(jù)和專(zhuān)利數(shù)據(jù)整合理論和方法是具有重要實(shí)際意義的。本文提出一種新的研究方法,將投融資數(shù)據(jù)和專(zhuān)利兩種異構(gòu)化的數(shù)據(jù)進(jìn)行融合對(duì)比,然后分析與挖掘可以得到更加全面多元化的分析結(jié)果,文章最后使用了最近10年投融資數(shù)據(jù)和專(zhuān)利數(shù)據(jù)對(duì)本方法進(jìn)行了實(shí)證研究,結(jié)果也相對(duì)比較理想。

      1 投融資數(shù)據(jù)與專(zhuān)利數(shù)據(jù)整合

      目前投融資數(shù)據(jù)與專(zhuān)利數(shù)據(jù)整合實(shí)踐研究的很少,更多的是進(jìn)行論文和專(zhuān)利的整合,任智軍等研究了論文與專(zhuān)利整合數(shù)據(jù)的研究,通過(guò)兩類(lèi)數(shù)據(jù)中都共同存在的人名數(shù)據(jù)字段將兩類(lèi)資源進(jìn)行整合[11],賴(lài)院根提出了通過(guò)分類(lèi)體系之間的映射關(guān)系實(shí)現(xiàn)期刊論文與專(zhuān)利文獻(xiàn)在領(lǐng)域?qū)用娴膶?duì)接,利用主題詞表,建立期刊論文與專(zhuān)利文獻(xiàn)在主題層面的鏈接[12]。目前尚無(wú)對(duì)投融資數(shù)據(jù)與專(zhuān)利數(shù)據(jù)整合研究,因此本文提出一種以融資企業(yè)為基礎(chǔ)融合專(zhuān)利的整合策略,從信息資源整合的角度入手,通過(guò)企業(yè)名稱(chēng)為核心將兩類(lèi)資源進(jìn)行整合,使得投融資數(shù)據(jù)與專(zhuān)利數(shù)據(jù)變得集中有序儲(chǔ)存。

      首先,基于大規(guī)模投融資數(shù)據(jù)和專(zhuān)利文獻(xiàn)數(shù)據(jù)收集和整理。在數(shù)據(jù)收集整理階段要對(duì)各種類(lèi)型(中國(guó)專(zhuān)利著錄項(xiàng)目及全文數(shù)據(jù)、DOCDB專(zhuān)利著錄項(xiàng)目、投融資數(shù)據(jù)、工商數(shù)據(jù))數(shù)據(jù)進(jìn)行歸并整理。

      圖1 投融資數(shù)據(jù)與專(zhuān)利數(shù)據(jù)整合

      其次進(jìn)行數(shù)據(jù)整合,數(shù)據(jù)整合分成三個(gè)部分:

      (1)數(shù)據(jù)抽?。合葘⑼度谫Y數(shù)據(jù)中的被投企業(yè)從簡(jiǎn)稱(chēng)得到企業(yè)的全稱(chēng),然后將企業(yè)全稱(chēng)獲取相關(guān)的工商數(shù)據(jù),同時(shí)根據(jù)企業(yè)全稱(chēng)利用申請(qǐng)人獲取專(zhuān)利數(shù)據(jù);

      (2)數(shù)據(jù)清理與加工:基于投融資數(shù)據(jù)自底向上構(gòu)建投資賽道,把所有在融企業(yè)標(biāo)引到投資賽道中,同時(shí)采用前期研究積累中已有的針對(duì)專(zhuān)利文獻(xiàn)的IPC抽取工具對(duì)IPC進(jìn)行提取,并將IPC數(shù)據(jù)進(jìn)行中文標(biāo)引和改寫(xiě)。

      (3)數(shù)據(jù)導(dǎo)入:將加工好的數(shù)據(jù)導(dǎo)入到投融資和專(zhuān)利整合數(shù)據(jù)庫(kù)。

      最后,本文選取最近10年投融資數(shù)據(jù)和專(zhuān)利數(shù)據(jù)進(jìn)行實(shí)證研究,進(jìn)行投融資數(shù)據(jù)和專(zhuān)利的整合,從信息資源整合的角度入手,通過(guò)挖掘其理論深度,把無(wú)序分散的資源集中起來(lái),把無(wú)序的資源變?yōu)橛行?,使之有效?shí)現(xiàn)投融資數(shù)據(jù)和專(zhuān)利數(shù)據(jù)的知識(shí)化組織、方便后繼的分析與挖掘。

      2 投資方向識(shí)別及標(biāo)注

      2.1 投資方向識(shí)別概述

      在投融資數(shù)據(jù)和專(zhuān)利數(shù)據(jù)整合基礎(chǔ)上,對(duì)新融資企業(yè)進(jìn)行標(biāo)注和度量,然后利用分類(lèi)算法對(duì)新融資企業(yè)進(jìn)行投資賽道分類(lèi),對(duì)投融資數(shù)據(jù)和專(zhuān)利數(shù)據(jù)融合程度進(jìn)行分析,研究投融資和專(zhuān)利兩種數(shù)據(jù)之間存在的相互影響和排斥關(guān)系,從而探索資本和技術(shù)之間的發(fā)展規(guī)律,確定科創(chuàng)投資方向。基于投融資數(shù)據(jù)和專(zhuān)利數(shù)據(jù)挖掘科創(chuàng)投資方向的首要問(wèn)題是識(shí)別在融企業(yè)所在投資賽道,本文采用的方法則是利用在融企業(yè)特征做分類(lèi),在分類(lèi)的基礎(chǔ)上,進(jìn)一步進(jìn)行企業(yè)聚類(lèi)并標(biāo)注聚類(lèi)名稱(chēng),企業(yè)聚類(lèi)的結(jié)果就是科創(chuàng)投資方向,具體如圖2所示。

      圖2 科創(chuàng)投數(shù)據(jù)和專(zhuān)利數(shù)據(jù)投資方向識(shí)別模型圖

      分類(lèi)和聚類(lèi)的基礎(chǔ)是企業(yè)技術(shù)和產(chǎn)品特征,企業(yè)技術(shù)特征是全面刻畫(huà)企業(yè)技術(shù)信息的系統(tǒng)性方法,基于工商、投融資和專(zhuān)利等多維數(shù)據(jù)可以更加全面了解企業(yè)的真實(shí)情況,也為后續(xù)科創(chuàng)投資方向識(shí)別算法提供有力支持,通過(guò)多樣化的產(chǎn)品標(biāo)簽,更加清晰地標(biāo)識(shí)了企業(yè)技術(shù)和產(chǎn)品的多種屬性等。其企業(yè)技術(shù)特征如下表1所示:

      表1 企業(yè)技術(shù)特征

      2.2 投資方向識(shí)別

      有了企業(yè)技術(shù)特征我們就可以使用分類(lèi)算法進(jìn)行產(chǎn)業(yè)的分類(lèi),分類(lèi)算法使用fasttext[13],在分類(lèi)之后,我們可以對(duì)產(chǎn)業(yè)下的賽道進(jìn)行聚類(lèi),聚類(lèi)賽道作為投資方向,基于聚類(lèi)的投資方向識(shí)別模型說(shuō)明如下:

      (1)從投融資數(shù)據(jù)和專(zhuān)利整合數(shù)據(jù)庫(kù)中抽取投融資特征和專(zhuān)利關(guān)鍵詞。

      (2)利用投融資指標(biāo)和關(guān)鍵詞作為特征進(jìn)行分類(lèi)。

      (3)在每個(gè)分類(lèi)里面,采用KMeans聚類(lèi)算法[14](sklearn kmeans[15])進(jìn)行融資企業(yè)聚類(lèi)。

      (4)根據(jù)聚類(lèi)結(jié)果將每個(gè)類(lèi)別作為投資方向。

      2.3 投資方向標(biāo)注

      在得到研究方向后,需要對(duì)研究方向進(jìn)行標(biāo)注,研究方向的標(biāo)注主要通過(guò)科技術(shù)語(yǔ)?;バ畔⑹潜硎緝蓚€(gè)變量之間關(guān)聯(lián)程度有用的度量,因此可以通過(guò)關(guān)鍵詞與研究方向的互信息來(lái)進(jìn)行研究方向的標(biāo)注。在對(duì)共同研究方向投融資數(shù)據(jù)和專(zhuān)利聚類(lèi)后,具有相同研究方向的投融資數(shù)據(jù)和專(zhuān)利聚為一類(lèi),這些投融資數(shù)據(jù)和專(zhuān)利在關(guān)鍵詞上具有共性,提取這個(gè)共性詞匯就是對(duì)研究方向的標(biāo)注。由于與同一個(gè)研究方向上互信息最大的關(guān)鍵詞不只一個(gè),因此共同研究方向標(biāo)注有可能由一組詞匯組成?;诨バ畔⒌难芯糠较蛎枋龅乃惴ㄈ缦拢?/p>

      (2)根據(jù)聚類(lèi)結(jié)果,利用互信息公式計(jì)算每個(gè)關(guān)鍵詞與所有類(lèi)別的互信息,MI公式如下所示

      (3)對(duì)MI進(jìn)行規(guī)劃化處理。

      (4)分類(lèi)別統(tǒng)計(jì)最大互信息值及對(duì)應(yīng)的主關(guān)鍵詞。

      3 投資趨勢(shì)走向分析模型

      投資趨勢(shì)走向分析是根據(jù)最新的投資方向和技術(shù)發(fā)展趨勢(shì)進(jìn)行分析和挖掘的結(jié)果,它們可能創(chuàng)立一個(gè)新投資賽道或改變某個(gè)老投資賽道。投資趨勢(shì)走向代表了一個(gè)新的投資賽道或者投資方向,被用來(lái)找到未來(lái)科創(chuàng)投資的技術(shù)領(lǐng)域和投資趨勢(shì)。投資趨勢(shì)走向分析對(duì)于投資方向研究意義重大:一方面,投融資與專(zhuān)利包括了資本和技術(shù),在最新被投資企業(yè)所在的新技術(shù)賽道熱點(diǎn),最有可能涌現(xiàn)新興投資趨勢(shì)。另外,新投資方向也會(huì)推動(dòng)資本投資趨勢(shì)和技術(shù)發(fā)展,吸引投資機(jī)構(gòu)和商業(yè)公司轉(zhuǎn)向研發(fā),從而提高投資機(jī)構(gòu)投資走向與專(zhuān)利的產(chǎn)出和提高技術(shù)創(chuàng)新水平有著重要的意義。由于資本是技術(shù)創(chuàng)新的催化劑,因此在投資趨勢(shì)走向是非常必要的,本文研究的投資趨勢(shì)走向分析是指在研究最近剛剛出現(xiàn)有新的投資方向或者由冷變熱的投資方向,投資趨勢(shì)走向分析模型采用的是基于聚類(lèi)的離群點(diǎn)檢測(cè)算法[16]?;诰垲?lèi)的離群點(diǎn)檢測(cè)算法如下所示:

      (1)計(jì)算現(xiàn)有投資分類(lèi)或者聚類(lèi)的質(zhì)心;

      (2)計(jì)算被投企業(yè)到最近質(zhì)心的距離;

      (3)計(jì)算各對(duì)象到它的最近質(zhì)心的相對(duì)距離;

      (4)與給定的閾值作比較,超過(guò)閾值即認(rèn)為是離群點(diǎn);

      (5)對(duì)離群點(diǎn)企業(yè)進(jìn)行聚類(lèi),找到新的投資方向。

      4 實(shí)驗(yàn)及分析

      為驗(yàn)證基于投融資數(shù)據(jù)與專(zhuān)利數(shù)據(jù)整合數(shù)據(jù)的投資方向發(fā)現(xiàn)模型的可行性,本文選擇了最近10年投融資數(shù)據(jù)和專(zhuān)利數(shù)據(jù)進(jìn)行實(shí)例研究,在互聯(lián)網(wǎng)上采集投融資數(shù)據(jù)和專(zhuān)利局專(zhuān)利下載獲取了數(shù)據(jù),利用投融資數(shù)據(jù)與專(zhuān)利數(shù)據(jù)整合之后構(gòu)建了投融資專(zhuān)利整合數(shù)據(jù)庫(kù),然后對(duì)投資賽道進(jìn)行投資方向分析和新興投資方向分析。

      4.1 投融資與專(zhuān)利數(shù)據(jù)整合

      投融資數(shù)據(jù)與專(zhuān)利整合數(shù)據(jù)中抽取10家融資企業(yè)的投融資和專(zhuān)利整合數(shù)據(jù)見(jiàn)表2。

      表2 投融資和專(zhuān)利整合

      (續(xù)表2)

      (續(xù)表2)

      (續(xù)表2)

      4.2 投資方向識(shí)別與標(biāo)注

      利用標(biāo)注算法投資方向識(shí)別及標(biāo)注方法對(duì)2020年投融資數(shù)據(jù)與專(zhuān)利整合數(shù)據(jù)進(jìn)行識(shí)別之后,得到融資企業(yè)6043家,并通過(guò)第2.3節(jié)中公式(1)對(duì)化學(xué)藥的類(lèi)別進(jìn)行了標(biāo)注,結(jié)果如表3所示。從表3可以看出,投資方向?yàn)椤吧V柱、藥品包裝,化學(xué)藥藥學(xué)理論,崩解劑,化學(xué)藥制備設(shè)備”等10個(gè)方向。

      表3 投資方向標(biāo)注

      4.3 新興投資方向分析

      根據(jù)第3.3節(jié)中新興技術(shù)術(shù)語(yǔ)的識(shí)別方法,2020年投融資數(shù)據(jù)對(duì)2020年新興投資方向識(shí)別,識(shí)別出植物肉、射頻濾波器、液態(tài)儲(chǔ)氫、內(nèi)窺鏡和手術(shù)機(jī)器人等5個(gè)新興投資方向,具體如表4所示。

      表4 新興投資方向識(shí)別表

      5 總結(jié)與展望

      本文提出了一種基于投融資數(shù)據(jù)與專(zhuān)利數(shù)據(jù)整合的分析與挖掘的研究方法,構(gòu)建了基于投融資數(shù)據(jù)與專(zhuān)利數(shù)據(jù)整合的分析與挖掘知識(shí)挖掘模型,從投融資與專(zhuān)利共同研究方向和新興技術(shù)發(fā)現(xiàn)兩個(gè)方面來(lái)揭示投融資與專(zhuān)利關(guān)系,最后,我們對(duì)最近10年投融資數(shù)據(jù)和專(zhuān)利數(shù)據(jù)進(jìn)行了實(shí)例驗(yàn)證,加強(qiáng)技術(shù)創(chuàng)新成果和資本之間的聯(lián)系,為科創(chuàng)投資等提供了一個(gè)新的研究思路。下一步的工作將在本文提出的模型基礎(chǔ)上,進(jìn)行基于投融資和專(zhuān)利整合的企業(yè)融資預(yù)測(cè)研究。

      猜你喜歡
      投融資科創(chuàng)賽道
      自制冰墩墩不能滑出“法律賽道”
      公民與法治(2022年4期)2022-08-03 08:20:24
      科創(chuàng)引領(lǐng),搶跑新賽道
      走向世界(2022年3期)2022-04-19 12:38:58
      科創(chuàng)走廊“乘風(fēng)起”
      科創(chuàng)“小燈泡”:從傘說(shuō)起
      保護(hù)人類(lèi)健康的科創(chuàng)產(chǎn)品
      征服蒙特卡洛賽道
      投融資關(guān)注榜(2019.6.16-2019.7.15)
      6月投融資關(guān)注榜(5.16-6.15)
      4月投融資關(guān)注榜(3.16-4.15)
      3月投融資關(guān)注榜(2.16-3.15)
      宁化县| 溆浦县| 新余市| 宁远县| 雷州市| 无棣县| 瑞丽市| 阿坝| 大名县| 班玛县| 乐都县| 江西省| 旅游| 沁水县| 安新县| 宿迁市| 高邮市| 稷山县| 射洪县| 禹州市| 滨海县| 黔西| 中江县| 紫金县| 沅江市| 若羌县| 阿勒泰市| 沧州市| 额尔古纳市| 东乡县| 德惠市| 南和县| 景东| 新郑市| 临安市| 吴堡县| 光山县| 阳朔县| 扶风县| 灯塔市| 新绛县|