• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于知識元抽取的中文智庫成果描述規(guī)則研究

      2017-04-19 18:02:49趙蓉英張心源
      圖書與情報 2017年1期
      關(guān)鍵詞:智庫

      趙蓉英 張心源

      摘 要:從資源角度來看,智庫是一個擁有大量知識資源的知識庫。知識經(jīng)濟時代,知識層面成為繼載體層面后的知識資源管理與計量的新視角,知識元概念的提出為實現(xiàn)知識資源直接管理和計量提供了可能。中文文本的分類、挖掘、標(biāo)引等研究基礎(chǔ)為我國智庫成果的知識元抽取提供了技術(shù)保障,將抽取出的知識元歸類、進一步歸納出對應(yīng)的描述規(guī)則有利于實現(xiàn)知識層面的中文智庫成果管理與評價。文章基于構(gòu)建主題詞表進行文本抽取的方法,選擇中國國際問題研究中心2015年全部可獲得的智庫研究成果為樣本,進行成果知識元的抽取,經(jīng)過人工選擇、精煉抽取結(jié)果后歸納總結(jié)出中文智庫成果的知識元類型及對應(yīng)描述規(guī)則。共歸納出事實知識元、定義知識元、結(jié)論知識元、方法知識元和關(guān)系知識元等5種知識元類型和16種具體的描述規(guī)則。

      關(guān)鍵詞:智庫;知識元;中文智庫成果;描述規(guī)則

      中圖分類號: G250.7;G252 文獻標(biāo)識碼: A DOI:10.11968/tsyqb.1003-6938.2017018

      Abstract From the perspective of resources, the think tanks are large knowledge base with rich knowledge resources. In the era of knowledge-driven economy, the knowledge resources management and measurement focus more on knowledge level than the carrier level. Knowledge elements are the key role when dealing with knowledge itself. Research on the classification, mining and index of Chinese text provides the technological support for knowledge element extraction of Chinese think-tank products. The descriptive rules, induced from the classification of extracted knowledge elements, would benefit the management and assessment of Chinese think-tank products from level of knowledge. According to the method of building thesaurus for text extraction, the paper chooses the accessible think-tank research products from China Institute of International Studies in 2015 as samples. The types and descriptive rules of Chinese think-tank products are summarized after man-made selection and purification of extraction results. Five kinds of knowledge elements such as fact knowledge element, definition knowledge element, conclusion knowledge element, method knowledge element and relation knowledge element as well as 16 types of descriptive rules of Chinese think-tank products are summed up.

      Key words think tank; knowledge element; Chinese think-tank products; descriptive rules

      當(dāng)今世界,我國內(nèi)外部環(huán)境正發(fā)生深刻變化,國際政治經(jīng)濟格局深刻調(diào)整、大國博弈日益復(fù)雜。以布魯金斯學(xué)會、蘭德公司等為代表的智庫在西方發(fā)達國家決策中發(fā)揮了重要作用。我國近年來也高度重視我國智庫建設(shè),指導(dǎo)我國智庫建設(shè)的文件相繼出臺,我國迎來了智庫時代[1]。

      國內(nèi)學(xué)界對智庫建設(shè)、運作模式、評價體系等方面也開展了豐富的研究,其中構(gòu)建適用于中國特色新型智庫的評價體系成為一項重要研究分支,以積極引導(dǎo)我國智庫實現(xiàn)從“量”到“質(zhì)”的轉(zhuǎn)變,提升智庫影響力。與此同時,知識管理活動正經(jīng)歷著由信息單元向知識單元邁進的探索,由于智庫本身就是一個知識庫,將知識元的概念引入智庫知識管理中,可以實現(xiàn)從產(chǎn)品數(shù)量到產(chǎn)品質(zhì)量的檢測評價,并為后續(xù)智庫成果知識單元挖掘研究以及從知識層面進行管理與評價我國智庫資源提供可能。故必然會引起智庫評價與管理的新變化。本文從中文文本的知識元抽取機制出發(fā),選取中文智庫成果作為研究對象,通過合適的樣本考察了中文智庫成果存在的知識元類型及其對應(yīng)的描述規(guī)則。其中,描述規(guī)則是對中文智庫成果的精準(zhǔn)化標(biāo)引,確定了智庫成果中知識單元數(shù)量。

      1 相關(guān)概述

      1.1 我國智庫的研究現(xiàn)狀與智庫評價體系

      通過文獻調(diào)研和內(nèi)容分析發(fā)現(xiàn),國內(nèi)現(xiàn)有對我國智庫建設(shè)的討論主要有:中外智庫對比[3-5]、智庫界定[6]、學(xué)術(shù)機構(gòu)與智庫間的轉(zhuǎn)型[7-8]、中國智庫發(fā)展理念與制度創(chuàng)新[9]以及中國智庫評價體系[10]等。智庫本身是一個綜合性強的知識加工機構(gòu),多個學(xué)科均有滲透,其中圖書情報學(xué)科尤為關(guān)注智庫評價體系的構(gòu)建。

      科學(xué)的評價體系不僅用于衡量智庫的優(yōu)劣,更是我國智庫發(fā)展方向的引導(dǎo)標(biāo)桿。上海高校智庫研究和管理中心執(zhí)行副主任沈國麟曾指出:智庫排行榜的最大價值在于催生了中國新型智庫的行業(yè)自覺,并通過設(shè)定指標(biāo)的形式引導(dǎo)智庫發(fā)展方向[11]。本文進行的智庫成果知識單元描述規(guī)則的抽取,為進行智庫成果知識單元挖掘提供了識別規(guī)則,提供了從知識計量學(xué)角度出發(fā)的基本計量單位。

      1.2 中文智庫成果與知識評價計量

      對比國內(nèi)現(xiàn)行的智庫指標(biāo)體系,結(jié)合相關(guān)文獻研究發(fā)現(xiàn),我國智庫評價采用了定性與定量相結(jié)合的指標(biāo)體系,指標(biāo)涉及了智庫資源、效用以及影響力等多個角度。尤其是對中文智庫成果的評價,包括了智庫智力成果的載體數(shù)量、智力成果受到政治團體的采用狀況等內(nèi)容。但現(xiàn)有評價指標(biāo)主要是對載體數(shù)量和后續(xù)使用情況的評判,沒有深入到智庫單位創(chuàng)造知識價值的多少。而以知識單元為單位進行知識層面的智庫成果評價的優(yōu)點在于知識計量指標(biāo)較傳統(tǒng)智庫計量指標(biāo)更為精準(zhǔn)、及時。

      首先,進行智庫成果數(shù)量上的統(tǒng)計,載體層面的評價會造成智力產(chǎn)品的重復(fù)統(tǒng)計,因為智庫各類型出版物均是智力產(chǎn)品的載體,而非知識本身,成果數(shù)量與智庫智力產(chǎn)品的價值并不等同;其次,以政策建議被決策者和社會組織采納情況來衡量智庫成果影響力不夠全面,因為智庫成果形式多樣,得到?jīng)Q策者批注的往往是決策咨詢報告、調(diào)研報告等正式形式的文檔,而智庫專家的一些著作、短評、論文等也蘊含了寶貴的智慧,這些形式的成果通過網(wǎng)絡(luò)、媒體等形式發(fā)揮著智庫的影響力;最后,智庫成果對政策的影響具有時效性,有些成果的影響力需要在多年以后才能彰顯出來,或者某項決策受到多個智庫成果的共同影響,這種情況單從被批注的智庫成果數(shù)量上不能得以全面體現(xiàn)。

      1.3 中文智庫的成果類型與內(nèi)容特點

      對中文智庫成果類型與內(nèi)容特點歸納是進行智庫成果知識單元抽取的基礎(chǔ)。按照主流理論觀點,中國智庫的類型主要包括:官方智庫、半官方智庫、民間智庫以及大學(xué)附屬型智庫[12]??v觀四種類型智庫的研究成果,基本涵蓋了以下形式:一是較為正式的決策咨詢報告,如調(diào)研報告、課題結(jié)項報告、藍皮書等,該類成果特點是研究項目多為政府或社會組織直接委托項目,格式規(guī)范,是智庫影響決策的主要工具;二是智庫學(xué)者公開發(fā)表的文獻,如學(xué)術(shù)論文、專著等,該類成果能夠方便地從期刊數(shù)據(jù)庫以及圖書出版機構(gòu)獲取,是科學(xué)觀點傳播的常用形式;三是通過網(wǎng)絡(luò)傳播的非正式成果,如專家短評、媒體訪談記錄等,該類成果更新快、影響范圍廣,是智庫與社會公眾交流的主要途徑,也代表了智庫的最新觀點。

      基于中文和中國國情特點,中文智庫成果呈現(xiàn)出以下特點:從成果內(nèi)容涉及主題上看,主要有軍事、外交、經(jīng)濟、社會、民生、教育、醫(yī)療等,根據(jù)智庫性質(zhì)的不同在各個主題的研究表現(xiàn)出不同的傾向;從成果形式上看,專家觀點、媒體訪談等非正式形式的成果在內(nèi)容結(jié)構(gòu)上不拘一格,而調(diào)研報告、學(xué)術(shù)論文、專著等具有相對工整的格式,包含摘要、引言、關(guān)鍵詞、參考文獻等信息;從成果研究主題上看,具有明顯的時間特征,因為智庫的研究目標(biāo)是影響決策,其研究方向集中在每年度的焦點問題上;從成果行文思路上看,中文智庫成果形式簡練,研究思路多為“事實陳述——分析——結(jié)論”的發(fā)展順序;從研究方法上看,區(qū)別于一般學(xué)術(shù)研究成果,研究方法集中在綜述研究、社會調(diào)查、統(tǒng)計分析等社會科學(xué)研究通用的基礎(chǔ)方法,引文分析等學(xué)科專有方法的使用頻率較低。

      2 知識元相關(guān)基礎(chǔ)研究

      2.1 知識元的提出與影響

      知識元(knowledge element)又稱為知識因子、知識基因、知識元素等。20世紀(jì)70年代后期,美國情報學(xué)家弗拉基米爾·斯拉麥卡教授來華講學(xué)時,提出知識的控制單位將從文獻深化到文獻中的數(shù)據(jù)、公式、事實、結(jié)論等最小的獨立的“知識元”,即“數(shù)據(jù)元”[13]。國內(nèi)關(guān)于知識元的最早定義是朱曉蕓等人在1993年提出的“原子知識元”的概念[14]。直至目前,關(guān)于知識元的明確定義尚未形成統(tǒng)一意見,特別是對知識元與知識單元之間關(guān)系的界定。部分學(xué)者認為知識單元等同知識元,是知識不可再分的基本單元,是構(gòu)成系統(tǒng)知識的最小規(guī)則,即狹義的知識單元概念,這種觀點較為普遍。如Reich.Y[15]、King A W[16]、邱均平[17]、宋艷輝[18]、文庭孝[19]等從信息計量學(xué)角度,認為知識單元是繼文獻單元、信息單元后計量單元從載體層次向認知層次的發(fā)展;王子舟[20]、馬費成[21]等從知識管理視角分析,認為知識單元是對知識對象進行知識組織和知識檢索的基礎(chǔ);趙紅州[22]從科學(xué)計量學(xué)角度認為知識單元又稱為知識本體,是能夠用數(shù)學(xué)公式表示的科學(xué)概念,并提出了知識單元的智荷的概念;馬費成[23]介紹了B.C.Brooks的認知地圖理論,認為認知地圖是用知識單元直接聯(lián)接的概念網(wǎng);溫有奎等[24]認為知識元是知識的最小管理單位,提出了知識元鏈接理論和模型。上述研究對知識單元與知識元的界定一致,是區(qū)別于文獻單元,從知識自身角度劃分的知識管控單位。而廣義上的知識單元是知識元的邏輯組合,是相對獨立的內(nèi)容或文本片段,容量具有無限度,而知識元是構(gòu)成最小要素。本文延續(xù)狹義知識單元與知識元等同的概念界定,認為知識元是知識的最小控制單位,既定量化的概念。中文智庫成果知識元是知識經(jīng)濟時代下開展智庫知識直接管理與評價的管控對象。

      結(jié)合現(xiàn)有知識元的理論研究,知識元具有獨立性、完整性、穩(wěn)定性、唯一性、不可再分性等特點,是知識管理和計量研究從載體層面向認知層面發(fā)展的本質(zhì)改變,是知識經(jīng)濟時代下進行知識管理活動控制單位對知識元的標(biāo)引、抽取等研究已成為實現(xiàn)認知層面知識管理的重要保障。

      2.2 知識元抽取的實現(xiàn)

      知識元抽取又稱為知識抽取、知識元標(biāo)引等,是實現(xiàn)知識層面的知識計量與知識管理的前提保障,知識元的抽取過程就是將文獻中涉及的知識元按照所屬知識元的類別逐一識別、理解、篩選、歸納的過程,并存儲成結(jié)構(gòu)化的知識元庫,用于進一步分析使用。國內(nèi)外知識元抽取的方法主要有三種類型:基于字符的自動標(biāo)引方法,包括詞典標(biāo)引法、切分標(biāo)記標(biāo)引法、單漢字標(biāo)引法等,其中前兩者都屬于先組式標(biāo)引法,處理速度快,但構(gòu)建和維護分詞詞典較為復(fù)雜繁瑣,不適用于大規(guī)模文獻的知識元抽取,單漢字標(biāo)引雖然避開了分詞障礙,不存在詞典構(gòu)造問題,但容易忽略文本中隱含的主題概念,容易產(chǎn)生虛假配組的現(xiàn)象;基于統(tǒng)計模型的抽取方法,如以齊普夫定律為基礎(chǔ)的詞頻統(tǒng)計標(biāo)引法和加權(quán)統(tǒng)計標(biāo)引法等,由于語言是有意義的符合序列,基于統(tǒng)計模型的抽取方法往往需要與語義語法分析相結(jié)合才能取得更高的標(biāo)引質(zhì)量;還有基于語義分析的標(biāo)引方法,如句法分析標(biāo)引法、語義分析標(biāo)引法、人工智能標(biāo)引法等,是漢語自動標(biāo)引技術(shù)發(fā)展的趨勢。知識元抽取過程的常用技術(shù)有自然語言處理技術(shù)、語義網(wǎng)、統(tǒng)計分析等。

      國內(nèi)外對知識元抽取的研究涉及語言學(xué)、情報學(xué)、人工智能、管理學(xué)、計算機科學(xué)等多個學(xué)科領(lǐng)域。在學(xué)術(shù)文獻的知識元抽取實踐中,化柏林[25]曾通過內(nèi)容分析對學(xué)術(shù)論文中方法知識元的類型與描述規(guī)則進行總結(jié),為方法知識元提供支撐;溫有奎等[26]將知識元分為兩大類:描述型和過程型,前者包括信息報道、名詞解釋、數(shù)值、問題描述、文獻引證等類型文獻知識,后者包括步驟、方法、定義、原理、經(jīng)驗等文獻知識,并指出文本創(chuàng)新點的知識元抽取方法;周寧等[27]利用XML描述規(guī)則探討知識元的表示與抽取模式;宋培彥等[28]設(shè)計了一種從術(shù)語定義句中自動抽取知識元的方法,并進行了實驗驗證。

      3 研究方法

      3.1 樣本選取

      根據(jù)賓大版《全球智庫報告》、中國社會科學(xué)院的《全球智庫評價報告》以及上海社會科學(xué)院智庫研究中心發(fā)布的《中國智庫報告》等在國內(nèi)外影響力較高的智庫評價報告,本文選取出中國影響力較高的7所智庫,分別是中國社會科學(xué)院、中國國際問題研究院、國務(wù)院發(fā)展研究中心、中國現(xiàn)代國際關(guān)系研究院、上海國際問題研究院、北京大學(xué)國際戰(zhàn)略研究院和中國人民大學(xué)重陽金融研究院為研究樣本。由于北京大學(xué)國際戰(zhàn)略研究院網(wǎng)頁不可訪問,故只對其余6所智庫代表的成果類型和成果可獲得性進行了詳細調(diào)查結(jié)果(見表1)。

      從調(diào)查結(jié)果可以看出,中國社會科學(xué)院作為我國規(guī)模和影響力最大的智庫涵蓋了全面的智庫成果類型,并且在實際調(diào)研中發(fā)現(xiàn)中國社會科學(xué)院作為綜合性智庫,研究內(nèi)容涉及了全球經(jīng)濟、能源、文化、政治、衛(wèi)生、食品、社會保障、道德倫理、生態(tài)環(huán)境等國家發(fā)展的方方面面,但其決策報告的全文可獲得度一般,從中國社會科學(xué)院網(wǎng)站中只有關(guān)于智庫報告的解讀、概要等信息,國務(wù)院發(fā)展研究中心也存在以上特點,所以中國社會科學(xué)院以及國務(wù)院發(fā)展研究中心都不是最佳樣本對象。其余4所智庫從主題單一性、成果可獲取度以及實際調(diào)查中智庫成果獲取的規(guī)范性角度對比等方面綜合考慮,本文選取了中國國際問題研究院作為本次研究的樣本源,以其2015年發(fā)布的成果作為描述規(guī)則研究的樣本。智庫研究具有年代背景突出、動態(tài)性強的特點,鎖定樣本來源為2015年成果有助于控制知識元抽取詞典的設(shè)立。

      中國國際問題研究院2015年共發(fā)布了6份研究報告,231篇時事評論,8部專著(含譯著),專家觀點、短評共計43篇,在中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫中檢索到2015年共發(fā)表95篇論文(排除發(fā)表在《國際問題研究》上的22篇),《國際問題研究》2015年共收錄了88篇文獻,但另有29篇已結(jié)項課題由于不公開原因不納入樣本范圍。

      3.2 方法模型

      首先確定模型的初始術(shù)語表,由于研究報告以及學(xué)術(shù)論文是格式規(guī)范的智庫成果,具有摘要、關(guān)鍵詞信息,并且研究報告和學(xué)術(shù)論文是智庫研究的主流成果形式,成果主題能夠代表智庫研究方向,筆者通過逐篇閱讀這些成果的摘要信息對關(guān)鍵詞集合進行篩選,匯總出代表2015年中國國際問題研究院研究主題關(guān)鍵詞集合作為初始術(shù)語表。中國國際問題研究院2015年的6冊研究報告和183篇學(xué)術(shù)論文共產(chǎn)生1212個關(guān)鍵詞,刪去重復(fù)和無意義關(guān)鍵詞后得到837個關(guān)鍵詞。在處理中國社會科學(xué)院這類綜合性智庫時,由于成果涉及主題多、數(shù)量多,需要先對成果庫成果進行主題識別、分類,然后選定對應(yīng)的主題術(shù)語表進行對含有知識元的術(shù)語句子進行抽取,由于本研究樣本主題單一,無需主題識別步驟,直接根據(jù)初始術(shù)語表進行句子抽取。抽取結(jié)果形成術(shù)語句式,未抽取句子則由人工識別出新的指示知識元的術(shù)語對術(shù)語表進行擴充。對最終得到的所有術(shù)語句子進行人工識別、篩選,按照知識元類型進行分類,生成對應(yīng)的知識元描述規(guī)則(基于知識元抽取的智庫成果描述規(guī)則的過程模型見圖1)。

      4 中文智庫成果的知識元描述規(guī)則

      智庫研究工作的特點是時代背景突出,智庫研究關(guān)注的是當(dāng)前外交、民生、社會等方面最前沿的問題;政策性語言豐富,智庫的目標(biāo)是影響決策,智庫成果存在大量政策解讀以及政策提議性內(nèi)容;觀點結(jié)論是成果重點,智庫成果區(qū)別于一般學(xué)術(shù)論文的是更突出研究結(jié)論和專家觀點的闡述,對研究方法的說明是成果呈現(xiàn)的輔助內(nèi)容。

      通過上述抽取模型對智庫成果的處理,筆者將智庫成果知識元分為陳述型和程序型,前者包括事實知識元、定義知識元、結(jié)論知識元等陳述型文字內(nèi)容,后者包含方法知識元和關(guān)系知識元等具有內(nèi)在結(jié)構(gòu)的文字內(nèi)容(見表2)。

      4.1 陳述型知識元描述規(guī)則

      4.1.1 事實知識元

      事實知識是對研究的背景環(huán)境、現(xiàn)存問題以及專家或者國際觀點、認識等信息的描述。筆者通過上述模型和樣本,共提煉出5種類型的事實知識元的描述規(guī)則,即觀點型、序列型、直述型、分析預(yù)測型、事件型(具體規(guī)則見表3)。

      觀點型描述規(guī)則是對中文智庫成果中觀點事實的結(jié)構(gòu)描述,用于指示智庫研究中的觀點信息,結(jié)構(gòu)特點是句式簡單,規(guī)則架構(gòu)聯(lián)接的內(nèi)容是觀點發(fā)出者、觀點內(nèi)容以及觀點釋義,廣泛存在于綜述研究的前期研究成果陳述、國際問題研究中各國立場聲明等內(nèi)容中。序列型是種形式化的描述規(guī)則,由序列性連接詞構(gòu)成,既可以是一、二、三等數(shù)字連接詞也可以是首先、其次等表達序列關(guān)系的連接詞,該類規(guī)則對應(yīng)內(nèi)容是中文智庫成果的常見形式,具有條例清楚、結(jié)構(gòu)分明的特點。直述型即直接敘述型語句,不具備典型的規(guī)則標(biāo)引語句,由主題術(shù)語表內(nèi)容作為句式主語,銜接論述內(nèi)容,事實知識元的直述型語句是對事實的陳述性表述,不存在句式上的修辭。分析預(yù)測型描述規(guī)則除了連接事實與推論外,事實既可以直接出現(xiàn),又常以“從……看”等規(guī)則與推論銜接。事件型規(guī)則的典型特點是具備時間點,對出現(xiàn)在時政事件的陳述。

      智庫成果的事實知識元集合構(gòu)成了智庫的背景知識資源庫,通過上述規(guī)則識別、存儲的關(guān)乎成果的事實資料得以合理、高效的抽取、組織起來,不僅可用于衡量智庫儲備的時政、理論資源含量,而且構(gòu)成了智庫專屬的事實知識庫,為后續(xù)課題研究提供客觀資料。同時,描述規(guī)則的歸納提供了半結(jié)構(gòu)化的知識資源結(jié)構(gòu),為智庫內(nèi)部檢索提供了方法。

      4.1.2 定義知識元

      定義知識元是對中文智庫成果中的政策概念、名詞術(shù)語等概念和原理的解釋。分為內(nèi)涵解釋型的定義知識元描述規(guī)則和外延解釋型的知識元描述規(guī)則,內(nèi)涵解釋型規(guī)則是概念說明,外延則是概念包含的范疇(具體規(guī)則見表4)。

      內(nèi)涵解釋型和外延解釋型分別對應(yīng)概念的內(nèi)涵與外延的概念,內(nèi)涵解釋型規(guī)則是對解釋定義本身的內(nèi)容的描述,該規(guī)則標(biāo)引出的內(nèi)容是對應(yīng)政策概念、原理的解讀。外延解釋型則描述了定義所含有的實例,同一定義的內(nèi)涵解釋規(guī)則標(biāo)引結(jié)果與外延解釋規(guī)則標(biāo)引結(jié)果共同構(gòu)成了該定義的概念描述。

      定義知識元對應(yīng)的知識資源是已有研究或者社會共識已認可的概念知識。定義知識元的抽取可以用于構(gòu)建智庫的概念知識集合,對于智庫開展理論學(xué)習(xí)、定義檢索有直接輔助作用。

      4.1.3 結(jié)論知識元

      結(jié)論知識元與事實知識元在劃分上很重要一點在于時間點不同,事實是對過去事件、觀點等已有事實的描述,具有明顯的過去式時間特征,結(jié)論是對客觀功能、作用、推斷、建議等的陳述,具有現(xiàn)在時或者將來時的時間特征。結(jié)論知識元的描述規(guī)則同樣具有直述型和序列型兩種,區(qū)別在于結(jié)論知識元描述內(nèi)容的時間點位于選用主題術(shù)語表的時間段之后。另有歸納推斷型和建議方案型共四種規(guī)則類型(見表5)。

      歸納推斷型規(guī)則是對中文智庫成果中歸納性結(jié)論語句的描述,有兩種類型,一類是“通過……,……”等形式的規(guī)則將被歸納的對象與歸納出的結(jié)論進行銜接;一類是“總體看來……”等形式的規(guī)則直接在上文討論內(nèi)容后連接結(jié)論內(nèi)容。建議方案型規(guī)則是對中文智庫成果研究者對研究問題提出的建議或解決方案的描述,連接詞為“需要、建議”等表明建議關(guān)系的中文詞匯,連接了研究的問題和研究提供的解決方案。

      結(jié)論是智庫研究活動的輸出結(jié)果,用于指導(dǎo)決策,是智庫最重要的成果內(nèi)容。結(jié)論知識元是智庫成果中創(chuàng)新程度最高、知識價值最突出的知識資源,是衡量智庫智慧產(chǎn)出的最重要依據(jù)。特別是歸納推斷型以及建議方案型結(jié)論知識元是對前期智庫研究活動的深層總結(jié),價值密度高。已有研究的結(jié)論知識元既是從知識層面衡量知識成果價值的重要依據(jù),也是智庫后續(xù)研究的理論知識庫。

      4.2 程序型知識元描述規(guī)則

      程序型知識元說明中文智庫成果內(nèi)容存在一定的內(nèi)在聯(lián)系,既可以是文本內(nèi)容對研究方法的說明,又可以是說明文本與文本間的關(guān)系,分別為方法知識元和關(guān)系知識元。

      4.2.1 方法知識元

      方法知識元的描述規(guī)包括方法類型說明和研究思想型規(guī)則(見表6)。

      方法類型規(guī)則一般不在文本中直接表述,但是摘要、引言等對研究介紹性文本中存在概括性語句。如“本文對……進行統(tǒng)計分析……”揭示了對應(yīng)研究的研究方法為統(tǒng)計分析方法。研究思路型規(guī)則是對中文智庫成果中揭示研究思路的文本的描述,描述了對應(yīng)研究的行文思路。

      方法知識元一般不是智庫的原創(chuàng)性成果,因此方法知識元對于從知識層面評價智庫成果的作用在于衡量智庫研究思路的合理性。智庫被采用的成果表征對應(yīng)的研究過程與結(jié)論的科學(xué)、合理性,據(jù)此可推論出從事某方向研究高效的方法范式。

      4.2.2 關(guān)系知識元

      智庫成果的關(guān)系知識元是對中文智庫成果文本與文本之間內(nèi)在關(guān)系描述、表示意義、重要程度、所屬關(guān)系等含義。

      關(guān)系知識元是從成果內(nèi)容的內(nèi)在關(guān)系進行考察,陳述知識元是對成果內(nèi)容類型進行劃分。如包含關(guān)系案例,從內(nèi)容類型上屬于結(jié)論知識元,但在內(nèi)容上存在包含關(guān)系(見圖2)。

      關(guān)系知識元可以揭示研究成果文本內(nèi)部的關(guān)系,其描述規(guī)則是一種半結(jié)構(gòu)化的知識表示方法。關(guān)系知識元的意義在于形成研究成果知識元之間的關(guān)

      系架構(gòu),智庫擁有的全部關(guān)系知識元通過層次、包含、因果等關(guān)系類型將獨立的知識元串聯(lián)起來。

      5 結(jié)論與展望

      本文基于中文文本知識元抽取機制,以中文智庫成果為對象進行知識元抽取,總結(jié)了中文智庫成果的知識元類型及對應(yīng)的描述規(guī)則,而現(xiàn)有國內(nèi)關(guān)于中文文本知識元描述規(guī)則研究的對象選取基本上集中在學(xué)術(shù)論文中,本文在文本對象的選擇和研究方法的遷移運用上具有創(chuàng)新性。中文智庫成果與傳統(tǒng)學(xué)術(shù)論文在研究主題、研究方法等方面存在明顯差異,決定了規(guī)則類型的區(qū)別,首先,學(xué)術(shù)論文具有明顯的學(xué)科特性,表現(xiàn)在學(xué)科術(shù)語和研究方法等方面具有明顯的學(xué)科傾向特點,以學(xué)術(shù)論文為對象的知識元類型與描述規(guī)則的相關(guān)研究也主要集中在特定學(xué)科術(shù)語和方法規(guī)則兩方面。智庫研究是對當(dāng)前國內(nèi)外環(huán)境最關(guān)注的問題進行聚焦,學(xué)科特點不突出,方法知識元的類型也相對學(xué)術(shù)論文的方法知識元單一,智庫成果的知識元類型與描述規(guī)則研究目標(biāo)在于對智庫知識資源的精準(zhǔn)化標(biāo)引;其次,學(xué)術(shù)論文是面向?qū)I(yè)人士的具有學(xué)術(shù)深度的文本,學(xué)術(shù)論文的知識元描述規(guī)則抽取也體現(xiàn)了學(xué)術(shù)研究的深刻性特點,注重對規(guī)則類型的細分,如化柏林在對學(xué)術(shù)論文的方法知識元進行抽取時將方法知識元從定義、功能、特點、流程、關(guān)系五個角度進行細分。而智庫成果是服務(wù)產(chǎn)品,尤其是智庫調(diào)研報告、專家觀點、媒體訪談等智庫專有形式的成果是對智庫開展研究后所提出解決方案的精煉表達,服務(wù)對象是不具備特定領(lǐng)域?qū)I(yè)知識的政府機構(gòu)。因此筆者對智庫成果知識元類型的劃分上實現(xiàn)全面總結(jié),詳細地歸納出中文智庫成果涉及的知識元類型。最后,學(xué)術(shù)論文與中文智庫成果相比在行文方式上更具有靈活性,句式表達多變,一類學(xué)術(shù)論文的知識元具有多種描述規(guī)則。而中文智庫成果在語言上具有簡潔、客觀性強的特點,句式多以陳述形式出現(xiàn),一類知識元對應(yīng)的描述規(guī)則有限。

      對中文智庫成果知識元類型和描述規(guī)則的研究有利于實現(xiàn)知識層面的中文智庫成果的知識資源計量與管理。一方面,智庫坐擁知識資源量評價智庫相比從載體數(shù)量對智庫產(chǎn)能進行考察更具精準(zhǔn)性和客觀性,因為知識層面的考察摒除了載體計量造成資源內(nèi)容的重復(fù)計算;另一方面,中文智庫成果的描述規(guī)則為中文智庫知識標(biāo)引提供有效方法,便于實現(xiàn)對知識本身的管理,促進智庫知識的共享、存儲和增值。基于知識元抽取的中文智庫描述規(guī)則提取的關(guān)鍵技術(shù)在于中文文本抽取,目前國內(nèi)對中文文本抽取、挖掘和標(biāo)引等方面的研究已取得一定的理論和實踐基礎(chǔ),經(jīng)歷了詞典抽取、統(tǒng)計抽取和語義抽取三個發(fā)展階段,抽取結(jié)果的精確性和全面性在逐步提升,因此本研究在實際應(yīng)用中具備較強的可行性。

      本文首次將知識元描述規(guī)則的概念引入到智庫成果中,是進行知識層面智庫成果評價的基礎(chǔ)工作,彌補了智庫評價領(lǐng)域知識層面評價研究的空白?;谖谋究偨Y(jié)歸納出的智庫成果知識元類型及其規(guī)則,以及研究思路能夠輔助后續(xù)智庫知識元描述規(guī)則擴充研究;其次,知識元描述規(guī)則的歸納提供了半結(jié)構(gòu)化的知識表達方式,有利于構(gòu)建智庫知識庫,是進行智庫知識檢索和存儲的結(jié)構(gòu)基礎(chǔ);最后,擴展知識元應(yīng)用范圍,由一般學(xué)術(shù)論文擴展至決策咨詢報告。

      參考文獻:

      [1] 曾培炎.探索建設(shè)中國特色新型智庫[EB/OL].[2016-09-03].http:www.qstheory.cn/tjyd/2014-12/25/c_1113768068.htm.

      [2] 劉月,李鑒修.人民日報人民要論:打造中國特色新型智庫[EB/OL].[2016-09-03].http://opinion.people.com.cn/n/2015/0728/c1003-27369340.html.

      [3] 許共城.歐美智庫比較及對中國智庫發(fā)展的啟示[J].經(jīng)濟社會體制比較,2010(2):77-83.

      [4] 王莉麗.美國智庫的“旋轉(zhuǎn)門”機制[J].國際問題研究,2010(2):13-18.

      [5] 楊尊偉,劉寶存.美國智庫的類型、運行機制和基本特征[J].中國高??萍?,2014(7):56-59.

      [6] 周仲高.智庫的科學(xué)分類與準(zhǔn)確定位[J].重慶社會科學(xué),2013(3):116-120.

      [7] 姜朝暉.中國特色新型高校智庫:內(nèi)涵、特征及定位[J].高校教育管理,2016,10(2):55-60.

      [8] 張?zhí)K敏.黨報建設(shè)智庫型媒體:定位、模式與發(fā)展策略[J].新聞世界,2015(8):25-27.

      [9] 李占峰,金家厚,鮑宗豪.中國智庫發(fā)展亟需理念和制度創(chuàng)新[J].開放導(dǎo)報,2011(6):100-104.

      [10] 帕瑞克·克勒納,韓萬渠.智庫概念界定和評價排名:亟待探求的命題[J].中國行政管理,2014(5):25-28.

      [11] 王斯敏.智庫評價:要不要做,如何做好?[EB/OL].[2016-09-06].http://epaper.gmw.cn/gmrb/html/2016-02/03/nw.D110000g

      mrb_20160203_2-16.htm.

      [12] 鄧巖.中國智庫的類型研究[J].天水行政學(xué)院學(xué)報,2011,12(5):62-65.

      [13] 溫有奎,焦玉英.知識元語義鏈接模型研究[J].圖書情報工作,2010,54(12):27-31.

      [14] 朱曉蕓,陳奇,楊棖,等.決策支持系統(tǒng)中的廣義知識元及模型庫[C].中國控制與決策學(xué)術(shù)年會論文集,1993:33-36.

      [15] Reic h Y.Measuring the value of knowledge[J].International Journal of Human-Computer Studies,2010,42(1):3-30.

      [16] King A W,Zeithaml C P.Measuring organizational knowledge:a conceptual and methodological framework[J].Strategic Management Journal,2003,24(8):763-772.

      [17] 邱均平,文庭孝,宋艷輝.知識計量學(xué)[M].北京:科學(xué)出版社,2014:66-68.

      [18] 宋艷輝,王小平.從文獻單元、信息單元向知識元的嬗變[J].科研管理,2015,36(1):459-464.

      [19] 文庭孝,羅賢春,劉曉英,等.知識元研究述評[J].中國圖書館學(xué)報,2011,37(5):75-86.

      [20] 王子舟,王碧瀅.知識的基本組分——文獻單元和知識元[J].中國圖書館學(xué)報,2003,29(1):5-11.

      [21] 馬費成,陳銳,袁紅.科學(xué)信息離散分布規(guī)律研究——從文獻單元到內(nèi)容單元的實證分析(Ⅱ):文獻離散分布的布氏區(qū)域分析[J].情報學(xué)報,1999,18(6):270-277.

      [22] 趙紅州,唐敬年.知識元的靜智荷及其在荷空間的表示問題(續(xù)一)[J].科學(xué)學(xué)與科學(xué)技術(shù)管理,1990,14(2):39-43.

      [23] 馬費成.科學(xué)情報的基本屬性與情報學(xué)原理[J].圖書館論壇,2002,22(5):15-18.

      [24] 溫有奎,溫浩,徐端頤,等.基于知識元的文本知識標(biāo)引[J].情報學(xué)報,2006,25(3):282-288.

      [25] 化柏林.學(xué)術(shù)論文中方法知識元的類型與描述規(guī)則研究[J].中國圖書館學(xué)報,2016,42(1):30-40.

      [26] 溫有奎,溫浩,徐端頤,等.基于創(chuàng)新點的知識元挖掘[J].情報學(xué)報,2005,24(6):663-668.

      [27] 周寧,余肖生,劉瑋,等.基于XML平臺的知識元表示與抽取研究[J].中國圖書館學(xué)報,2006,32(3):41-45.

      [28] 宋培彥,路青,劉寧靜.一種從術(shù)語定義句中自動抽取知識元的方法[J].情報雜志,2014,(4):139-143.

      作者簡介:趙蓉英,女,武漢大學(xué)信息管理學(xué)院、武漢大學(xué)中國科學(xué)評價研究中心教授,博士生導(dǎo)師;張心源,武漢大學(xué)信息管理學(xué)院、武漢大學(xué)中國科學(xué)評價研究中心博士研究生。

      猜你喜歡
      智庫
      微智庫
      微智庫
      微智庫
      微智庫
      微智庫
      微智庫
      微智庫
      微智庫
      微智庫
      微智庫
      明溪县| 团风县| 西城区| 西丰县| 杭锦旗| 佛坪县| 永顺县| 玉屏| 璧山县| 深水埗区| 凤山市| 天津市| 栖霞市| 咸丰县| 贵南县| 灌南县| 张家港市| 通化市| 繁峙县| 远安县| 盐池县| 叶城县| 个旧市| 望城县| 怀安县| 延吉市| 慈溪市| 三河市| 凌源市| 普格县| 花垣县| 麦盖提县| 铜川市| 团风县| 永善县| 金乡县| 三明市| 惠州市| 聊城市| 牟定县| 集贤县|