• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      政策信息學(xué)視角下政策文本量化方法研究進(jìn)展

      2022-06-18 07:29:19曹玲靜張志強(qiáng)
      圖書與情報(bào) 2022年6期
      關(guān)鍵詞:文本分析

      曹玲靜 張志強(qiáng)

      摘? ?要:政策信息學(xué)是大數(shù)據(jù)科學(xué)范式下政策科學(xué)向大數(shù)據(jù)政策知識(shí)發(fā)現(xiàn)研究發(fā)展的跨學(xué)科研究方向,從該理論視角系統(tǒng)梳理政策文本量化的知識(shí)發(fā)現(xiàn)方法及最新研究進(jìn)展,可以指導(dǎo)數(shù)據(jù)密集的政策文本分析實(shí)踐。文章基于政策信息學(xué)理論分析政策文本量化研究興起背景、概念內(nèi)涵和研究框架,將現(xiàn)有研究歸納為面向政策結(jié)構(gòu)特征的政策計(jì)量分析、面向政策內(nèi)容特征的政策內(nèi)容量化和面向政策語義特征的政策文本挖掘等三類研究方法,分別總結(jié)各類量化方法的研究流程、主要類型及優(yōu)缺點(diǎn),并系統(tǒng)論述政策文本量化知識(shí)發(fā)現(xiàn)研究進(jìn)展。政策文本量化研究近年來發(fā)展迅速,集中體現(xiàn)在政策信息爆炸性增長(zhǎng)、多領(lǐng)域方法交叉融合現(xiàn)象凸顯、政策分析需求復(fù)雜多樣。未來應(yīng)重點(diǎn)關(guān)注:建設(shè)領(lǐng)域政策大數(shù)據(jù)庫、開發(fā)針對(duì)性的方法工具以及注重理論研究實(shí)踐落地。

      關(guān)鍵詞:政策信息學(xué);政策量化;政策計(jì)量;文本分析

      中圖分類號(hào):D035;G203? ?文獻(xiàn)標(biāo)識(shí)碼:A? ?DOI:10.11968/tsyqb.1003-6938.2022087

      Research Progress on Quantitative Methods of Policy Texts from the Perspective of Policy Informatics

      Abstract Policy Informatics is an interdisciplinary research direction developed from policy science to big data policy knowledge discovery research under the research paradigm of big data science. From this theoretical perspective, it systematically combs the current situation and latest progress of knowledge discovery research methods in policy text quantitative, which can guide the practice of policy text analysis of data density. This paper analyzes the background, concept connotation and research framework of quantitative research on policy text from the theory of Policy Informatics, and classifies the existing research into three types of research methods: policiometrics analysis based on policy structural features, policy content quantification based on policy content features, and policy text mining based on policy semantic features. It summarizes the research process, main types, advantages and disadvantages of various quantitative methods, and systematically discusses the research progress of knowledge discovery in policy text quantification. Knowledge discovery research on policy text quantification has developed rapidly in recent years, which is mainly reflected in the explosive growth of policy information, the prominent phenomenon of cross integration of multi domain methods, and the complex and diverse demand for policy analysis. In the future, we should focus on: building a large policy database in the field, developing targeted methods and tools, and paying attention to the implementation of theoretical research.

      Key words policy informatics; policy quantification; policiometrics; text analysis

      21世紀(jì)以來新一輪科技革命和產(chǎn)業(yè)變革加速演進(jìn),全球范圍內(nèi)科技競(jìng)爭(zhēng)加劇和國家創(chuàng)新體系建設(shè)重要性凸顯,世界各國進(jìn)入了政策強(qiáng)供給時(shí)代,政策分析研究迎來了新的發(fā)展機(jī)遇。傳統(tǒng)的政策分析源于文本解讀,即依賴專家學(xué)者的學(xué)識(shí)儲(chǔ)備和經(jīng)驗(yàn)判斷來定性分析政策文本的核心思想和觀點(diǎn),總結(jié)政策變遷規(guī)律并對(duì)政策發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè)與研判。然而,隨著政策數(shù)據(jù)指數(shù)級(jí)增長(zhǎng)和政策相關(guān)議題愈發(fā)復(fù)雜,偏主觀的政策文本定性解讀無法滿足政界和學(xué)術(shù)界對(duì)理性、科學(xué)的需求,如何利用多學(xué)科的技術(shù)方法開展大數(shù)據(jù)驅(qū)動(dòng)下政策信息的知識(shí)分析和發(fā)現(xiàn)變得日益重要,政策文本量化研究作為其關(guān)鍵環(huán)節(jié)開始萌芽與發(fā)展。近年來,情報(bào)學(xué)界關(guān)于政策文本的知識(shí)發(fā)現(xiàn)研究逐漸增多,政策文本成為情報(bào)學(xué)繼期刊論文、專利文獻(xiàn)之后的又一重要研究對(duì)象,這種趨勢(shì)契合了大數(shù)據(jù)時(shí)代“全樣本”數(shù)據(jù)分析的發(fā)展需求,也迎合了知識(shí)經(jīng)濟(jì)時(shí)代學(xué)科交叉融合創(chuàng)新的發(fā)展邏輯。

      政策文本主要包括國家各級(jí)行政機(jī)構(gòu)頒布的法律、法規(guī)和規(guī)劃等官方政策文件;政策制定過程中因評(píng)估、咨詢、聽證和決議等形成的報(bào)告文檔;政策活動(dòng)過程中因演講、辯論、報(bào)道、訪談、評(píng)論等形成的政策輿情文本??梢?,政策文本不同于期刊論文、專利文獻(xiàn)等結(jié)構(gòu)化數(shù)據(jù),具有來源渠道繁雜、數(shù)據(jù)類型多樣、文本結(jié)構(gòu)各異等特征。目前,缺乏政策文本分析特有方法,學(xué)術(shù)界圍繞政策文本開展知識(shí)發(fā)現(xiàn)研究時(shí)多是借鑒參考其他學(xué)科的方法和工具,尚未形成系統(tǒng)的政策文本量化研究理論和框架。如黃萃將計(jì)量學(xué)方法應(yīng)用到政策文本分析中,綜合利用數(shù)理統(tǒng)計(jì)學(xué)、文獻(xiàn)計(jì)量學(xué)、科學(xué)計(jì)量學(xué)和社會(huì)網(wǎng)絡(luò)分析等方法對(duì)政策文本的內(nèi)外部特征屬性進(jìn)行分析[1];付琳等通過編碼的方式將政策文本進(jìn)行歸納、分類和人工標(biāo)引,形成可量化統(tǒng)計(jì)的分析單元[2];Baker等使用基于字典的方法來構(gòu)建政策不確定性的度量[3];Beauchamp、Laver等將政策文本視為數(shù)據(jù),利用計(jì)算機(jī)科學(xué)的相關(guān)方法和技術(shù),挖掘文本中的政策立場(chǎng)[4-5]。

      政策信息學(xué)是政策科學(xué)在數(shù)據(jù)密集型科學(xué)范式下發(fā)展形成的跨學(xué)科研究領(lǐng)域,其研究?jī)?nèi)容是基于政策文件數(shù)據(jù)、科研文獻(xiàn)數(shù)據(jù)和社會(huì)媒體數(shù)據(jù)等政策相關(guān)的多源海量異構(gòu)數(shù)據(jù),利用數(shù)理統(tǒng)計(jì)學(xué)、文獻(xiàn)計(jì)量學(xué)、科學(xué)計(jì)量學(xué)和計(jì)算機(jī)科學(xué)等多學(xué)科的技術(shù)方法,圍繞政策科學(xué)研究的關(guān)鍵問題開展知識(shí)挖掘和知識(shí)發(fā)現(xiàn)研究[6]。從該視角全面梳理和總結(jié)政策文本量化研究的理論發(fā)展、方法體系和應(yīng)用進(jìn)展,能夠?yàn)楫?dāng)前多樣化的政策文本量化研究實(shí)踐提供系統(tǒng)的理論框架和規(guī)范的方法范式。因此,本文基于政策信息學(xué)理論從政策文本量化的緣起入手,梳理、總結(jié)和歸納政策文本量化的概念內(nèi)涵和基本框架,整理政策文本量化主流研究方法的分析流程、方法工具和應(yīng)用場(chǎng)景等,構(gòu)建系統(tǒng)的依賴政策文本量化開展政策知識(shí)發(fā)現(xiàn)的研究體系,以期為今后學(xué)者開展政策分析相關(guān)研究提供參考和借鑒。

      1? ?政策文本量化研究的理論發(fā)展

      1.1? ? 政策文本量化研究的興起

      1.1.1? ?政策文本數(shù)量激增提供了可用的數(shù)據(jù)基礎(chǔ)

      隨著大數(shù)據(jù)和數(shù)字時(shí)代的到來,政策相關(guān)文本數(shù)據(jù)爆炸式增長(zhǎng),主要體現(xiàn)在政策信息來源復(fù)雜化、政策文本信息碎片化、文本數(shù)據(jù)類型多樣化。而開放政府、數(shù)字政府及電子政務(wù)的世界性發(fā)展趨勢(shì)為政策文本量化研究提供了信息獲取的機(jī)會(huì)和可能。如我國于2007年4月公布《中華人民共和國政府信息公開條例》(2008年5月1日起實(shí)施,2019年二次修訂),明確要求政府必須公開行政法規(guī)、國民經(jīng)濟(jì)和社會(huì)發(fā)展規(guī)劃、專項(xiàng)規(guī)劃、區(qū)域規(guī)劃等規(guī)范性政府文件;2014年頒布《關(guān)于加強(qiáng)政府網(wǎng)站信息內(nèi)容建設(shè)的意見》,明確指出各級(jí)政府要將政府網(wǎng)站作為政府信息公開的第一平臺(tái)。同時(shí),政府信息管理系統(tǒng)的不斷豐富和完善為政策文本量化研究提供了大量可用的基礎(chǔ)性和結(jié)構(gòu)化數(shù)據(jù)??梢姡髷?shù)據(jù)時(shí)代背景下政策文本的完備性、時(shí)效性、可獲取性、可計(jì)算性顯著提升。

      1.1.2? ?方法技術(shù)快速發(fā)展使量化分析成為可能

      海量政策文本的出現(xiàn)使得傳統(tǒng)的依靠定性解讀或手動(dòng)編碼的政策分析方法不再適用,新興信息技術(shù)的快速發(fā)展為政策數(shù)據(jù)的復(fù)雜計(jì)算、政策知識(shí)的深度挖掘和政策規(guī)律的可視化呈現(xiàn)提供了新的解決方案。計(jì)算機(jī)技術(shù)、文本挖掘技術(shù)的日臻成熟和廣泛應(yīng)用,使得公共管理、公共政策和其他社會(huì)科學(xué)的學(xué)者能夠處理大量政策文本,以發(fā)現(xiàn)挖掘其中的潛在關(guān)系;另一方面,情報(bào)學(xué)、數(shù)理統(tǒng)計(jì)學(xué)、社會(huì)科學(xué)等學(xué)科知識(shí)和方法的交叉融合為政策文本量化研究提供了方法源泉,文獻(xiàn)計(jì)量、內(nèi)容分析和語義分析等成熟量化分析方法大大拓展了政策分析的研究邊界,主題模型、知識(shí)圖譜和可視化技術(shù)等擴(kuò)展了對(duì)復(fù)雜政策過程的理解及向不同受眾解釋、傳播的能力。近年來,計(jì)算機(jī)科學(xué)技術(shù)發(fā)展日新月異、學(xué)科交叉融合趨勢(shì)愈發(fā)明顯,政策量化研究作為政策質(zhì)性分析的有效補(bǔ)充蓬勃發(fā)展。

      1.1.3? ?政界及學(xué)界對(duì)政策分析日益精細(xì)的需求

      政策文本量化研究是數(shù)據(jù)驅(qū)動(dòng)科學(xué)研究范式下政策分析科學(xué)化、合理化發(fā)展的必然結(jié)果,也是學(xué)科交叉融合背景下學(xué)術(shù)界針對(duì)海量政策數(shù)據(jù)開展政策分析的必然選擇。隨著政策分析樣本量的豐富性增長(zhǎng)和多學(xué)科方法技術(shù)的成熟化發(fā)展,政策參與方(政策制定者與利益相關(guān)者)對(duì)政策分析提出了更高的要求。如何從多種類型的海量政策文本信息中提取知識(shí),發(fā)現(xiàn)政策演化變遷規(guī)律、評(píng)估政府決策本身的效益或者預(yù)測(cè)相關(guān)領(lǐng)域發(fā)展走向?如何科學(xué)合理地運(yùn)用相關(guān)工具和方法將政策文本量化為可復(fù)用的研究數(shù)據(jù),使政策分析更加客觀、系統(tǒng)和高效,為政策制定提供有力的證據(jù)?基于此,政策管理制定已經(jīng)從依賴經(jīng)驗(yàn)判斷走向數(shù)據(jù)驅(qū)動(dòng)的循證決策,政策分析亟需從小樣本統(tǒng)計(jì)推斷轉(zhuǎn)向大樣本知識(shí)發(fā)現(xiàn),政策研究關(guān)注重點(diǎn)應(yīng)從相關(guān)關(guān)系探討轉(zhuǎn)向因果關(guān)系分析。

      1.2? ? 政策文本量化研究?jī)?nèi)涵及特征

      政策信息學(xué)視角下的政策文本知識(shí)發(fā)現(xiàn)研究并不局限于傳統(tǒng)政策解讀較為關(guān)注的規(guī)范性政策文本,更多關(guān)注大樣本量、半結(jié)構(gòu)化或非結(jié)構(gòu)化政策文本的量化分析。與之相關(guān)且較為被學(xué)術(shù)界所熟知的概念有“政策文獻(xiàn)計(jì)量”“政策文獻(xiàn)量化”和“政策文本計(jì)算”。政策文獻(xiàn)計(jì)量是將以“洛特卡定律”“布拉德福定律”與“齊夫定律”三大定律為理論基礎(chǔ)的文獻(xiàn)計(jì)量學(xué)方法遷移到政策量化分析的研究中[7],是參考論文結(jié)構(gòu)屬性開展計(jì)量分析的政策文本量化方法。政策文獻(xiàn)量化是將內(nèi)容分析法、文獻(xiàn)計(jì)量法、社會(huì)網(wǎng)絡(luò)分析法、知識(shí)圖譜等方法應(yīng)用到政策分析過程中,圍繞政策文獻(xiàn)內(nèi)外部結(jié)構(gòu)要素特性進(jìn)行的計(jì)量分析[8],本質(zhì)上仍然是政策計(jì)量的范疇;政策文本計(jì)算主張運(yùn)用政策文本與語詞之間的映射關(guān)系進(jìn)行政策概念的自動(dòng)識(shí)別和自動(dòng)處理,構(gòu)建從政策文本到政策語義的自動(dòng)解析框架[9],偏重于利用計(jì)算機(jī)技術(shù)挖掘、呈現(xiàn)政策文本的語義信息[10]??梢?,這些概念是政策文本量化內(nèi)容的不同側(cè)重,實(shí)際上均屬于政策文本量化研究的范疇,故本文將其統(tǒng)稱為政策文本量化。

      實(shí)際上,政策信息學(xué)是一種理論框架和方法集成,也是一套系統(tǒng)完整的政策分析流程。政策文本量化是將政策信息學(xué)的研究對(duì)象聚焦到政策文本開展定量知識(shí)分析與發(fā)現(xiàn)的必備環(huán)節(jié)。其中,政策文本應(yīng)該廣義地理解為是一種政策相關(guān)文本,包括:結(jié)構(gòu)化的學(xué)術(shù)文本(圍繞政策問題、內(nèi)容、過程形成的研究成果)、非結(jié)構(gòu)化的媒體文本(新聞、評(píng)論等自然語言中存在一些政策主張)和半結(jié)構(gòu)化的政策文本(最直接的政策信息來源)等多模態(tài)異構(gòu)數(shù)據(jù)。基于此,將政策文本量化定義為通過某種轉(zhuǎn)換方式將政策文本轉(zhuǎn)換成抽象化、特征化、可計(jì)算的結(jié)構(gòu)化數(shù)據(jù),再根據(jù)研究目標(biāo)融合數(shù)理統(tǒng)計(jì)學(xué)、文獻(xiàn)計(jì)量學(xué)、科學(xué)計(jì)量學(xué)、計(jì)算機(jī)科學(xué)等多種方法對(duì)所得數(shù)據(jù)進(jìn)行數(shù)學(xué)統(tǒng)計(jì)、主題建模、網(wǎng)絡(luò)構(gòu)建、相似性計(jì)算等定量分析,并輔以研究人員依賴專業(yè)知識(shí)和經(jīng)驗(yàn)積累進(jìn)行定性解讀的研究過程。

      政策文本量化具有如下特征:(1)可統(tǒng)計(jì)性。政策文本量化的根本要義就是將用語言表述的政策轉(zhuǎn)化為可用“數(shù)量”統(tǒng)計(jì)的數(shù)據(jù),通過對(duì)政策量化的分析,找出能夠反映政策過程、政策意圖、政策規(guī)律的特定要素以及易于計(jì)數(shù)的內(nèi)外部特征,保證數(shù)據(jù)操作的可重復(fù)性和客觀性;(2)非精確性。政策文本量化是針對(duì)大量政策文本利用編碼處理或計(jì)算機(jī)語義降維的過程,實(shí)際上是一種損失精度的政策分析方法,在研究過程中需要與定性研究方法相結(jié)合[11],從而實(shí)現(xiàn)政策分析中宏觀與微觀、主觀與客觀的二元統(tǒng)一;(3)跨學(xué)科性。政策文本量化研究是融合統(tǒng)計(jì)學(xué)、情報(bào)學(xué)、公共政策學(xué)等多學(xué)科的理論基礎(chǔ)和方法技術(shù)開展的政策文本定量分析,近年來是情報(bào)學(xué)、政策學(xué)界以及計(jì)算機(jī)科學(xué)的熱門研究領(lǐng)域。

      1.3? ? 政策文本量化研究框架

      政策信息學(xué)的核心是針對(duì)政策全生命周期信息的大數(shù)據(jù)分析和知識(shí)發(fā)現(xiàn)研究,其三大支柱是:多來源異構(gòu)海量數(shù)據(jù)、多學(xué)科數(shù)據(jù)分析方法、多目標(biāo)知識(shí)應(yīng)用場(chǎng)景[6]?;诖藢⒄呶谋玖炕芯窟^程分為政策文本獲取、政策文本處理和政策文本分析三個(gè)階段[12],構(gòu)建政策文本知識(shí)發(fā)現(xiàn)研究的基本框架(見圖1)。其中,政策文本獲取的關(guān)鍵是構(gòu)建適合研究目標(biāo)的政策語料庫,目前主要有三種方式:利用現(xiàn)有的結(jié)構(gòu)化政策數(shù)據(jù)庫(如北大法寶、美國政府出版局等)直接下載所需數(shù)據(jù);人工收集或計(jì)算機(jī)技術(shù)爬取開源政策文本保存到本地自建數(shù)據(jù)庫;為保證獲取到符合研究目標(biāo)的完備性數(shù)據(jù),在實(shí)踐過程中往往將前兩種方法相結(jié)合形成特定的政策語料庫。政策文本處理在具體的政策文本量化方法中有不同的處理方式,本質(zhì)上是將非結(jié)構(gòu)化或半結(jié)構(gòu)化的政策文本轉(zhuǎn)換成可計(jì)算或可量化的分析單元,是一種語義降維處理過程。政策本文分析的基本遵循是政策實(shí)踐需求驅(qū)動(dòng)和政策研究問題導(dǎo)向,即根據(jù)政策目標(biāo)和應(yīng)用場(chǎng)景開展政策數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)研究。

      2? ?政策文本量化的主要研究方法

      按照政策文本分析的層次,政策文本量化研究可分為面向政策文本結(jié)構(gòu)特征的政策計(jì)量分析、面向政策內(nèi)容特征的政策內(nèi)容量化分析和面向政策語義特征的政策文本挖掘三類典型研究方法(見圖2)。其中,政策計(jì)量分析是通過統(tǒng)計(jì)、計(jì)算或可視化政策文本的若干規(guī)范屬性對(duì)政策文本的演進(jìn)、擴(kuò)散及府際關(guān)系等開展研究;政策內(nèi)容量化是按照一定的標(biāo)引框架和量化標(biāo)準(zhǔn)對(duì)政策內(nèi)容進(jìn)行人工或者計(jì)算機(jī)輔助的編碼處理,提升政策內(nèi)容解析的效度;政策文本挖掘是借助自然語言處理技術(shù)挖掘政策隱含內(nèi)涵或政策語義關(guān)系,便于生成政策知識(shí)圖譜。為直觀展現(xiàn)政策分析結(jié)果,各類政策文本量化方法的最終步驟均是可視化呈現(xiàn),按照類型的不同主要可以分為:基于數(shù)理統(tǒng)計(jì)的可視化、基于主題內(nèi)容的可視化和基于語義關(guān)系的可視化。

      2.1? ? 面向政策結(jié)構(gòu)特征的計(jì)量分析方法

      2.1.1? ?政策計(jì)量分析的內(nèi)涵與流程

      政策計(jì)量分析是將計(jì)量學(xué)的方法引入應(yīng)用到政策對(duì)象,逐漸發(fā)展成為情報(bào)學(xué)和政策科學(xué)交叉的研究領(lǐng)域——政策計(jì)量[13],包括政策文獻(xiàn)計(jì)量、政策科學(xué)計(jì)量[14]和政策替代計(jì)量指標(biāo)[15-17]等一系列概念。該方法的基本核心是通過現(xiàn)有政策數(shù)據(jù)庫下載或基于自建數(shù)據(jù)集將政策文本處理成類似論文文獻(xiàn)的結(jié)構(gòu)化數(shù)據(jù),分析政策文本在頒布機(jī)構(gòu)、發(fā)布時(shí)間、主題分布、政策引用以及政策主體關(guān)系等內(nèi)外部屬性要素進(jìn)行計(jì)量分析,旨在揭示某個(gè)領(lǐng)域、某個(gè)主題或某個(gè)時(shí)段的政策分布特征、政策演化規(guī)律和政府合作關(guān)系等。政策文本計(jì)量分析方法流程(見圖3)主要有:①構(gòu)建政策文本研究數(shù)據(jù)集;②結(jié)構(gòu)化政策文本屬性要素;③統(tǒng)計(jì)分析、文獻(xiàn)計(jì)量和社會(huì)網(wǎng)絡(luò)分析;④結(jié)果可視化呈現(xiàn)及結(jié)果解讀。

      2.1.2? ?政策計(jì)量分析的主要類型

      政策計(jì)量分析很大程度上依賴于政策文本的結(jié)構(gòu)化程度,基于政策文本數(shù)據(jù)集的不同可以分為三種類型:一是利用政策文本數(shù)據(jù)庫(如北大法寶和CNKI政府公報(bào)數(shù)據(jù)庫)自帶的字段信息開展計(jì)量分析,分析政策數(shù)量增長(zhǎng)、機(jī)構(gòu)合作、政策變化規(guī)律等。如盧小賓等、馮昌揚(yáng)等利用北大法寶數(shù)據(jù)庫分別對(duì)我國信息公開政策、文化扶貧政策進(jìn)行了計(jì)量分析[18-19];二是通過自建政策文本數(shù)據(jù)庫與語料庫形成新的統(tǒng)計(jì)字段。如清華大學(xué)科教政策研究中心搜集了中國1949年以來中央政府頒布的科技政策構(gòu)建了政府文獻(xiàn)數(shù)據(jù)庫,并對(duì)政策類型統(tǒng)計(jì)分析形成了《中國科技政策要目概覽》[20];代欣玲等收集整理1996年以來創(chuàng)新培養(yǎng)人才政策,形成了發(fā)文機(jī)構(gòu)、年份、地區(qū)、層級(jí)、文種類型、關(guān)鍵詞等字段,并將相關(guān)字段處理成文獻(xiàn)計(jì)量軟件Citespace所需格式,開展主題聚類、主題變遷、機(jī)構(gòu)合作等分析[21];趙洪等通過公文的內(nèi)容解構(gòu)、主題標(biāo)引、摘要生成等方法,構(gòu)建了應(yīng)用于大規(guī)模政府公文的知識(shí)發(fā)現(xiàn)與分析系統(tǒng)[22];三是利用替代計(jì)量學(xué)(Altermetrics)方法[23]對(duì)社會(huì)媒體(如新聞、微博、演講等)涉及的政策文本數(shù)據(jù)進(jìn)行分析研究。如Somasundaran和Wiebe構(gòu)建了政策辯論數(shù)據(jù)庫[24],并通過對(duì)其相關(guān)文本分析發(fā)現(xiàn)政策立場(chǎng)和政治意識(shí)[25];Proksch等使用自動(dòng)語音識(shí)別系統(tǒng)生成政治演講文本,結(jié)合計(jì)算機(jī)處理技術(shù)可以對(duì)該文本語料庫開展計(jì)量研究[26]。

      2.1.3? ?政策計(jì)量分析的優(yōu)缺點(diǎn)

      政策計(jì)量分析方法對(duì)數(shù)據(jù)的結(jié)構(gòu)化要求程度比較高,現(xiàn)有的政策數(shù)據(jù)庫在開放性、完備性和結(jié)構(gòu)化方面尚不能滿足政策計(jì)量分析的需求,反映政策文本內(nèi)容的信息較少,如主題詞、政策摘要和引證關(guān)系等均無法從數(shù)據(jù)庫直接下載獲取,亟需構(gòu)建類似文獻(xiàn)數(shù)據(jù)庫、專利數(shù)據(jù)庫的政策大數(shù)據(jù)平臺(tái)。文獻(xiàn)計(jì)量指標(biāo)應(yīng)用于政策對(duì)象時(shí)主要聚焦在對(duì)政策內(nèi)外部屬性的宏觀分析,有助于發(fā)現(xiàn)政策整體的分布特征和長(zhǎng)時(shí)間序列的發(fā)展規(guī)律,并不能滿足精細(xì)化的研究需求,對(duì)于政策文本細(xì)節(jié)、政策隱含語義、政策特色表征等的分析需要構(gòu)建全面且個(gè)性化的分析指標(biāo)。

      2.2? ? 面向政策內(nèi)容特征的內(nèi)容量化方法

      2.2.1? ?政策內(nèi)容量化的內(nèi)涵與流程

      政策文本內(nèi)容量化通過界定能反映政策語義與語詞之間映射關(guān)系的編碼標(biāo)準(zhǔn)和分析框架進(jìn)行政策概念的識(shí)別和處理,是一種介于定性與定量之間的半定量研究方法。該方法的基本核心是建立合適的有價(jià)值的類目以分解政策文本內(nèi)容,將政策文本中非量化的、非結(jié)構(gòu)化的信息轉(zhuǎn)換為可分析的定量數(shù)據(jù),以便為政策效果評(píng)價(jià)、政策效力分析和影響因素探討提供數(shù)據(jù)基礎(chǔ)。政策文本內(nèi)容量化方法流程(見圖4)主要有:①構(gòu)建政策文本數(shù)據(jù)集;②確定分析框架和分析維度;③定義分析單元與類目進(jìn)行編碼;④信度與效度檢驗(yàn);⑤數(shù)理統(tǒng)計(jì)分析和結(jié)果解釋。

      政策內(nèi)容量化方法的關(guān)鍵在于分析維度的選擇,其中,政策工具維度是政策內(nèi)容量化分析實(shí)踐中的必要組成部分。政策工具研究始于20世紀(jì)80年代,是為解決某一社會(huì)問題或達(dá)成一定政策目標(biāo)所采用的手段和措施,實(shí)際上是一種調(diào)節(jié)政府行為的機(jī)制[27],其分類是定義分析單元分類標(biāo)準(zhǔn)和類目設(shè)置的重要依據(jù)。目前比較有代表性的政策工具分類有:Klein等根據(jù)政府資源類型將政策工具分為信息型、權(quán)威型、組織型和財(cái)政型[28];McDonnell 和Elmore根據(jù)政策效力的不同分為命令型、激勵(lì)型、能力建設(shè)型和系統(tǒng)變化型四種[29],Phhal類似地分為自愿型、強(qiáng)制型和混合型工具[30];Hoppmann等根據(jù)政策制定層次將工具分為戰(zhàn)略層、綜合層及基本層[31];陳振明將政策工具分為市場(chǎng)化工具、工商管理技術(shù)與社會(huì)化手段[32];Rothwell和Zegveld根據(jù)政策產(chǎn)生影響層面的不同分為供給型、需求型和環(huán)境型三種[33],這也是政策內(nèi)容量化應(yīng)用最為廣泛的分類標(biāo)準(zhǔn)。

      2.2.2? ?政策內(nèi)容量化的主要類型

      政策內(nèi)容量化分析實(shí)際上既包含了傳統(tǒng)意義上對(duì)政策信息的定性判斷,也包括了對(duì)政策內(nèi)容的量化統(tǒng)計(jì)?;诖?,政策內(nèi)容量化分析主要分為三種類型:一是對(duì)編碼處理后的政策文本研究類目的純定量分析,主要聚焦于政策目標(biāo)、政策主體、政策客體以及政策工具維度等在時(shí)間序列上的變化特征。如李浩等構(gòu)建“基于政策目標(biāo)、政策工具和政策力度”的三維框架,對(duì)國家層面DRG(Diagnosis Related Group,疾病診斷相關(guān)組)政策條目進(jìn)行多維分類和交叉對(duì)比統(tǒng)計(jì)分析[34];黃如花和溫芳芳利用Nvivo對(duì)國家層面政府?dāng)?shù)據(jù)開放共享政策文本進(jìn)行編碼,利用Excel表格進(jìn)行描述性統(tǒng)計(jì),以反映政策文本的形式和內(nèi)容[35];二是基于政策文本描述性量化分析結(jié)果,再運(yùn)用PMC指數(shù)、AHP層次分析法、BP神經(jīng)網(wǎng)絡(luò)綜合評(píng)價(jià)法、灰色關(guān)聯(lián)度分析法等對(duì)政策進(jìn)行績(jī)效評(píng)價(jià)。如李煜華和張敬怡運(yùn)用內(nèi)容分析法對(duì)國家先進(jìn)制造業(yè)發(fā)展政策文本進(jìn)行整體性的“政策工具-產(chǎn)業(yè)發(fā)展要素”二維量化分析,在此基礎(chǔ)上引入神經(jīng)網(wǎng)絡(luò)理論的自編碼技術(shù)構(gòu)建先進(jìn)制造業(yè)多維政策評(píng)價(jià)的PMC-AE指數(shù)模型評(píng)價(jià)典型先進(jìn)制造業(yè)發(fā)展政策的優(yōu)劣情況[36];李鵬紅對(duì)土壤污染治理政策文本進(jìn)行編碼處理和質(zhì)性分析,再運(yùn)用AHP-熵權(quán)耦合方法對(duì)公眾參與政策工具集進(jìn)行了綜合評(píng)價(jià)[37];三是對(duì)政策內(nèi)容描述性定量分析與闡釋性、預(yù)測(cè)性定性分析的結(jié)合,通常是在政策結(jié)構(gòu)屬性分布特征的基礎(chǔ)上對(duì)政策演變規(guī)律和發(fā)展趨勢(shì)進(jìn)行研判和預(yù)測(cè)。如李梓涵昕和周晶宇分別從政策力度、政策工具、政策客體、孵化器生命周期四個(gè)維度對(duì)孵化器政策進(jìn)行描述性統(tǒng)計(jì)分析,并結(jié)合中國孵化器發(fā)展階段,分析不同階段孵化器政策演變特點(diǎn)并預(yù)測(cè)了未來發(fā)展規(guī)律[38];李霞等構(gòu)建基于“資源效用-技術(shù)結(jié)構(gòu)-應(yīng)用領(lǐng)域”的智慧城市政策工具分析框架,運(yùn)用統(tǒng)計(jì)分析、政策網(wǎng)絡(luò)分析與多維尺度方法展示了我國智慧城市政策階段共現(xiàn)主題詞和政策演進(jìn)脈絡(luò)[39]。

      2.2.3? ?政策內(nèi)容量化分析優(yōu)缺點(diǎn)

      政策內(nèi)容量化分析沿襲了政治學(xué)中的政治話語研究和政治語詞解讀(政策主題歸納)的研究傳統(tǒng),在研究樣本量較少、程序規(guī)則清楚、類目界定清晰的條件下能夠更為恰當(dāng)且深度地解析政策文本。但由于其對(duì)政策文本進(jìn)行概念抽取時(shí)主要依賴人工處理,人力成本與使用難度會(huì)隨著樣本量和分析角度的增加而增長(zhǎng),不適用于對(duì)海量政策文本分析處理。除了方法本身的局限性外,政策內(nèi)容量化方法的研究過程完全依賴于最初所界定的分析維度和分析單元,最終結(jié)果將受限于研究者的政策認(rèn)知水平、專業(yè)知識(shí)基礎(chǔ)以及對(duì)政策語言理解的能力。

      2.3? ? 面向政策語義特征的文本挖掘方法

      2.3.1? ?政策文本挖掘的內(nèi)涵與流程

      隨著計(jì)算機(jī)和大數(shù)據(jù)技術(shù)的蓬勃發(fā)展,政策文本挖掘方法逐漸成為提升政策文本量化成熟度的關(guān)鍵,為政策計(jì)量和內(nèi)容量化等研究提供了堅(jiān)實(shí)的數(shù)據(jù)處理基礎(chǔ)和分析工具支撐。政策文本挖掘方法是指在大規(guī)模政策文本集合中發(fā)現(xiàn)潛在信息和隱含知識(shí)的過程,包括機(jī)器學(xué)習(xí)、自然語言處理、深度學(xué)習(xí)、可視化技術(shù)、數(shù)據(jù)庫技術(shù)等多類技術(shù)方法[40]。該方法的基本核心是利用技術(shù)方法和機(jī)器效率完成對(duì)政策文本多種維度的特征識(shí)別和信息抽取,以便解讀和獲知政策立場(chǎng)、政策意見、政策行為、政策情感等深層的政策語義內(nèi)涵。政策文本挖掘方法流程(見圖5)主要有:①獲取文本形成政策語料庫;②文本數(shù)據(jù)預(yù)處理;③政策文本表示;④根據(jù)研究目標(biāo)選擇合適的模型;⑤結(jié)果可視化及模型評(píng)估。

      政策文本挖掘方法的關(guān)鍵在于將政策文本處理成計(jì)算機(jī)容易處理和理解的數(shù)據(jù),即政策文本表示。目前常用的文本表示方法主要有三種:第一種是詞袋模型(Bag of Words,BOW)[41],BOW模型是最原始的文本表示方法,其忽略政策文本中的詞序和語法,將單個(gè)文本看成若干獨(dú)立詞匯的集合,每個(gè)詞不依賴于其他詞是否出現(xiàn);第二種是主題模型(Topic Model)[42],該模型假設(shè)每個(gè)文本是由一系列主題的概率分布表示而成,基于BOW模型做了降維處理,訓(xùn)練得到詞和文檔的特征向量,有效避免了文本在特征空間中的稀疏性;第三種是詞向量模型(Word Embedding)[43],充分考慮了政策文本中詞匯出現(xiàn)的上下文語境和相互依賴關(guān)系,將文本表示成一個(gè)低維且連續(xù)的稠密向量。實(shí)質(zhì)上是將文本中每個(gè)詞映射到一個(gè)向量空間中,而詞之間的關(guān)系也可以通過向量計(jì)算表示,彌補(bǔ)了僅依賴詞匯導(dǎo)致的語義不足問題。

      2.3.2? ?政策文本挖掘的主要類型

      政策文本挖掘注重在大量文本數(shù)據(jù)集合中探索深層或潛在語義關(guān)系、發(fā)現(xiàn)分類和聚類特征、挖掘隱形關(guān)聯(lián)知識(shí)或關(guān)系牽連。當(dāng)前研究類型主要可分為三種:一是政策文本分類研究,如Zhitomirsky等實(shí)現(xiàn)了無需任何人工標(biāo)注的政治文本全自動(dòng)分類[44];沈自強(qiáng)等利用BERT深度學(xué)習(xí)模型對(duì)科技政策進(jìn)行自動(dòng)分類實(shí)驗(yàn),發(fā)現(xiàn)通過BERT模型,融合標(biāo)題和TF-IDF政策關(guān)鍵詞的分類效果最佳[45];二是政策主題模型研究,其與政策文本聚類、政策主題演化等研究密切相關(guān)。如曲靖野等提出了一種以科技報(bào)告為載體數(shù)據(jù)源,基于LDA主題識(shí)別與K-means聚類方法相融合的科技報(bào)告文本聚類的文本挖掘新方法,從主題的視角對(duì)科技報(bào)告文本進(jìn)行聚類研究[46];劉建華等基于政策文本中多維政策實(shí)體及實(shí)體之間的直接語義關(guān)系、直接共現(xiàn)關(guān)系、間接共現(xiàn)關(guān)系、關(guān)聯(lián)路徑衰減指數(shù)等,構(gòu)建綜合計(jì)算科技政策實(shí)體關(guān)聯(lián)的多指標(biāo)模型,并結(jié)合實(shí)體時(shí)間屬性,揭示科技政策演化路徑[47];三是政策情感識(shí)別研究,其在識(shí)別政策立場(chǎng)傾向、政策意見分析和選舉預(yù)測(cè)中應(yīng)用較多。如Hopkins和King開發(fā)了一種自動(dòng)非參數(shù)的文本數(shù)據(jù)分析方法,能夠分析博客、演講、報(bào)紙等非結(jié)構(gòu)化文本中的政策傾向[48];Saremento等提出了一種自動(dòng)創(chuàng)建政治參考語料庫的方法,定義并使用一組由大型情感詞典支持的人工制作的高精度規(guī)則識(shí)別相似文本語句,以挖掘用戶評(píng)論中的政治意見[49]。

      2.3.3? ?政策文本挖掘的優(yōu)缺點(diǎn)

      政策文本挖掘方法顯著提高了處理大量政策文本的能力,一定程度上解決了大數(shù)據(jù)環(huán)境下政策計(jì)量和內(nèi)容量化法分析效率較低、分析深度不夠等問題,為跨語料分析和實(shí)時(shí)政策文本分析提供了可能。這也決定了政策文本挖掘方法對(duì)宏觀政策問題和政策現(xiàn)象分析效果越好,在一些具體案例、細(xì)小問題、以及個(gè)別政策分析方面甚至不如定性分析來得準(zhǔn)確。此外,應(yīng)當(dāng)注意到政策文本挖掘本質(zhì)上是依賴計(jì)算機(jī)技術(shù)發(fā)展水平的衍生應(yīng)用領(lǐng)域,要受到當(dāng)前算法成熟度、系統(tǒng)誤差以及硬件計(jì)算能力等客觀水平的限制。

      3? ?政策文本量化的知識(shí)發(fā)現(xiàn)應(yīng)用研究

      在計(jì)算機(jī)技術(shù)、信息通信技術(shù)和大數(shù)據(jù)技術(shù)蓬勃發(fā)展的時(shí)代,“方法技術(shù)不是難題”是社會(huì)科學(xué)研究的統(tǒng)一共識(shí)。政策信息學(xué)作為連接政策量化分析和政策問題求解的交叉學(xué)科,不僅僅是理想狀態(tài)下的問題求解,而是必須明確解決方案最終實(shí)現(xiàn)所需要的各種約束條件[50]。近年來,情報(bào)學(xué)、政治學(xué)和公共管理學(xué)等領(lǐng)域的學(xué)者在數(shù)據(jù)拓展、方法融合、實(shí)踐應(yīng)用等方面進(jìn)行了積極地探索,主要集中在以下幾個(gè)方面。

      3.1? ? 政策分布特征和發(fā)展規(guī)律研究

      多學(xué)科和多類型政策文本量化分析方法的應(yīng)用極大程度上拓展了政策分析的精度和深度,突破了人工定性解讀和單純頻次計(jì)算的研究范疇,可以更加顯性化地挖掘政策間的關(guān)聯(lián)關(guān)系,揭示政策分布、政策變遷和政策擴(kuò)散等政策發(fā)展規(guī)律。在政策分布方面,Isoaho等對(duì)歐盟委員會(huì)能源聯(lián)盟出臺(tái)的5000多份政策文件進(jìn)行主題建模分析,發(fā)現(xiàn)能源聯(lián)盟的政策重點(diǎn)在于脫碳和能源效率,而氣候安全和氣候可負(fù)擔(dān)性政策存在政策趨同的信號(hào)[51];Prior等使用文本挖掘策略與語義網(wǎng)絡(luò)分析技術(shù)相結(jié)合的方法提煉政策文本的基本內(nèi)容元素,了解了英國環(huán)境衛(wèi)生領(lǐng)域的政策文件分布特征[52]。在政策變遷方面,Huang等利用文獻(xiàn)計(jì)量學(xué)方法分析了不同時(shí)期不同部門的政策出臺(tái)情況,梳理了中國科技創(chuàng)新政策體系的發(fā)展脈絡(luò)[53],并提出一種基于“政策目標(biāo)-政策工具”模式政策主題變遷的方法,分析了中國核領(lǐng)域政策的演變過程[54];Arenal等結(jié)合文本挖掘技術(shù)、主題聚類分析和定性評(píng)估等方法,分析了歐盟創(chuàng)業(yè)政策的周期曲線和主題演變[55]。在政策擴(kuò)散方面,江雨薇等運(yùn)用統(tǒng)計(jì)分析和文本挖掘方法對(duì)破除“唯論文”政策的時(shí)空演進(jìn)、發(fā)文機(jī)構(gòu)及主題內(nèi)容進(jìn)行分析,總結(jié)政策在不同層級(jí)間的主題擴(kuò)散特征,預(yù)判政策發(fā)展趨向[56]; 王芳等運(yùn)用政策文本挖掘從擴(kuò)散主題維度和政策擴(kuò)散傾向性兩個(gè)方面分析了我國大數(shù)據(jù)政策擴(kuò)散特征,利用可視化技術(shù)呈現(xiàn)從中央到省級(jí)、地市級(jí)政策擴(kuò)散過程中的主題變遷,揭示了我國各級(jí)政府在政策擴(kuò)散過程中的傾向性和特點(diǎn)[57]。

      3.2? ? 政策作用過程和效果評(píng)估研究

      政策評(píng)價(jià)是科技評(píng)價(jià)的重要組成部分,隨著經(jīng)濟(jì)社會(huì)環(huán)境變化加快、政策議題日益復(fù)雜多樣和評(píng)價(jià)信息來源紛繁雜亂,大數(shù)據(jù)驅(qū)動(dòng)下的政策信息學(xué)研究為政策評(píng)價(jià)工作帶來了新的發(fā)展機(jī)遇。政策量化評(píng)價(jià)研究當(dāng)前主要圍繞政策文本特征和政策文本內(nèi)容展開,為政策的制定、調(diào)整以及完善提供了重要的理論支撐和決策依據(jù)?;谡呶谋咎卣鞯牧炕u(píng)價(jià)研究,指的是從政策文本的多個(gè)維度設(shè)置變量分析政策優(yōu)劣。具有代表性的方法是Estrada建立的PMC指數(shù)[58-59]。學(xué)者們分別圍繞科技服務(wù)業(yè)政策[60]、數(shù)字經(jīng)濟(jì)政策[61]、人工智能政策[62]等開展了大量研究。有學(xué)者進(jìn)一步將PMC指數(shù)與AE技術(shù)相結(jié)合構(gòu)建PMC-AE指數(shù)模型,實(shí)現(xiàn)了對(duì)制造業(yè)創(chuàng)新政策[63]和軍民融合政策[64]的深入挖掘和量化評(píng)價(jià)研究?;谡呶谋緝?nèi)容的量化評(píng)價(jià)研究,指的是從政策本身出發(fā)對(duì)政策內(nèi)容進(jìn)行細(xì)分,設(shè)定量化標(biāo)準(zhǔn)以評(píng)價(jià)政策影響和政策效果,核心是政策工具理論。如Libecap為美國礦產(chǎn)權(quán)相關(guān)法規(guī)政策設(shè)定法律變革指數(shù),選擇了15個(gè)范疇來計(jì)算政策得分,這是最早的政策量化評(píng)價(jià)研究[65]。彭紀(jì)生等則基于政策工具理論構(gòu)建了“政策力度-政策措施-政策目標(biāo)”三維評(píng)價(jià)指標(biāo)體系[66],并形成了一套具體的政策量化標(biāo)準(zhǔn)操作手冊(cè),被學(xué)術(shù)界廣泛應(yīng)用[67-68]。

      3.3? ? 政策立場(chǎng)研判和博弈關(guān)系研究

      政策制定離不開政策主體之間的合作與博弈,政策文本作為政治思想觀點(diǎn)的直接載體,通過政策文本量化研究識(shí)別政策立場(chǎng)、解析政策情感和判斷政策傾向可以避免顯性的政策沖突,促進(jìn)政策完善與創(chuàng)新,同時(shí)也能更好地跟蹤政策利益關(guān)系,精準(zhǔn)預(yù)測(cè)政策未來發(fā)展走向。政策文本挖掘研究,尤其是政策情感分析廣泛應(yīng)用于西方政黨選情預(yù)測(cè)和政策立場(chǎng)預(yù)判,核心在于通過收集開源的輿情文本,將公眾政策意見與政黨支持相關(guān)聯(lián),進(jìn)而做出政策預(yù)測(cè)。如Ceron 等使用情感分析方法監(jiān)測(cè)分析社交媒體中選民的政策意圖,以判斷選在競(jìng)選過程中投票傾向[69];Sudhahar 等利用文本挖掘的方法對(duì) 13萬余篇關(guān)于美國總統(tǒng)大選的新聞文章自動(dòng)解析產(chǎn)生了一個(gè)由關(guān)鍵政治參與者和問題形成的網(wǎng)絡(luò),可以自動(dòng)提取和分析政治立場(chǎng)[70]。政策利益博弈研究是政策實(shí)施過程中多個(gè)利益者相互競(jìng)爭(zhēng)或合作的結(jié)果,也是政策文本量化的重要應(yīng)用領(lǐng)域。如Laver 等分析了法國政黨宣言和總統(tǒng)演講的內(nèi)容分析,揭示了2002 年法國立法和總統(tǒng)選舉中的政策競(jìng)爭(zhēng)關(guān)系[71];孫濤等和溫雪梅、陳宇等基于府際關(guān)系視角,對(duì)環(huán)境治理政策演變、政策行動(dòng)和主體關(guān)系結(jié)構(gòu)進(jìn)行量化研究,分析了政府在區(qū)域環(huán)境政策執(zhí)行過程中的利益博弈和行為偏差的產(chǎn)生機(jī)制[72-73];Sun和Cao從中國的創(chuàng)新政策文本中提取政府機(jī)構(gòu)之間的結(jié)構(gòu)關(guān)系,并利用社會(huì)網(wǎng)絡(luò)分析方法量化分析了中國創(chuàng)新政策網(wǎng)絡(luò)的演變過程,從政策議程、權(quán)力集中和異質(zhì)性依賴等政策網(wǎng)絡(luò)特征揭示政策制定機(jī)構(gòu)間競(jìng)爭(zhēng)與合作關(guān)系[74]。

      通過以上分析可以發(fā)現(xiàn),隨著政策信息爆炸性增長(zhǎng)、政策議題愈發(fā)復(fù)雜以及學(xué)科交叉現(xiàn)象凸顯,政策文本量化研究已經(jīng)廣泛應(yīng)用于政策制定咨詢、政策比較評(píng)估和政策走向預(yù)測(cè)等政治活動(dòng)領(lǐng)域。綜合來看,在實(shí)際的政策分析研究開展過程中,多種量化方法的交叉融合使用為當(dāng)前政策知識(shí)分析與發(fā)現(xiàn)提供了新的解決方案,有助于發(fā)現(xiàn)政策文本中隱藏的政策信息與內(nèi)在邏輯、提升政策作用效果評(píng)估的效率和精細(xì)度、補(bǔ)充質(zhì)化研究中察覺不到的演變軌跡并可視化呈現(xiàn)、驗(yàn)證帶有主觀色彩的思想觀點(diǎn)輸出與規(guī)律性預(yù)判等。

      4? ?未來發(fā)展

      立足政策信息學(xué)理論對(duì)政策文本量化研究方法及其知識(shí)發(fā)現(xiàn)研究應(yīng)用進(jìn)展進(jìn)行系統(tǒng)的梳理和總結(jié),可以發(fā)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)環(huán)境下的政策文本量化豐富了政策知識(shí)分析發(fā)現(xiàn)的研究范圍和研究深度,極大程度上解密了政策制定“黑箱”、促進(jìn)了政府科學(xué)決策。但同時(shí)基于結(jié)構(gòu)化政策文本有限、文本量化方法寬泛等特點(diǎn),當(dāng)前學(xué)者大多集中在借助已有方法進(jìn)行不同領(lǐng)域政策文本的知識(shí)分析發(fā)現(xiàn)實(shí)踐,呈現(xiàn)應(yīng)用研究有余、深層次創(chuàng)新不足、與實(shí)際政策問題融合不夠的態(tài)勢(shì)?;诖耍疚奶岢鲆韵掳l(fā)展建議。

      4.1? ? 建設(shè)領(lǐng)域政策大數(shù)據(jù)庫及知識(shí)分析發(fā)現(xiàn)平臺(tái)

      政策數(shù)據(jù)庫是政策文本量化分析的基礎(chǔ),沒有規(guī)范化的政策領(lǐng)域大數(shù)據(jù)平臺(tái),就不可能支撐政策信息學(xué)發(fā)展及其領(lǐng)域知識(shí)發(fā)現(xiàn)。當(dāng)前我國已經(jīng)形成眾多結(jié)構(gòu)化政策數(shù)據(jù)平臺(tái),如北大法寶、中國科學(xué)技術(shù)信息研究所研發(fā)的科技情報(bào)成果與服務(wù)共享平臺(tái)[75] 、中國科協(xié)創(chuàng)新戰(zhàn)略研究院的政策法規(guī)庫[76]、中國科學(xué)院文獻(xiàn)情報(bào)中心的“科技政策匯”數(shù)據(jù)庫平臺(tái)[77]以及延伸發(fā)展形成的科技政策分析服務(wù)平臺(tái)[78]等。但由于數(shù)據(jù)庫構(gòu)建、維護(hù)和管理成本的限制,其完備性、時(shí)效性和針對(duì)性都有所欠缺,政策研究者在研究實(shí)踐中仍然需要自建數(shù)據(jù)庫和語料庫,在一定程度上會(huì)造成政策數(shù)據(jù)收集重復(fù)和冗余,以及人力和物力資源的浪費(fèi)。因此,應(yīng)當(dāng)由國家機(jī)構(gòu)進(jìn)行宏觀組織協(xié)調(diào)或者建立一個(gè)政策聯(lián)盟,從上到下地進(jìn)行宏觀統(tǒng)籌和規(guī)劃,將政策相關(guān)的全類信息匯總起來,促進(jìn)數(shù)據(jù)整合與共享。特別是需要建設(shè)各個(gè)領(lǐng)域的政策大數(shù)據(jù)庫和語料庫,只有建設(shè)專業(yè)領(lǐng)域政策數(shù)據(jù)庫才能支撐開展專業(yè)化的政策知識(shí)分析發(fā)現(xiàn),為政策的精細(xì)化分析研究提供源源不斷的知識(shí)供給。

      4.2? ? 開發(fā)針對(duì)性專門化的政策知識(shí)分析方法工具

      政策文本與期刊論文、專利文獻(xiàn)類似,具備基本結(jié)構(gòu)要素和語義信息,但同時(shí)政策文本又有其自身獨(dú)特性。首先,政策文本發(fā)布具備周期性,通常具有更高的知識(shí)密度,擁有更加規(guī)范的話語體系;其次,政策文本之間的關(guān)系更加復(fù)雜,基于政策引用、擴(kuò)散和更新活動(dòng)可能呈現(xiàn)出連續(xù)、組合和互補(bǔ)的網(wǎng)絡(luò)結(jié)構(gòu);第三,政策文本基于其獨(dú)特的政治屬性,通常包含著豐富的語義信息,包括政治立場(chǎng)、政策傾向、政策價(jià)值、政策情感等。基于這樣的特殊性,現(xiàn)有的分析技術(shù)方法和工具難以全面且恰當(dāng)?shù)膽?yīng)用于政策文本分析。這就需要注重政策分析的效度和信度檢驗(yàn),并在不斷借鑒其他學(xué)科方法的基礎(chǔ)上結(jié)合政策文本特點(diǎn)進(jìn)行整合和創(chuàng)新,設(shè)計(jì)和開發(fā)出適用于政策文本研究的針對(duì)性技術(shù)方法模塊和數(shù)據(jù)分析工具包等,形成類似Citespace、VOSviewer類的開源軟件,促進(jìn)政策規(guī)律的探索發(fā)現(xiàn)和政策知識(shí)的挖掘分析。

      4.3? ? 開展領(lǐng)域政策問題研究與知識(shí)發(fā)現(xiàn)應(yīng)用實(shí)踐

      政策文本量化研究是與政策分析密切相關(guān)的方法類研究范式,也是與實(shí)際應(yīng)用需求緊密結(jié)合的研究領(lǐng)域,已經(jīng)廣泛應(yīng)用于國際政策比較研究、智庫政策思想輸出和國家政策決策咨詢活動(dòng)。但在實(shí)踐過程中,基于研究目標(biāo)和身份角色的不同,政策分析者開展實(shí)踐研究的角度與決策制定者之間往往是相對(duì)割裂的,很難同時(shí)兼顧理論研究和應(yīng)用需求的二元統(tǒng)一。如利用計(jì)算機(jī)技術(shù)進(jìn)行政策文本量化分析呈現(xiàn)時(shí),更加注重技術(shù)創(chuàng)新和方法突破,結(jié)果往往是抽象的或數(shù)據(jù)化的,只有結(jié)合相關(guān)的應(yīng)用背景進(jìn)行解讀才能完全理解。這說明政策文本量化研究絕不僅僅是利用一些新興的方法和技術(shù)單純的將政策文本作為研究樣本,也不僅僅是為完成一項(xiàng)任務(wù)、工作和項(xiàng)目,而要以需求為引領(lǐng)、以問題為導(dǎo)向?qū)⒍ㄐ匝芯亢投垦芯肯嘟Y(jié)合開展政策分析實(shí)踐,鼓勵(lì)政策研究者與政策制定者充分交流合作,從而產(chǎn)生一些針對(duì)性的思想建議,為相關(guān)政策決策咨詢提供服務(wù)和參考。

      參考文獻(xiàn):

      [1]? 黃萃.政策文獻(xiàn)量化研究[M].北京:科學(xué)出版社,2016.

      [2]? 付琳,張東雨,閆昊本,等.基于政策文本分析的中國碳減排政策工具研究[J/OL].科學(xué)學(xué)研究:1-19[2022-07-25].DOI:10.16192/j.cnki.1003-2053.20220627.001.

      [3]? Baker S R,Bloom N,Davis S J.Measuring economic policy uncertainty[J].The quarterly journal of economics,2016,131(4):1593-1636.

      [4]? Beauchamp N.Using text to scale legislatures with uninformative voting[J].New York University Mimeo,2011.

      [5]? Laver M,Benoit K,Garry J.Extracting Policy Positions from Political Texts Using Words as Data[J].American Political Science Review,2003,97(2):311-331.

      [6]? 曹玲靜,張志強(qiáng).政策信息學(xué)的發(fā)展與前瞻[J].圖書情報(bào)工作,2021,65(21):38-50.

      [7]? 李江,劉源浩,黃萃,等.用文獻(xiàn)計(jì)量研究重塑政策文本數(shù)據(jù)分析——政策文獻(xiàn)計(jì)量的起源、遷移與方法創(chuàng)新[J].公共管理學(xué)報(bào),2015,12(2):138-144.

      [8]? 黃萃,任弢,張劍.政策文獻(xiàn)量化研究:公共政策研究的新方向[J].公共管理學(xué)報(bào),2015,12(2):129-137,158-159.

      [9]? 裴雷,孫建軍,周兆韜.政策文本計(jì)算:一種新的政策文本解讀方式[J].圖書與情報(bào),2016(6):47-55.

      [10]? Wiedemann G.Computer-Assisted Text Analysis in the Social Sciences[M].Text Mining for Qualitative Data Analysis in the Social Sciences.Springer Fachmedien Wiesbaden,2016:17-53.

      [11]? Hollibaugh G E.The use of text as data methods in public administration:A review and an application to agency priorities[J].Journal of Public Administration Research and Theory,2019,29(3):474-490.

      [12]? Grimmer J,Stewart B M.Text as Data:The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts[J].Political Analysis,2013,21(3):267-297.

      [13]? 馬海群,張斌.我國政策計(jì)量研究:方法與模型[J].數(shù)字圖書館論壇,2019(5):2-8.

      [14]? 丁潔蘭,劉細(xì)文,楊立英,等.科學(xué)計(jì)量方法在科技政策研究中應(yīng)用的實(shí)證研究[J].圖書情報(bào)工作,2017,61(24):77-86.

      [15]? BORNMANN L,HAUNSCHILD R,MARX W.Policy documents as sources for measuring societal impact:how often is climate change research mentioned in policy-related documents?[J].Scientometrics,2016,109(3):1477-1495.

      [16]? 余厚強(qiáng),肖婷婷,王曰芬,等.政策文件替代計(jì)量指標(biāo)分布特征研究[J].中國圖書館學(xué)報(bào),2017,43(5):57-69.

      [17]? 余厚強(qiáng),李龍飛.政策文件替代計(jì)量指標(biāo)影響因素研究[J].情報(bào)理論與實(shí)踐,2021,44(7):28-36.

      [18]? 盧小賓,霍帆帆,霍朝光.我國信息公開政策計(jì)量分析:權(quán)力主體、法律淵源與政策工具[J].情報(bào)理論與實(shí)踐,2022,45(1):46-53.

      [19]? 馮昌揚(yáng),張佩玲.政策計(jì)量視角下的我國文化扶貧政策分析[J/OL].圖書館建設(shè):1-22[2022-08-03].http://kns.cnki.net/kcms/detail/23.1331.G2.20220105.1732.004.html.

      [20]? 蘇竣,黃萃.中國科技政策要目概覽[M].北京:科學(xué)技術(shù)文獻(xiàn)出版社,2012.

      [21]? 代欣玲,彭小兵,王京雷.中國情境下創(chuàng)新人才培養(yǎng)政策的文獻(xiàn)計(jì)量分析[J].科研管理,2022,43(3):27-36.

      [22]? 趙洪,王芳,王曉宇,等.基于大規(guī)模政府公文智能處理的知識(shí)發(fā)現(xiàn)及應(yīng)用研究[J].情報(bào)學(xué)報(bào),2018,37(8):805-812.

      [23]? Piwowar H.Altmetrics:Value all research products[J].Nature,2013,493(7431):159.

      [24]? Somasundaran S,Wiebe J.Multi-Perspective Question Answer Opinion Corpus[EB/OL].[2022-07-20].http://mpqa.cs.pitt.edu/corpora/political_debates/.

      [25]? Somasundaran S,Wiebe J.Recognizing stances in ideological on-line debates[C].Proceedings of the NAACL HLT 2010 workshop on computational approaches to analysis and generation of emotion in text.2010:116-124.

      [26]? Proksch S O,Wratil C,W?ckerle J.Testing the Validity of Automatic Speech Recognition for Political Text Analysis[J].Political Analysis,2019,27(3):339-359.

      [27]? Hughes O E.Public management and administration[M].London:Bloomsbury Publishing,2017.

      [28]? KLEIN W R,LANKHUIZEN M,GILSING V.A system failure framework for innovation policy design[J].Technovation,2005,25(6):609-619.

      [29]? McDonnell L M,Elmore R F.Getting the job done:Alternative policy instruments[J].Educational evaluation and policy analysis,1987,9(2):133-152.

      [30]? PHAAL R,OSULLIVAN E,ROUTLEY M,et al.A framework for mapping industrial emergence[J].Technological Forecasting and Social Change,2011,78(2):217-230.

      [31]? HOPPMANN J,PETERS M,SCHNEIDER M,et al.The two faces of market support how deployment policies affect technological exploration and exploitation in the solar photovoltaic industry[J].Research Policy,2013,42(4):989-1003.

      [32]? 陳振明.政策科學(xué):公共政策分析導(dǎo)論(第二版)[M].北京:中國人民大學(xué)出版社,2003.

      [33]? ROTHWELL R,ZEGVELD W.Reindustrialization and technology[M].London:Longman Group Limited,1985:83-84.

      [34]? 李浩,戴遙,陶紅兵.我國DRG政策的文本量化分析——基于政策目標(biāo)、政策工具和政策力度的三維框架[J].中國衛(wèi)生政策研究,2021,14(12):16-25.

      [35]? 黃如花,溫芳芳.我國政府?dāng)?shù)據(jù)開放共享的政策框架與內(nèi)容:國家層面政策文本的內(nèi)容分析[J].圖書情報(bào)工作,2017,

      61(20):12-25.

      [36]? 李煜華,張敬怡.先進(jìn)制造業(yè)發(fā)展政策量化評(píng)價(jià)與優(yōu)化路徑[J].統(tǒng)計(jì)與決策,2022,38(10):175-179.

      [37]? 李鵬紅.風(fēng)險(xiǎn)社會(huì)視角下公眾參與土壤污染治理的政策文本分析——基于AHP-熵權(quán)耦合的綜合評(píng)價(jià)[J].河北農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2022,24(2):88-99.

      [38]? 李梓涵昕,周晶宇.中國孵化器政策的演進(jìn)特征、問題和對(duì)策——基于政策力度、政策工具、政策客體和孵化器生命周期的四維分析[J].科學(xué)學(xué)與科學(xué)技術(shù)管理,2020,41(9):20-34.

      [39]? 李霞,陳琦,賈宏曼.中國智慧城市政策體系演化研究[J].科研管理,2022,43(7):1-10.

      [40]? 郭金龍,許鑫,陸宇杰.人文社會(huì)科學(xué)研究中文本挖掘技術(shù)應(yīng)用進(jìn)展[J].圖書情報(bào)工作,2012,56(8):10-17.

      [41]? Miller G A.WordNet:An electronic lexical database[M].Cambridge:MIT press,1998.

      [42]? Ponte J M,Croft W B.A language modeling approach to information retrieval[C].ACM SIGIR Forum.New York,NY,USA:ACM,2017,51(2):202-208.

      [43]? 鄭新曼,董瑜.政策文本量化研究的綜述與展望[J].現(xiàn)代情報(bào),2021,41(2):168-177.

      [44]? Zhitomirsky M,David E,Koppel M.Utilizing Overtly Political Texts for Fully Automatic Evaluation of Political Leaning of Online News Websites[J].Online Information Review,2016,40(3):362-379.

      [45]? 沈自強(qiáng),李曄,丁青艷,等.基于BERT模型的科技政策文本分類研究[J].數(shù)字圖書館論壇,2022(1):10-16.

      [46]? 曲靖野,陳震,鄭彥寧.基于主題模型的科技報(bào)告文檔聚類方法研究[J].圖書情報(bào)工作,2018,62(4):113-120.

      [47]? 劉建華,張智雄,張琴.基于多維政策實(shí)體及其關(guān)系的科技政策演化路徑揭示方法研究[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2019,3(5):57-67.

      [48]? Hopkins D J,King G.A Method of Automated Nonparametric Content Analysis for Social Science[J].American Journal of Political Science,2010,54(1):229-247.

      [49]? Sarmento L,Carvalho P,Silva M J,et al.Automatic creation of a reference corpus for political opinion mining in user-generated content[C].Proceedings of the 1st international CIKM workshop on Topic-sentiment analysis for mass opinion.2009:29-36.

      [50]? 張楠,馬寶君,孟慶國.政策信息學(xué):大數(shù)據(jù)驅(qū)動(dòng)的公共政策分析[M].北京:清華大學(xué)出版社,2019.

      [51]? ISOAHO K,MOILANEN F,TOIKKA A.A big data view of the European energy union:shifting from a floating signifier to an active driver of decarbonisation?[J].Politics and Governance,2019,7(1):28-44.

      [52]? PRIOR L,HUGHES D,PECKHAM S.The discursive turn in policy analysis and the validation of policy stories[J].Journal of Social Policy,2012,41:271-289.

      [53]? HUANG C,SU J,XIE X,et al.A bibliometric study of Chinas science and technology policies:1949-2010[J].Scientometrics,2015,102(2):1521-1539.

      [54]? HUANG C,YANG C,SU J.Policy change analysis based on“policy target-policy instrument”patterns:a case study of china's nuclear energy policy[J].Scientometrics,2018,117(2):1081-1114.

      [55]? Arenal A,F(xiàn)eijoo C,Moreno A.Entrepreneurship Policy Agenda in the European Union:A Text Mining Perspective[J].Review Of Policy Research,2021,38(2):243-271.

      [56]? 江雨薇,陳君沂,林麗嬌,等.政策計(jì)量視角下破除“唯論文”政策擴(kuò)散的特征分析[J].情報(bào)理論與實(shí)踐,2022,45(6):89-97.

      [57]? 王芳,徐路路.基于智能化公文主題分析的我國政策層級(jí)擴(kuò)散傾向性研究[J].情報(bào)學(xué)報(bào),2021,40(4):387-401.

      [58]? Estrada M A R.The policy modeling research consistency index(PMC-Index)[J/OL].[2022-09-23].https://www.researchgate.net/publication/228302925_The_Policy_Modeling_Research_Consistency_Index_PMC-Index.

      [59]? ESTRADA M A R.Policy modeling:definition,classification and evaluation[J].Journal of policy modeling,2011,33(4):523-536.

      [60]? 杜寶貴,陳磊.基于PMC指數(shù)模型的科技服務(wù)業(yè)政策量化評(píng)價(jià):遼寧及相關(guān)省市比較[J].科技進(jìn)步與對(duì)策,2022,39(1):132-140.

      [61]? 蔡冬松,柴藝琳,田志雄.基于PMC指數(shù)模型的吉林省數(shù)字經(jīng)濟(jì)政策文本量化評(píng)價(jià)[J].情報(bào)科學(xué),2021,39(12):139-145.

      [62]? 任莎莎.基于PMC指數(shù)模型的北京市人工智能政策量化評(píng)價(jià)[J].全球科技經(jīng)濟(jì)瞭望,2021,36(10):54-62.

      [63]? 吳衛(wèi)紅,盛麗瑩,唐方成,等.基于特征分析的制造業(yè)創(chuàng)新政策量化評(píng)價(jià)[J].科學(xué)學(xué)研究,2020,38(12):2246-2257.

      [64]? 王進(jìn)富,楊青云,張穎穎.基于PMC-AE指數(shù)模型的軍民融合政策量化評(píng)價(jià)[J].情報(bào)雜志,2019,38(4):66-73.

      [65]? LIBECAP G D.Economic variables and the development of the law:the case of western mineral rights[J].The journal of economic history,1978,38(2):338-362.

      [66]? 彭紀(jì)生,仲為國,孫文祥.政策測(cè)量、政策協(xié)同演變與經(jīng)濟(jì)績(jī)效:基于創(chuàng)新政策的實(shí)證研究[J].管理世界,2008(9):25-36.

      [67]? 程翔,鮑新中.科技金融政策效率研究——以京津冀地區(qū)為例[J].北京聯(lián)合大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2018,16(3):116-124.

      [68]? 王幫俊,朱榮.產(chǎn)學(xué)研協(xié)同創(chuàng)新政策效力與政策效果評(píng)估——基于中國2006-2016年政策文本的量化分析[J].軟科學(xué),2019,33(3):30-35,44.

      [69]? Ceron A,Curini L,Iacus S M.Using sentiment analysis to monitor electoral campaigns:Method matters—evidence from the United States and Italy[J].Social Science Computer Review,2015,33(1):3-20.

      [70]? Sudhahar S,Veltri G A,Cristianini N.Automated analysis of the US presidential elections using Big Data and network analysis[J].Big Data&Society,2015,2(1):1-28.

      [71]? Laver M,Benoit K,Sauger N.Policy competition in the 2002 French legislative and presidential elections[J].European Journal of Political Research,2006,45(4):667-697.

      [72]? 孫濤,溫雪梅.府際關(guān)系視角下的區(qū)域環(huán)境治理——基于京津冀地區(qū)大氣治理政策文本的量化分析[J].城市發(fā)展研究,2017,24(12):45-53.

      [73]? 陳宇,閆倩倩,王洛忠.府際關(guān)系視角下區(qū)域環(huán)境政策執(zhí)行偏差研究——基于博弈模型的分析[J].北京理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2019,21(5):56-64.

      [74]? SUN Y,CAO C.The evolving relations between government agencies of innovation policymaking in emerging economies:a policy network approach and its application to the Chinese case[J].Research policy,2018,47(3):592-605.

      [75]? 中國科學(xué)技術(shù)信息研究所.科技情報(bào)成果與服務(wù)共享平臺(tái)[EB/OL].[2022-07-24].https://www.chinainfo.org.cn/index.

      [76]? 中國科協(xié)創(chuàng)新戰(zhàn)略研究院.政策法規(guī)庫[EB/OL].[2022-07-24].http://dev.anylangtech.com/cnais-policy-web/#/homePage.

      [77]? 中國科學(xué)院文獻(xiàn)情報(bào)中心.科技政策匯[EB/OL].[2022-07-24].http://gopolicy.las.ac.cn/service.

      [78]? 馬雨萌,黃金霞,王昉,等.基于政策文本量化研究的科技政策分析服務(wù)平臺(tái)建設(shè)[J/OL].情報(bào)科學(xué):1-15[2022-07-27].http://kns.cnki.net/kcms/detail/22.1264.g2.20220617.1845.034.html.

      作者簡(jiǎn)介:曹玲靜,女,中國科學(xué)院成都文獻(xiàn)情報(bào)中心、中國科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院圖書情報(bào)與檔案管理系博士研究生;張志強(qiáng),男,中國科學(xué)院成都文獻(xiàn)情報(bào)中心、中國科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院圖書情報(bào)與檔案管理系研究員,博士生導(dǎo)師。

      猜你喜歡
      文本分析
      基于AntConc軟件對(duì)小說《黑駿馬》的文本分析
      文教資料(2016年24期)2017-02-21 18:43:10
      投資者情緒短期對(duì)股票市場(chǎng)的影響研究
      維護(hù)正統(tǒng)還是觀念復(fù)辟?
      戲劇之家(2016年22期)2016-11-30 16:49:57
      德語小說《布登勃洛克一家》中的家文化與中國傳統(tǒng)家庭觀念比較
      文本情感計(jì)算系統(tǒng)“小菲”的設(shè)計(jì)及其在教育領(lǐng)域文本分析中的應(yīng)用
      我國地方紀(jì)錄片的出路研究
      初中英語聽說課教學(xué)實(shí)踐探索
      考試周刊(2016年45期)2016-06-24 13:48:11
      試論20世紀(jì)80年代與90年代電視劇《水滸傳》的創(chuàng)作
      經(jīng)合組織成員體教師隊(duì)伍現(xiàn)狀、特點(diǎn)及發(fā)展趨勢(shì)
      以符號(hào)矩陣?yán)碚摐\析《鬼魅丹青》
      沙河市| 定结县| 隆化县| 剑川县| 尼木县| 察雅县| 元江| 汽车| 新郑市| 双江| 奉化市| 平罗县| 云和县| 华坪县| 正蓝旗| 湖北省| 思茅市| 阿瓦提县| 大洼县| 泸溪县| 沂水县| 奉节县| 长寿区| 邯郸县| 郸城县| 江津市| 夹江县| 道真| 旅游| 福泉市| 廉江市| 年辖:市辖区| 虎林市| 永丰县| 黔西| 电白县| 阿拉善右旗| 武功县| 定安县| 杭锦旗| 登封市|