• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      網(wǎng)民眼中的政府反腐敗
      ——基于網(wǎng)絡(luò)爬蟲和結(jié)構(gòu)主題模型的分析(2012—2017)

      2020-05-04 07:13:50鄭崇明
      關(guān)鍵詞:社會(huì)公眾網(wǎng)民腐敗

      鄭崇明

      (深圳大學(xué) 城市治理研究院,廣東 深圳 518060)

      引 言

      黨的十八大以來(lái),中國(guó)廉政建設(shè)呈現(xiàn)出前所未有的反腐敗高壓態(tài)勢(shì)。據(jù)統(tǒng)計(jì),2013年至2019年9月,全國(guó)紀(jì)檢監(jiān)察機(jī)關(guān)共立案263.5萬(wàn)件,給予黨紀(jì)政紀(jì)處分245.7萬(wàn)人。(1)根據(jù)中紀(jì)委網(wǎng)站公布數(shù)據(jù)整理。2015年2月27日,習(xí)近平總書記在中央全面深化改革領(lǐng)導(dǎo)小組第十次會(huì)議上,首次提出讓人民群眾有更多獲得感的重大戰(zhàn)略思想;[1]2016年1月12日,在十八屆中央紀(jì)委六次全會(huì)上,習(xí)近平總書記提出了“讓正風(fēng)反腐給老百姓帶來(lái)更多獲得感”的黨風(fēng)廉政建設(shè)和反腐敗新理念;[2]2019年1月,習(xí)近平總書記在十九屆中央紀(jì)委三次全會(huì)上指出,要“著力處置群眾身邊的腐敗問題”[3]。習(xí)近平總書記的上述理念反映的是政府反腐敗與社會(huì)公眾評(píng)價(jià)之間的關(guān)系。換言之,社會(huì)公眾是政府廉政建設(shè)工作的評(píng)估主體,其評(píng)價(jià)結(jié)果的高低直接反映了社會(huì)公眾的反腐敗獲得感水平。從這個(gè)意義上講,反腐敗績(jī)效如何由社會(huì)公眾來(lái)準(zhǔn)確評(píng)價(jià)就成為研究的重要議題。

      由社會(huì)公眾評(píng)價(jià)反腐敗績(jī)效屬于反腐敗績(jī)效評(píng)價(jià)方式中的主觀評(píng)價(jià)方法范疇。在廉政研究的諸多文獻(xiàn)中,對(duì)政府反腐敗績(jī)效的主觀評(píng)價(jià)出現(xiàn)了“腐敗感知”“腐敗容忍度”“反腐敗效能感”等三種不同的概念和研究方向。最初,腐敗感知主要以專家和企業(yè)人士為研究主體,調(diào)查其對(duì)政府過(guò)去一年的腐敗程度認(rèn)知水平,比如透明國(guó)際的CPI指數(shù)。此后,陸續(xù)出現(xiàn)了基于某些國(guó)家和地區(qū)的腐敗感知研究(Belousova, Goel, Korhonen, 2016[4];ábelková, Hanousek, 2004[5]; León, Araa, de León, 2013[6]; Melgar, Rossi, 2009)[7],重點(diǎn)在于識(shí)別影響因素,提高公眾廉潔感知水平;腐敗容忍度則集中體現(xiàn)為社會(huì)公眾或公職人員對(duì)政府腐敗現(xiàn)象和程度的容忍程度或接納程度(公婷, 王世茹, 2012),[8]它反映的是歷史長(zhǎng)期累積和文化差異對(duì)個(gè)體腐敗認(rèn)知方面的影響;而反腐敗效能感則是社會(huì)公眾期望政府的反腐敗努力能夠減少他們對(duì)腐敗問題的擔(dān)憂并且使得社會(huì)更加清廉(Li, Gong, Xiao, 2016)。[9]

      不難發(fā)現(xiàn),上述三種主觀評(píng)價(jià)方法各自側(cè)重反腐敗績(jī)效的一個(gè)方面,僅能表明公眾不同程度的腐敗感知、腐敗容忍度和社會(huì)公眾對(duì)政府反腐敗努力期望的差異,難以揭示黨的十八大以來(lái),社會(huì)公眾對(duì)政府反腐敗工作的具體認(rèn)知狀況和討論內(nèi)容,即社會(huì)公眾對(duì)黨的十八大以來(lái)政府廉政建設(shè)討論了什么具體內(nèi)容?涉及到哪些主題?哪類主題占比較高以及可能的影響因素是什么?

      為回答上述問題,我們使用網(wǎng)絡(luò)爬蟲和自動(dòng)文本分析技術(shù),從新浪微博上獲取了所有有關(guān)2012年12月至2017年6月政府廉政建設(shè)的數(shù)據(jù)并加以分析。通過(guò)對(duì)該數(shù)據(jù)集進(jìn)行詞云和結(jié)構(gòu)主題模型分析,揭示網(wǎng)民對(duì)政府反腐敗績(jī)效的主觀評(píng)價(jià)內(nèi)容和認(rèn)知差異,從全新的維度對(duì)話反腐敗績(jī)效評(píng)價(jià)。

      對(duì)上述問題的研究可以彌補(bǔ)僅靠單一指標(biāo)衡量反腐敗工作的不足,真正做到中國(guó)政府的反腐敗工作由人民群眾自己評(píng)價(jià)。從公眾參與廉政建設(shè)的角度出發(fā),通過(guò)大數(shù)據(jù)的分析方法,獲取社會(huì)公眾反腐敗認(rèn)知的海量數(shù)據(jù),可以準(zhǔn)確識(shí)別和判斷社會(huì)公眾對(duì)中國(guó)廉政建設(shè)的期望和所關(guān)注的重點(diǎn)議題,從反腐敗工作的獲得感出發(fā),切實(shí)調(diào)整政府廉政建設(shè)的時(shí)間注意力分配。

      一、反腐敗績(jī)效研究文獻(xiàn)綜述

      如何評(píng)價(jià)反腐敗工作是擺在理論和實(shí)務(wù)工作者面前的重要議題。已有文獻(xiàn)主要運(yùn)用主觀和客觀兩種方法評(píng)價(jià)政府的反腐敗效果(過(guò)勇, 宋偉, 2016)。[10]一般來(lái)說(shuō),反腐敗工作的評(píng)價(jià)與腐敗規(guī)模的大小共生共存。換言之,對(duì)腐敗程度的測(cè)量是反腐敗工作評(píng)價(jià)的間接方式,而反腐敗工作的落腳點(diǎn)也在于衡量一個(gè)地區(qū)政府腐敗規(guī)模是否實(shí)質(zhì)性地降低,是否贏取了社會(huì)公眾對(duì)政府反腐敗工作的認(rèn)可。

      (一)反腐敗績(jī)效的主觀評(píng)價(jià):多維度測(cè)評(píng)時(shí)代

      腐敗感知是與反腐敗結(jié)果評(píng)價(jià)最為相關(guān)且發(fā)展時(shí)間較長(zhǎng)的概念。然而,已有文獻(xiàn)表明,完全依靠腐敗感知并不能有效評(píng)估政府的反腐敗工作。最為相關(guān)的是學(xué)者們采用量化研究的方法,系統(tǒng)檢驗(yàn)政府反腐敗力度與公眾清廉感知之間的關(guān)系,發(fā)現(xiàn)兩者之間存在著較大的不確定性。有研究指出,沒有經(jīng)驗(yàn)證據(jù)表明兩者之間存在著顯著的相關(guān)關(guān)系(倪星, 孫宗鋒, 2015),[11]即在縣區(qū)層面,似乎反腐敗力度的大小并不影響公眾的腐敗感知水平;然而,也有研究表明兩者之間存在著顯著的負(fù)相關(guān)關(guān)系(孫宗鋒, 楊麗天晴, 2016),[12]即在短期內(nèi),反腐敗力度加大會(huì)曝光大量腐敗信息,刷新民眾對(duì)腐敗認(rèn)知的底線,反而不利于社會(huì)公眾的政府清廉感知水平的提高。此外,有相當(dāng)一部分學(xué)者系統(tǒng)檢驗(yàn)了腐敗感知的影響因素,發(fā)現(xiàn)宏觀層面的制度和文化差異與微觀個(gè)體層面的因素共同導(dǎo)致了腐敗感知的差異。具體來(lái)說(shuō),宏觀層面的制度包括法律法規(guī)(La Porta, Lopez-de-Silanes, Shleifer, Vishny, 1999)[13]、政治民主(Brunetti, Kisunko, Weder, 1998;[14]Diamond, Plattner, 1996[15])、經(jīng)濟(jì)發(fā)展(李輝, 唐敏, 2015)[16]等。文化層面的影響因素有宗教信仰(Persily, Lammie, 2004)[17]、腐敗容忍度(倪星, 2017;[18]肖漢宇, 公婷, 2016[19])等;微觀個(gè)體層面包括官方媒體的使用和小道消息(Zhu, Lu, Shi, 2013)[20]、腐敗經(jīng)歷(Rose, Mishler, 2010)[21]等??梢姡瘮「兄@一概念受到諸多因素的影響,并且與政府反腐敗力度之間的關(guān)系呈現(xiàn)出復(fù)雜的圖景。單純的腐敗感知并不能準(zhǔn)確地顯示出腐敗減少與否,也不能完全反映反腐敗績(jī)效的高低。

      由于腐敗感知受到諸多因素影響,容易產(chǎn)生偏誤。因此,一些學(xué)者主張應(yīng)當(dāng)考察反腐敗滿意度,提出用反腐敗效能感來(lái)反映當(dāng)前社會(huì)公眾對(duì)政府反腐敗效果的主觀評(píng)價(jià)(Lili,2016)。[22]政府反腐敗效能感越強(qiáng)意味著社會(huì)公眾感覺到政府反腐敗政策的執(zhí)行更加有效。研究發(fā)現(xiàn),個(gè)體的收入不公平感顯著影響社會(huì)公眾的反腐敗效能感差異。類似地,國(guó)家統(tǒng)計(jì)局也開展了相關(guān)調(diào)查,主要調(diào)查受訪者對(duì)國(guó)家反腐敗工作的滿意度評(píng)價(jià)水平。2015年民意調(diào)查顯示,91.5%的群眾對(duì)黨風(fēng)廉政建設(shè)和反腐敗工作成效表示滿意,比2012年提高16.5個(gè)百分點(diǎn);90.7%的群眾對(duì)遏制腐敗現(xiàn)象表示有信心,比2012年提高11.4個(gè)百分點(diǎn);90.6%的群眾認(rèn)為當(dāng)前違紀(jì)違法案件高發(fā)勢(shì)頭得到遏制,比2012年提高5.2個(gè)百分點(diǎn),均創(chuàng)新高。[23]

      除此之外,學(xué)者們重點(diǎn)關(guān)注腐敗研究的文化維度,并體現(xiàn)為對(duì)腐敗容忍度差異的研究。已有研究指出,腐敗容忍度意味著公眾對(duì)腐敗現(xiàn)象的“包容”程度,顯示了人們對(duì)公職人員違規(guī)行為的接受限度(公婷, 王世茹, 2012)。[8]換言之,腐敗容忍度是反腐敗制度建設(shè)的重要社會(huì)土壤,當(dāng)腐敗容忍度較低時(shí),民眾的反腐敗決心和參與的意愿都會(huì)較高,有利于形成全社會(huì)的腐敗零容忍態(tài)度。同時(shí),腐敗容忍度還會(huì)顯著影響公眾對(duì)政府腐敗程度的認(rèn)知差異(倪星, 孫宗鋒, 2015)。[11]當(dāng)腐敗容忍度較高時(shí),人們會(huì)對(duì)小規(guī)模的政府腐敗采取默許和想當(dāng)然的態(tài)度,因而不利于政府清廉水平的提升。

      然而,無(wú)論是反腐敗效能感、腐敗容忍度還是反腐敗滿意度的調(diào)查,均反映的是社會(huì)公眾對(duì)廉政建設(shè)評(píng)估的一個(gè)維度,無(wú)法了解公眾對(duì)政府廉政建設(shè)討論了什么具體內(nèi)容、涉及哪些主題、哪些主題占比較高以及可能的影響因素。

      (二)實(shí)踐探索:指標(biāo)多元化時(shí)代

      與理論探討同時(shí)開展的是各地區(qū)反腐敗績(jī)效評(píng)價(jià)的實(shí)踐探索。1999年,韓國(guó)首爾市政府開發(fā)了一套“反腐敗指數(shù)”(2)該指數(shù)包含反腐敗認(rèn)知指數(shù)和反腐敗努力指數(shù)。,用來(lái)評(píng)估市政府各行政單位的廉潔程度;臺(tái)灣地區(qū)“法務(wù)部”開展了“臺(tái)灣地區(qū)公眾對(duì)政府廉政主觀指標(biāo)與廉政政策評(píng)價(jià)”的調(diào)查(余致力, 2011);[24]香港廉政公署通過(guò)問卷調(diào)查方式,廣泛收集不同社會(huì)群體的反腐敗認(rèn)知態(tài)度,推動(dòng)香港廉政建設(shè)和反腐敗工作。[25]

      山東省淄博市出臺(tái)了建立廉政指標(biāo)體系的意見,共13項(xiàng)腐敗控制指數(shù)和12項(xiàng)公眾感知指數(shù),廉政指標(biāo)體系的建立,改變了過(guò)去對(duì)反腐倡廉建設(shè)評(píng)價(jià)客觀性不足、說(shuō)服力不強(qiáng)的狀況,成為加強(qiáng)各部門黨風(fēng)廉政建設(shè)工作指導(dǎo)、推進(jìn)全市反腐倡廉建設(shè)的有力抓手;[26]安徽省紀(jì)委(2002)構(gòu)建了“安徽省反腐倡廉工作綜合評(píng)價(jià)系統(tǒng)”[27],該評(píng)價(jià)系統(tǒng)分為目標(biāo)測(cè)度系統(tǒng)和民意調(diào)查系統(tǒng);河南省紀(jì)委提出了以工作作風(fēng)、依法行政、廉潔從政、廉政效能四個(gè)維度為一級(jí)指標(biāo)的評(píng)價(jià)指標(biāo)體系;廣州市“廉潔廣州”建設(shè)領(lǐng)導(dǎo)小組構(gòu)建了以廉潔清明政治、廉潔誠(chéng)信市場(chǎng)、廉潔文化、廉潔公平社會(huì)、廉潔城區(qū)建設(shè)五個(gè)維度為一級(jí)指標(biāo)的評(píng)價(jià)指標(biāo)體系。這些指標(biāo)體系的構(gòu)建對(duì)于提高反腐工作的科學(xué)性起到了重要推動(dòng)作用,體現(xiàn)了各地方政府廉政建設(shè)的特色,實(shí)現(xiàn)了指標(biāo)設(shè)計(jì)的本土化,具有重要的現(xiàn)實(shí)意義。

      但這些指標(biāo)體系將腐敗與反腐敗、主觀與客觀指標(biāo)混合到一起,使得評(píng)估結(jié)果混雜無(wú)序,更無(wú)法準(zhǔn)確解讀結(jié)果所反映的具體方向。雖然有學(xué)者(過(guò)勇, 2017)[28]主張反腐敗績(jī)效評(píng)估體系的設(shè)計(jì)不應(yīng)局限在采用簡(jiǎn)單的腐敗感知來(lái)評(píng)價(jià)中國(guó)社會(huì)的反腐敗成效,而應(yīng)從腐敗程度、反腐敗強(qiáng)度和腐敗風(fēng)險(xiǎn)三個(gè)角度入手,但是將多種指標(biāo)融合到一起的風(fēng)險(xiǎn)可能使反腐敗效果的可解讀性更弱。

      由于腐敗感知會(huì)降低人們對(duì)政府的信任度(Kim, 2010),[29]影響政權(quán)合法性(Seligson, 2002),[30]因此政府反腐敗績(jī)效的評(píng)價(jià)顯得至關(guān)重要。事實(shí)上,自黨的十八大以來(lái),政府反腐敗工作確實(shí)得到了社會(huì)各界的廣泛關(guān)注,尤其是負(fù)責(zé)廉政建設(shè)的各級(jí)紀(jì)委監(jiān)察部門。

      (三)主觀評(píng)估的必要性和不足

      由上述文獻(xiàn)分析可知,反腐敗績(jī)效的主觀評(píng)價(jià)結(jié)果反映了公眾、專家、媒體等各方主體對(duì)政府廉政建設(shè)的觀點(diǎn)和看法。相比客觀的統(tǒng)計(jì)數(shù)據(jù),如官員違紀(jì)違法案例數(shù)、反腐敗機(jī)構(gòu)的廉政教育次數(shù)、制度建設(shè)和監(jiān)督保障機(jī)制等,主觀評(píng)估的結(jié)果更能體現(xiàn)社會(huì)公眾對(duì)政府廉政建設(shè)的關(guān)切水平,尤其是在黨的十八大以來(lái)的反腐背景下更為凸顯。另外,社會(huì)公眾對(duì)政府高壓反腐帶來(lái)的非預(yù)期的后果,即官員腐敗信息在較短期內(nèi)呈現(xiàn)出爆炸式的曝光如何評(píng)價(jià)同樣值得關(guān)注。已有研究表明,單一指標(biāo)衡量反腐敗績(jī)效會(huì)在短期內(nèi)產(chǎn)生與預(yù)期結(jié)論相反的結(jié)果(孫宗鋒, 楊麗天晴, 2016)。[12]如果將分析內(nèi)容轉(zhuǎn)變?yōu)樯鐣?huì)公眾對(duì)反腐敗認(rèn)知的分析,改變過(guò)去的指數(shù)化模式,則可能實(shí)現(xiàn)由社會(huì)公眾來(lái)評(píng)價(jià)反腐敗績(jī)效的目標(biāo)。然而,已有研究在這方面的關(guān)注卻并不多見。Zhu等使用5家網(wǎng)站數(shù)據(jù)(3)騰訊、搜狐、新浪、鳳凰和財(cái)新網(wǎng)。研究網(wǎng)民對(duì)反腐敗運(yùn)動(dòng)的情感態(tài)度認(rèn)知,并發(fā)現(xiàn)9大評(píng)論的分類(Zhu, Huang, Zhang, 2017)。[31]這對(duì)我們?cè)诜锤瘮☆I(lǐng)域使用大數(shù)據(jù)方法研究社會(huì)公眾的反腐敗情感差異具有啟發(fā)性。

      二、文本分析技術(shù)與模型設(shè)計(jì)

      為解決上述問題,我們采用基于Python語(yǔ)言的網(wǎng)絡(luò)爬蟲技術(shù)和基于R語(yǔ)言的結(jié)構(gòu)主體模型(STM,Structural Topic Model)。前者在網(wǎng)頁(yè)數(shù)據(jù)的獲取上存在著比較優(yōu)勢(shì),后者在自動(dòng)文本分析上略勝一籌。我們通過(guò)設(shè)計(jì)編程語(yǔ)言,從新浪微博上爬取了網(wǎng)民對(duì)2012年12月至2017年6月這一時(shí)間段所有有關(guān)政府反腐敗方面的討論帖子。

      據(jù)統(tǒng)計(jì),截至2017年6月,中國(guó)網(wǎng)民規(guī)模達(dá)7.51億,互聯(lián)網(wǎng)普及率為54.3%;手機(jī)網(wǎng)民規(guī)模達(dá)7.24億,移動(dòng)互聯(lián)網(wǎng)已滲透到人們生活的方方面面。(4)資料來(lái)源:中國(guó)互聯(lián)網(wǎng)信息中心發(fā)布的《中國(guó)互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》。眾所周知,新浪微博是中國(guó)社會(huì)最大的社交網(wǎng)絡(luò)平臺(tái),該平臺(tái)在2012年便擁有注冊(cè)用戶超過(guò)5億。2017年6月的月活躍用戶數(shù)(MAUs)為3.61億,較上年同期增長(zhǎng)28%,其中92%為移動(dòng)端用戶。2017年6月的日均活躍用戶數(shù)(DAUs)為1.59億,較上年同期增長(zhǎng)26%。盡管有研究指出,新浪微博存在著刪帖的現(xiàn)象(King, Pan, Roberts, 2014),[32]但它仍是最能反應(yīng)當(dāng)前網(wǎng)民討論社會(huì)熱點(diǎn)問題的重要平臺(tái)。事實(shí)上,新浪微博的數(shù)據(jù)挖掘和分析在眾多研究中均有所體現(xiàn)(Tong, Zuo, 2014)。[33]本文的基本前提假設(shè)是新浪微博的數(shù)據(jù)可以反映黨的十八大以來(lái)網(wǎng)民對(duì)政府廉政建設(shè)的認(rèn)知狀況和討論話題的差異。

      在這一前提下,我們使用目前大數(shù)據(jù)算法常用的自動(dòng)文本分析技術(shù),開展網(wǎng)民對(duì)政府反腐敗認(rèn)知差異的研究。從本質(zhì)上看,圖像是模糊的非結(jié)構(gòu)化數(shù)據(jù),而文字則屬于一種半結(jié)構(gòu)化的數(shù)據(jù)類型,即我們所知的語(yǔ)言。語(yǔ)言之中包含了有關(guān)其自身的信息。新浪微博用戶發(fā)表的有關(guān)政府反腐敗方面的帖子在很大程度上反映了當(dāng)前網(wǎng)民的認(rèn)知態(tài)度和情感取向。而主題模型則是在眾多文檔中提取主要內(nèi)容的重要方法,其常用的算法為詞袋法(Bag of Words),即它認(rèn)為一篇文檔是由一組詞構(gòu)成的一個(gè)集合,詞與詞之間沒有順序以及先后的關(guān)系。一篇文檔可以包含多個(gè)主題,文檔中每一個(gè)詞都由其中的一個(gè)主題生成。在此基礎(chǔ)上,相關(guān)主題模型和結(jié)構(gòu)主題模型等眾多模型得以產(chǎn)生。結(jié)構(gòu)主題模型允許用戶整合元數(shù)據(jù)(Metadata)進(jìn)入到主題建模中去,其主要目的是允許研究者發(fā)現(xiàn)主題并估計(jì)主題和文檔之間的關(guān)系。

      為此,本文在微博上按照關(guān)鍵詞搜尋的辦法,進(jìn)行相關(guān)主題搜索,形成本文要分析的數(shù)據(jù)集。同時(shí),通過(guò)結(jié)構(gòu)主題模型,迅速識(shí)別所有微博帖子關(guān)于反腐敗討論的內(nèi)容。具體而言,網(wǎng)民討論反腐敗包含哪些主題、各自占比多少、受哪些因素影響,等等。一般而言,我們主張主題占比會(huì)在人口統(tǒng)計(jì)學(xué)變量如性別上存在顯著差異。此外,微博用戶因?yàn)槠潢P(guān)注者的多寡會(huì)對(duì)網(wǎng)絡(luò)輿論走向產(chǎn)生不同影響。換言之,用戶關(guān)注者多,說(shuō)明其輿論影響力大,也即經(jīng)常出現(xiàn)在媒體面前的“大V”。因此,文章試圖檢驗(yàn)用戶影響力的大小與不同主題占比之間的關(guān)系。

      三、數(shù)據(jù)收集與研究發(fā)現(xiàn)

      (一)數(shù)據(jù)收集

      已有關(guān)于腐敗問題的實(shí)證研究主要基于問卷調(diào)查和典型案例的方法。問卷調(diào)查雖然具有代表性和可推性,但數(shù)據(jù)的收集和處理不夠靈活,并且在實(shí)際的操作過(guò)程中極易存在抽樣偏誤的問題;而個(gè)案訪談雖然可以對(duì)典型案例進(jìn)行深度挖掘,但是難以實(shí)現(xiàn)因果推斷。相反,大數(shù)據(jù)方法自其產(chǎn)生之初便標(biāo)榜能獲取要分析的海量數(shù)據(jù)和多樣化的變量(Diebold, 2012;[34]維克托·邁爾-舍恩伯格,肯尼思·庫(kù)克耶, 2013[35]),因而成為本文分析方法的首選。我們分別以“十八大反腐敗”“打老虎拍蒼蠅”“習(xí)近平反腐”“廉政”“中央反腐”“基層反腐敗”為關(guān)鍵詞進(jìn)行搜索,爬取了2012年12月至2017年6月所有新浪微博討論內(nèi)容,形成了一個(gè)包含7 836個(gè)微博原創(chuàng)發(fā)帖的數(shù)據(jù)集。

      (二)研究方法

      由于本文的數(shù)據(jù)均為文本格式,意味著傳統(tǒng)的統(tǒng)計(jì)模型難以滿足本研究需求。隨著自然語(yǔ)言處理技術(shù)的進(jìn)步和文本分析方法的成熟,對(duì)海量數(shù)據(jù)實(shí)現(xiàn)自動(dòng)文本分析已經(jīng)成為可能。結(jié)構(gòu)主題模型的出現(xiàn)極大地方便了眾多研究者開展文本分析(Roberts, Stewart, Tingley, 2014[36]; Roberts, Stewart, Tingley, 2014[34])。結(jié)構(gòu)主題模型能夠?qū)A课谋具M(jìn)行自動(dòng)文本主題識(shí)別和主題影響因素分析,為詳細(xì)闡釋網(wǎng)民對(duì)反腐敗的認(rèn)知和評(píng)價(jià)狀態(tài)提供了技術(shù)支持。

      (三)總體描述

      通過(guò)R語(yǔ)言的自動(dòng)文本分析程序包,我們首先對(duì)7 836條微博進(jìn)行基本整理,然后用segmentCN包對(duì)所有文本進(jìn)行分詞,并采用常用漢字停用詞表,去掉一些沒有意義的字詞,如“那么”“但是”“此外”等。在對(duì)分詞后的文本進(jìn)行去掉數(shù)字和字母以及一些網(wǎng)址等信息后,最終形成本文要分析的語(yǔ)料庫(kù)。為了直觀展示所有微博帖子可能的反腐敗評(píng)論的內(nèi)容,我們繪制了詞云圖,如圖1所示。

      圖1 7 836條微博對(duì)2013年以來(lái)反腐敗工作的討論內(nèi)容

      2012年12月中央出臺(tái)八項(xiàng)規(guī)定以來(lái),中紀(jì)委堅(jiān)持“老虎”“蒼蠅”一起打的反腐敗方針,形成了空前的反腐敗高壓態(tài)勢(shì);2015年十八屆中紀(jì)委五次全會(huì)明確指出,要繼續(xù)保持反腐敗高壓態(tài)勢(shì)不放松、堅(jiān)決遏制腐敗蔓延勢(shì)頭;[38]2016年中紀(jì)委六次全會(huì)要求全面從嚴(yán)治黨、加強(qiáng)黨內(nèi)監(jiān)督,[2]同年6月通過(guò)了《中國(guó)共產(chǎn)黨問責(zé)條例》;2019年1月11日,習(xí)近平總書記在十九屆中央紀(jì)律檢查委員會(huì)第三次全體會(huì)議上發(fā)表講話指出,要深化運(yùn)用監(jiān)督執(zhí)紀(jì)“四種形態(tài)”,奪取反腐敗斗爭(zhēng)壓倒性勝利,著力懲治群眾身邊的腐敗問題,完善黨和國(guó)家監(jiān)督體系等,以問責(zé)倒逼責(zé)任落實(shí),推動(dòng)管黨治黨走向嚴(yán)緊硬。[3]研究發(fā)現(xiàn),黨的十八大以來(lái),網(wǎng)民對(duì)腐敗和反腐敗工作進(jìn)行了熱烈的討論,并且在眾多的詞匯中,討論廉政建設(shè)時(shí)用到的高頻詞匯一般包括“廉政”“腐敗”“黨風(fēng)廉政建設(shè)”“干部”“清風(fēng)”和“教育”等。其中,也包含“貪官”“違紀(jì)”“中央”“紀(jì)委”“打老虎”等內(nèi)容。這說(shuō)明網(wǎng)民對(duì)政府反腐敗工作的討論與中紀(jì)委和各省紀(jì)委近些年的反腐敗工作重點(diǎn)具有高度的契合性。然而,上述內(nèi)容雖然可以讓讀者總體上把握過(guò)去三年微博用戶所發(fā)有關(guān)反腐敗帖子的主要內(nèi)容,但卻并不能展示所有帖子討論的主題、各自占比以及可能的影響因素。

      近幾年興起的結(jié)構(gòu)主題模型(Structural Topic Model,簡(jiǎn)稱STM),不僅可以識(shí)別海量文本中的主題,也可以發(fā)現(xiàn)影響主題占比和主題內(nèi)容的因素。所謂主題占比(Topic Prevalence)是指各主題在所有文本中所占比重,占比越高,代表主題被討論的可能性越高,而主題內(nèi)容(Topic Content)是指某一主題之下,有哪些關(guān)鍵詞語(yǔ)作為支撐。

      (四)主題占比

      如圖2所示,經(jīng)過(guò)結(jié)構(gòu)主題建模分析,在20個(gè)主題中,“中國(guó)-官場(chǎng)-大地震”占比最高,約為所有主題的10%。這意味著自黨的十八大以來(lái),微博用戶對(duì)中國(guó)反腐敗發(fā)表最多的評(píng)論是“官場(chǎng)大地震”,表明網(wǎng)民對(duì)政府反腐敗的力度和決心之大表示震驚,同時(shí)也彰顯了中國(guó)共產(chǎn)黨以零容忍度的態(tài)度面對(duì)各種形式的腐敗,堅(jiān)決懲治腐敗行為、遏制腐敗現(xiàn)象的決心和行動(dòng)。此外,對(duì)中國(guó)的反腐敗,網(wǎng)民還討論了縣級(jí)官員廉政問題、廉潔教育問題、黨風(fēng)廉政建設(shè)制度推進(jìn)問題、反腐敗責(zé)任落實(shí)與監(jiān)督問題、腐敗案件與犯罪問題、聚焦人民群眾反腐敗問題、基層廉政建設(shè)的問題、中央巡視黨紀(jì)維護(hù)問題、社區(qū)廉潔活動(dòng)建設(shè)問題、紀(jì)檢監(jiān)察機(jī)關(guān)廉政建設(shè)問題、中央巡視組“打老虎”問題等。

      上述議題的討論表明,網(wǎng)民對(duì)廉政建設(shè)保持了較高的熱情和參與積極性。2003年聯(lián)合國(guó)大會(huì)通過(guò)了《聯(lián)合國(guó)反腐敗公約》(下文簡(jiǎn)稱“反腐公約”),為各國(guó)反腐敗提供了國(guó)際標(biāo)準(zhǔn)原則和政策目標(biāo)。聯(lián)合國(guó)反腐公約在吸收各區(qū)域性反腐公約的基礎(chǔ)上,進(jìn)一步強(qiáng)調(diào)了社會(huì)參與反腐敗的重要性,敦促各國(guó)推動(dòng)社會(huì)參與,把社會(huì)參與作為預(yù)防腐敗機(jī)制的重要環(huán)節(jié),并作為一項(xiàng)國(guó)家應(yīng)盡的義務(wù)(王雪梅, 2009)。[39]

      圖2 各主題占比注:topic代表主題。

      另外,在數(shù)據(jù)爬取時(shí),我們不僅獲取了網(wǎng)民微博討論的內(nèi)容,還獲取了網(wǎng)民的性別和微博賬戶的影響力(5)影響力用該微博用戶的關(guān)注者數(shù)量多少來(lái)衡量。關(guān)注的數(shù)量越多,代表其影響力越大。等信息。結(jié)構(gòu)主題模型的優(yōu)勢(shì)在于,其可以提供協(xié)變量對(duì)各主題占比影響的分析。為檢驗(yàn)各主題占比是否受到性別的影響,我們把主題占比作為因變量,性別作自變量進(jìn)行了分析,分析結(jié)果如圖3所示。

      與女性相比,發(fā)現(xiàn)主題1、主題9和主題18的占比,男性要分別顯著高0.025、0.1和0.02左右。而與女性相比,主題7、8、10、11、12、13和15的占比,男性顯著低。

      為進(jìn)一步探究主題占比可能的影響因素,我們同時(shí)以性別和微博影響力作為解釋變量,微博主題占比為因變量,建立統(tǒng)計(jì)回歸模型,分析結(jié)果如表1所示。

      表1所示的主題占比影響因素模型表明,性別和微博影響力兩個(gè)變量顯著影響反腐敗主題占比。

      圖3 主題占比男女之間差異注:0.00左側(cè)代表女性,0.00右側(cè)代表男性。

      表1 主題占比影響因素分析

      注:***0.001,**0.01,*0.05。

      具體而言,與女性相比,男性在主題2和9上占比顯著較高,而在主題7、8、10、11、12、13、15和18上占比顯著較低。在主題1、3、4、5、6、16、17、19和20上,男女之間并無(wú)顯著差異。

      在主題1、3、4、5、6、8、11、13、14、16、17和18上,隨著微博影響力越來(lái)越大,主題占比也顯著增加;相反,在主題2、7、9、10、12、15和20上,隨著微博影響力的逐漸增大,主題占比顯著提升。

      (五)主題內(nèi)容

      主題內(nèi)容不僅反映了網(wǎng)民對(duì)政府反腐敗的認(rèn)識(shí),還體現(xiàn)了網(wǎng)民對(duì)政府反腐敗的注意力分配。按照主題占比前4位的標(biāo)準(zhǔn)顯示主題內(nèi)容,結(jié)果如圖4所示。

      圖4 主題內(nèi)容(占比前4)注:左上為主題9,右上為主題18,左下為主題1,右下為主題11。

      不難發(fā)現(xiàn),主題9的主題占比最高。這表明主題9除了說(shuō)明了“中國(guó)官場(chǎng)-大地震”以外,還有“習(xí)大大-中紀(jì)委巡視組-打老虎-反腐風(fēng)暴”等內(nèi)容,直接表明了反腐敗力度之大前所未有,反腐敗決心之不動(dòng)搖,前所未有;主體18為“廉政文化”主題,其內(nèi)容更多的包含了“黨風(fēng)廉政建設(shè)-社會(huì)主義-人人-心聲”等;主題1為“廉政教育”,具體包含“廉潔-家庭-提醒”等內(nèi)容;而主題11則是廉政建設(shè)部署工作,具體體現(xiàn)為“書記-召開-貫徹-會(huì)議-精神”等內(nèi)容。

      此外,由于男女差異,可能對(duì)主題內(nèi)容產(chǎn)生一定影響。因此,以主題6為例,我們做了進(jìn)一步的分析,具體如圖5所示。

      圖5 男女主題6內(nèi)容對(duì)比注:f代表女性,m代表男性,topic為主題。

      圖5表明,在主題6上,男女之間的詞語(yǔ)使用上存在明顯差異。左側(cè)紅色字體為女性常用詞,分別為“黨委-班子-機(jī)構(gòu)-職能”等詞匯,而右側(cè)藍(lán)色字體則為男性常用詞匯,包含了“黨風(fēng)廉政建設(shè)-紀(jì)委-責(zé)任-落實(shí)”等內(nèi)容。

      此外,我們還分析了不同主題間的詞匯差異,如圖6所示,發(fā)現(xiàn)主題12更多使用了“腐敗-案件-犯罪-問題”等詞匯,而主題14則更多使用了“黨風(fēng)廉政建設(shè)-政治-制度-執(zhí)紀(jì)問責(zé)”等詞匯。

      圖6 主題12和主題14內(nèi)容對(duì)比

      結(jié)論與討論

      本文以2012年12月至2017年6月所有新浪微博涉及到的反腐敗方面的帖子作為分析對(duì)象,采用自動(dòng)文本分析和結(jié)構(gòu)主題模型方法識(shí)別出20個(gè)主題。研究發(fā)現(xiàn),當(dāng)前網(wǎng)民對(duì)反腐敗工作保持了較高的參與熱情,網(wǎng)民討論的主題與黨的十八大以來(lái)的廉政建設(shè)工作具有較高的一致性,各主題的占比受到微博用戶的性別和微博影響力的顯著影響,從而拓展了社會(huì)反腐的研究深度。

      從委托代理的角度來(lái)看,腐敗源于代理人對(duì)委托人公權(quán)力的濫用。沿著這一思路,形成了國(guó)家中心主義和社會(huì)中心主義兩種反腐敗模式,其中社會(huì)中心主義的反腐敗模式強(qiáng)調(diào)營(yíng)造良好的社會(huì)氛圍,杜絕腐敗滋生的土壤。由此人們開始圍繞社會(huì)反腐敗進(jìn)行了深入的研究,為社會(huì)反腐敗的知識(shí)增長(zhǎng)積累了豐富的文獻(xiàn),因而具有重要的理論和現(xiàn)實(shí)意義。然而,社會(huì)反腐敗研究的不足也非常明顯,即通過(guò)腐敗感知、反腐敗效能感知、腐敗容忍度等難以更加深入地評(píng)價(jià)政府反腐敗績(jī)效。正是在這個(gè)意義上,本文聚焦社會(huì)公眾度對(duì)政府反腐敗工作的具體認(rèn)識(shí)狀況和討論內(nèi)容,使得社會(huì)公眾度對(duì)政府反腐敗內(nèi)容的評(píng)價(jià)更加具體,從而豐富了社會(huì)中心主義的反腐敗內(nèi)容。

      此外,把大數(shù)據(jù)運(yùn)用到反腐敗研究領(lǐng)域也是對(duì)研究方法的一種創(chuàng)新。通過(guò)數(shù)據(jù)爬取、數(shù)據(jù)處理、自動(dòng)文本分析、結(jié)構(gòu)主題建模等方法,實(shí)現(xiàn)了對(duì)海量數(shù)據(jù)的降維處理,通過(guò)網(wǎng)絡(luò)爬蟲獲取大數(shù)據(jù)的方法克服了傳統(tǒng)依靠調(diào)查數(shù)據(jù)進(jìn)行分析的弊端,即主觀調(diào)查本身具有滯后性和偏誤性,因而能夠更加全方位地反映網(wǎng)民對(duì)反腐敗認(rèn)知的全貌。在公共管理實(shí)踐領(lǐng)域,也為政府反腐敗績(jī)效的主觀評(píng)價(jià)提供了一種新思路,表現(xiàn)為對(duì)數(shù)據(jù)的分析擺脫過(guò)去僅依靠數(shù)值型數(shù)值的局限,可以采用半結(jié)構(gòu)化的數(shù)據(jù)-海量文本-進(jìn)行政府績(jī)效的評(píng)估。

      猜你喜歡
      社會(huì)公眾網(wǎng)民腐敗
      努力給社會(huì)公眾求證事情的真相——以金華晚報(bào)《求證》欄目為例
      “群體失語(yǔ)”需要警惕——“為官不言”也是腐敗
      網(wǎng)民低齡化 “小網(wǎng)蟲”的明天誰(shuí)來(lái)守護(hù)
      遵義(2018年20期)2018-10-19 07:15:06
      有關(guān)公路,網(wǎng)民有話說(shuō)
      社會(huì)公眾二孩生育影響因素研究綜述:2003—2015
      社會(huì)公眾追究政府生態(tài)責(zé)任的角色定位
      腐敗,往往由細(xì)微處開始……
      國(guó)外警察腐敗控制與啟示
      社會(huì)公眾視閾下的政府購(gòu)買公共服務(wù)研究——基于武漢市的調(diào)查
      有感“網(wǎng)民節(jié)”
      丽水市| 富川| 郑州市| 永川市| 木兰县| 霍城县| 寿宁县| 灵丘县| 绥宁县| 江源县| 玉溪市| 漯河市| 平罗县| 郯城县| 临沂市| 陆河县| 中超| 巍山| 周口市| 长泰县| 华阴市| 沾化县| 北票市| 山西省| 和田县| 泗水县| 灵寿县| 朔州市| 奇台县| 无棣县| 从江县| 漳浦县| 高州市| 海兴县| 资兴市| 阿克陶县| 龙井市| 神农架林区| 临沂市| 宁乡县| 尼木县|