譚星 盧思遠(yuǎn) 郭泉
摘 要:武漢市憑借著豐富的經(jīng)驗(yàn)有效地控制住疫情,對(duì)于社區(qū)治理方面的研究熱點(diǎn)久居不下,在該背景下,把握文本信息并對(duì)當(dāng)前武漢市社區(qū)治理的趨勢(shì)和需求分析顯得尤為重要。本文采用改進(jìn)的TF-IDF算法和語(yǔ)義網(wǎng)絡(luò)從政策信息和居民動(dòng)態(tài)兩個(gè)方面的文本信息進(jìn)行了趨勢(shì)和需求分析,最后從基層治理、技術(shù)創(chuàng)新和人才引進(jìn)三個(gè)角度給出建議。
關(guān)鍵詞:社區(qū)治理;改進(jìn)的TF-IDF;語(yǔ)義網(wǎng)絡(luò);文本分析
中圖分類號(hào):F2 文獻(xiàn)標(biāo)識(shí)碼:Adoi:10.19311/j.cnki.16723198.2022.18.007
0 引言
憑借著豐富的突發(fā)事件處理經(jīng)驗(yàn),新冠疫情在我國(guó)得到有效控制,我國(guó)也逐步進(jìn)入后疫情時(shí)代。而疫情的爆發(fā)導(dǎo)致大量的社會(huì)問題和公共服務(wù)需求下沉到社區(qū)這一層面,社區(qū)不得不承接自上而下轉(zhuǎn)移的諸多問題。社區(qū)是社會(huì)治理的重要載體,治理體制的完善已成為政府的關(guān)鍵工作。體制的完善又與政策的變化和實(shí)際治理現(xiàn)狀相關(guān)聯(lián)。黨的十九大報(bào)告明確指出:“加強(qiáng)社區(qū)治理體系建設(shè),推動(dòng)社會(huì)治理重心向基層下移”。依托多元化的治理模式與主體,城市的社區(qū)治理通過多方合作化的形式來提升公共服務(wù)質(zhì)量。
公共治理的技術(shù)化已成為現(xiàn)代國(guó)家治理的重要趨勢(shì)之一,社區(qū)治理的一系列問題都需要通過定量或定性分析得出。馬晗從發(fā)展脈絡(luò)、合作網(wǎng)絡(luò)等角度對(duì)近年來社區(qū)治理的有關(guān)文獻(xiàn)進(jìn)行研究,得出研究規(guī)范但合作網(wǎng)絡(luò)較弱的結(jié)論。Yao Lili采用基于定量數(shù)據(jù)的案例研究方法,測(cè)試了用戶在線參與和社區(qū)治理感知互動(dòng)的理論。滕方煒根據(jù)傳播學(xué)的原理解釋了基層社會(huì)治理現(xiàn)代化的時(shí)代邏輯與路徑選擇。在趨勢(shì)與需求分析中,大多數(shù)研究針對(duì)的是指標(biāo)類數(shù)據(jù)而忽略了文本信息對(duì)其的影響。本文通過文本分析手段對(duì)政策信息和居民動(dòng)態(tài)兩個(gè)角度進(jìn)行深入挖掘,并分析當(dāng)前武漢市社區(qū)治理的趨勢(shì)與需求。
1 研究設(shè)計(jì)
待分析的有兩方面內(nèi)容:一是社區(qū)治理的趨勢(shì);二是社區(qū)治理的需求。對(duì)于趨勢(shì)的分析,可采用關(guān)鍵詞提取算法針對(duì)工作報(bào)告、意見等政策類文本進(jìn)行關(guān)鍵詞挖取;對(duì)于需求的探究,可采用語(yǔ)義網(wǎng)絡(luò)對(duì)社交平臺(tái)上武漢市社區(qū)居民發(fā)布的動(dòng)態(tài)進(jìn)行網(wǎng)絡(luò)分析。
1.1 數(shù)據(jù)來源與處理
本文所分析的全部為文本型數(shù)據(jù)。其中,趨勢(shì)分析的數(shù)據(jù)來源于武漢市民政局官網(wǎng)(mzj.wuhan.gov.cn),在該官網(wǎng)中采集的數(shù)據(jù)具體為:武漢市2012-2021年政府工作報(bào)告、政府公開的政策與意見和關(guān)注度較高的新聞。需求分析的數(shù)據(jù)來源于各個(gè)社區(qū)用戶微博、知乎等社交平臺(tái)的動(dòng)態(tài)正文(不包括評(píng)論與回復(fù))。文本信息的檢索詞設(shè)定為社區(qū)治理、基層治理,數(shù)據(jù)采集時(shí)間為2022年2月10日。
通過Python的Scrapy框架,給定不同的初始網(wǎng)址,可以較快速的抓取所需數(shù)據(jù),之后進(jìn)行預(yù)處理,包括機(jī)械壓縮、無效內(nèi)容去除、構(gòu)建停用詞典等,最終獲取的有效信息情況如表1所示。
1.2 分析方法
1.2.1 改進(jìn)的TF-IDF算法
TF-IDF是一種較為有效的關(guān)鍵詞提取算法,它是根據(jù)詞頻與逆文本頻率的大小來綜合判斷某個(gè)詞的重要程度,在政治論述類文章里詞頻的大小往往反映重要性程度,因而相較于TextRank、LDA主題算法,更能體現(xiàn)出它的優(yōu)越性。算法分為兩部分:一部分為TF算法;另一部分為IDF算法,在實(shí)際使用中,TF的計(jì)算式如下:
tfi=nijΣknkj
其中nij表示詞i在文檔j中的出現(xiàn)頻次,對(duì)詞頻進(jìn)行歸一化后,分母就是統(tǒng)計(jì)文檔中每個(gè)詞出現(xiàn)次數(shù)的總和。
IDF的計(jì)算方式為:
idfi=log (D1+Di)
其中,D為文檔集中的總文檔數(shù),Di為文檔集中出現(xiàn)詞i的文檔數(shù)量,分母加1采用了拉普拉斯平滑,避免有部分新的詞段沒有在語(yǔ)料庫(kù)中出現(xiàn)而導(dǎo)致分母為零的情況出現(xiàn),增強(qiáng)算法的健壯性。
那么對(duì)于詞i的TF-IDF值,有:
tfidfi=tfi×idfi
但傳統(tǒng)的TF-IDF忽略了類間集中度和類內(nèi)分散度造成的問題,因此需要引入修正因子η來進(jìn)行改進(jìn)。η表示為:
η=mimi+ki×mimi+qi
其中,m和k分別表示為某文檔集和其他文檔中包含詞i的數(shù)目,q為不包含詞i的數(shù)目,因而修正系數(shù)可以表示為集中度和分散度的乘積。最終改進(jìn)的TF-IDF計(jì)算公式如下:
tfidf′i=tfi×idfi×η
1.2.2 語(yǔ)義網(wǎng)絡(luò)分析
對(duì)于居民用戶的動(dòng)態(tài)數(shù)據(jù),適合采用語(yǔ)義網(wǎng)絡(luò)分析,整體分為兩步:第一步還是關(guān)鍵詞的提取;第二步為共現(xiàn)分析,根據(jù)關(guān)鍵詞的重要程度得到共現(xiàn)矩陣,再根據(jù)共現(xiàn)矩陣來進(jìn)一步理解各詞之間的關(guān)系與親疏程度。
1.3 研究工具
本研究采用的工具為Python、ROST CM 6以及Gephi 0.9.2。用Python進(jìn)行數(shù)據(jù)爬取與預(yù)處理并利用改進(jìn)的TF-IDF算法進(jìn)行關(guān)鍵詞提取,接著利用ROST CM 6進(jìn)行語(yǔ)義網(wǎng)絡(luò)分析,最后利用Gephi 0.9.2將語(yǔ)義網(wǎng)絡(luò)分析得到的共此矩陣可視化。
2 結(jié)果分析
2.1 從政策信息看武漢市社區(qū)治理的趨勢(shì)
將所收集到的政府工作報(bào)告、公開政策與意見和相關(guān)熱點(diǎn)新聞?wù)碇羉sv文件中并代入編寫好的改進(jìn)TF-IDF算法框架程序中運(yùn)行,得到的各關(guān)鍵詞的TF-IDF值降序排列,結(jié)果表2所示。
針對(duì)TF-IDF的值對(duì)其進(jìn)行詞云可視化,可視化結(jié)果如圖1所示。
可以較為清晰地看出,網(wǎng)格化、智慧化和信息化是當(dāng)前武漢市社區(qū)治理較為明顯的趨勢(shì)特征,“基層”在文本中的重要程度反映了當(dāng)前社區(qū)治理的中心有所下沉?!皵?shù)據(jù)”“信息”“平臺(tái)”和“精準(zhǔn)”等詞體現(xiàn)了將先進(jìn)技術(shù)、智能設(shè)施以及大數(shù)據(jù)相結(jié)合的重要性。
2.2 從居民動(dòng)態(tài)看武漢市社區(qū)治理的需求
需求部分的分析利用的數(shù)據(jù)為居民發(fā)布在平臺(tái)上的動(dòng)態(tài)信息,先使用Python的jieba庫(kù)進(jìn)行分詞并儲(chǔ)存為csv格式文件,然后將該文件導(dǎo)入ROST CM 6進(jìn)行語(yǔ)義網(wǎng)絡(luò)分析,再將語(yǔ)義網(wǎng)絡(luò)分析得到的共詞矩陣導(dǎo)入Gephi 0.9.2進(jìn)行可視化,結(jié)果如圖2所示。
語(yǔ)義網(wǎng)絡(luò)的結(jié)點(diǎn)大小和邊的粗細(xì)分別對(duì)應(yīng)著該社區(qū)治理網(wǎng)絡(luò)中詞的重要程度和共現(xiàn)度,而某詞中心度的大小可由與之相連接的詞的數(shù)目來衡量。從上圖可以看出,“智能”的中心度最高且連接著“問題”,說明當(dāng)前武漢市的社區(qū)智慧化程度還有待提高,對(duì)于各個(gè)治理模塊,智能化都是關(guān)鍵要素。再與“智能”相連接的詞中,“數(shù)字”“服務(wù)”“治理”和“反饋”的重要程度和中心度緊隨其后。此外,從“基層”和“反饋”兩詞及其相連接的詞可以看出,基層治理仍需要進(jìn)行加強(qiáng)和創(chuàng)新,對(duì)于治理意見的反饋平臺(tái)存在著一定的問題,需要進(jìn)一步提高資源的共享性。
3 結(jié)論與建議
在社區(qū)地位不斷提高的背景下,武漢市在社區(qū)治理這方面有扎實(shí)的基礎(chǔ)與豐富的經(jīng)驗(yàn)。網(wǎng)格化、智慧化、信息化和重心下沉化是從疫情爆發(fā)以來不變的趨勢(shì),信息化平臺(tái)或網(wǎng)站的缺乏給居民反饋和相關(guān)人員的管理造成一定的難度,黨建引領(lǐng)、智慧賦能、信息共享是當(dāng)前武漢市居民的主要需求,加強(qiáng)社區(qū)治理的創(chuàng)新并打造社區(qū)治理的高效模式具有較大意義?,F(xiàn)從基層治理、技術(shù)創(chuàng)新和人才引進(jìn)三個(gè)角度給出建議:
(1)落實(shí)基層治理,將黨員干部下沉社區(qū)。
不斷強(qiáng)化居民需求導(dǎo)向,更有效地完善基層治理的協(xié)同合作模式。做到“兩個(gè)加強(qiáng)、兩個(gè)引入”,加強(qiáng)黨的影響力與基層行政能力,引入新的社區(qū)服務(wù)與社區(qū)治理機(jī)構(gòu)。在此基礎(chǔ)上,強(qiáng)化多元共治,推進(jìn)“三治”結(jié)合。
(2)加快先進(jìn)技術(shù)的引入與創(chuàng)新,提高智慧化程度。
運(yùn)用數(shù)字技術(shù)推動(dòng)社區(qū)服務(wù)與管理的精細(xì)化,利用數(shù)字技術(shù)賦權(quán)打造共治共享的新格局,消除治理主體之間的交流阻礙,盡快實(shí)現(xiàn)智能設(shè)施在武漢市社區(qū)的普及,對(duì)現(xiàn)有基礎(chǔ)設(shè)施進(jìn)行數(shù)字化改造升級(jí),跨越“數(shù)字鴻溝”,提高社區(qū)數(shù)字化治理效能。
(3)堅(jiān)持人才引領(lǐng)發(fā)展的戰(zhàn)略地位。
政府應(yīng)出臺(tái)一系列政策加強(qiáng)專業(yè)人才的引進(jìn),鼓勵(lì)技術(shù)人員從實(shí)踐中創(chuàng)新,提高對(duì)居民意見、反饋等平臺(tái)文本信息的重視程度并不定期結(jié)合NLP前沿領(lǐng)域的算法進(jìn)行文本分析,為數(shù)字化治理效能的提高夯實(shí)基礎(chǔ)。
參考文獻(xiàn)
[1]韋仁忠,張作程.新時(shí)代城市社區(qū)治理的現(xiàn)實(shí)境遇和實(shí)踐向度——基于協(xié)同共治的視角[J].領(lǐng)導(dǎo)科學(xué)論壇,2022,(01):3137.
[2]Hanguang Hu. Research on the Construction of Grass Roots Governance System of “Three Governance Combination”[J].International Journal of Higher Education Teaching Theory,2020,1(4).
[3]周瑩瑩.社會(huì)主體多元化治理中的社會(huì)參與問題淺析[J].經(jīng)貿(mào)實(shí)踐,2018,(06):78.
[4]Yang Yutang. Knowledge Map of Community Governance Research in the Last 10 Years—Visual Analysis Based on CiteSpace[J].社會(huì)科學(xué)前沿,2021,10(12).
[5]馬晗.中國(guó)城市社區(qū)治理的研究熱點(diǎn)與發(fā)展趨勢(shì)——基于CiteSpace的可視化分析[J].社會(huì)福利(理論版),2021,(04):3745.
[6]Yili Yao,Xianghong Zhou. Impacts of the internet on perceptions of governance at the community level:the case of Jiangqiao Township in Shanghai,China[J]. Public Administration and Policy,2021,24(2).
[7]滕方煒.基層社會(huì)治理現(xiàn)代化:時(shí)代邏輯與路徑選擇——基于社區(qū)治理的文本分析[J].傳播力研究,2018,2(18):13.
[8]胡媛敏,張壽明.基于信息論的TF-IDF算法在文本分類中的應(yīng)用研究[J].中國(guó)水運(yùn)(下半月),2021,21(12):3133.
[9]Xinming Zhang,Zhang Xinming,Shi Yuanbo,Wei Haiping. Research on TFIDF Algorithm Based on Weighting of Distribution Factors[J]. Journal of Physics:Conference Series,2020,1621(1).
[10]Christensen Alexander P,Kenett Yoed N. Semantic network analysis (SemNA):A tutorial on preprocessing,estimating,and analyzing semantic networks[J]. Psychological methods,2021.