• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      智慧城市背景下西安市民參與城市治理話題熱點識別

      2021-09-10 07:22:44成園園劉云忠
      經(jīng)濟師 2021年4期
      關(guān)鍵詞:城市治理

      成園園 劉云忠

      摘 要:采用TF-IDF算法有效處理詞頻信息,并選擇基于LDA主題發(fā)現(xiàn)模型的文本挖掘方法,通過web網(wǎng)絡(luò)爬蟲軟件爬取“華商論壇”數(shù)據(jù),挖掘市民參與西安城市治理的關(guān)注主題。分析結(jié)果表明:西安市民參與城市治理熱點主題包括交通出行、環(huán)境污染、小區(qū)物業(yè)等13個方面。主題討論熱度高低與受眾需求有極大關(guān)系,與市民生活越密切相關(guān)的城市治理主題越受市民的高度關(guān)注。該結(jié)果對定位西安城市治理關(guān)注點,助力“智慧西安”建設(shè)具有現(xiàn)實意義。

      關(guān)鍵詞:城市治理 主題挖掘 LDA模型 智慧西安

      中圖分類號:F290? 文獻標(biāo)識碼:A

      文章編號:1004-4914(2021)04-018-03

      一、引言

      2020年國家明確提出大力發(fā)展“新基建”,為城市創(chuàng)新和高質(zhì)量發(fā)展提供新動能?!靶禄ā笔前l(fā)力于科技端的新型基礎(chǔ)設(shè)施建設(shè),其支點是基于云、AI、5G和計算機等技術(shù)的融合與創(chuàng)新。作為中國西部地區(qū)重要中心城市,“智慧西安”的未來發(fā)展,與技術(shù)創(chuàng)新的深度息息相關(guān)。騰訊曾與西安在城市建設(shè)、政府治理、民生服務(wù)等領(lǐng)域進行深度合作,共同打造智慧城市。2020年騰訊云又與西安高新區(qū)達成戰(zhàn)略合作,持續(xù)加碼“智慧西安”。因而了解市民所關(guān)心的城市治理熱點話題對助力“智慧西安”建設(shè)尤為重要。

      基于互聯(lián)網(wǎng)大數(shù)據(jù)追蹤市民參與城市治理的熱門話題、情感傾向的相關(guān)研究持續(xù)增長。馮小東等(2018)基于TF-IDF及LDA模型,針對政務(wù)微博互動中的微觀數(shù)據(jù),研究發(fā)現(xiàn),參與相同政務(wù)微博的公眾之間興趣主題也很接近。孫赫(2015)利用網(wǎng)絡(luò)爬蟲技術(shù)和分詞系統(tǒng),分析城市微博投訴數(shù)據(jù),進而設(shè)計并搭建微博城市投訴分析平臺。國外研究公眾參與城市治理的網(wǎng)絡(luò)平臺大多集中在Twitter、Facebook。Bonsón等(2015)研究西歐地方政府Facebook內(nèi)容類型對公眾參與的影響,研究發(fā)現(xiàn),不同地方政府發(fā)布內(nèi)容類型偏好不同直接導(dǎo)致公眾參與的積極性也有差異。West(2004)通過評估網(wǎng)絡(luò)平臺下政務(wù)互動的滿意度和參與度,研究互聯(lián)網(wǎng)的互動功能能否提升公眾參與城市治理積極性。

      但國內(nèi)外學(xué)者利用大數(shù)據(jù)研究城市治理問題大多還是集中在交通治理、公共安全、輿情監(jiān)測等方面,對公眾參與方面研究相對較少,而市民參與度彰顯一個城市的基層治理能力,是評價城市治理的重要參考指標(biāo)。因此本文以西安市政府網(wǎng)絡(luò)交流論壇為主要研究對象,使用web網(wǎng)絡(luò)爬蟲軟件對論壇數(shù)據(jù)進行挖掘,因市民參與城市治理的互動內(nèi)容涉及主題范圍廣,為有效發(fā)現(xiàn)市民的訴求類別,利用TF-IDF及LDA主題模型挖掘政務(wù)網(wǎng)站上市民對城市治理問題的意見及態(tài)度,以便為西安城市治理提供針對性參考。

      二、主題挖掘工具

      (一)TF-IDF算法

      TF-IDF(term frequency inverse document frequency)是一種用于資訊檢索與文本挖掘的常用加權(quán)技術(shù),用以評估一個字詞對于一個文件集或語料庫中的其中一份文件的重要程度。

      1.詞頻(term frequency,TF)表示詞條在文本中出現(xiàn)的頻率。

      即:TF=

      2. 逆向文件頻率(inverse document frequency,IDF)是一個詞語普遍重要性的度量。

      即:LDF=log()

      3.TF-IDF實際是:TF*IDF

      某一特定文件內(nèi)的高詞語頻率,以及該詞語在整個文件集合中的低頻率文件,可以產(chǎn)生出高權(quán)重的TF-IDF。因此,TF-IDF傾向于過濾掉常見的詞語,保留重要的詞語。

      (二)LDA主題模型

      主題模型是文本主題挖掘的重要方法,在分析文本相關(guān)性時將文本的潛在信息考慮在內(nèi),如今已成為文本挖掘的研究熱門。在各種主題模型中,LDA(隱含狄利克雷分布)模型得到廣泛使用,它是一個包含詞、主題、文檔三層結(jié)構(gòu)的貝葉斯概率模型,屬于非監(jiān)督機器學(xué)習(xí)技術(shù)??捎糜谧R別大規(guī)模文檔集或語料庫中潛藏的主題信息。該模型使用詞袋法將文檔視為詞頻向量,從而將文本信息轉(zhuǎn)化為易于建模的數(shù)字信息。

      LDA對文本信息的主題建模過程為:首先從文檔中采樣主題,然后提取主題對應(yīng)詞分布中的單詞,不斷重復(fù)這個隨機生成過程,直到遍歷文章中的每一個單詞。

      三、數(shù)據(jù)采集與預(yù)處理

      (一)數(shù)據(jù)采集

      “華商論壇”是西安本地新聞、爆料、亂拍等網(wǎng)上交流互動社區(qū)論壇,其建立時間早,數(shù)據(jù)量豐富,尤其是“群眾呼聲”版塊記錄了市民參與城市治理的大量文本數(shù)據(jù),且政府部門及時回復(fù),回函快速高效。因此本文通過web網(wǎng)絡(luò)爬蟲軟件對該版塊論壇數(shù)據(jù)進行爬取,主要包括主題帖內(nèi)容、發(fā)布時間、用戶id。以2015年1月論壇版塊正式開通為時間點,截至2020年11月獲取約4萬個主題帖。

      (二)數(shù)據(jù)預(yù)處理

      由于抓取的數(shù)據(jù)量龐大,部分?jǐn)?shù)據(jù)不可避免有格式混亂、數(shù)據(jù)重復(fù)等現(xiàn)象,為了減少噪音數(shù)據(jù)對主題分類的干擾,有必要對數(shù)據(jù)進行去重,設(shè)置規(guī)則過濾篩選掉特殊文本和無效不相關(guān)文本等一系列工作,預(yù)處理后最終有效論壇文本為38776條數(shù)據(jù),用于下文主題挖掘研究。其中無意義文本類型見表1。

      四、城市治理熱點主題挖掘

      (一)詞頻統(tǒng)計及詞云圖

      首先將所有文本數(shù)據(jù)進行jieba分詞,采用一個較為通用的停用詞表(https://blog.csdn.net/Dorisi_H_n_q/article/details/82114913,

      共有1893個停用詞),將其作為初始停用詞,根據(jù)多次主題分析結(jié)果,對初始停用詞表進行擴展,增加主題分類實驗中出現(xiàn)的對于主題分類無意義的高頻詞,如:陜西、西安等詞,最終挑選出詞語出現(xiàn)頻率前20的詞語,如表2所示。

      根據(jù)詞頻統(tǒng)計結(jié)果,“消費”詞頻出現(xiàn)最高,“交通”“出行”等也頻頻出現(xiàn),“醫(yī)療”“教育”等也是市民討論的關(guān)注點。不難發(fā)現(xiàn)這些主題均與市民日常生活息息相關(guān)。

      基于詞頻統(tǒng)計結(jié)果,將其做成詞云圖進行展示。詞云圖是根據(jù)詞頻大小進行作圖,頻數(shù)越大的詞字體越大。詞云圖見圖1。

      由圖1可直觀地看出,“消費”一詞出現(xiàn)頻率最高,“出行”“交通”次之,“紅綠燈”“公交車”“人行道”等詞表達市民對于交通出行便捷程度等問題的關(guān)注;“衛(wèi)生”“環(huán)境”市民討論也較多,“垃圾”“污染”等詞反映市民對于未進行垃圾分類,隨處亂扔垃圾等現(xiàn)象造成的環(huán)境衛(wèi)生問題的不滿等;“小區(qū)”“物業(yè)”“業(yè)主”等詞頻頻出現(xiàn)反映了業(yè)主與物業(yè)之間的矛盾糾紛問題持續(xù)存在;“醫(yī)療”“教育”等一系列問題也是市民反饋的主要關(guān)注點。

      (二)確定最優(yōu)主題個數(shù)

      LDA主題建模過程中參數(shù)K的設(shè)定對模型性能起到關(guān)鍵性作用,參考一種基于Perplexity的最優(yōu)自適應(yīng)LDA模型選擇方法,對于未知分布,其復(fù)雜度越低,模型越好。其過程如下:一是確定初始K值并計算主題之間復(fù)雜度;二是減少或增加K值并再次計算主題之間復(fù)雜度;三是如此重復(fù)直至得到最優(yōu)K。

      因此針對分詞結(jié)果,設(shè)置復(fù)雜度參數(shù)從20~100,以5為步長不斷訓(xùn)練得到模型,計算不同主題數(shù)之間復(fù)雜度。如圖2所示:

      (三)總體主題分布

      確定最優(yōu)主題數(shù)后,訓(xùn)練LDA主題模型,選取每個主題中分布概率最高的10個單詞作為主題內(nèi)容的特征詞,并對其進行計算與分析??蓪⒖傮w主題分布綜合歸納如表3所示。

      由總體主題分布結(jié)果可看出,討論熱度最高的13類問題分別是交通出行、環(huán)境污染、小區(qū)物業(yè)、消費權(quán)益、噪聲擾民、醫(yī)療衛(wèi)生、勞動保障、社會治安、住房問題、教育入學(xué)、城市規(guī)劃、公共服務(wù)、入冬供暖。這13個主題較為全面地反映了市民參與城市治理所關(guān)注的民生問題,且均與市民日常生活息息相關(guān)。因而有助于政府更加細(xì)致深入地了解市民呼聲和民生狀況。

      五、結(jié)論及建議

      筆者通過收集西安市民參與城市治理的論壇數(shù)據(jù),首先對數(shù)據(jù)集進行去重和規(guī)則過濾等預(yù)處理工作,所得新數(shù)據(jù)共38776條。進而選擇TF-IDF進行詞頻統(tǒng)計,并通過參數(shù)尋優(yōu)后訓(xùn)練LDA主題模型進行話題熱點分析,挖掘西安市民參與城市治理的關(guān)注熱點,從熱點主題看,主題討論熱度高低與受眾需求有極大關(guān)系,與市民生活息息相關(guān)的城市治理主題更受市民的高度關(guān)注。交通出行、環(huán)境污染、小區(qū)物業(yè)、消費權(quán)益、噪聲擾民、醫(yī)療衛(wèi)生、勞動保障、社會治安、住房問題、教育入學(xué)、城市規(guī)劃、公共服務(wù)、入冬供暖這13類問題是市民關(guān)注的熱點。

      針對本文的分析結(jié)果,從交通規(guī)劃、醫(yī)療衛(wèi)生等多方面提出建議,助力“智慧西安”建設(shè)與發(fā)展。

      一是交通出行方面。根據(jù)攝像頭、測速儀、射頻識別系統(tǒng)、公交地鐵刷卡所反饋信息,通過大數(shù)據(jù)實現(xiàn)交通流量的實時監(jiān)測、交通擁堵的實時疏導(dǎo),構(gòu)建智慧交通。

      二是環(huán)境污染方面。完善智能垃圾回收系統(tǒng),例如垃圾桶處于滿載狀態(tài)時主動發(fā)出信號,工作人員根據(jù)此信號來安排分配垃圾運輸車的出行頻率和路線,從而提高垃圾處理效率。

      三是醫(yī)療衛(wèi)生方面。實現(xiàn)所有診療環(huán)節(jié)以自助方式辦理。完善陜西“醫(yī)療云”“健康云”平臺。加速優(yōu)質(zhì)醫(yī)療資源整合,進而實現(xiàn)遠(yuǎn)程會診、遠(yuǎn)程門診、雙向轉(zhuǎn)診等醫(yī)療健康服務(wù)覆蓋。

      四是公共服務(wù)方面。通過手機APP讓市民隨時隨地通過手機定位并報告公共設(shè)施損壞情況,同時市民能夠登錄系統(tǒng)隨時查看市政問題的解決過程及結(jié)果。

      五是教育入學(xué)方面。以MOOC、網(wǎng)易有道為代表的新型網(wǎng)絡(luò)教育模式開啟了智能教育時代,能夠促使城市保持長期競爭力。

      六是消費權(quán)益、噪聲擾民、社會治安、勞動保障方面。開發(fā)手機APP,實施舉報有獎?wù)撸瑫r實現(xiàn)多部門共享數(shù)據(jù)協(xié)同治理。

      七是小區(qū)物業(yè)、入冬供暖、住房問題等。著力完善西安“15分鐘政務(wù)服務(wù)圈”示范點,推動群眾辦事“就近辦”“網(wǎng)上辦”“一次辦”等,加快建設(shè)城市社區(qū)周邊15分鐘可達的便民服務(wù)中心、代辦點、網(wǎng)格服務(wù)點等服務(wù)設(shè)施,提升市民辦事便利度。打造“智慧西安”需要公眾參與的支持,城市治理的“一雙眼”,不如市民的“千萬眼”,只有動員全社會力量參與,才能快速促進西安城市治理智慧化。

      [本文系2019年度陜西省社科界重大理論與現(xiàn)實問題研究項目《新時代中國超大城市治理的社會學(xué)研究——以西安為例》部分研究成果(項目編號:2019Z062)。]

      參考文獻:

      [1] 馮小東,張會平.興趣驅(qū)動的政務(wù)微博公眾評論行為影響模型及實證研究[J].電子政務(wù),2018,(11):23-33.

      [2] 孫赫.基于微博的城市投訴文本的挖掘與分析[D];北京信息科技大學(xué),2015.

      [3] BONSóN E, ROYO S, RATKAI M. Citizens' engagement on local governments' Facebook sites.An empirical analysis: The impact of different media and content types in Western Europe [J].Government Information Quarterly,2015, 32(1): 52-62.

      [4] WEST D M. E government and the transformation of? service? delivery? andcitizen attitudes [J]. Public administration review, 2004, 64(1): 15-27.

      (作者單位:西安財經(jīng)大學(xué)統(tǒng)計學(xué)院 陜西西安 710100)

      [作者簡介:成園園,女,西安財經(jīng)大學(xué)統(tǒng)計學(xué)院碩士研究生;劉云忠,男,西安財經(jīng)大學(xué)統(tǒng)計學(xué)院碩士生導(dǎo)師。]

      (責(zé)編:若佳)

      猜你喜歡
      城市治理
      20世紀(jì)90年代以來上海探索超大城市治理推進基層黨建的實踐與啟示
      倫敦: 功能布局合理 綜合交通便捷
      前線(2017年1期)2017-03-01 05:35:24
      創(chuàng)新城市治理理念 扎實推進城市工作
      卷宗(2016年10期)2017-01-21 19:22:27
      微博問政視域下城市治理轉(zhuǎn)型研究
      唐山城市治理的問題與對策
      考試周刊(2016年84期)2016-11-11 00:27:36
      新時期銀川市和諧民族關(guān)系的建設(shè)路徑
      城市治理結(jié)構(gòu)中抽象系統(tǒng)信任建設(shè)與法治
      城市政治學(xué)視角下對中國城鎮(zhèn)化的思考
      商(2016年14期)2016-05-30 17:14:30
      中國城市發(fā)展與治理的全新思維方式
      人民論壇(2016年1期)2016-05-17 12:17:17
      綜合評價法在城市治理評估指標(biāo)體系中的應(yīng)用*
      江淮論壇(2015年6期)2016-03-09 23:10:15
      平乡县| 邯郸县| 竹北市| 平定县| 博白县| 南充市| 兴城市| 蚌埠市| 时尚| 西峡县| 拉萨市| 沅陵县| 犍为县| 连平县| 沅陵县| 洪雅县| 龙里县| 太白县| 名山县| 星座| 龙胜| 桐梓县| 华池县| 嘉荫县| 五原县| 博野县| 白沙| 垦利县| 邵东县| 伽师县| 南宫市| 南川市| 青冈县| 会东县| 开封县| 丹巴县| 博爱县| 札达县| 通山县| 马公市| 恩施市|