• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于LDA 模型的我國開放公共數(shù)據(jù)政策供給特征分析

      2023-08-14 16:02:06馬海群張斌
      現(xiàn)代情報 2023年8期
      關(guān)鍵詞:政策分析模型

      馬海群 張斌

      摘 要: [目的/ 意義] 完善的公共數(shù)據(jù)開放政策是確保我國公共數(shù)據(jù)能夠有效開放的重要保障。從“供給側(cè)” 角度出發(fā)進行分析, 揭示我國開放公共數(shù)據(jù)政策供給特征, 為相關(guān)部門制定政策和公共數(shù)據(jù)高質(zhì)量開放提供借鑒和參考。[方法/ 過程] 在“北大法寶” 和我國各級政府官方網(wǎng)站中檢索我國開放公共數(shù)據(jù)相關(guān)的政策文本, 然后進行人工二次篩選。之后運用LDA 模型方法對我國公共數(shù)據(jù)開放政策進行聚類量化分析, 進而歸納出我國開放公共數(shù)據(jù)政策供給特征。[結(jié)果/ 結(jié)論] 我國開放公共數(shù)據(jù)政策供給特征呈現(xiàn)出明顯的“ 差異性” 和“不均衡性”。即重視日常狀態(tài)下的開放而對于“應(yīng)急狀態(tài)” 下的開放沒有給予足夠的重視; 同時也存在著公共數(shù)據(jù)開放的政策涉及“領(lǐng)域” 不均衡和“地域” 不均衡的特點, 欠缺構(gòu)造一個涉及廣泛領(lǐng)域的開放公共數(shù)據(jù)政策網(wǎng)絡(luò)來促進公共數(shù)據(jù)中的價值得到有效釋放。

      關(guān)鍵詞: 開放公共數(shù)據(jù); 政策分析; 政策聚類; 政策供給特征; LDA 模型

      DOI:10.3969 / j.issn.1008-0821.2023.08.004

      〔中圖分類號〕G203 〔文獻標(biāo)識碼〕A 〔文章編號〕1008-0821 (2023) 08-0035-10

      在大數(shù)據(jù)時代, 政府作為社會數(shù)據(jù)的最大擁有者和掌握者, 把不涉及國家安全、商業(yè)機密以及個人隱私的數(shù)據(jù)開放出來, 滿足社會各界對于數(shù)據(jù)資源的需求, 是政府提升公眾滿意度、提升政府滿意程度的重要舉措[1] 。我國政府對公共數(shù)據(jù)開放工作高度重視, 2022 年, 國務(wù)院印發(fā)《“十四五” 數(shù)字經(jīng)濟發(fā)展規(guī)劃》[2] , 要求“構(gòu)建統(tǒng)一的國家公共數(shù)據(jù)開放平臺和開發(fā)利用端口, 提升公共數(shù)據(jù)開放水平”。2021 年, 在《中華人民共和國國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和2035 年遠(yuǎn)景目標(biāo)綱要》[3] 中提到, 要提升數(shù)字政府的建設(shè)水平, 加強公共數(shù)據(jù)開放共享。各個地方政府也積極響應(yīng), 出臺一系列相關(guān)的配套條例, 促進本行政區(qū)域內(nèi)的公共數(shù)據(jù)開放工作??梢哉f, 從中央到地方, 對公共數(shù)據(jù)開放均給予了較高的重視程度。

      但是目前而言, 大多數(shù)地方的公共數(shù)據(jù)開放僅僅是政府信息公開的“升級版”[4] , 沒有產(chǎn)生公共數(shù)據(jù)開放應(yīng)有的效果, 地方政府對于如何對公共數(shù)據(jù)進行開放仍然沒有一個較為清晰的概念, 無法更好地釋放公共數(shù)據(jù)開放的紅利。因此, 深入分析我國公共數(shù)據(jù)開放政策文本內(nèi)容, 探究其供給特征, 一方面為后續(xù)相關(guān)政策的完善提供借鑒和參考; 另一方面也更好地促進相關(guān)公共數(shù)據(jù)開放工作穩(wěn)步推進。

      1 相關(guān)研究述評

      1 1 開放公共數(shù)據(jù)研究

      從開源的視角出發(fā), 公共數(shù)據(jù)開放可以追溯到20 世紀(jì)80 年代以自由開放操作系統(tǒng)為代表的開源運動[5] 。隨著大數(shù)據(jù)技術(shù)的發(fā)展, 開源運動從技術(shù)和系統(tǒng)領(lǐng)域逐步發(fā)展到數(shù)據(jù)領(lǐng)域, 公眾開始呼吁數(shù)據(jù)開放。特別是進入21 世紀(jì)以來, 美國[6] 、澳大利亞[7] 、加拿大[8] 以及巴西[9] 等國家(地區(qū))先后對自身所掌握的公共數(shù)據(jù)進行了開放。雖然國內(nèi)公共數(shù)據(jù)開放起步較晚, 但是也取得了相當(dāng)數(shù)量的成果。陸敬筠等[10] 以上海市公共數(shù)據(jù)開放平臺的訪問數(shù)據(jù)為研究對象, 構(gòu)建了上海市公共數(shù)據(jù)開放平臺的用戶畫像, 并分析了用戶的行為特征, 結(jié)合分析的結(jié)果提出了相應(yīng)的優(yōu)化策略; 高爭志[5] 分析了公共數(shù)據(jù)開放制度的價值定位以及實現(xiàn)路徑, 認(rèn)為應(yīng)當(dāng)以價值目標(biāo)為導(dǎo)向, 對公共數(shù)據(jù)開放的概念進行重新界定, 同時在此基礎(chǔ)上構(gòu)建出不同類型的公共數(shù)據(jù)開放機制; 儲節(jié)旺等[11] 對公共數(shù)據(jù)開放的主體責(zé)任進行了研究, 提出可以從數(shù)據(jù)來源、平臺建設(shè)、消除數(shù)據(jù)孤島等方面優(yōu)化政府的主體責(zé)任;鄭磊等[12] 以上海開放數(shù)據(jù)創(chuàng)新應(yīng)用大賽為例, 對公共數(shù)據(jù)開放的產(chǎn)出與效果進行了研究, 指出公共數(shù)據(jù)開放具有巨大的潛在商業(yè)效益和社會效益; 蒲攀等[13] 通過內(nèi)容分析、系統(tǒng)分析等方法, 構(gòu)建了我國開放數(shù)據(jù)政策的S-R-P 理論模型。國外對于公共數(shù)據(jù)開放的研究重點側(cè)重于通過案例進行分析。

      Pereira G V 等[14] 分析了里約熱內(nèi)盧公共數(shù)據(jù)開放中心的案例, 認(rèn)為公共數(shù)據(jù)的合理開放能夠為智慧城市運營提供數(shù)據(jù)支撐, 同時也提高了數(shù)字政府的運行效率; Lakomaa E 等[15] 學(xué)者以瑞典企業(yè)家為案例, 研究了他們對于公共數(shù)據(jù)開放的看法, 認(rèn)為合理的政策支撐能夠確保公共數(shù)據(jù)得到有效開放, 并且能夠最大限度地激發(fā)其中所蘊含的價值; Verslu?is L 等[16] 爬取了若干個城市系統(tǒng)的開放公共數(shù)據(jù)流, 發(fā)現(xiàn)不同工作負(fù)載源、領(lǐng)域和領(lǐng)域之間的特征、屬性和工作流結(jié)構(gòu)存在重大差異。

      1 2 開放公共數(shù)據(jù)政策研究

      公共數(shù)據(jù)開放運動在全球如火如荼展開以及國內(nèi)外學(xué)者對公共數(shù)據(jù)開放給予較高關(guān)注度的同時,關(guān)于“開放公共數(shù)據(jù)政策” 的相關(guān)研究也開始越來越多地被學(xué)者們關(guān)注。特別是隨著“數(shù)據(jù)” 作為生產(chǎn)要素的地位在不斷地提升, 如何從政策的角度出發(fā), 對規(guī)范公共數(shù)據(jù)開放行為, 更好地發(fā)揮其在國家治理、透明政府和公共服務(wù)方面的作用有重要的意義。王本剛等[17] 通過對國內(nèi)外相關(guān)政策文件內(nèi)容進行解讀, 對公共數(shù)據(jù)蘊含的“公共價值”進行了探討, 界定了公共數(shù)據(jù)的公共價值概念。孫瑞英等[18] 認(rèn)為, 目前公共數(shù)據(jù)開放政策存在預(yù)測、引導(dǎo)作用不足, 忽視個人信息保護方面的內(nèi)容, 政策目標(biāo)和當(dāng)?shù)厍闆r的協(xié)同程度有待提升的問題。因此, 馬海群等[19] 從關(guān)聯(lián)規(guī)則的角度出發(fā), 對開放政府?dāng)?shù)據(jù)政策的協(xié)同性進行了分析, 為減少政策沖突、增強政策之間的兼容性提供了借鑒和參考, 付熙雯[20] 也從數(shù)字中國建設(shè)的角度出發(fā), 提出了公共數(shù)據(jù)開放政策的優(yōu)化策略。除此之外, 對于日本[21] 、美國[22] 、英國[23] 、丹麥[24] 和加拿大[25] 等國家(地區(qū))的公共數(shù)據(jù)開放政策進行研究, 從中總結(jié)出能為我國所借鑒和采納的相關(guān)經(jīng)驗, 也是我國學(xué)者所關(guān)注的研究方向之一。

      而國外對于公共數(shù)據(jù)開放政策的研究或者是以具體國家為研究對象, 如Sumitomo T 等[26] 學(xué)者對于日本的開放公共數(shù)據(jù)政策進行了研究, 發(fā)現(xiàn)日本政府、學(xué)術(shù)界和企業(yè)三方在完善開放公共數(shù)據(jù)政策體系中發(fā)揮了主要的作用; Viscusi G 等[27] 和Jung K等[28] 分別從概念模型和語義網(wǎng)絡(luò)的角度出發(fā), 指出“概念建?!?在激發(fā)公共數(shù)據(jù)潛在價值方面具有重要的作用, 并且更好地發(fā)揮“公共數(shù)據(jù)” 的“社會價值” 的作用, 并為將“公共數(shù)據(jù)” 的開放納入數(shù)字經(jīng)濟生態(tài)體系提供了借鑒和理論支撐。

      1 3 LDA 模型研究

      LDA 主題模型是學(xué)者Blei D M 等[29] 于2003 年提出的一種文本分析模型, 該模型的提出有效彌補了PLSA(概率隱形語義分析模型)的缺陷, 提升了對深層次文本內(nèi)容挖掘和語義分析的精準(zhǔn)度與效率。LDA 主題模型認(rèn)為, 每篇文檔包含若干個主題, 每個主題包含若干個詞語。從文檔到主題再到詞語, 三層之間是通過一定的概率進行選擇, 即每個文檔按照一定的概率選擇了某個主題, 某個主題再按照一定的概率選擇了某個詞語, 重復(fù)上述步驟得到了一整篇文檔[30] 。國內(nèi)對于LDA 主題模型的研究一般集中在情感分析[31] 、主題挖掘[32] 、文本分類[33] 以及話題演化[34] 等方面, 或者是通過相關(guān)算法研究、推薦算法來實現(xiàn)對現(xiàn)有LDA 主題模型的改進[35] 。如池毛毛等[36] 對酒店用戶評論文本進行情感分析; 田園等對在線教學(xué)需求數(shù)據(jù)進行主題挖掘與分析; 吳江等[37] 采用LDA 模型對在線醫(yī)療社區(qū)的文本分類進行了研究; 孫玉潔等[38] 從LDA主題模型的角度出發(fā), 提出一種新的多角度個性化微博推薦算法, 并實證了該算法的有效性; 王璟琦等[39] 利用LDA 模型對空間自相關(guān)背景下的網(wǎng)絡(luò)輿情話題演化時空規(guī)律進行了分析。國外采用LDA主題模型基本側(cè)重點在對主題模型進行深化以及不同領(lǐng)域的研究, 主要從協(xié)同過濾[40] 和個性化推薦[41] 、圖像分類標(biāo)注與檢索[42] 等不同方面進行應(yīng)用; 深化則主要集中在對“作者—主題模型”[43] 以及“分層狄利克雷過程”[44] 等拓展模型進行研究。

      針對公共數(shù)據(jù)開放政策的相關(guān)研究雖然已經(jīng)取得了一定數(shù)量的成果, 但是多就政策文本本身采用定量分析、定性比較或者總結(jié)歸納等方式進行研究, 多傾向于“需求側(cè)” 角度。但是公共數(shù)據(jù)政策是一個涉及“供給側(cè)” 和“需求側(cè)” 兩個方面的復(fù)雜系統(tǒng), 只有“供給側(cè)” 和“需求側(cè)” 都彼此適配, 才能促進我國公共數(shù)據(jù)開放政策體系的完善, 保證我國的公共數(shù)據(jù)釋放出自身內(nèi)部的價值。因此, 本文采用LDA 主題模型, 對開放公共數(shù)據(jù)政策文本進行挖掘, 從“供給側(cè)” 角度出發(fā), 找到政策文本的側(cè)重點, 分析其中還有哪些需要補充和完善的地方, 嘗試為構(gòu)建涉及不同層級單位、不同領(lǐng)域的全方位開放公共數(shù)據(jù)政策體系網(wǎng)絡(luò)提供學(xué)理支撐和參考, 也能夠與以往研究相呼應(yīng)。

      2 研究方法選擇與數(shù)據(jù)的獲取和預(yù)處理

      2 1 研究方法

      本文之所以選擇LDA 主題模型作為分析工具,主要原因有以下兩點: 第一, 該模型是一種無監(jiān)督的經(jīng)典學(xué)習(xí)方法, 且在分析不同領(lǐng)域和不同類型的政策方面都有著較好的實踐效果; 第二, 采用LDA主題模型能夠有效挖掘和分析政策文本內(nèi)部潛在的主題, 更好地理解政策文本的內(nèi)涵和精髓, 提高了政策文本分析的細(xì)粒度和精確度。而本文的研究目的是尋找公共數(shù)據(jù)開放政策供給的側(cè)重點, 需要透過政策表面來看政策文本內(nèi)部之間的聯(lián)系, 符合應(yīng)用LDA 主題模型的條件。而政策文件的主題詞是對一篇政策文件主要內(nèi)容的闡釋, 而且為了保證政策文本在執(zhí)行的時候能夠取得預(yù)期效果, 所以在詞語選擇上均經(jīng)過深思熟慮, 以求避免相關(guān)政策產(chǎn)生二義性, 通過分析了解一篇政策文件的主題詞都有哪些, 以及每個主題詞出現(xiàn)的頻次的高低和共現(xiàn)情況,能夠有效地了解整篇政策文件的內(nèi)容。所以本文從主題詞和LDA 主題模型兩方面出發(fā), 對我國公共數(shù)據(jù)開放政策進行分析, 以期實現(xiàn)本文的研究目的。

      2 2 數(shù)據(jù)獲取和預(yù)處理

      本文研究的對象主要是我國地方政府發(fā)布的涉及公共數(shù)據(jù)開放的政策文本, 所以在“北大法寶”數(shù)據(jù)庫中進行檢索, 檢索步驟為: 首先在“北大法寶” 數(shù)據(jù)庫中選擇“高級檢索”, 在“法律法規(guī)”模塊中選擇“地方法規(guī)”, 全文中包含“公共數(shù)據(jù)開放”, 點擊“同篇”, 以政策發(fā)布日期為準(zhǔn), 共計得到地方性法規(guī)37 條, 地方政府規(guī)章13 條, 地方規(guī)范性文件266 條, 地方工作文件742 條, 初步將上述政策文件納入研究范圍之中(檢索時間為2023年3 月2 日)。

      而國外對于公共數(shù)據(jù)開放政策的研究或者是以具體國家為研究對象, 如Sumitomo T 等[26] 學(xué)者對于日本的開放公共數(shù)據(jù)政策進行了研究, 發(fā)現(xiàn)日本政府、學(xué)術(shù)界和企業(yè)三方在完善開放公共數(shù)據(jù)政策體系中發(fā)揮了主要的作用; Viscusi G 等[27] 和Jung K等[28] 分別從概念模型和語義網(wǎng)絡(luò)的角度出發(fā), 指出“概念建?!?在激發(fā)公共數(shù)據(jù)潛在價值方面具有重要的作用, 并且更好地發(fā)揮“公共數(shù)據(jù)” 的“社會價值” 的作用, 并為將“公共數(shù)據(jù)” 的開放納入數(shù)字經(jīng)濟生態(tài)體系提供了借鑒和理論支撐。

      1 3 LDA 模型研究

      LDA 主題模型是學(xué)者Blei D M 等[29] 于2003 年提出的一種文本分析模型, 該模型的提出有效彌補了PLSA(概率隱形語義分析模型)的缺陷, 提升了對深層次文本內(nèi)容挖掘和語義分析的精準(zhǔn)度與效率。LDA 主題模型認(rèn)為, 每篇文檔包含若干個主題, 每個主題包含若干個詞語。從文檔到主題再到詞語, 三層之間是通過一定的概率進行選擇, 即每個文檔按照一定的概率選擇了某個主題, 某個主題再按照一定的概率選擇了某個詞語, 重復(fù)上述步驟得到了一整篇文檔[30] 。國內(nèi)對于LDA 主題模型的研究一般集中在情感分析[31] 、主題挖掘[32] 、文本分類[33] 以及話題演化[34] 等方面, 或者是通過相關(guān)算法研究、推薦算法來實現(xiàn)對現(xiàn)有LDA 主題模型的改進[35] 。如池毛毛等[36] 對酒店用戶評論文本進行情感分析; 田園等對在線教學(xué)需求數(shù)據(jù)進行主題挖掘與分析; 吳江等[37] 采用LDA 模型對在線醫(yī)療社區(qū)的文本分類進行了研究; 孫玉潔等[38] 從LDA主題模型的角度出發(fā), 提出一種新的多角度個性化微博推薦算法, 并實證了該算法的有效性; 王璟琦等[39] 利用LDA 模型對空間自相關(guān)背景下的網(wǎng)絡(luò)輿情話題演化時空規(guī)律進行了分析。國外采用LDA主題模型基本側(cè)重點在對主題模型進行深化以及不同領(lǐng)域的研究, 主要從協(xié)同過濾[40] 和個性化推薦[41] 、圖像分類標(biāo)注與檢索[42] 等不同方面進行應(yīng)用; 深化則主要集中在對“作者—主題模型”[43] 以及“分層狄利克雷過程”[44] 等拓展模型進行研究。針對公共數(shù)據(jù)開放政策的相關(guān)研究雖然已經(jīng)取得了一定數(shù)量的成果, 但是多就政策文本本身采用定量分析、定性比較或者總結(jié)歸納等方式進行研究, 多傾向于“需求側(cè)” 角度。但是公共數(shù)據(jù)政策是一個涉及“供給側(cè)” 和“需求側(cè)” 兩個方面的復(fù)雜系統(tǒng), 只有“供給側(cè)” 和“需求側(cè)” 都彼此適配, 才能促進我國公共數(shù)據(jù)開放政策體系的完善, 保證我國的公共數(shù)據(jù)釋放出自身內(nèi)部的價值。因此, 本文采用LDA 主題模型, 對開放公共數(shù)據(jù)政策文本進行挖掘, 從“供給側(cè)” 角度出發(fā), 找到政策文本的側(cè)重點, 分析其中還有哪些需要補充和完善的地方, 嘗試為構(gòu)建涉及不同層級單位、不同領(lǐng)域的全方位開放公共數(shù)據(jù)政策體系網(wǎng)絡(luò)提供學(xué)理支撐和參考, 也能夠與以往研究相呼應(yīng)。

      2 研究方法選擇與數(shù)據(jù)的獲取和預(yù)處理

      2 1 研究方法

      本文之所以選擇LDA 主題模型作為分析工具,主要原因有以下兩點: 第一, 該模型是一種無監(jiān)督的經(jīng)典學(xué)習(xí)方法, 且在分析不同領(lǐng)域和不同類型的政策方面都有著較好的實踐效果; 第二, 采用LDA主題模型能夠有效挖掘和分析政策文本內(nèi)部潛在的主題, 更好地理解政策文本的內(nèi)涵和精髓, 提高了政策文本分析的細(xì)粒度和精確度。而本文的研究目的是尋找公共數(shù)據(jù)開放政策供給的側(cè)重點, 需要透過政策表面來看政策文本內(nèi)部之間的聯(lián)系, 符合應(yīng)用LDA 主題模型的條件。而政策文件的主題詞是對一篇政策文件主要內(nèi)容的闡釋, 而且為了保證政策文本在執(zhí)行的時候能夠取得預(yù)期效果, 所以在詞語選擇上均經(jīng)過深思熟慮, 以求避免相關(guān)政策產(chǎn)生二義性, 通過分析了解一篇政策文件的主題詞都有哪些, 以及每個主題詞出現(xiàn)的頻次的高低和共現(xiàn)情況,能夠有效地了解整篇政策文件的內(nèi)容。所以本文從主題詞和LDA 主題模型兩方面出發(fā), 對我國公共數(shù)據(jù)開放政策進行分析, 以期實現(xiàn)本文的研究目的。

      2 2 數(shù)據(jù)獲取和預(yù)處理

      本文研究的對象主要是我國地方政府發(fā)布的涉及公共數(shù)據(jù)開放的政策文本, 所以在“北大法寶”數(shù)據(jù)庫中進行檢索, 檢索步驟為: 首先在“北大法寶” 數(shù)據(jù)庫中選擇“高級檢索”, 在“法律法規(guī)”模塊中選擇“地方法規(guī)”, 全文中包含“公共數(shù)據(jù)開放”, 點擊“同篇”, 以政策發(fā)布日期為準(zhǔn), 共計得到地方性法規(guī)37 條, 地方政府規(guī)章13 條, 地方規(guī)范性文件266 條, 地方工作文件742 條, 初步將上述政策文件納入研究范圍之中(檢索時間為2023年3 月2 日)。

      除此之外, 僅以“北大法寶” 作為數(shù)據(jù)庫, 不僅在數(shù)據(jù)來源上有局限性, 而且相關(guān)政策的收錄時間也存在一定的滯后性。因此, 同時在各省(自治區(qū)、直轄市)政府網(wǎng)站以及全國人大法律法規(guī)數(shù)據(jù)庫中進行檢索作為補充數(shù)據(jù)來源。綜合上述, 兩個來源共計獲得初步納入本研究范圍的政策文件673篇。

      對上述673 篇政策文件進行人工二次篩選, 剔除與本研究目的關(guān)聯(lián)性不強的政策文本, 如《北京市實施開放舉措行動方案》涉及“公共數(shù)據(jù)開放” 的內(nèi)容僅僅是“加快推進公共數(shù)據(jù)開放, 制定本市公共數(shù)據(jù)管理制度”, 未涉及公共數(shù)據(jù)開放的領(lǐng)域和重點等, 與本研究的關(guān)聯(lián)性不強, 因此予以剔除。而根據(jù)相關(guān)學(xué)者的研究經(jīng)驗, 相關(guān)技術(shù)標(biāo)準(zhǔn)也可以作為政策分析的一種對象納入進來, 所以此類標(biāo)準(zhǔn)文件予以保留。經(jīng)過篩選, 最終將16 條地方政府規(guī)章、25 條地方性法規(guī)、197 條地方規(guī)范性文件、104 條地方工作文件以及1 條推薦性地方標(biāo)準(zhǔn)納入本研究的數(shù)據(jù)集之中, 共計343 篇政策文件, 部分政策文件的信息如表1 所示。

      3 我國公共數(shù)據(jù)開放政策分析

      3 1 描述性統(tǒng)計分析

      1) 按政策效力區(qū)分。張濤等[45] 按照政策效力的高低將政策分為根政策、干政策和枝政策, 而表1 中提及的政策文件信息的5 種類別中, 地方政府規(guī)章效力低于地方性法規(guī), 地方工作文件的效力低于地方規(guī)范性文件, 也低于地方政府規(guī)章。因此,借鑒張濤等[45] 學(xué)者的分類方法, 同時在與相關(guān)法學(xué)專家溝通的基礎(chǔ)上, 將地方性法規(guī)劃為“根政策”, 地方政府規(guī)章和地方規(guī)范性文件劃為“干政策”, 地方工作文件和推薦性地方標(biāo)準(zhǔn)劃為“枝政策”。

      其中, “根政策” 共計25 篇, 約占比7%, “干政策” 共計213 篇, 約占比62%, “枝政策” 共計105 篇, 約占比31%。地方性法規(guī)的制定應(yīng)當(dāng)遵循本地具體情況和實際需要相一致的原則, 從而更好地促進黨和國家的相關(guān)法律、法規(guī)政策在本地區(qū)落地實施, 如《福建省大數(shù)據(jù)發(fā)展條例》[46] 的制定目的即推進數(shù)字福建建設(shè), 促進大數(shù)據(jù)的有序健康發(fā)展, 并對相關(guān)公共數(shù)據(jù)的開放和利用作出了一定的規(guī)定。而地方政府規(guī)章和地方規(guī)范性文件則相當(dāng)于地方政府相關(guān)部門在處理公共數(shù)據(jù)開放和使用過程中的細(xì)化, 如《山東省公共數(shù)據(jù)開放辦法》[47] 對公共數(shù)據(jù)的定義、開放原則、開放方式和組織機構(gòu)等進行了明確的規(guī)定, 《廣東省公共數(shù)據(jù)管理辦法》從公共數(shù)據(jù)目錄管理, 公共數(shù)據(jù)的采集、核準(zhǔn)與提供, 公共數(shù)據(jù)的共享和使用, 公共數(shù)據(jù)的開發(fā)和利用等若干方面對公共數(shù)據(jù)開放全過程進行了細(xì)化;《哈爾濱市公共數(shù)據(jù)開放管理暫行辦法》則提到了建立公共數(shù)據(jù)統(tǒng)一開放平臺保證公共數(shù)據(jù)開放的質(zhì)量。地方工作文件相當(dāng)于地方政府中對于公共數(shù)據(jù)開放管理政策的“末端”, 通過協(xié)調(diào)項目, 提出規(guī)劃, 或者舉辦公共數(shù)據(jù)開發(fā)利用比賽等手段激活公共數(shù)據(jù)的價值, 擴大公共數(shù)據(jù)開放的影響力。廣西提出通過開放公安、交運、市場監(jiān)管、氣象、銀聯(lián)和通信行業(yè)等多類型的公共數(shù)據(jù), 打造“一鍵游廣西” 項目; 上海市先后批準(zhǔn)多批次的公共數(shù)據(jù)開發(fā)和利用項目, 涉及銀聯(lián)、不動產(chǎn)租賃、征信以及數(shù)字地圖可視化等領(lǐng)域??梢哉f, 不同地方政府結(jié)合當(dāng)?shù)氐那闆r, 對本地區(qū)的開放公共數(shù)據(jù)作出了一定細(xì)化。

      2) 按政策公布年限區(qū)分。對上述343 篇政策文件按照發(fā)文年度進行統(tǒng)計, 截至2023 年3 月5日, 各年度發(fā)布政策數(shù)目如圖1 所示。

      從圖1 中可以看出, 我國公共數(shù)據(jù)開放相關(guān)政策出現(xiàn)于2014 年(2 部), 之后呈現(xiàn)出穩(wěn)步上升的趨勢, 并先后在2017 年(68 部)和2021 年(83 部)達到較高的水平, 說明我國地方政府高度重視公共數(shù)據(jù)開放的問題。2014 年, 北京中關(guān)村科技園和武漢市人民政府分別發(fā)布《關(guān)于加快培育大數(shù)據(jù)產(chǎn)業(yè)集群推動產(chǎn)業(yè)轉(zhuǎn)型升級的意見》(以下簡稱《大數(shù)據(jù)意見》)和《武漢市大數(shù)據(jù)產(chǎn)業(yè)發(fā)展行動計劃(2014—2018 年)》(以下簡稱《行動計劃》)。《大數(shù)據(jù)意見》要求“抓好公共數(shù)據(jù)開放環(huán)節(jié)” “探索公共數(shù)據(jù)開放機制”, 進而促進公共數(shù)據(jù)開放在工業(yè)化和信息化深度融合中發(fā)揮應(yīng)有的作用; 武漢市則指出, 要建立“公共數(shù)據(jù)開放機制”, 除法律法規(guī)禁止開放的信息之外, 一律向社會公開。公共數(shù)據(jù)涉及公眾生活的方方面面, 遠(yuǎn)比政府?dāng)?shù)據(jù)或者是政務(wù)數(shù)據(jù)涵蓋的范圍要廣, 對于公眾的影響也更加密切。因此, 結(jié)合各種自媒體終端的大量普及以及5G、物聯(lián)網(wǎng)等技術(shù)的快速發(fā)展, 打造公眾專屬的個人數(shù)據(jù)空間, 滿足市民的日常生活需要, 讓公共數(shù)據(jù)更好地發(fā)揮其自身應(yīng)有的作用就顯得尤為重要。

      3) 按政策發(fā)布的省級行政區(qū)域區(qū)分。對各個地方政策發(fā)布部門按照其所屬省級行政區(qū)域進行統(tǒng)計, 本研究涉及到的關(guān)于公共數(shù)據(jù)開放的政策文件, 共囊括我國除西藏、云南、臺灣、香港以及澳門之外的29 個省級行政區(qū)。其中, 政策發(fā)布數(shù)量較多的省級行政區(qū)域和政策數(shù)量分別為: 浙江(23篇)、江蘇(8 篇)、上海(15 篇)、山東(9 篇)、川渝地區(qū)(16 篇)和貴州(13 篇)。除貴州和川渝地區(qū)外, 基本都屬于我國東部沿海地區(qū), 且經(jīng)濟發(fā)展水平都較高。根據(jù)國家統(tǒng)計局公布的2021 年我國省級行政區(qū)域GDP 來看, 上述4 個東部沿海地區(qū)省級行政區(qū)域的經(jīng)濟數(shù)據(jù)均位居全國前10 名, 表明經(jīng)濟水平是影響我國公共數(shù)據(jù)開放政策發(fā)布的重要推動力[48] , 特別是將數(shù)字納入生產(chǎn)要素的范疇中之后, 數(shù)字已經(jīng)成為促進地方經(jīng)濟發(fā)展的重要生產(chǎn)資料。貴州雖然在2021 年的地區(qū)生產(chǎn)總值僅為19 586 42億元, 在全國排名第22 位, 但是貴州省地方政府積極重視公共數(shù)據(jù)開放的應(yīng)用, 積極組織或者舉辦相關(guān)開放數(shù)據(jù)應(yīng)用大賽, 以此為導(dǎo)向促進本地區(qū)公共數(shù)據(jù)開放進程, 也為評估公共數(shù)據(jù)開放的產(chǎn)出和效果提供了契機[49] 。而且, 內(nèi)蒙古自治區(qū)積極響應(yīng)國家關(guān)于數(shù)字經(jīng)濟和“東數(shù)西算” 相關(guān)布局的政策; 川渝地區(qū)也成為了國家算力樞紐節(jié)點的中心, 充分發(fā)揮數(shù)字經(jīng)濟時代“算力” 的“生產(chǎn)力” 作用, 說明了經(jīng)濟發(fā)展水平的高低、積極響應(yīng)國家政策以及推動公共數(shù)據(jù)開放的價值落地轉(zhuǎn)變?yōu)椤吧a(chǎn)力” 成為了提升當(dāng)?shù)毓矓?shù)據(jù)開放水平的重要推動力。

      3 2 基于LDA 主題模型的政策文本聚類分析

      3 2 1 最優(yōu)主題數(shù)目的獲取

      對政策文本進行聚類, 首先要對其進行主題挖掘, 而確定涉及的政策文本中包含的主題數(shù)目是保證后續(xù)進行主題挖掘和聚類達到合理效果的關(guān)鍵因素。LDA 主題模型的提出者Blei D M 等[29] 、胡吉明等[33] 、王秀紅等[50] 、邱均平等[51] 學(xué)者認(rèn)為, 采用困惑度來對主題數(shù)目進行衡量, 選取困惑度最小的模型確定主題的最優(yōu)數(shù)目, 但是存在主題辨識、情報分析效率過低的現(xiàn)象; Griffiths T L 等[52] 認(rèn)為,應(yīng)用貝葉斯模型來確定最優(yōu)主題數(shù)目, 但是該方法的計算復(fù)雜度較高, 且應(yīng)用范圍有限, 因此還需要結(jié)合專家意見來進行最終判定。綜合上述各位學(xué)者提到的方法, 結(jié)合本研究的實際情況, 決定采用計算對數(shù)似然估計數(shù)值的方法來確定最優(yōu)主題數(shù)目。

      首先對上述納入研究范疇的文本在R 語言環(huán)境下進行數(shù)據(jù)清理和文本分詞, 從而確保后續(xù)相關(guān)主題數(shù)目獲取和政策文本分析的精確度與可靠性。使用R 環(huán)境中的Worker()函數(shù)以及Jieba 分詞工具,Worker()函數(shù)中, User 參數(shù)設(shè)定用戶自定義的詞庫,Stop_word 參數(shù)設(shè)定停用詞表路徑。將上述兩個參數(shù)的值按照本研究的實際需要來進行設(shè)置, 確保去掉相關(guān)數(shù)據(jù)噪聲。

      在R 語言環(huán)境中設(shè)定主題范圍為2~100 的閉區(qū)間, 按照步長為5 依次測算不同主題數(shù)目所對應(yīng)的似然估計數(shù)值, 將似然估計數(shù)值最大的時候所對應(yīng)的主題數(shù)目確定為最優(yōu)主題數(shù)目, 主要代碼為:fitted_many<-lapply(sequ,function(k) topicmodels::LDA(TDM,k =k,method =“Gibbs”,control =list(bur?nin=burnin,iter=iter,keep=keep)))。經(jīng)過計算, 不同類型政策文本的最優(yōu)主題數(shù)目如表2 所示, 以下所有分析均是在最優(yōu)主題數(shù)目的環(huán)境下進行的。

      3 2 2 政策文本識別使用Java 版LDA 主題模型軟件, 在表3 中各個政策類型文本的最優(yōu)主題數(shù)目下, 對政策文本進行主題挖掘, 其中, 迭代次數(shù)為2 000次。每種政策類型的文件所識別出的部分主題及其每個主題下包含的排名前5 位的詞語如表3 所示。表3 中“政策類別” 按照政策效力作用范圍從大到小進行排列。從表3 內(nèi)容中可以看出, 我國開放公共數(shù)據(jù)政策中對于數(shù)據(jù)的供給給予了較高的關(guān)注度, 特別是在“地方政府規(guī)章” 相關(guān)政策文件中, “供給” “提供” 等關(guān)鍵詞更是出現(xiàn)在每個主題排名前5 位的關(guān)鍵詞之內(nèi), 而且更加強調(diào)對于“開放平臺” 等數(shù)據(jù)供給措施的建設(shè)。同時隨著政策作用范圍越小, 對于開放公共數(shù)據(jù)的內(nèi)容則更加具體。

      3 2 3 政策文本聚類

      使用Vosviewer, 對表3 中涉及的5 類政策識別出的各個主題包含的關(guān)鍵詞進行聚類, Resolution 的值設(shè)定為1, 分析方法選擇“Association Strength”(關(guān)聯(lián)強度方法), 目的是為了利用LDA 主題模型能夠從語義的角度分析政策文本主題詞關(guān)系的優(yōu)點,得到基于LDA 模型的我國公共數(shù)據(jù)開放政策文本聚類情況, 如圖2 所示。

      從圖2 中可以看出, 各個政策的內(nèi)容可以劃分為9 類, 按照每一個聚類內(nèi)部包含的信息, 可以將政策文本內(nèi)容劃為如下4 個方面:

      第一, 涉及開放公共數(shù)據(jù)中的個人信息保護問題。對于開放公共數(shù)據(jù)過程中如果涉及個人信息的問題, 數(shù)據(jù)的收集、保存和使用者應(yīng)當(dāng)遵循相應(yīng)的技術(shù)規(guī)范和政府規(guī)章規(guī)制, 采取技術(shù)手段對數(shù)據(jù)進行清洗優(yōu)化, 從而保障數(shù)據(jù)在既能夠發(fā)揮相關(guān)作用的前提下還能夠不泄露或者可能泄露相關(guān)人員的隱私, 特別是我國的《數(shù)據(jù)安全法》和《個人信息保護法》更是對此作出了明確的規(guī)定, 部分地方政府規(guī)章, 如《浙江省公共數(shù)據(jù)開放條例》等也結(jié)合本地區(qū)的實際經(jīng)驗作出了相應(yīng)的規(guī)范。

      第二, 涉及公共數(shù)據(jù)開放的政府管理。公共數(shù)據(jù)合法、有效、高效地開放, 離不開政府部門的有效管理。特別是隨著智慧城市的建設(shè)以及地方政府?dāng)?shù)字化轉(zhuǎn)型的加快, 為了滿足科學(xué)化決策和精準(zhǔn)化響應(yīng), 更加需要對公共數(shù)據(jù)的開放管理和使用實行高精度的管理。因此, 隨著2021 年發(fā)布的《中華人民共和國國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和2035 年遠(yuǎn)景目標(biāo)綱要》亦提及要“開展政府?dāng)?shù)據(jù)授權(quán)運營試點, 鼓勵第三方深化對公共數(shù)據(jù)的挖掘利用”[2-3] , 浙江、福建、海南等諸多省份紛紛對公共數(shù)據(jù)的管理、使用進行規(guī)范, 《海南省大數(shù)據(jù)開發(fā)應(yīng)用條例》指出, 要將“公共數(shù)據(jù)納入國有資產(chǎn)管理”。同時還明確“市場主體可享有增值性利用產(chǎn)生的產(chǎn)品和收益”, 促進了第三方等主體積極投身于公共數(shù)據(jù)開放的應(yīng)用領(lǐng)域之中[53] 。

      第三, 涉及公共數(shù)據(jù)開放過程中的國家安全問題。對相關(guān)數(shù)據(jù)實行分級分類管理, 按照數(shù)據(jù)主體或者數(shù)據(jù)來源、數(shù)據(jù)屬性等相關(guān)標(biāo)準(zhǔn)進行分類。按照和國家安全聯(lián)系的遠(yuǎn)近來分別采取不同的技術(shù)手段或者規(guī)章制度來分別確定不同類型的數(shù)據(jù)的使用方法和范疇, 在數(shù)據(jù)開放和保障國家安全之間作出平衡[54] 。

      第四, 涉及公共數(shù)據(jù)開放過程中的技術(shù)問題。從加強公共數(shù)據(jù)開放的角度出發(fā), 在公共數(shù)據(jù)從生成到使用再到最后的銷毀一系列過程中環(huán)節(jié)較多,例如可以通過相應(yīng)的區(qū)塊鏈等技術(shù)手段, 讓每一個階段的數(shù)據(jù)處理和使用過程有跡可循; 或者通過技術(shù)手段來限制某一主體在一定范圍內(nèi)和時間內(nèi)對相關(guān)公共數(shù)據(jù)資源的訪問頻次, 進而實現(xiàn)數(shù)據(jù)機密性、完整性和可用性三者之間的有機結(jié)合[55] 。

      4 結(jié)語與局限性

      本文從主題詞和LDA 主題模型兩個角度出發(fā),通過對文本主題詞的詞頻和不同主題詞之間的相互關(guān)系兩個維度入手, 對我國公共數(shù)據(jù)開放政策的文本進行了聚類分析, 可以發(fā)現(xiàn)我國公共數(shù)據(jù)開放政策供給特征有如下幾點:

      第一, 從各個行政區(qū)域發(fā)布的政策數(shù)量來看,我國公共數(shù)據(jù)開放政策供給從東部地區(qū)到西部地區(qū)呈現(xiàn)出明顯的“階梯式” 下降的趨勢。主要原因在于東部地區(qū)由于區(qū)位優(yōu)勢和經(jīng)濟發(fā)展的需要, 對公共數(shù)據(jù)的需求量較大, 由此倒逼東部地方政府積極出臺相關(guān)政策來規(guī)范相關(guān)數(shù)據(jù)開放行為, 挖掘公共開放數(shù)據(jù)中的潛力, 從而讓數(shù)字經(jīng)濟成為促進地區(qū)經(jīng)濟發(fā)展的有力引擎。

      第二, 我國公共數(shù)據(jù)開放政策供給領(lǐng)域不均衡?,F(xiàn)行的政策文本關(guān)注的主要是和公眾利益密切相關(guān)的領(lǐng)域, 如光電、城市醫(yī)療、公共交通等領(lǐng)域。雖然在客觀程度上反映了我國公共數(shù)據(jù)開放重視保護公眾的利益、保障公眾的知情權(quán)等, 但是公共數(shù)據(jù)涉及的領(lǐng)域很廣, 除了上述領(lǐng)域之外, 金融、科技、文化等領(lǐng)域的相關(guān)數(shù)據(jù)開放也應(yīng)該在確保數(shù)據(jù)安全的前提下, 出臺相應(yīng)的開放數(shù)據(jù)政策, 從而構(gòu)造一個涉及各個領(lǐng)域的公共數(shù)據(jù)開放政策網(wǎng)絡(luò)。

      第三, 突發(fā)緊急事件狀態(tài)下公共數(shù)據(jù)供給的力度還有待提高。目前而言, 大部分公共數(shù)據(jù)開放政策尚未涉及在突發(fā)緊急事件狀態(tài)下相關(guān)數(shù)據(jù)的開放和使用問題。而突發(fā)緊急事件下相關(guān)數(shù)據(jù)的正常公開、合法使用和精準(zhǔn)流通往往是確保突發(fā)事件能夠高效解決的關(guān)鍵。但是各類政策文本對此卻鮮有涉及, 因此還需要相關(guān)部門結(jié)合歷次突發(fā)事件的特征和公共數(shù)據(jù)的特點, 制定突發(fā)緊急事件狀態(tài)下的公共數(shù)據(jù)開放法規(guī)。

      本文存在部分局限性, 主要表現(xiàn)在由于對“公共數(shù)據(jù)” 的定義, 不同的學(xué)者還存在著不同的理解,因此在納入本研究范疇的政策文件選擇上還可以繼續(xù)斟酌, 以期兼顧政策文件的“查全率” 與“查準(zhǔn)率”; 此外, 針對相關(guān)政策內(nèi)容聚類和劃分時,對于各個主題的細(xì)粒度還可以進一步進行優(yōu)化; 在總結(jié)主題標(biāo)簽的過程中還可以結(jié)合本領(lǐng)域的專家意見或者相關(guān)文獻進行歸納, 以使得主題標(biāo)簽的科學(xué)性更強。后續(xù)將圍繞解決上述不足進行進一步的深化研究。

      參考文獻

      [1] 何哲, 黃璜, 劉文宇. 等. 建設(shè)網(wǎng)絡(luò)強國、促進國家治理體系和治理能力現(xiàn)代化行動指南———《習(xí)近平在網(wǎng)絡(luò)安全和信息化工作座談會上的講話》精神學(xué)習(xí)體會[J]. 電子政務(wù), 2016, (6):2-25.

      [2] 新華網(wǎng). (兩會授權(quán)發(fā)布)中華人民共和國國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和2035 年遠(yuǎn)景目標(biāo)綱要[EB/ OL]. http:/ /www.xinhuanet.com/2021-03/13/ c_1127205564.htm, 2023-02-13.

      [3] 中華人民共和國中央人民政府. 國務(wù)院關(guān)于印發(fā)“十四五”數(shù)字經(jīng)濟發(fā)展規(guī)劃的通知[EB/ OL]. http:/ / www.gov.cn/ zhengce/content/2022-01/12/ content_5667817.htm?type=1, 2023-02-13.

      [4] 胡業(yè)飛, 孫華俊. 政府信息公開與數(shù)據(jù)開放的關(guān)聯(lián)及治理邏輯辨析———基于“政府—市場—社會” 關(guān)系變遷視角[J]. 中國行政管理, 2021, (2): 31-39.

      [5] 高爭志. 公共數(shù)據(jù)開放制度的價值定位與實現(xiàn)路徑[ J]. 數(shù)字圖書館論壇, 2020, (1): 27-34.

      [6] 東方, 鄧靈斌. 政府?dāng)?shù)據(jù)開放的法律規(guī)制: 美國立法與中國路徑———基于美國《開放政府?dāng)?shù)據(jù)法》(OGDA) 的思考[J]. 情報資料工作, 2021, 42 (5): 50-57.

      [7] 陳美. 澳大利亞地方政府開放數(shù)據(jù)的保障機制研究———基于多元公共行政觀的視角[J]. 情報理論與實踐, 2017, 40 (12):139-144, 111.

      [8] 黃如花, 王春迎, 范冰玥, 等. 加拿大圖書館開放政府?dāng)?shù)據(jù)服務(wù)實踐調(diào)查分析及對我國的啟示[ J]. 圖書館學(xué)研究, 2018,(13): 97-101.

      [9] 冉連. 基于WOS 的國外公共部門大數(shù)據(jù)應(yīng)用研究可視化分析[J]. 電子政務(wù), 2018, (7): 90-99.

      [10] 陸敬筠, 呂海艷. 上海市公共數(shù)據(jù)開放平臺用戶畫像構(gòu)建與分析[J]. 數(shù)字圖書館論壇, 2021, (10): 54-59.

      [11] 儲節(jié)旺, 楊雪. 公共數(shù)據(jù)開放的政府主體責(zé)任研究[ J]. 現(xiàn)代情報, 2019, 39 (10): 127-135.

      [12] 鄭磊, 呂文增. 公共數(shù)據(jù)開放的產(chǎn)出與效果研究———以上海開放數(shù)據(jù)創(chuàng)新應(yīng)用大賽為例[J]. 電子政務(wù), 2017, (9): 2-10.

      [13] 蒲攀, 馬海群. 大數(shù)據(jù)時代我國開放數(shù)據(jù)政策模型構(gòu)建[ J].情報科學(xué), 2017, 35 (2): 3-9.

      [14] Pereira G V, Macadar M A, Luciano E M, et al. DeliveringPublic Value Through Open Government Data Initiatives in a SmartCity Context [J]. Information Systems Frontiers, 2017, 19 (2):213-229.

      [15] Lakomaa E, Kallberg J. Open Data as a Foundation for Innova?tion: The Enabling Effect of Free Public Sector Information for En?trepreneurs [J]. IEEE Access, 2013, 1: 558-563.

      [16] Versluis L, Mathá R, Talluri S, et al. The Workflow Trace Ar?chive: Open-Access Data from Public and Private Computing In?frastructures [ J]. IEEE Transactions on Parallel and DistributedSystems, 2020, 31 (9): 2170-2184.

      [17] 王本剛, 馬海群. 公共數(shù)據(jù)的公共價值研究———以國內(nèi)外相關(guān)政策和報告為核心的解讀[J]. 情報理論與實踐, 2022, 45(10): 1-10.

      [18] 孫瑞英, 陳宜泓. 基于PMC 指數(shù)模型的我國公共數(shù)據(jù)開放政策評價研究[J/ OL]. 情報理論與實踐: 1-16 [2023-04-09].http:/ / kns.cnki.net/ kcms/ detail/11.1762.g3.20230322.1639.006.ht?ml.

      [19] 馬海群, 劉興麗, 韓娜. 基于關(guān)聯(lián)規(guī)則的開放政府?dāng)?shù)據(jù)主題多政策協(xié)同性研究[J]. 情報科學(xué), 2022, 40 (4): 3-8, 17.

      [20] 付熙雯. 數(shù)字中國建設(shè)中政府?dāng)?shù)據(jù)開放利用政策的優(yōu)化[ J].陜西師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版), 2022, 51 (4): 118-133.

      [21] 黃雨婷, 傅文奇. 日本政府?dāng)?shù)據(jù)開放的政策保障及其啟示[J].?dāng)?shù)字圖書館論壇, 2020, (9): 9-17.

      [22] 東方, 鄧靈斌. 政府?dāng)?shù)據(jù)開放的法律規(guī)制: 美國立法與中國路徑———基于美國《開放政府?dāng)?shù)據(jù)法》( OGDA) 的思考[ J].情報資料工作, 2021, 42 (5): 50-57.

      [23] 黃如花, 劉龍. 英國政府?dāng)?shù)據(jù)開放的政策法規(guī)保障及對我國的啟示[J]. 圖書與情報, 2017, (1): 1-9.

      [24] 黃雨婷, 黃如花. 丹麥政府?dāng)?shù)據(jù)開放的政策法規(guī)保障及對我國的啟示[J]. 圖書與情報, 2017, (1): 27-36.

      [25] 曹雨佳. 政府開放數(shù)據(jù)生態(tài)鏈中的用戶參與機制———以加拿大政府?dāng)?shù)據(jù)開放實踐為例[J]. 情報理論與實踐, 2021, 44 (6):18-27.

      [26] Sumitomo T, Koshizuka N. Progress and Initiatives for Open DataPolicy in Japan [J]. Computer, 2018, 51 (12): 14-23.

      [27] Viscusi G, Batini C. Information Production and Social Value forPublic Policy: A Conceptual Modeling Perspective [J]. Policy &Internet, 2016, 8 (3): 334-353.

      [28] Jung K, Park H W. A Semantic ( TRIZ) Network Analysis ofSouth Koreas “ Open Public Data” Policy [ J]. Government In?formation Quarterly, 2015.

      [ 29] Blei D M, Ng A Y, Jordan M I. Latent Dirichlet Allocation [J].Journal of Machine Learning Research, 2003, 3 (4/5): 993-1022.

      [30] 張濤, 馬海群. 一種基于LDA 主題模型的政策文本聚類方法研究[J]. 數(shù)據(jù)分析與知識發(fā)現(xiàn), 2018, 2 (9): 59-65.

      [31] 黃仕靖, 吳川徽, 袁勤儉, 等. 基于情感分析的突發(fā)公共衛(wèi)生事件輿情時空演化差異研究[J/ OL]. 情報科學(xué): 1-11 [2023-02-13]. http: / / hfffg5fce84748f1d4cc2hxuwxpcpkunpc6pbv.fgfy. hlju.cwkeji.cn/ kcms/ detail/22.1264.G2.20220314.1057.012.html.

      [32] 周健, 張杰, 屈冉, 等. 基于LDA 的國內(nèi)外區(qū)塊鏈主題挖掘與演化分析[J]. 情報雜志, 2021, 40 (9): 161-169.

      [33] 胡吉明, 付文麟, 錢瑋, 等. 融合主題模型和注意力機制的政策文本分類模型[J]. 情報理論與實踐, 2021, 44 (7): 159-165.

      [34] 劉雅姝, 張海濤, 徐海玲, 等. 多維特征融合的網(wǎng)絡(luò)輿情突發(fā)事件演化話題圖譜研究[J]. 情報學(xué)報, 2019, 38 (8): 798-806.

      [35] 姚潔, 孟小璐. 運用改進型LDA 算法的電商微博熱點話題研究[J]. 重慶理工大學(xué)學(xué)報(自然科學(xué)), 2019, 33 (12): 184-188.

      [36] 池毛毛, 潘美鈺, 王偉軍. 共享住宿與酒店用戶評論文本的跨平臺比較研究: 基于LDA 的主題社會網(wǎng)絡(luò)和情感分析[ J].圖書情報工作, 2021, 65 (2): 107-116.

      [37] 吳江, 侯紹新, 靳萌萌, 等. 基于LDA 模型特征選擇的在線醫(yī)療社區(qū)文本分類及用戶聚類研究[J]. 情報學(xué)報, 2017, 36(11): 1183-1191.

      [38] 孫玉潔, 秦永彬. 基于LDA 模型的多角度個性化微博推薦算法[J]. 計算機工程, 2017, 43 (4): 177-182.

      [39] 王璟琦, 李銳, 吳華意. 基于空間自相關(guān)的網(wǎng)絡(luò)輿情話題演化時空規(guī)律分析[J]. 數(shù)據(jù)分析與知識發(fā)現(xiàn), 2018, 2 ( 2):64-73.

      [40] Zhou X Z, Wu S X. Rating LDA Model for Collaborative Filtering[J]. Knowledge-Based Systems, 2016, 110 (15): 135-143.

      [41] Chen S, Huang L, Lei Z, et al. Research on Personalized Rec?ommendation Hybrid Algorithm for Interactive Experience Equipment[J]. Computational Intelligence, 2020, 36 (3): 1348-1373.

      [42] Yang L, Jing L P, Michael K N, et al. A Discriminative andSparse Topic Model for Image Classification and Annotation [ J].Image and Vision Computing, 2016, 51 (7): 22-35.

      [43] Wang L. Automatic Annotation of Multispectral Satellite Images U?sing Author-Topic Model [J]. IEEE Geoscience & Remote Sens?ing Letters, 2012, 9 (4): 634-638.

      [44] Beraha M, Guglielmi A, Quintana F A. The Semi-hierarchicalDirichlet Process and Its Application to Clustering Homogeneous Dis?tributions [J]. Bayesian Analysis, 2021, 16 (4): 1187-1219.

      [45] 張濤, 馬海群. 我國大數(shù)據(jù)政策主題分析及發(fā)展動向研判[J].情報理論與實踐, 2022, 45 (3): 72-80.

      [46] 中央網(wǎng)信辦. 《福建省大數(shù)據(jù)發(fā)展條例》公布[ EB/ OL]. ht?tp: / / www.cac. gov. cn/2021 - 12/28/ c_1642291459800235. htm,2023-02-13.

      [47] 山東省人民政府. 山東省公共數(shù)據(jù)開放辦法[ EB/ OL]. ht?tp: / / www.shandong.gov.cn/ art/2022/2/9/ art_107851_117339.ht?ml, 2023-02-13.

      [48] 門理想, 王叢虎, 門鈺璐. 公共價值視角下的政府?dāng)?shù)據(jù)開放———文獻述評與研究展望[J]. 情報雜志, 2021, 40 (8): 104-110.

      [49] 鄭磊, 呂文增. 公共數(shù)據(jù)開放的產(chǎn)出與效果研究———以上海開放數(shù)據(jù)創(chuàng)新應(yīng)用大賽為例[J]. 電子政務(wù), 2017, (9): 2-10.

      [50] 王秀紅, 高敏. 基于BERT-LDA 的關(guān)鍵技術(shù)識別方法及其實證研究———以農(nóng)業(yè)機器人為例[J]. 圖書情報工作, 2021, 65(22): 114-125.

      [51] 邱均平, 沈超. 基于LDA 模型的國內(nèi)大數(shù)據(jù)研究熱點主題分析[J]. 現(xiàn)代情報, 2021, 41 (9): 22-31.

      [52] Griffiths T L, Steyvers M. Finding Scientific Topics [ J]. Pro?ceedings of the National Academy of Sciences of the United States ofAmerica, 2004, 101 (1): 5228-5235.

      [53] 袁千里, 張云翔. 基于信息技術(shù)的共同生產(chǎn): 作用、影響因素和挑戰(zhàn)[J]. 公共行政評論, 2022, 15 (1): 171-195, 200.

      [54] 新華網(wǎng). 中共中央國務(wù)院關(guān)于構(gòu)建更加完善的要素市場化配置體制機制的意見[EB/ OL]. https:/ / xueqiu.com/6227555304/146559790?page=2, 2023-02-13.

      [55] 胡吉明, 溫芳芳, 黃如花, 等. 中國政府?dāng)?shù)據(jù)開放研究的主題關(guān)聯(lián)結(jié)構(gòu)與演化態(tài)勢[J]. 情報資料工作, 2019, 40 (4):56-68.

      (責(zé)任編輯: 郭沫含)

      猜你喜歡
      政策分析模型
      一半模型
      p150Glued在帕金森病模型中的表達及分布
      重要模型『一線三等角』
      重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
      關(guān)于研究生淘汰制實施成效的政策反思
      隨遷子女異地高考政策研究
      在糾結(jié)中前行的網(wǎng)約車改革
      人民論壇(2016年37期)2016-12-28 11:10:20
      中哈霍爾果斯國際邊境合作中心優(yōu)惠政策分析報告
      商(2016年35期)2016-11-24 13:45:59
      基于廣州流動兒童的城鄉(xiāng)居民基本醫(yī)療保險政策探究
      商(2016年34期)2016-11-24 13:30:28
      3D打印中的模型分割與打包
      西贡区| 信丰县| 吉隆县| 丰台区| 怀远县| 石门县| 云南省| 台湾省| 台东县| 安国市| 吴江市| 沂南县| 普安县| 荣昌县| 邹平县| 吴旗县| 林周县| 桑植县| 洪洞县| 寿阳县| 内丘县| 都兰县| 达州市| 天长市| 岢岚县| 买车| 临夏县| 上犹县| 故城县| 边坝县| 宜章县| 湘乡市| 光泽县| 屯门区| 法库县| 岐山县| 浦江县| 深水埗区| 鄂托克旗| 郁南县| 延吉市|