• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據建模技術在廉潔風險防控領域的應用

      2023-07-25 12:09:51康強劉光耀鄧姍妮
      中國新通信 2023年9期
      關鍵詞:數(shù)據模型建模防控

      康強 劉光耀 鄧姍妮

      摘要:廉潔風險防控管理過程繁雜,管理鏈條和周期長,對數(shù)據建模體系性和一致性的要求很高,本文系統(tǒng)研究分析總結了廉潔風險防控領域的建模需求、數(shù)據建模方式及存儲內容管理等相關技術實踐,結合紀檢工作本質和領域特點提出應用方案。本研究旨在數(shù)據建模技術與廉潔風險防控業(yè)務搭建橋梁,為利用多源數(shù)據全景化分析紀檢關聯(lián)要素提供方向性的指導。

      關鍵詞:廉潔風險防控;數(shù)據建模

      一、引言

      數(shù)據需求的定義與分析廣泛地使用數(shù)據建模技術,同時是一個支持將整個信息系統(tǒng)重新設計的過程[1]。而廉潔風險防控也是當今所重視的領域,利用數(shù)據建模技術來構建數(shù)據結構框架,從而保證相關部門的有效運行。而這個數(shù)據結構框架主要應用在兩個方面,一是抓重點業(yè)務領域、重點職能部門、重點業(yè)務環(huán)節(jié),篩選廉潔風險、完善內控機制、筑牢廉潔防線,確保紀檢部門信息管理系統(tǒng)的建設以及數(shù)據關聯(lián)。二是廉潔風險教育與大數(shù)據分析的需求需要強有力的結構框架,數(shù)據建模技術可以充分地發(fā)揮作用。

      廉潔風險防控管理過程繁雜,涉及的關鍵要素眾多,不同的業(yè)務場景涉及的管理規(guī)定、執(zhí)行過程各不相同,業(yè)務流程設計不同直接決定了信息系統(tǒng)結構和邏輯大相徑庭,結合這幾種情況,在數(shù)據交互和關聯(lián)分析時,就會出現(xiàn)信息融合困難,關聯(lián)程度低等問題,尤其是當前很多企業(yè)的管理規(guī)定并未完全線上化,這就導致存在很多線下文件并行,致使數(shù)據難以融合,無法統(tǒng)一管理。本文通過廉潔風險防控領域中數(shù)據建模過程的實踐,分析廉潔風險防控中數(shù)據建模技術的應用,并對其進行經驗總結。

      二、數(shù)據建模技術介紹

      (一)數(shù)據建模簡介

      數(shù)據建模是一種用于定義和分析數(shù)據的要求和其需要的相應支持的信息系統(tǒng)的過程。所以,在進行數(shù)據建模的過程中,專業(yè)性的數(shù)據建模工作離不開企業(yè)的利益及用戶的信息系統(tǒng)。

      從需求到實際數(shù)據庫構建,一般包括三個步驟。。僅用于信息系統(tǒng)的數(shù)據建模是作為一個模型來應用,最基本的功能是來記錄一組數(shù)據達到規(guī)范的目的。一個數(shù)據建模技術系統(tǒng)要想構建,首先思考是否符合企業(yè)最初的需求,其次才能轉變?yōu)橐粋€邏輯數(shù)據模型,恰好這個邏輯數(shù)據模型可以在數(shù)據庫中構造。一個概念數(shù)據模型的實現(xiàn)可能需要多個邏輯數(shù)據模型。最后需要確定邏輯數(shù)據模型與物理數(shù)據模型之間的數(shù)據訪問性能和存儲方面的具體要求,不僅僅是數(shù)據元素,同時它們之間的結構和聯(lián)系也不可忽視[2]。

      數(shù)據建模常用在系統(tǒng)開發(fā)與系統(tǒng)維護的工作環(huán)境中,也稱為系統(tǒng)開發(fā)生命周期(SDLC)。當然,數(shù)據建模也可以用在更廣泛的領域,如業(yè)務和數(shù)據架構、主數(shù)據管理和數(shù)據治理計劃,其直接的結果不是在數(shù)據庫,而是對組織數(shù)據的理解。模型是現(xiàn)實中事物的一種表征或者想要創(chuàng)造事物的一種模式。一個模型可以包含一個或多個圖表。模型圖可以使人們通過標準化的符號快速了解其內容。地圖、組織架構圖和建筑藍圖都是日常模型的例子。

      數(shù)據模型描述了組織已經理解或者未來需要的數(shù)據。數(shù)據模型包含一組帶有文本標簽的符號,這些符號以可視化的方式展現(xiàn)數(shù)據需求并將其傳遞給數(shù)據建模人員。也可以把模型理解成一種文檔形式,用于記錄數(shù)據需求和建模過程產生的數(shù)據定義。數(shù)據模型是用來將數(shù)據需求從業(yè)務傳遞到IT溝通的主要媒介。

      數(shù)據建模需要遵循如下幾點原則[3]:

      ①格式化。數(shù)據模型是對于數(shù)據結構和數(shù)據關系的簡潔定義。需要能夠評估當前或者理想情況下業(yè)務規(guī)則對數(shù)據的影響情況。格式化的定義賦予數(shù)據規(guī)范的結構,減少在訪問和保存數(shù)據時發(fā)生異常的概率。通過展現(xiàn)數(shù)據中的結構和關系,數(shù)據模型使數(shù)據更容易被使用。

      ②范圍定義。數(shù)據模型可以幫助解釋數(shù)據上下文的邊界,以及購買的應用程序包、項目、方案或實施的現(xiàn)有系統(tǒng)。

      ③知識保留記錄。數(shù)據模型通過以書面的形式獲取知識來保存系統(tǒng)或項目的數(shù)據信息。它要能給未來項目提供原始記錄。數(shù)據模型要有助于更好地理解一個組織、一個業(yè)務方向、一個已存在的應用。同時,數(shù)據模型需要能被重復利用,能夠幫助業(yè)務專業(yè)人員了解環(huán)境中的數(shù)據結構。

      (二)數(shù)據建模的方法

      常見的6種數(shù)據建模方法是:關系建模、維度建模、面向對象建模、基于事實建模、基于時間建模和非關系型建模[4]。每種建模方法都采用一些特定的表示法來進行表達。

      ①關系建模,能夠精準表達業(yè)務數(shù)據,減少數(shù)據存儲的冗余,其適用于設計操作型的系統(tǒng)。

      ②維度建模,專注于特定的業(yè)務流程和領域問題,在維度模型中,數(shù)據組織的方式是為了優(yōu)化海量數(shù)據的查詢和分析。

      ③面向對象建模,規(guī)定了實體類與其屬性的關系,可以利用封裝、繼承、多態(tài)等先進特性對模型進行重復開發(fā)。

      ④基于事實建模,可以不使用屬性從需求信息和查詢實例開始,實例在外部環(huán)境中呈現(xiàn),然后在概念層次上用受控自然語言所表達的事實來描述實例。

      ⑤基于時間建模,是當數(shù)據值必須按照時間順序與特定時間值相關聯(lián)時,必要的一種建模方法。

      ⑥非關系型建模,可以將業(yè)務主題在無需進行多關系結構分解的情況下,存儲在文檔結構中,也可以利用鍵值對將數(shù)據進行列式存儲,從而提升查詢效率。

      三、數(shù)據建模技術在廉潔風險防控領域的應用

      (一)數(shù)據建模需求

      隨著廉潔風險數(shù)據可獲取性的提升以及數(shù)據分析應用技術的逐步發(fā)展,全面從嚴治黨管理工作不再局限于對思想政治以及意識形態(tài)塑造的探索,而是面向更廣泛的數(shù)字活動場景,相關紀檢工作也逐步運用大數(shù)據分析、機器學習、深度學習等計算方法對高頻違規(guī)風險點進行分析[5]。

      然而,不同領域理論與技術方法的交叉實踐配合相對復雜且繁瑣,數(shù)據呈現(xiàn)出的動態(tài)和開放的特征也加劇了多源數(shù)據組織、聚合與建模的難度,進而阻礙了相關研究的步伐,為此,提出數(shù)據建模技術在廉潔風險防控領域的需求。

      廉潔風險防控數(shù)據建模主要目的是要通過數(shù)據模型梳理數(shù)字化的紀檢關鍵要素特征,針對廉潔風險源頭部門或崗位,形成法律法規(guī)典型案例的數(shù)據資產。

      從業(yè)務層面上來說,數(shù)據建模技術發(fā)揮著不可替代的作用,可以整合紀檢管理計劃以及法規(guī)理解能力,從技術層面來說,廉潔風險防控相關信息化系統(tǒng)與法律法規(guī)業(yè)務數(shù)據間可以有效的、多層次的讀取,確保數(shù)據之間平穩(wěn)的層次交互、多維跨越。旨在技術和業(yè)務之間建立一個有效的橋梁,為利用新型數(shù)字技術全景化為數(shù)據進行精準剖析,為紀檢工作提供方向性的指導。

      廉潔風險防控領域應用的數(shù)據建模技術需要從業(yè)務邏輯和數(shù)據邏輯兩個方面來考慮,業(yè)務邏輯是指法律法規(guī)及相關案例的數(shù)據是否能夠與經營生產業(yè)務產生必要的聯(lián)系,業(yè)務邏輯通過關系建模方法,將法律法規(guī)數(shù)據和業(yè)務領域關聯(lián),并建立起必要的數(shù)據關聯(lián)關系。數(shù)據邏輯層面要從數(shù)據的完整性、集中度,以及與廉潔關鍵影響因素等角度來考慮,并進行模型設計,可以使用基于事實建模方法,將廉潔防控業(yè)務中影響因子抽象成事實模型,并進行后續(xù)的采樣分析。

      (二)數(shù)據特征建模

      廉潔風險數(shù)據模型會表現(xiàn)出復雜的結構特征以及動態(tài)數(shù)據特性,高頻、高風險的活動能夠使各類業(yè)務數(shù)據在不同的業(yè)務場景下流動,在此過程中,由于活動的多樣性和構成要素多粒度的復雜特性,要圍繞著廉潔風險研究的關鍵場景,高頻風險點進行多元關系模型的構建,通過數(shù)據之間的特征關聯(lián),來呈現(xiàn)并解析實際紀檢工作中的運行模式與規(guī)律[6]。

      在完成廉潔風險防控數(shù)據特征建模設計時,首先要根據數(shù)據資源進行體系劃分,同時抽取與廉潔風險防控全生命周期管理相關的對象,并將對象分類和提煉,最終構建便于應用的數(shù)據模型。

      為了能夠將廉潔風險管理數(shù)據與模型有機結合,需要進行基于多數(shù)據源深化的數(shù)據特征建模,對廉潔風險防控表示模型進行“實體-屬性-關系-數(shù)據”的數(shù)據關聯(lián)。

      數(shù)據特征建模的過程可以厘清廉潔風險各對象之間的關系,它可以面向更廣泛的業(yè)務活動場景,揭示業(yè)務領域的違規(guī)特征和內部運行機制,數(shù)據特征建模具體的工作步驟如下所示:

      ①切分數(shù)據對象,包括廉潔風險管理中涉及的組織、部門、崗位、角色等業(yè)務實體和經營、生產、管理相關的業(yè)務活動。

      ②構建數(shù)據關系,包括部門層級、法律條款前后時序、數(shù)據重疊等不同數(shù)據之間的關聯(lián)內容。

      ③明確數(shù)據屬性,記錄數(shù)據庫中對象和關系的屬性描述,如業(yè)務領域中的業(yè)務流程和業(yè)務描述,違規(guī)特征中的違規(guī)場景、違規(guī)頻率和關聯(lián)法律等。

      ④進行數(shù)據約束,對數(shù)據在如制度、規(guī)程、有效狀態(tài)等業(yè)務層面的規(guī)則和限制進行安全約束和說明。

      (三)數(shù)據模型存儲

      數(shù)據實體化旨在通過存儲不同來源的多維度數(shù)據實現(xiàn)對于廉潔風險的業(yè)務實體進行數(shù)字化表征,進而形成完整的結構化數(shù)據單元,服務于后續(xù)業(yè)務執(zhí)行以及數(shù)據分析工作。其過程包括多源數(shù)據匯聚、數(shù)據結構化清洗、實體數(shù)據融合等核心任務[7]。

      多源數(shù)據匯聚是指在完成廉潔風險防控數(shù)據特征建模后,需要將不同渠道、不同維度的數(shù)據進行分片存儲,在存儲的過程中要保證數(shù)據在整個生命周期中的可用性和數(shù)據讀取的性能。當前廉潔風險相關的數(shù)據較為分散,數(shù)據形式、數(shù)據結構、數(shù)據編碼均未統(tǒng)一,其中人員、崗位等信息為結構化數(shù)據,法律法規(guī)和紀檢案例均有大部分非結構化數(shù)據和紙質文檔。

      針對此類數(shù)據質量不穩(wěn)定、數(shù)據結構不統(tǒng)一的情況,就需要將數(shù)據進行結構化的清洗。數(shù)據清洗的具體工作是預先將異構系統(tǒng)中不同渠道、不同維度的數(shù)據放入ETL自動流水線中加載原始數(shù)據,再將數(shù)據置于中間數(shù)據庫的維度表中對其進行清洗轉換,清洗后的數(shù)據會存儲至目標數(shù)據庫,根據數(shù)據庫的約束結合文本匹配技術,實現(xiàn)數(shù)據去重,減少不必要的冗余。結構化的數(shù)據能夠從紀檢的基本屬性、人員的行為屬性和法規(guī)的管理屬性為出發(fā)點,采用不同維度來解析和透視廉潔風險數(shù)據特征,最終形成服務于紀檢管理的數(shù)據主題。

      實體數(shù)據融合是要將經過清洗后的結構化數(shù)據集進行提取,形成實體數(shù)據單元。盡管多源數(shù)據匯聚階段對相關數(shù)據進行了初步的組織,但是在數(shù)據模型存儲完畢后,仍需要根據不同類型的數(shù)據特征制定相應數(shù)據的提取規(guī)則,實現(xiàn)從主題數(shù)據到廉潔風險屬性的映射[8]。在這個過程中為了保證實體數(shù)據單元的唯一性,需要對內容相同的實體進行合并,實現(xiàn)實體層面的融合,對于相同名字的法規(guī)和條款,或是相同場景的廉潔影響因素,可以直接通過屬性合并來實現(xiàn)實體融合。對于不同數(shù)據文本中名稱存在差異的實體,需要先從實體屬性數(shù)據間的相似性入手,消除實體描述的歧義后再根據名稱進行實體融合。

      (四)數(shù)據內容管理

      數(shù)據建模并成功存儲至數(shù)據庫后的工作重點在于保持數(shù)據的安全及完整性,并使這些數(shù)據模型能夠被搜索?;诹疂嶏L險管控的工作特點,以及其相關數(shù)據的特性,我們選用了Lucene為應用提供檢索功能。Lucene可以方便地在目標系統(tǒng)中實現(xiàn)全文檢索的功能,或者是以此為基礎建立起完整的全文檢索引擎,它采用了基于反向索引的設計原理,在底層采用了數(shù)據分段的讀取模式,分段是只讀的,使它在讀寫時可以避免了鎖的出現(xiàn),大大提升了讀寫性能。

      面向具體的應用場景,在廉潔風險防控數(shù)據建模的基礎上,采用如聚類集成、復合關系數(shù)據矩陣融合等方法,可以對紀檢管理活動中的數(shù)據與場景進行融合,從而有效地揭示“部門-崗位-職責-人員”與“高風險場景-高頻違規(guī)點-法律法規(guī)”的關系,實現(xiàn)從多角度對廉潔風險防控工作的對象、過程、結構、組織及其作用和效應進行有機關聯(lián)。基于數(shù)據和風險因素的結合,讓信息和知識的擴散不再受到媒介的限制,讓更多受眾能夠有機會獲取并利用相關數(shù)據。

      交互體驗方面,基于數(shù)據內容結合崗位及紀檢業(yè)務特點,我們使用隱馬爾可夫模型來優(yōu)化語義識別,該模型可以解決數(shù)據內容及詞條評估、解碼及機器學習的問題,它將分詞算法置于可觀測狀態(tài)并能夠逐步優(yōu)化用戶體驗,從而掃除基層員工法規(guī)查閱困難,理解有難度的障礙,從根本上提高受眾對法規(guī)、條款的理解能力。

      四、結束語

      數(shù)據建模在數(shù)字化系統(tǒng)建設中起著很重要的作用,它決定了整個數(shù)據架構的穩(wěn)定性和易用性,這對廉潔風險防控領域未來的數(shù)字化建設影響深遠。廉潔風險防控工作是一個管理范圍廣、執(zhí)行路徑長的復雜工程,數(shù)據作為信息化建設的成果體現(xiàn),需要體系的結構設計、嚴謹?shù)某橄竽P头椒?,才能保障應用的?guī)范性和擴展性,有效的應用數(shù)據建模技術,能夠提升紀檢工作的管理效率,提高廉潔風險防控領域應用的交互體驗。

      作者單位:康強 劉光耀 鄧姍妮 中石油西南油氣田分公司勘探開發(fā)研究院

      參 ?考 ?文 ?獻

      [1]陳娟.基于Java的搜索引擎的研究與設計[J].電子技術與軟件工程,2021(21):8-9.

      [2]馮宇.基于模糊層次分析法的Lucene網頁排序算法研究[J].計算機與現(xiàn)代化, 2011(01):124-126.

      [3]張樹國,林懿.監(jiān)督貼近管理的科學意義[J].中國廣播,2010(06):21-22.

      [4]林卉,王一先,朱毅華.基于Lucene和Nutch的教學資源搜索引擎的研究與發(fā)現(xiàn)[J].中國教育信息化:高教職教,2010(11):82-85.

      猜你喜歡
      數(shù)據模型建模防控
      配合防控 人人有責
      豬常見腹瀉病癥狀及防控
      聯(lián)想等效,拓展建模——以“帶電小球在等效場中做圓周運動”為例
      守牢防控一線 靜待春暖花開
      人大建設(2020年3期)2020-07-27 02:48:40
      夏季羊中暑的防控
      面板數(shù)據模型截面相關檢驗方法綜述
      基于PSS/E的風電場建模與動態(tài)分析
      電子制作(2018年17期)2018-09-28 01:56:44
      不對稱半橋變換器的建模與仿真
      加熱爐爐內跟蹤數(shù)據模型優(yōu)化
      電子測試(2017年12期)2017-12-18 06:35:36
      三元組輻射場的建模與仿真
      迭部县| 商洛市| 峨边| 乌鲁木齐县| 津市市| 仙居县| 罗源县| 筠连县| 峡江县| 奉化市| 仁怀市| 罗甸县| 新竹市| 陇川县| 大安市| 简阳市| 改则县| 家居| 枝江市| 玛曲县| 大安市| 灌阳县| 满城县| 昆明市| 石屏县| 乌苏市| 饶平县| 临猗县| 额敏县| 米泉市| 孟州市| 略阳县| 云林县| 东山县| 南澳县| 融水| 天全县| 获嘉县| 亳州市| 尉氏县| 炉霍县|