• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于標(biāo)簽分類的數(shù)據(jù)協(xié)同技術(shù)研究

      2020-05-09 09:58:01邱瑞汪寧朱振華
      科技創(chuàng)新與品牌 2020年2期
      關(guān)鍵詞:標(biāo)簽

      邱瑞 汪寧 朱振華

      摘 ? 要:通過對標(biāo)簽體系分類方法和標(biāo)簽數(shù)據(jù)共享技術(shù)路線的研究,利用基礎(chǔ)屬性、統(tǒng)計(jì)分析、模型算法及大數(shù)據(jù)分析等技術(shù),將描述研究對象的標(biāo)簽數(shù)據(jù)進(jìn)行提取和分類,實(shí)現(xiàn)了對標(biāo)簽資源的分類,建立統(tǒng)一標(biāo)簽資源目錄體系。在數(shù)據(jù)協(xié)同過程中,系統(tǒng)中心節(jié)點(diǎn)獲取各子節(jié)點(diǎn)查詢請求,并統(tǒng)一調(diào)配計(jì)算資源,最后將匯總結(jié)果返回到請求方節(jié)點(diǎn),從而實(shí)現(xiàn)節(jié)點(diǎn)間的標(biāo)簽數(shù)據(jù)共享,有效的推動業(yè)務(wù)數(shù)據(jù)跨地區(qū)、跨部門的共享,促進(jìn)了業(yè)務(wù)模型向智能化發(fā)展。

      關(guān)鍵詞:標(biāo)簽;標(biāo)簽?zāi)夸?數(shù)據(jù)協(xié)同

      1 引言

      標(biāo)簽反映人或物的社會屬性、行為屬性等屬性特征。近年來,在公共安全等領(lǐng)域,專家用標(biāo)簽進(jìn)行畫像和特征分析,建立相關(guān)的應(yīng)用系統(tǒng),幫助用戶進(jìn)行工作模式的改進(jìn)和工作效率的提高。

      在標(biāo)簽數(shù)據(jù)分類的過程中,由于不同的分類方式產(chǎn)生的標(biāo)簽定義也不一致,有可能造成在使用過程中導(dǎo)致數(shù)據(jù)難以共享、標(biāo)簽易誤解等問題,造成對研究對象的錯誤預(yù)警。

      在標(biāo)簽資源服務(wù)系統(tǒng)中,對各子節(jié)點(diǎn)間獲取統(tǒng)一標(biāo)簽資源目錄體系,通過分布式調(diào)度架構(gòu)將查詢請求經(jīng)中心節(jié)點(diǎn)發(fā)送至各子節(jié)點(diǎn),中心節(jié)點(diǎn)統(tǒng)一協(xié)調(diào)各子節(jié)點(diǎn)的調(diào)配資源,將標(biāo)簽查詢結(jié)果匯總后返回到請求方節(jié)點(diǎn),從而實(shí)現(xiàn)了不同子節(jié)點(diǎn)間的標(biāo)簽數(shù)據(jù)共享。

      本文將利用屬性標(biāo)注、模型算法、文本挖掘等技術(shù),研究標(biāo)簽數(shù)據(jù)的分類技術(shù),同時(shí)研究基于標(biāo)簽資源目錄的協(xié)同共享技術(shù),實(shí)現(xiàn)標(biāo)簽數(shù)據(jù)的協(xié)同共享。

      2 標(biāo)簽治理和分類

      2.1 數(shù)據(jù)治理

      標(biāo)簽數(shù)據(jù)治理是對匯集的原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化、規(guī)范化的處理過程,主要包括數(shù)據(jù)匯集、數(shù)據(jù)治理、數(shù)據(jù)建庫等工作。通過對數(shù)據(jù)進(jìn)行一系列的治理,形成結(jié)構(gòu)化、規(guī)范化的資源庫,為標(biāo)簽分類和生產(chǎn)提供數(shù)據(jù)基礎(chǔ)。

      首先,通過數(shù)據(jù)采集系統(tǒng)采集多源異構(gòu)數(shù)據(jù),如金融數(shù)據(jù)等相關(guān)數(shù)據(jù)。之后,針對不同的數(shù)據(jù)采取數(shù)據(jù)去重、數(shù)據(jù)融合、字段標(biāo)準(zhǔn)等規(guī)范化操作。最后,構(gòu)建基于標(biāo)簽領(lǐng)域相關(guān)的資源庫,實(shí)現(xiàn)對各級業(yè)務(wù)數(shù)據(jù)統(tǒng)一規(guī)范化的管理,針對各個(gè)數(shù)據(jù)進(jìn)行主題分類、標(biāo)準(zhǔn)化和規(guī)范化存儲。

      2.2 數(shù)據(jù)分類

      標(biāo)簽分類體系的建設(shè)過程就是對數(shù)據(jù)不斷提煉和價(jià)值迭代的過程,通過構(gòu)建標(biāo)簽分類體系,讓數(shù)據(jù)價(jià)值清晰化、規(guī)范化,通過標(biāo)簽表達(dá)數(shù)據(jù)潛在的意義、滿足當(dāng)前業(yè)務(wù)的分析工作。標(biāo)簽分類主要從屬性抽取、特征提煉、規(guī)律刻畫等幾個(gè)方面考慮,標(biāo)簽按照數(shù)據(jù)生成的維度可以分為屬性標(biāo)簽、統(tǒng)計(jì)標(biāo)簽和算法標(biāo)簽。

      (1) 屬性標(biāo)簽包括研究對象的所有原生屬性和派生屬性,主要為人的年齡、性別、學(xué)歷、身份信息等基礎(chǔ)屬性信息,基礎(chǔ)屬性的標(biāo)簽往往和個(gè)人信息有關(guān)。

      (2) 統(tǒng)計(jì)標(biāo)簽是基于過往特定時(shí)間段內(nèi)的行為、日志數(shù)據(jù)而計(jì)算出的描述個(gè)體或群體的規(guī)律性標(biāo)簽,這類標(biāo)簽隨著統(tǒng)計(jì)周期而發(fā)生變化,更新頻率較大、周期較短、標(biāo)簽變化性較大。

      (3) 算法標(biāo)簽是根據(jù)過去特定段時(shí)間的行為狀態(tài),預(yù)測事物未發(fā)生、或?qū)砑磳l(fā)生的行為,這種標(biāo)簽是基于普通標(biāo)簽、統(tǒng)計(jì)標(biāo)簽數(shù)據(jù),通過使用特定算法、挖掘技術(shù)計(jì)算出來的,給出預(yù)測對象的行為相符合的標(biāo)簽。

      3 標(biāo)簽建設(shè)路線

      標(biāo)簽開發(fā)流程分為特征提取、標(biāo)簽加工、標(biāo)簽管理、標(biāo)簽應(yīng)用四大部分。首先,特征提取主要從基礎(chǔ)特征、人員特征、行為特征、社會屬性等維度來提取特征,形成基礎(chǔ)化標(biāo)簽;在標(biāo)簽加工過程中,對已經(jīng)提取的基礎(chǔ)化標(biāo)簽數(shù)據(jù)進(jìn)行規(guī)則清洗、加工、建模,再經(jīng)由對標(biāo)簽進(jìn)行ETL開發(fā),從而得到體系化、規(guī)范化的標(biāo)簽,并進(jìn)入標(biāo)簽市場,為下一步標(biāo)簽應(yīng)用做準(zhǔn)備。

      我們可以將標(biāo)簽構(gòu)建過程分為三個(gè)階段。第一階段是基礎(chǔ)標(biāo)簽的建設(shè),此階段將通過對數(shù)據(jù)資源按照一定的規(guī)則進(jìn)行加工得到基礎(chǔ)化的標(biāo)簽,用來刻畫實(shí)體的基礎(chǔ)特征,主要由數(shù)據(jù)治理人員參與并完成。伴隨基礎(chǔ)標(biāo)簽的體系建立標(biāo)簽構(gòu)建將進(jìn)入第二階段,業(yè)務(wù)人員根據(jù)行業(yè)分析經(jīng)驗(yàn)將對基礎(chǔ)標(biāo)簽進(jìn)行組合,從而得到符合行業(yè)的業(yè)務(wù)標(biāo)簽。第三階段為數(shù)據(jù)分析人員對業(yè)務(wù)標(biāo)簽進(jìn)行分析,并經(jīng)過對事件進(jìn)行分析、研判、建模,構(gòu)建符合的算法標(biāo)簽,以滿足預(yù)測預(yù)警的需求。經(jīng)過三大階段對標(biāo)簽的構(gòu)建過程,將構(gòu)建符合行業(yè)規(guī)范的數(shù)據(jù)資源目錄體系,從而實(shí)現(xiàn)對標(biāo)簽數(shù)據(jù)的分類。

      4 數(shù)據(jù)協(xié)同技術(shù)的研究

      標(biāo)簽資源服務(wù)系統(tǒng)面向各級子節(jié)點(diǎn)開放,建設(shè)了標(biāo)準(zhǔn)化、規(guī)范化的標(biāo)簽資源服務(wù)目錄,實(shí)現(xiàn)標(biāo)簽統(tǒng)一發(fā)布、各級子節(jié)點(diǎn)共享,能夠有效支撐各級子節(jié)點(diǎn)業(yè)務(wù)需求,為用戶提供便捷的操作方式,減少標(biāo)簽生成復(fù)雜過程。

      文中數(shù)據(jù)協(xié)同技術(shù)采用的是“一主多從”架構(gòu)。中心節(jié)點(diǎn)為主節(jié)點(diǎn),統(tǒng)一對資源目錄進(jìn)行建設(shè)、上線、下線等管理操作。各級子節(jié)點(diǎn)為平級子節(jié)點(diǎn),共享中心節(jié)點(diǎn)所發(fā)布的資源目錄。各級子節(jié)點(diǎn)通過“申請審批”等流程,當(dāng)子節(jié)點(diǎn)A啟動節(jié)點(diǎn)間標(biāo)簽組合查詢時(shí),即開始占用其請求的子節(jié)點(diǎn)的標(biāo)簽資源,中心節(jié)點(diǎn)統(tǒng)一調(diào)配資源并在中心節(jié)點(diǎn)進(jìn)行計(jì)算,將標(biāo)簽組合查詢結(jié)果匯總后返到查詢子節(jié)點(diǎn)A,減少了資源的浪費(fèi),同時(shí)實(shí)現(xiàn)了節(jié)點(diǎn)間的標(biāo)簽數(shù)據(jù)協(xié)同共享。

      5 結(jié)束語

      本文研究實(shí)現(xiàn)了標(biāo)簽治理、分類目的,解決了如何從海量數(shù)據(jù)中發(fā)現(xiàn)各種數(shù)據(jù)關(guān)系與關(guān)聯(lián)規(guī)則,挖掘數(shù)據(jù)的價(jià)值問題,形成了語義化的描述。建立統(tǒng)一標(biāo)簽資源目錄體系,通過分布式調(diào)度系統(tǒng)將查詢請求發(fā)送至各子節(jié)點(diǎn),最后中心節(jié)點(diǎn)將匯總結(jié)果返回到請求方節(jié)點(diǎn),從而實(shí)現(xiàn)了不同節(jié)點(diǎn)間的標(biāo)簽數(shù)據(jù)共享。下一步將繼續(xù)優(yōu)化算法模型,在預(yù)測類標(biāo)簽生成的準(zhǔn)確性方面進(jìn)行重點(diǎn)研究。

      參考文獻(xiàn)

      [1]張大偉. 公安數(shù)據(jù)標(biāo)簽化建設(shè)應(yīng)用研究[J].警察技術(shù),2017,(6):37-41.

      [2]席巖, 張乃光, 王磊, et al. 基于大數(shù)據(jù)的用戶畫像方法研究綜述[J]. 廣播電視信息, 2017(10):39-43.

      [3]王慶, 趙發(fā)珍. 基于"用戶畫像"的圖書館資源推薦模式設(shè)計(jì)與分析[J]. 現(xiàn)代情報(bào), 2018(3):105-109,137

      [4]丁偉,王題,劉新海等.基于大數(shù)據(jù)技術(shù)的手機(jī)用戶畫像與征信研究[J].郵電設(shè)計(jì)技術(shù),2016(3):64-69.

      責(zé)編/李曼

      猜你喜歡
      標(biāo)簽
      拒標(biāo)簽
      給風(fēng)景貼上自己的標(biāo)簽
      無懼標(biāo)簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      每個(gè)年代都有自己的時(shí)尚標(biāo)簽
      標(biāo)簽化傷害了誰
      2015年最酷紅酒標(biāo)簽
      海外星云(2015年15期)2015-12-01 04:17:44
      讓衣柜擺脫“雜亂無章”的標(biāo)簽
      Coco薇(2015年11期)2015-11-09 13:22:17
      科學(xué)家的標(biāo)簽
      科學(xué)家的標(biāo)簽
      灵宝市| 河间市| 扎鲁特旗| 阳山县| 承德市| 武夷山市| 佛教| 永济市| 永泰县| 从江县| 南华县| 曲水县| 玉门市| 岳池县| 新竹市| 库尔勒市| 博湖县| 勐海县| 临邑县| 漳浦县| 丹阳市| 奈曼旗| 横山县| 上林县| 西平县| 尖扎县| 惠州市| 新余市| 喀喇沁旗| 扶绥县| 周口市| 繁昌县| 寻甸| 湄潭县| 顺昌县| 汽车| 孟津县| 大化| 商水县| 罗定市| 客服|