• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      政務(wù)服務(wù)用戶畫像標簽體系的建立方法和應(yīng)用設(shè)計

      2020-07-08 09:46:02郭大勇朱俊偉
      中國科技縱橫 2020年6期
      關(guān)鍵詞:用戶畫像

      郭大勇 朱俊偉

      摘 要:用戶畫像標簽技術(shù)已經(jīng)在電商、金融、保險、電信等領(lǐng)域的精準營銷、差異服務(wù)、分險防控等方面得到了廣泛的應(yīng)用,并取得了顯著的成效。本文就如何利用互聯(lián)網(wǎng)成熟的用戶畫像標簽技術(shù),在“互聯(lián)網(wǎng)+政務(wù)服務(wù)”領(lǐng)域進行應(yīng)用,從而實現(xiàn)政務(wù)服務(wù)的個性化、精準化、主動化、智能化提出可借鑒的方法。

      關(guān)鍵詞:用戶畫像;動態(tài)標簽;學習標簽;離線標注

      中圖分類號:TP311.1 文獻標識碼:A 文章編號:1671-2064(2020)06-0029-02\

      1 “用戶畫像標簽”應(yīng)用現(xiàn)狀分析

      在電商領(lǐng)域,淘寶、京東、美團、攜程等互聯(lián)網(wǎng)公司,根據(jù)用戶的喜好、購買記錄等建立起了電商用戶畫像標簽體系。在金融領(lǐng)域,銀聯(lián)、支付寶、招商銀商、交通銀行、農(nóng)業(yè)銀行等金融公司,根據(jù)用戶的人群、職業(yè)、學歷、收入、信貸記錄等建立起了金融用戶畫像標簽體系。在信息領(lǐng)域,今日頭條、簡書、知乎等信息內(nèi)容公司,根據(jù)用戶的年齡、性別、瀏覽記錄、分享記錄等建立起了信息用戶畫像標簽體系。各領(lǐng)域基于各自的用戶畫像標簽體系,實現(xiàn)精準營銷,提供精準服務(wù)、主動服務(wù),降低營銷和服務(wù)的綜合成本。同時,也使用戶在獲得便捷服務(wù)體驗時,降低了搜索、比較、鑒別的時間成本。

      2 “用戶畫像標簽”應(yīng)用模式分析

      (1)“用戶畫像標簽”在互聯(lián)網(wǎng)領(lǐng)域應(yīng)用模式分析。分析電商、金融等領(lǐng)域用戶畫像的各種應(yīng)用場景,用戶畫像標簽本質(zhì)上是對用戶的分群分類,而且都是從商品、產(chǎn)品角度分析適用于哪些用戶、適用于用戶的哪些生命周期階段,從而進行用戶畫像特征的細分刻畫。電商是從商品特征和用戶的購買行為特征關(guān)系來刻畫用戶畫像標簽,如華為、小米、蘋果等商品的品牌作為用戶的喜好標簽。金融是從理財產(chǎn)品特征和用戶的人群特征關(guān)系來細分刻畫用戶畫像標簽,如有無工作、有車無車、有房無房、有無信用卡、有無不良征信記錄等標簽。(2)“用戶畫像標簽”在政務(wù)服務(wù)領(lǐng)域應(yīng)用模式分析。借鑒互聯(lián)網(wǎng)領(lǐng)域用戶畫像標簽的應(yīng)用模式,在政務(wù)服務(wù)領(lǐng)域面向用戶提供的不是商品、產(chǎn)品,提供的是一種服務(wù)。服務(wù)和商品、產(chǎn)品一樣,也是不同的服務(wù)特征適用、匹配于不同的個人(企業(yè)),同樣也需要從服務(wù)的角度對用戶進行細致的分群分類,從而實現(xiàn)基于政務(wù)服務(wù)用戶畫像特征的提前服務(wù)、精準服務(wù)、主動服務(wù),讓用戶知曉什么時間、什么情形需要辦理什么服務(wù),從普遍式等“客”上門式服務(wù)向主動預測推薦式服務(wù)轉(zhuǎn)變。

      3 “政務(wù)用戶畫像標簽”體系構(gòu)建方法

      (1)來源分析。從政務(wù)服務(wù)內(nèi)容事項辦事指南和政策申報條件等文本內(nèi)容中識別提取用戶畫像標簽,是一種從“需求側(cè)”出發(fā)的有效方法。如《推動大眾創(chuàng)新創(chuàng)業(yè)的實施意見》政策文件中可識別提取了“園區(qū)注冊”、“在孵團隊大于3個”、“無不良信用記錄”等用戶畫像標簽要素。(2)識別提取。明確了用戶畫像標簽的分析來源,利用NLP自然語言處理技術(shù)的實體識別、實體消岐技術(shù),從事項辦事指南、政策申報條件等服務(wù)內(nèi)容文本中自動識別提取用戶畫像標簽,再結(jié)合人工審核加工就可快速形成政務(wù)用戶畫像標簽語料庫。(3)分類聚類?;诔醪叫纬傻挠脩舢嬒駱撕炚Z料庫,利用分類技術(shù)和聚類技術(shù),對用戶畫像標簽進行分類聚類處理,并和用戶生命周期分類結(jié)合形成容易理解、帶有層次結(jié)構(gòu)的用戶畫像標簽分類。(4)判定規(guī)則。基于數(shù)據(jù)資源目錄的大數(shù)據(jù)資源信息,對每個用戶畫像標簽建立數(shù)據(jù)判別計算規(guī)則。同時,對于數(shù)據(jù)資源目錄中缺少的信息資源,以用戶畫像標簽判別規(guī)則為需求進行數(shù)據(jù)共享歸集。(5)計算標注。利用數(shù)據(jù)資源目錄和用戶畫像標簽判別規(guī)則,通過計算機程序建立用戶畫像規(guī)則執(zhí)行引擎,按照任務(wù)批量進行離線標注或按照用戶訪問時自動進行動態(tài)標注,實現(xiàn)用戶畫像標簽信息和服務(wù)內(nèi)容的匹配關(guān)系建立。

      4 “政務(wù)用戶畫像標簽體系”整體架構(gòu)設(shè)計

      4.1 “政務(wù)用戶畫像標簽”術(shù)語和定義

      (1)基礎(chǔ)標簽。個人或企業(yè)用戶基礎(chǔ)靜態(tài)信息,如個人的姓名、性別、出生日期、籍貫、出生地等標簽信息,靜態(tài)標簽一般通過基本信息的查詢即可判別,無需進行復雜的規(guī)則計算。(2)動態(tài)標簽。個人或企業(yè)用戶動態(tài)變化信息,如個人的學歷(小學、中學、大學…)、企業(yè)的規(guī)模(小微、中小、規(guī)上…)等標簽信息,動態(tài)標簽需要通過多種行為數(shù)據(jù)進行較為復雜的業(yè)務(wù)規(guī)則計算后才能判別。(3)學習標簽。通過對個人(企業(yè))的歷史行為數(shù)據(jù)特征進行機器學習后得出的預測性用戶畫像標簽為學習標簽。如“下季度辦理居轉(zhuǎn)戶的人員”、“明年企業(yè)專利數(shù)>2的企業(yè)”等預測性標簽。(4)標簽識別提取。通過人工結(jié)合自然語義處理技術(shù)的方式,從服務(wù)事項、法律法規(guī)和政策文件的申請條件、適用范圍等文本內(nèi)容中自動進行個人(企業(yè))用戶畫像標簽的實體抽取、實體消岐的過程。(5)標簽計算規(guī)則。用戶畫像標簽特別是動態(tài)標簽是需要依靠用戶行為數(shù)據(jù)按照一定的業(yè)務(wù)規(guī)則來計算判斷的,如“規(guī)模以上企業(yè)”標簽,需要通過年產(chǎn)值是否超過2000萬元人民幣業(yè)務(wù)規(guī)則來判斷。(6)標簽動態(tài)標注。標簽動態(tài)標注是指在用戶訪問服務(wù)時,才進行當前用戶符合哪些標簽的實時計算標注,動態(tài)計算標注主要對年齡、婚姻狀況等規(guī)則計算量小的標簽進行處理。(7)標簽離線標注。標簽離線標注是指無需用戶在線訪問,系統(tǒng)利用線下空閑時間進行畫像標簽的自動提前標注,是用戶畫像標簽標注的預處理過程,主要針對計算量大的標簽規(guī)則。如“即將退休人員”標簽需要經(jīng)過多種數(shù)據(jù)源綜合判別計算才能得出。(8)標簽自動學習。利用政務(wù)服務(wù)用戶歷史行為數(shù)據(jù),如事項歷史辦件庫、政策歷史申報庫,結(jié)合人口、法人基礎(chǔ)特征信息,通過協(xié)同過濾等算法進行標簽自動學習,形成如“近期可能辦理社??ǖ耐鈦砣藛T”預測標簽。

      4.2 “政務(wù)用戶畫像標簽”整體應(yīng)用架構(gòu)

      政務(wù)用戶畫像標簽體系整體架構(gòu)圖1所示。

      (1)數(shù)據(jù)層。一是由政務(wù)服務(wù)內(nèi)容信息(事項、政策等)組成,主要作為用戶畫像標簽的分析來源數(shù)據(jù)。二是由數(shù)據(jù)資源目錄信息(事項辦件庫、政策申報庫等)組成,主要作為標簽規(guī)則計算數(shù)據(jù)。(2)算法層。由NLP自然語言處理相關(guān)的實體抽取、屬性抽取、關(guān)系抽取、實體消岐以及協(xié)同過濾算法等組成,主要作為用戶動態(tài)標簽和學習標簽的識別提取、分類聚類的技術(shù)支撐。(3)畫像層。由用戶畫像表和畫像標簽表、標簽規(guī)則表以及標簽規(guī)則執(zhí)行引擎組成,主要存儲通過規(guī)則計算標注后用戶和標簽的數(shù)據(jù)關(guān)系集合。(4)應(yīng)用層。主要由基于用戶畫像標簽體系建立的事項推薦、政策推薦、符合度預測搜索等智能應(yīng)用組成,支持多終端多渠道。

      5 “政務(wù)用戶畫像標簽”關(guān)鍵技術(shù)

      5.1 NLP自然語言處理技術(shù)

      信息抽?。╥nformation extraction,IE)能夠幫助人們在海量信息中快速定位到自己真正需要的信息,它是一個以未知的自然語言文檔作為輸入,產(chǎn)生固定格式、無歧義的輸出數(shù)據(jù)的過程[1]。政務(wù)服務(wù)用戶畫像標簽就是利用NLP信息抽取、實體消岐技術(shù),從事項辦事指南、政策文件原文等文本型非結(jié)構(gòu)化數(shù)據(jù)中,快速進行如“本市戶籍居民”、“非首次生育”、“小微企業(yè)”等標簽實體單元的識別抽取,迭代地生成政務(wù)服務(wù)畫像標簽實體和屬性標注語料庫,提高政務(wù)服務(wù)畫像標簽的處理效率。

      5.2 文本分類聚類處理技術(shù)

      文本的分類算法是一種有監(jiān)督學習的過程,需要人類實現(xiàn)對數(shù)據(jù)進行一定的區(qū)別和分類,從而在這種基礎(chǔ)上使計算機系統(tǒng)能夠通過機器學習來對數(shù)據(jù)進行一定的分類。文本聚類算法通過文本的相似度信息計算每個簇,相似度信息隨應(yīng)用場合不同而不同。當前文本聚類主要應(yīng)用包括多文檔自動文摘、搜索引擎結(jié)果聚類、信息過濾與信息推薦、文本分類、文本可視化以及文本自動歸檔等領(lǐng)域[2]。利用NLP實體抽取、實體識別和實體消岐技術(shù)從政務(wù)服務(wù)內(nèi)容(辦事指南、政策文件原文)識別提取形成用戶畫像標簽語料庫,是初步的草稿集,為了進一步提高用戶畫像標簽的可讀性和可用性,需要利用文本分類和聚類統(tǒng)計技術(shù),對用戶畫像標簽語料庫進行進一步的分類和聚類,形成可讀性強,使用性更高的標簽標準集。

      5.3 機器學習標簽標注技術(shù)

      協(xié)同過濾(CollaborativeFiltering,CF)是目前推薦引擎中應(yīng)用最廣泛的個性化推薦技術(shù)之一。其通過研究用戶歷史行為,分析用戶興趣(或項目屬性),為用戶建立模型,依據(jù)活躍用戶對項目的評價,來尋找與活躍用戶興趣相同的用戶組,然后用該用戶組中評價比較高的一組項目序列為活躍用戶作出相關(guān)推薦[3]。對于預測性用戶畫像標簽識別和標注,需要基于用戶“歷史辦事數(shù)據(jù)”的自動化學習和訓練,最終篩選出與預測目標性用戶畫像標簽相匹配的用戶結(jié)果集,從而實現(xiàn)對用戶畫像標簽的自動化標注。如通過對法人庫和歷史已取得和未取得高新技術(shù)企業(yè)認定的企業(yè)特征數(shù)據(jù)進行學習,利用協(xié)同過濾模型,實現(xiàn)“3年內(nèi)可能符合高新技術(shù)企業(yè)認定政策的企業(yè)”結(jié)果集的預測性篩選。

      6 “政務(wù)用戶畫像標簽”應(yīng)用深化拓展

      政務(wù)用戶畫像標簽體系不僅在“互聯(lián)網(wǎng)+政務(wù)服務(wù)”領(lǐng)域深入應(yīng)用,還可以在“互聯(lián)網(wǎng)+監(jiān)管”領(lǐng)域、“智慧城市網(wǎng)格化治理”領(lǐng)域、“扶貧脫貧幫困”領(lǐng)域進行拓展應(yīng)用,實現(xiàn)精準服務(wù)、精準監(jiān)管、精準治理、精準扶貧等目標的實現(xiàn),從普遍服務(wù)向主動服務(wù)、精準服務(wù)轉(zhuǎn)變。

      參考文獻

      [1] 牟晉娟,包宏.中文實體關(guān)系抽取研究[J].計算機工程與設(shè)計,2009(15):3587-3590.

      [2] 史夢潔.文本聚類算法綜述[J].現(xiàn)代計算機,2014(3):3-6+25.

      [3] 蘇楊茜.協(xié)同過濾算法改進及研究[J].軟件導刊,2015(2):74-77.

      猜你喜歡
      用戶畫像
      基于數(shù)據(jù)分析高校學生自畫像的初探
      分析用戶畫像在企業(yè)精準營銷中的應(yīng)用方式
      基于用戶畫像的數(shù)字原住民社會化媒體采納意愿的階段性分析
      基于大數(shù)據(jù)技術(shù)的廣電用戶收視行為建模
      基于大數(shù)據(jù)的電商活動頁面設(shè)計策略研究
      計算機時代(2017年4期)2017-04-26 08:35:33
      用戶畫像在內(nèi)容推送中的研究與應(yīng)用
      貝葉斯網(wǎng)絡(luò)在用戶畫像構(gòu)建中的研究
      移動通信(2016年22期)2017-03-07 21:59:13
      把聲音的魅力發(fā)揮到極致
      中國廣播(2017年1期)2017-02-21 13:40:10
      移動用戶畫像構(gòu)建研究
      基于微博的大數(shù)據(jù)用戶畫像與精準營銷
      双牌县| 容城县| 社旗县| 宕昌县| 永定县| 和龙市| 罗定市| 西吉县| 遵义市| 韶山市| 紫云| 顺义区| 陵川县| 舟山市| 贵溪市| 黔江区| 中宁县| 增城市| 商水县| 平阴县| 格尔木市| 舟曲县| 沽源县| 广水市| 瓦房店市| 绿春县| 连州市| 诸暨市| 门头沟区| 兰考县| 修武县| 吉安市| 黑龙江省| 津市市| 澄江县| 信阳市| 巴中市| 北安市| 资阳市| 翁牛特旗| 大新县|