• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大數(shù)據(jù)技術(shù)在鄉(xiāng)村畫像中的應(yīng)用研究

      2020-02-08 07:14:26李望月劉瑾陳娜
      大數(shù)據(jù) 2020年1期
      關(guān)鍵詞:概念模型畫像標(biāo)簽

      李望月,劉瑾,陳娜

      1. 北京國(guó)研網(wǎng)信息股份有限公司,北京 100010;2. 國(guó)務(wù)院發(fā)展研究中心信息網(wǎng),北京 100010

      1 引言

      隨著國(guó)家大數(shù)據(jù)戰(zhàn)略的實(shí)施推進(jìn),大數(shù)據(jù)技術(shù)蓬勃發(fā)展,正加速成為發(fā)現(xiàn)新知識(shí)、創(chuàng)造新價(jià)值的新一代生產(chǎn)力,其應(yīng)用已滲入經(jīng)濟(jì)社會(huì)的各個(gè)微觀單元,并逐漸成為各行各業(yè)尋求突破、創(chuàng)新發(fā)展的關(guān)鍵力量。其中,大數(shù)據(jù)技術(shù)中的用戶畫像技術(shù)在電子商務(wù)、金融等領(lǐng)域的成功應(yīng)用,為這些行業(yè)帶來(lái)了巨大的經(jīng)濟(jì)效益。在最早應(yīng)用用戶畫像技術(shù)的電子商務(wù)領(lǐng)域,目前已實(shí)現(xiàn)對(duì)上億用戶的智能化畫像,為電商企業(yè)快速、便捷、精準(zhǔn)地了解用戶消費(fèi)行為、興趣偏好等特征提供了新的途徑,同時(shí)也為營(yíng)銷策略的精準(zhǔn)制定和實(shí)施提供了科學(xué)依據(jù)。

      大數(shù)據(jù)技術(shù)同樣已經(jīng)滲入鄉(xiāng)村發(fā)展的某些領(lǐng)域,其中,應(yīng)用比較廣泛的是農(nóng)業(yè)領(lǐng)域。通過(guò)對(duì)氣候、土壤、農(nóng)作物基因庫(kù)、農(nóng)業(yè)傳感器返回的數(shù)據(jù)等農(nóng)業(yè)大數(shù)據(jù)進(jìn)行挖掘、分析發(fā)現(xiàn),大數(shù)據(jù)技術(shù)在推動(dòng)精準(zhǔn)農(nóng)業(yè)實(shí)施建設(shè)方面做出了重要貢獻(xiàn),在農(nóng)業(yè)產(chǎn)量預(yù)測(cè)、農(nóng)業(yè)自然災(zāi)害的監(jiān)測(cè)預(yù)警、農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)、農(nóng)產(chǎn)品營(yíng)銷等方面的應(yīng)用也取得了良好的效果。但到目前為止,無(wú)論是理論層面,還是實(shí)踐層面,尚未有文獻(xiàn)對(duì)大數(shù)據(jù)技術(shù)在鄉(xiāng)村層面的系統(tǒng)性應(yīng)用進(jìn)行研究。

      黨的十九大報(bào)告確立了“鄉(xiāng)村振興”戰(zhàn)略的重要地位,實(shí)施鄉(xiāng)村振興戰(zhàn)略的第一步是立足鄉(xiāng)情,全面、準(zhǔn)確地了解當(dāng)前“鄉(xiāng)村”這一微觀單元的經(jīng)濟(jì)社會(huì)運(yùn)行全貌和特征,即首先要開展“鄉(xiāng)村畫像”工作。據(jù)2016年第三次全國(guó)農(nóng)業(yè)普查數(shù)據(jù)顯示,截止到2016年底,全國(guó)約有4萬(wàn)個(gè)鄉(xiāng)鎮(zhèn)、60萬(wàn)個(gè)行政村,對(duì)這些鄉(xiāng)鎮(zhèn)、村的發(fā)展全貌和特征屬性進(jìn)行系統(tǒng)性分析與挖掘需要耗費(fèi)大量的人力、物力、財(cái)力,如果不借助大數(shù)據(jù)畫像技術(shù),將很難實(shí)現(xiàn)。大數(shù)據(jù)鄉(xiāng)村畫像可以實(shí)現(xiàn)對(duì)數(shù)十萬(wàn)鄉(xiāng)村的智能化管理,是現(xiàn)代農(nóng)村建設(shè)發(fā)展的智能型管理工具,為快速了解鄉(xiāng)村發(fā)展全貌與現(xiàn)代化建設(shè)趨勢(shì),挖掘鄉(xiāng)村優(yōu)勢(shì)特征與不足,制定政策支持方向、科研方向、投資決策方向,提供了有力的理論依據(jù)和數(shù)據(jù)支撐。根據(jù)鄉(xiāng)村畫像的結(jié)果,政府部門可以明確鄉(xiāng)村產(chǎn)業(yè)發(fā)展方向、鄉(xiāng)村治理領(lǐng)域,同時(shí)監(jiān)測(cè)鄉(xiāng)村振興實(shí)施效果、制定鄉(xiāng)村現(xiàn)代化發(fā)展規(guī)劃;科研機(jī)構(gòu)可以在鄉(xiāng)村畫像系統(tǒng)的海量數(shù)據(jù)基礎(chǔ)上,使用科學(xué)方法構(gòu)建鄉(xiāng)村發(fā)展模型,為解決我國(guó)“三農(nóng)”問(wèn)題提出建議;商業(yè)機(jī)構(gòu)可以使用鄉(xiāng)村畫像系統(tǒng),根據(jù)自身的投資方向,確定最佳投資對(duì)象、投資方式和投資期限。

      綜上所述,大數(shù)據(jù)技術(shù)在多個(gè)領(lǐng)域的應(yīng)用已較為成熟,但在鄉(xiāng)村領(lǐng)域的應(yīng)用大多聚焦于農(nóng)業(yè)領(lǐng)域,對(duì)于其在電商等領(lǐng)域成功應(yīng)用的畫像技術(shù),在鄉(xiāng)村領(lǐng)域尚未進(jìn)行應(yīng)用與實(shí)踐,而鄉(xiāng)村畫像又是一項(xiàng)重要且必要的工作。鑒于此,本文將對(duì)大數(shù)據(jù)技術(shù)在鄉(xiāng)村畫像中的應(yīng)用開展前瞻性研究,在借鑒用戶畫像方法的同時(shí),基于鄉(xiāng)村大數(shù)據(jù)情況,建立大數(shù)據(jù)鄉(xiāng)村畫像的概念模型、標(biāo)簽體系以及實(shí)施算法。

      2 大數(shù)據(jù)鄉(xiāng)村畫像的相關(guān)研究現(xiàn)狀

      鑒于當(dāng)前尚未檢索到以大數(shù)據(jù)鄉(xiāng)村畫像為主題的直接文獻(xiàn),本文將沿著“以數(shù)據(jù)為基礎(chǔ),以技術(shù)為手段,以助推鄉(xiāng)村振興發(fā)展為目的”的思路,從鄉(xiāng)村大數(shù)據(jù)源、大數(shù)據(jù)畫像技術(shù)和鄉(xiāng)村振興領(lǐng)域研究的熱點(diǎn)、重點(diǎn)和難點(diǎn)問(wèn)題3個(gè)方面出發(fā),分別進(jìn)行研究。

      2.1 鄉(xiāng)村大數(shù)據(jù)源的研究現(xiàn)狀

      鄉(xiāng)村大數(shù)據(jù)源是大數(shù)據(jù)技術(shù)開展鄉(xiāng)村畫像的基礎(chǔ)。在對(duì)現(xiàn)有文獻(xiàn)進(jìn)行檢索研究時(shí),并未發(fā)現(xiàn)有關(guān)“鄉(xiāng)村大數(shù)據(jù)”“農(nóng)村大數(shù)據(jù)”的研究,但近兩年關(guān)于“農(nóng)業(yè)大數(shù)據(jù)”[1-2]的研究逐漸增加,趙瑞雪等人[1]從數(shù)據(jù)來(lái)源上梳理了國(guó)內(nèi)外在農(nóng)業(yè)科技活動(dòng)中長(zhǎng)期積累和整編的海量科學(xué)數(shù)據(jù),即農(nóng)業(yè)科學(xué)大數(shù)據(jù),通過(guò)對(duì)其列出的數(shù)據(jù)源進(jìn)行梳理發(fā)現(xiàn),數(shù)量上匯集了12個(gè)國(guó)外數(shù)據(jù)源和30個(gè)國(guó)內(nèi)數(shù)據(jù)源(包括6個(gè)地方政府門戶開放數(shù)據(jù)),內(nèi)容上大致可分為4類:自然條件與資源數(shù)據(jù),如氣象數(shù)據(jù)、地質(zhì)數(shù)據(jù)、再生資源數(shù)據(jù)、空間數(shù)據(jù)等;農(nóng)業(yè)經(jīng)濟(jì)數(shù)據(jù),如宏觀農(nóng)業(yè)數(shù)據(jù)、生態(tài)農(nóng)業(yè)、中國(guó)飼料數(shù)據(jù)庫(kù)等;生命科學(xué)數(shù)據(jù),如生物信息數(shù)據(jù)、細(xì)胞數(shù)據(jù)、微生物病毒數(shù)據(jù)、基因數(shù)據(jù)等;農(nóng)業(yè)行政機(jī)構(gòu)數(shù)據(jù),主要來(lái)自于政府部門開放門戶。姜侯等人[2]從農(nóng)業(yè)大數(shù)據(jù)產(chǎn)生的角度,提出了農(nóng)業(yè)物聯(lián)網(wǎng)數(shù)據(jù)、農(nóng)業(yè)遙感和農(nóng)業(yè)無(wú)人機(jī)數(shù)據(jù)、農(nóng)業(yè)網(wǎng)絡(luò)數(shù)據(jù)、科研及農(nóng)戶生產(chǎn)經(jīng)驗(yàn)數(shù)據(jù)4類農(nóng)業(yè)大數(shù)據(jù),設(shè)計(jì)了農(nóng)業(yè)大數(shù)據(jù)平臺(tái)整體架構(gòu),并對(duì)農(nóng)業(yè)大數(shù)據(jù)的應(yīng)用方向進(jìn)行了論述。除上述微觀層面的農(nóng)業(yè)大數(shù)據(jù)外,中華人民共和國(guó)農(nóng)業(yè)農(nóng)村部、國(guó)家統(tǒng)計(jì)局、中華人民共和國(guó)海關(guān)總署等部門擁有的農(nóng)業(yè)統(tǒng)計(jì)數(shù)據(jù)同樣是農(nóng)業(yè)大數(shù)據(jù)。省、市級(jí)別宏觀匯總數(shù)據(jù)可從《中國(guó)統(tǒng)計(jì)年鑒》《中國(guó)農(nóng)業(yè)年鑒》等公開的年鑒資料中獲取,但微觀數(shù)據(jù)較難獲得。

      農(nóng)業(yè)大數(shù)據(jù)是鄉(xiāng)村大數(shù)據(jù)的一部分,除農(nóng)業(yè)之外的其他鄉(xiāng)村大數(shù)據(jù)主要集中在國(guó)家統(tǒng)計(jì)局、地方統(tǒng)計(jì)局以及其他政府部門。其中,省、市級(jí)別的鄉(xiāng)村數(shù)據(jù)可在《中國(guó)農(nóng)村統(tǒng)計(jì)年鑒》《中國(guó)農(nóng)業(yè)機(jī)械工業(yè)年鑒》《中國(guó)環(huán)境統(tǒng)計(jì)年鑒》等公開年鑒中獲取,而微觀數(shù)據(jù)由各部門保存,一般不對(duì)外公開,外部組織機(jī)構(gòu)也無(wú)法通過(guò)網(wǎng)絡(luò)爬取獲得。在國(guó)家或地方各部門擁有的鄉(xiāng)村數(shù)據(jù)中,以農(nóng)業(yè)普查數(shù)據(jù)中包含的農(nóng)村信息最為全面,普查表中的行政村綜合表和鄉(xiāng)鎮(zhèn)綜合表囊括了鄉(xiāng)村基本信息和特征信息;普查表中的農(nóng)戶基層表包括了村內(nèi)農(nóng)戶生活、生產(chǎn)經(jīng)營(yíng)活動(dòng)的方方面面,進(jìn)一步豐富了鄉(xiāng)村數(shù)據(jù)。農(nóng)業(yè)普查數(shù)據(jù)可提供全面的鄉(xiāng)村數(shù)據(jù)信息,局限性為每十年開展一次,最近一次是2016年開展的第三次全國(guó)農(nóng)業(yè)普查。但隨著近兩年地方鄉(xiāng)村振興戰(zhàn)略統(tǒng)計(jì)工作的開展,鄉(xiāng)村振興戰(zhàn)略統(tǒng)計(jì)的調(diào)查指標(biāo)與普查指標(biāo)具有較高的相似度,可對(duì)相同的指標(biāo)進(jìn)行不同年度的連續(xù)分析。除農(nóng)業(yè)普查數(shù)據(jù)外,鄉(xiāng)村層面還存在著數(shù)量可觀的非傳統(tǒng)數(shù)據(jù),如中國(guó)精神文明網(wǎng)網(wǎng)站(中國(guó)共產(chǎn)黨中央委員會(huì)宣傳部、中央精神文明建設(shè)指導(dǎo)委員辦公室)發(fā)布的5個(gè)批次共計(jì)4 717個(gè)全國(guó)文明村鎮(zhèn)的名單數(shù)據(jù),中華人民共和國(guó)建設(shè)部、中華人民共和國(guó)文化和旅游部、中華人民共和國(guó)財(cái)政部等7個(gè)部門發(fā)布的5個(gè)批次共計(jì)6 819個(gè)中國(guó)傳統(tǒng)村落的名單數(shù)據(jù),中華人民共和國(guó)農(nóng)業(yè)農(nóng)村部發(fā)布的兩個(gè)批次共計(jì)300個(gè)中國(guó)美麗休閑鄉(xiāng)村的名單數(shù)據(jù)。此外,隨著《鄉(xiāng)村振興戰(zhàn)略規(guī)劃(2018—2022年)》和《數(shù)字鄉(xiāng)村發(fā)展戰(zhàn)略綱要》[3]的推進(jìn)實(shí)施,數(shù)字鄉(xiāng)村的建設(shè)速度加快,鄉(xiāng)村大數(shù)據(jù)將會(huì)得到快速沉淀。

      2.2 大數(shù)據(jù)畫像技術(shù)的研究現(xiàn)狀

      大數(shù)據(jù)畫像技術(shù)是大數(shù)據(jù)鄉(xiāng)村畫像的核心技術(shù)手段。大數(shù)據(jù)畫像的概念來(lái)源于用戶畫像,用戶畫像的英文概念“user persona”最早由艾倫·庫(kù)珀提出,其認(rèn)為 user persona是真實(shí)用戶的虛擬代表,根據(jù)用戶行為、動(dòng)機(jī)等將用戶分為不同的類型,從中抽取每類用戶的社會(huì)屬性、生活習(xí)慣、消費(fèi)行為和興趣偏好等信息的共同特征,并設(shè)定名字、照片、場(chǎng)景等要素對(duì)其進(jìn)行描述[4]。用戶畫像又稱為人群畫像,是根據(jù)用戶信息抽象出的一個(gè)標(biāo)簽化的用戶模型,即用高度精練的特征描述一類人,例如年齡、性別、職業(yè)、興趣偏好等。

      大數(shù)據(jù)畫像技術(shù)是用戶畫像在大數(shù)據(jù)環(huán)境下的延伸和發(fā)展,是基于大量傳統(tǒng)數(shù)據(jù)和非傳統(tǒng)數(shù)據(jù)、靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),使用統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)和人工智能等算法,構(gòu)建模型、挖掘數(shù)據(jù)、提取特征并進(jìn)行動(dòng)態(tài)可視化展示的一門數(shù)據(jù)分析與展示技術(shù)。在中國(guó)知網(wǎng)文獻(xiàn)數(shù)據(jù)庫(kù)中,以“大數(shù)據(jù)畫像”“鄉(xiāng)村畫像”“畫像”等關(guān)鍵詞進(jìn)行檢索,對(duì)現(xiàn)有文獻(xiàn)從畫像對(duì)象、畫像技術(shù)方法兩個(gè)方面進(jìn)行歸納總結(jié)。

      從畫像對(duì)象來(lái)看,當(dāng)前文獻(xiàn)庫(kù)中可檢索到以“用戶畫像”“產(chǎn)品畫像”“企業(yè)畫像”“城市畫像”為標(biāo)題的研究,其中,“用戶畫像”作為畫像技術(shù)的初始應(yīng)用領(lǐng)域,研究的文獻(xiàn)最多,應(yīng)用也最為廣泛,尤其是在互聯(lián)網(wǎng)電商、電信、金融等領(lǐng)域[5-7];研究“產(chǎn)品畫像[8]”和“企業(yè)畫像[9]”的文獻(xiàn)數(shù)量較少,研究?jī)?nèi)容和視角基本沿用“用戶畫像”的思路;而“城市畫像”相關(guān)文獻(xiàn)中對(duì)畫像的理解和研究差異較大,一些文獻(xiàn)局限于城市傳統(tǒng)數(shù)據(jù)的傳統(tǒng)圖表的畫像,還有一些文獻(xiàn)使用GPS數(shù)據(jù)、互聯(lián)網(wǎng)等新興大數(shù)據(jù)進(jìn)行可視化分析[10-11]。但以“鄉(xiāng)村畫像”為標(biāo)題的文獻(xiàn)尚未發(fā)現(xiàn)。

      從畫像技術(shù)方法來(lái)看[9-23],特征值(標(biāo)簽值)的提取是畫像技術(shù)的關(guān)鍵。當(dāng)前畫像技術(shù)中特征值的提取方法眾多,主要可以分為兩大類:一類是人工抽取特征值的方法,即通過(guò)查閱文獻(xiàn)、調(diào)研、訪談并在專家的建議下提取用戶特征,構(gòu)建用戶畫像,此種方法適用于數(shù)據(jù)表達(dá)清晰、數(shù)據(jù)量小的場(chǎng)景,主要應(yīng)用于經(jīng)濟(jì)社會(huì)宏觀和中觀領(lǐng)域;另一類是數(shù)據(jù)挖掘的方法,主要的特征提取大數(shù)據(jù)技術(shù)方法有k均值聚類(k-means)[15]、線性判別分析(linear discriminant analysis,LDA)[16]、樸素貝葉斯(naive bayesian,NB)[17]、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)[18]、決策樹[19-20]等,主要的大數(shù)據(jù)關(guān)聯(lián)規(guī)則方法有APRORI算法[21]、FPGrowth關(guān)聯(lián)規(guī)則算法[22],這些方法主要應(yīng)用于電商、金融等行業(yè)的用戶畫像[23]。雖然當(dāng)前關(guān)于特征值提取的方法很多,但是特征值挖掘和提取的準(zhǔn)確性仍是要持續(xù)攻克的難點(diǎn)。

      2.3 鄉(xiāng)村振興領(lǐng)域研究的熱點(diǎn)、重點(diǎn)及難點(diǎn)問(wèn)題

      鄉(xiāng)村振興領(lǐng)域的熱點(diǎn)、重點(diǎn)及難點(diǎn)問(wèn)題是大數(shù)據(jù)鄉(xiāng)村畫像的重要應(yīng)用方向。自2017年黨的十九大報(bào)告中提出鄉(xiāng)村振興戰(zhàn)略,到2018年《鄉(xiāng)村振興戰(zhàn)略規(guī)劃(2018—2022年)》正式出臺(tái),再到2019年《數(shù)字鄉(xiāng)村發(fā)展戰(zhàn)略綱要》的提出,學(xué)術(shù)界關(guān)于鄉(xiāng)村振興領(lǐng)域研究的熱點(diǎn)、重點(diǎn)及難點(diǎn)問(wèn)題的研究大多圍繞著鄉(xiāng)村振興發(fā)展而開展,或是聚焦鄉(xiāng)村振興發(fā)展的產(chǎn)業(yè)興旺、生態(tài)宜居、鄉(xiāng)村文明、治理有效、生活富裕5個(gè)維度整體,或是聚焦某一個(gè)局部展開研究。通過(guò)對(duì)鄉(xiāng)村領(lǐng)域相關(guān)文獻(xiàn)進(jìn)行研究和分析,可以總結(jié)為:鄉(xiāng)村振興領(lǐng)域研究的熱點(diǎn)是鄉(xiāng)村振興實(shí)施效果評(píng)價(jià)[24-26],文獻(xiàn)以鄉(xiāng)村振興評(píng)價(jià)指標(biāo)體系構(gòu)建為主,部分文獻(xiàn)選取對(duì)象進(jìn)行實(shí)證分析;鄉(xiāng)村振興領(lǐng)域研究的重點(diǎn)是鄉(xiāng)村振興實(shí)施路徑[27-29],當(dāng)前文獻(xiàn)大多對(duì)鄉(xiāng)村振興的某一方面進(jìn)行重點(diǎn)研究,從問(wèn)題導(dǎo)向給出鄉(xiāng)村振興的實(shí)施路徑;鄉(xiāng)村振興領(lǐng)域研究的難點(diǎn)是鄉(xiāng)村振興差異化的前期規(guī)劃[30-33],如黃祖輝提出要從區(qū)域新型城鎮(zhèn)化戰(zhàn)略和鄉(xiāng)村差異化發(fā)展的實(shí)際出發(fā),落實(shí)鄉(xiāng)村振興戰(zhàn)略。其中,除鄉(xiāng)村振興的實(shí)施效果可以進(jìn)行定量分析外,其他研究大多為定性分析。

      大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)的成果可以為鄉(xiāng)村振興領(lǐng)域熱點(diǎn)、重點(diǎn)及難點(diǎn)問(wèn)題的研究提供科學(xué)有力的支撐,在實(shí)際應(yīng)用過(guò)程中,大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)主要有三大作用。第一,充分了解鄉(xiāng)村全貌。傳統(tǒng)的鄉(xiāng)村發(fā)展評(píng)價(jià)模型一般使用年鑒數(shù)據(jù)和調(diào)查數(shù)據(jù),對(duì)互聯(lián)網(wǎng)上大量可用數(shù)據(jù)的利用率不高,維度通常也局限于年鑒數(shù)據(jù)提供的信息,無(wú)法全面刻畫鄉(xiāng)村面貌。大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)可以充分利用年鑒數(shù)據(jù)、政府網(wǎng)站公開數(shù)據(jù)等結(jié)構(gòu)化數(shù)據(jù),同時(shí)也可以利用地理位置信息、氣候信息、政策文件信息、政策稱號(hào)信息等非結(jié)構(gòu)化數(shù)據(jù),多維度、全方位、立體化地對(duì)鄉(xiāng)村發(fā)展情況進(jìn)行描述,幫助政府根據(jù)鄉(xiāng)村存在的現(xiàn)實(shí)問(wèn)題,有針對(duì)性地制定政策。第二,尋找差異,為因地制宜發(fā)展鄉(xiāng)村振興提供理論支持。利用大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng),可以對(duì)省份層面、地市層面、縣域?qū)用妗⑧l(xiāng)鎮(zhèn)層面以及行政村層面等各級(jí)行政區(qū)劃的鄉(xiāng)村振興發(fā)展情況進(jìn)行分析,應(yīng)用范圍廣泛。通過(guò)對(duì)比,可以發(fā)現(xiàn)研究主體的優(yōu)勢(shì)和劣勢(shì),幫助當(dāng)?shù)卣虻刂埔?,開展“千村千面”個(gè)性化、特色化規(guī)劃,解決規(guī)劃的同質(zhì)性和落地難等問(wèn)題。同時(shí),大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)可智能化匹配生產(chǎn)條件、自然條件或者社會(huì)條件相似的標(biāo)桿性鄉(xiāng)村,幫助落后鄉(xiāng)村找到適合當(dāng)?shù)氐泥l(xiāng)村振興發(fā)展路徑和實(shí)施路徑。第三,監(jiān)測(cè)鄉(xiāng)村振興政策實(shí)施效果。大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)可以對(duì)鄉(xiāng)村振興發(fā)展情況進(jìn)行連續(xù)時(shí)間的監(jiān)測(cè),通過(guò)對(duì)多年的數(shù)據(jù)和信息進(jìn)行對(duì)比,系統(tǒng)可使用標(biāo)簽對(duì)分析結(jié)果進(jìn)行展示,例如,某省份人均農(nóng)林牧漁產(chǎn)值連續(xù)5年增加,鄉(xiāng)村畫像標(biāo)簽可展示為“連續(xù)5年人均農(nóng)林牧漁產(chǎn)值增加”。同時(shí),大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)也可設(shè)置預(yù)警機(jī)制,在指標(biāo)值出現(xiàn)異常波動(dòng)或者下降趨勢(shì)時(shí)(針對(duì)正向指標(biāo)),發(fā)出預(yù)警信號(hào),幫助政府部門及時(shí)做出應(yīng)對(duì)。

      綜上所述,本文結(jié)合已有研究成果,以鄉(xiāng)村大數(shù)據(jù)為基礎(chǔ),以大數(shù)據(jù)畫像技術(shù)為手段,以輔助解決鄉(xiāng)村振興發(fā)展中的熱點(diǎn)、重點(diǎn)和難點(diǎn)問(wèn)題為導(dǎo)向,開展鄉(xiāng)村畫像概念模型和標(biāo)簽體系的構(gòu)建工作。

      3 鄉(xiāng)村畫像概念模型構(gòu)建及數(shù)據(jù)支撐

      概念模型來(lái)源于數(shù)據(jù)庫(kù)設(shè)計(jì),是對(duì)現(xiàn)實(shí)世界中問(wèn)題域內(nèi)的事物進(jìn)行描述的模型,是現(xiàn)實(shí)世界到信息世界的第一層抽象,是用戶與數(shù)據(jù)庫(kù)設(shè)計(jì)人員進(jìn)行交流的語(yǔ)言,因此,概念模型一般具有較強(qiáng)的語(yǔ)義表達(dá)能力,能夠方便、直接地表達(dá)應(yīng)用中的各種語(yǔ)義知識(shí),且簡(jiǎn)單、清晰、易于用戶理解。鄉(xiāng)村畫像概念模型是對(duì)鄉(xiāng)村微觀單元中的經(jīng)濟(jì)和社會(huì)發(fā)展進(jìn)行描述的模型,是對(duì)真實(shí)鄉(xiāng)村的經(jīng)濟(jì)社會(huì)運(yùn)行狀態(tài)和行為的刻畫,是大數(shù)據(jù)鄉(xiāng)村畫像的核心內(nèi)容,是影響鄉(xiāng)村畫像結(jié)果的關(guān)鍵。本文將在確立鄉(xiāng)村畫像構(gòu)建原則的基礎(chǔ)上,從基本屬性、狀態(tài)屬性和行為屬性3個(gè)方面構(gòu)建鄉(xiāng)村畫像概念模型,并在概念模型的基礎(chǔ)上,系統(tǒng)性梳理所需的鄉(xiāng)村畫像數(shù)據(jù)支撐。

      3.1 鄉(xiāng)村畫像概念模型的構(gòu)建原則

      鄉(xiāng)村畫像概念模型是大數(shù)據(jù)鄉(xiāng)村畫像的基礎(chǔ),構(gòu)建科學(xué)合理的大數(shù)據(jù)鄉(xiāng)村畫像概念模型應(yīng)遵循全面性、系統(tǒng)性、特征性、可行性和智能性的原則。

      (1)全面性原則

      鄉(xiāng)村畫像概念模型在構(gòu)建時(shí)應(yīng)遵循全面性原則,即應(yīng)充分考慮各類鄉(xiāng)村的屬性,構(gòu)建的鄉(xiāng)村畫像模型應(yīng)覆蓋全部村的基本屬性,可以實(shí)現(xiàn)對(duì)任何一個(gè)鄉(xiāng)村進(jìn)行畫像,不應(yīng)存在不能進(jìn)行鄉(xiāng)村畫像的情況。

      (2)系統(tǒng)性原則

      鄉(xiāng)村畫像的系統(tǒng)性是指在鄉(xiāng)村畫像概念模型的構(gòu)建中,堅(jiān)持全局意識(shí)、整體觀念。概念模型構(gòu)建時(shí)應(yīng)系統(tǒng)地考慮各要素的層次性,各要素由外至內(nèi)層層深入,構(gòu)建一個(gè)鄉(xiāng)村經(jīng)濟(jì)社會(huì)內(nèi)各子系統(tǒng)、各要素相互獨(dú)立又相互聯(lián)系的有機(jī)整體。

      (3)特征性原則

      鄉(xiāng)村畫像概念模型的構(gòu)建要突出特征性,特征屬性是鄉(xiāng)村畫像概念模型的重要組成部分,是彰顯鄉(xiāng)村特色、挖掘鄉(xiāng)村價(jià)值、因地制宜地推進(jìn)鄉(xiāng)村振興的重要工作抓手。

      (4)可行性原則

      鄉(xiāng)村大數(shù)據(jù)是大數(shù)據(jù)鄉(xiāng)村畫像落地實(shí)施的前提,鄉(xiāng)村畫像是在鄉(xiāng)村大數(shù)據(jù)分析、計(jì)算和研究的基礎(chǔ)上開展的,如果鄉(xiāng)村畫像的數(shù)據(jù)不可獲得,那么鄉(xiāng)村畫像概念模型的構(gòu)建將會(huì)停留在理論研究層面,無(wú)法走向?qū)嶋H操作層面。

      (5)智能性原則

      概念模型的構(gòu)建應(yīng)清晰、明確,能夠被計(jì)算機(jī)理解,便于進(jìn)行程序化實(shí)施,進(jìn)而保障后續(xù)對(duì)4萬(wàn)個(gè)鄉(xiāng)鎮(zhèn)、60萬(wàn)個(gè)行政村的大數(shù)據(jù)畫像的自動(dòng)化、智能化、動(dòng)態(tài)化實(shí)現(xiàn)。

      3.2 鄉(xiāng)村畫像概念模型的建立

      基于鄉(xiāng)村畫像概念模型的構(gòu)建原則,在鄉(xiāng)村畫像概念模型構(gòu)建的過(guò)程中,綜合考量鄉(xiāng)村經(jīng)濟(jì)社會(huì)的基本屬性和特征屬性、靜態(tài)屬性和動(dòng)態(tài)屬性、微觀屬性和宏觀屬性,最終確定鄉(xiāng)村畫像概念模型從“基本屬性”“狀態(tài)屬性”“行為屬性”3個(gè)方面進(jìn)行構(gòu)建。在構(gòu)建概念模型時(shí),將按照“345”的原則構(gòu)建,即鄉(xiāng)村畫像基本屬性由3個(gè)維度構(gòu)成,分別為“地理區(qū)位”“自然條件”“政策稱號(hào)”;鄉(xiāng)村畫像狀態(tài)屬性由4個(gè)維度構(gòu)成,分別為“規(guī)模”“速度”“結(jié)構(gòu)”“效率”;鄉(xiāng)村畫像行為屬性由5個(gè)維度構(gòu)成,分別為“發(fā)展產(chǎn)業(yè)”“保護(hù)生態(tài)”“延續(xù)文明”“加強(qiáng)治理”“推動(dòng)共同富裕”。鄉(xiāng)村畫像概念模型如圖1所示。

      3.3 鄉(xiāng)村畫像概念模型的數(shù)據(jù)支撐

      鄉(xiāng)村畫像概念模型及標(biāo)簽體系的設(shè)立是基于廣泛的、多維度的鄉(xiāng)村大數(shù)據(jù)源進(jìn)行的,包括傳統(tǒng)數(shù)據(jù)和非傳統(tǒng)數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)等多種類型。本文使用的主要數(shù)據(jù)來(lái)源及相應(yīng)用途見(jiàn)表1。

      4 大數(shù)據(jù)鄉(xiāng)村畫像標(biāo)簽體系的構(gòu)建

      在鄉(xiāng)村畫像概念模型的框架下,以鄉(xiāng)村大數(shù)據(jù)為基礎(chǔ),以展示鄉(xiāng)村全貌、挖掘鄉(xiāng)村特征、助力鄉(xiāng)村振興發(fā)展為目標(biāo),構(gòu)建鄉(xiāng)村畫像標(biāo)簽體系。相對(duì)于概念模型而言,鄉(xiāng)村畫像標(biāo)簽體系更加具體和形象,在獲取數(shù)據(jù)的基礎(chǔ)上,可直接進(jìn)行可視化標(biāo)簽分析。

      4.1 標(biāo)簽體系的構(gòu)建方法

      與指標(biāo)體系不同,標(biāo)簽體系不再受各指標(biāo)層級(jí)必須相同、指標(biāo)值必須為數(shù)值型數(shù)據(jù)的限制,是一種更為靈活、更適合大數(shù)據(jù)生態(tài)的模型體系。本文將從指標(biāo)數(shù)據(jù)、知識(shí)圖譜、政策規(guī)劃文本3個(gè)方面,介紹5類標(biāo)簽的構(gòu)建方法。其中,從指標(biāo)數(shù)據(jù)出發(fā),可以構(gòu)建2類原始標(biāo)簽;從知識(shí)圖譜出發(fā),可以通過(guò)對(duì)原始標(biāo)簽進(jìn)行擴(kuò)展和泛化處理,生成2類新的標(biāo)簽;從政策規(guī)劃文本出發(fā),提取關(guān)鍵詞,可以生成宏觀屬性的鄉(xiāng)村行為標(biāo)簽。

      (1)基于指標(biāo)名稱的原始標(biāo)簽提取

      從鄉(xiāng)村數(shù)據(jù)指標(biāo)出發(fā),對(duì)數(shù)據(jù)指標(biāo)名稱進(jìn)行轉(zhuǎn)換,在保持指標(biāo)含義不變的條件下,將原始指標(biāo)轉(zhuǎn)換為以短詞語(yǔ)或短詞組形式為主、指標(biāo)名稱更為精簡(jiǎn)的標(biāo)簽,并將其標(biāo)記為原始標(biāo)簽。如第三次全國(guó)農(nóng)業(yè)普查中行政村普查表中的“生活污水是否經(jīng)過(guò)集中處理”這一指標(biāo),在提取標(biāo)簽時(shí),可以提取為“生活污水集中處理”。此外,對(duì)于指標(biāo)中存在的“個(gè)數(shù)”“人數(shù)”“戶數(shù)”等內(nèi)容,在進(jìn)行標(biāo)簽提取時(shí),一般進(jìn)行刪除處理,如“村集體創(chuàng)辦的互助型養(yǎng)老服務(wù)設(shè)施個(gè)數(shù)”指標(biāo),在提取標(biāo)簽時(shí),轉(zhuǎn)化為“村集體創(chuàng)辦互助型養(yǎng)老服務(wù)設(shè)施”。

      (2)基于指標(biāo)數(shù)據(jù)計(jì)算的標(biāo)簽提取

      表1 鄉(xiāng)村畫像概念模型數(shù)據(jù)源匯總

      從鄉(xiāng)村數(shù)據(jù)出發(fā),借助傳統(tǒng)描述性統(tǒng)計(jì)分析,計(jì)算某一指標(biāo)或原始標(biāo)簽的基本統(tǒng)計(jì)量,對(duì)單時(shí)點(diǎn)數(shù)據(jù)計(jì)算最大值、最小值、均值、秩(排序),對(duì)連續(xù)時(shí)點(diǎn)數(shù)據(jù)計(jì)算增長(zhǎng)率等,并對(duì)計(jì)算后的統(tǒng)計(jì)量中的突出特征進(jìn)行提取。以單時(shí)點(diǎn)第三次全國(guó)農(nóng)業(yè)普查數(shù)據(jù)為例,針對(duì)行政村“外來(lái)人口”這一指標(biāo),在全省樣本層面計(jì)算指標(biāo)排名,針對(duì)排名提取最具特征的標(biāo)簽,如“外來(lái)人口省內(nèi)Top3”“外來(lái)人口省內(nèi)前10%”等。對(duì)于非傳統(tǒng)數(shù)據(jù)的標(biāo)簽化處理,視數(shù)據(jù)情況而定,其中,政府部門公開評(píng)選的鄉(xiāng)村稱號(hào)數(shù)據(jù),如“鄉(xiāng)村振興示范村”“生態(tài)村”等文本型數(shù)據(jù),無(wú)需轉(zhuǎn)換,可直接作為鄉(xiāng)村畫像標(biāo)簽。

      (3)基于知識(shí)圖譜的原始標(biāo)簽擴(kuò)展

      基本知識(shí)圖譜的原始標(biāo)簽擴(kuò)展是指從原始指標(biāo)出發(fā),借助相關(guān)知識(shí)圖譜,引入外部相關(guān)信息,在原始指標(biāo)的基礎(chǔ)上,擴(kuò)展出新的標(biāo)簽。關(guān)于擴(kuò)展型標(biāo)簽的知識(shí)圖譜的構(gòu)建,應(yīng)將鄉(xiāng)村的地理區(qū)位等基本屬性與國(guó)家政策、本區(qū)域的特征、相鄰區(qū)域的特征建立直接或間接的關(guān)系,借助相關(guān)知識(shí)圖譜,可以擴(kuò)展出是否為“兩省邊界村”、是否“與一線城市相鄰”、是否“與經(jīng)濟(jì)大省相鄰”等擴(kuò)展性標(biāo)簽。

      (4)基于知識(shí)圖譜的原始標(biāo)簽泛化

      基本知識(shí)圖譜的原始標(biāo)簽泛化是指從原始指標(biāo)出發(fā),借助知識(shí)圖譜技術(shù),挖掘出多個(gè)指標(biāo)的共同屬性,并將其泛化成一個(gè)共性標(biāo)簽。對(duì)于泛化型標(biāo)簽的知識(shí)圖譜的構(gòu)建,應(yīng)將鄉(xiāng)村的各項(xiàng)經(jīng)濟(jì)和社會(huì)活動(dòng)進(jìn)行系統(tǒng)化處理,并建立鄉(xiāng)村各項(xiàng)經(jīng)濟(jì)和社會(huì)活動(dòng)的層級(jí)關(guān)系,進(jìn)而基于建立的層次關(guān)系,實(shí)現(xiàn)原始標(biāo)簽準(zhǔn)確、高效的泛化。如某個(gè)鄉(xiāng)村在“設(shè)施農(nóng)業(yè)、循環(huán)農(nóng)業(yè)、工廠化生產(chǎn)”“高標(biāo)準(zhǔn)農(nóng)田”“按測(cè)土配方施肥”方面開展了大量工作,則基于相關(guān)的知識(shí)圖譜,可以泛化出“開展新型生產(chǎn)模式”這一標(biāo)簽。

      (5)基于政策規(guī)劃文本的標(biāo)簽提取

      從國(guó)家級(jí)政策規(guī)劃文本出發(fā),提取其中的關(guān)鍵詞,對(duì)關(guān)鍵詞進(jìn)行轉(zhuǎn)換,生成新的標(biāo)簽,一般適用于宏觀屬性一、二級(jí)標(biāo)簽的提取,對(duì)于三級(jí)以上標(biāo)簽的提取仍需依賴相關(guān)的知識(shí)圖譜。這種標(biāo)簽提取方法緊跟國(guó)家政策形勢(shì),提取的標(biāo)簽可直接用于政策實(shí)施進(jìn)度、實(shí)施效果的監(jiān)測(cè),受到政府相關(guān)部門的高度關(guān)注。如從《鄉(xiāng)村振興戰(zhàn)略規(guī)劃(2018—2022年)》中提取“構(gòu)建現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)體系”一詞,可以將其標(biāo)簽化為“推行現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)化發(fā)展”。

      4.2 鄉(xiāng)村畫像基本屬性標(biāo)簽體系

      在鄉(xiāng)村畫像概念模型中,鄉(xiāng)村畫像基本屬性包含“地理區(qū)位”“自然條件”“政策稱號(hào)”3個(gè)維度。地理區(qū)位從行政區(qū)劃出發(fā),借助基于地理、經(jīng)濟(jì)等知識(shí)圖譜體系,生成行政區(qū)劃、區(qū)域擴(kuò)展、臨近區(qū)域等新型標(biāo)簽;自然條件將地形、氣候、土壤、資源、自然災(zāi)害作為畫像標(biāo)簽;政策稱號(hào)將鄉(xiāng)村、鄉(xiāng)村所屬市縣園區(qū)、鄉(xiāng)村下屬企業(yè)在涉農(nóng)領(lǐng)域獲取的國(guó)家部委機(jī)構(gòu)公開評(píng)選的政策稱號(hào),直接作為鄉(xiāng)村標(biāo)簽。這3個(gè)維度的標(biāo)簽值在短期內(nèi)相對(duì)穩(wěn)定,除行政村區(qū)劃調(diào)整和滾動(dòng)評(píng)審的政策稱號(hào)之外,絕大多鄉(xiāng)村的基本屬性在短期內(nèi)不會(huì)變動(dòng)。鄉(xiāng)村畫像基本屬性標(biāo)簽體系如圖2所示。

      鄉(xiāng)村畫像基本屬性標(biāo)簽體系構(gòu)建中,地理區(qū)位標(biāo)簽的初始數(shù)據(jù)一般僅為鄉(xiāng)村所屬的行政區(qū)劃這一個(gè)數(shù)據(jù)值的信息,對(duì)于其他地理區(qū)位標(biāo)簽,需借助知識(shí)圖譜進(jìn)行標(biāo)簽擴(kuò)展;自然條件的數(shù)據(jù)支撐以農(nóng)業(yè)部信息中心、國(guó)家氣象信息中心等政府部門的公開數(shù)據(jù)為主,進(jìn)行標(biāo)簽構(gòu)建;政策稱號(hào)數(shù)據(jù)以中華人民共和國(guó)農(nóng)業(yè)農(nóng)村部、中華人民共和國(guó)國(guó)家發(fā)展和改革委員會(huì)、中華人民共和國(guó)科學(xué)技術(shù)部、中華人民共和國(guó)財(cái)政部、中華人民共和國(guó)生態(tài)環(huán)境部、中華人民共和國(guó)水利部、中華人民共和國(guó)文化和旅游部、中華人民共和國(guó)住房和城鄉(xiāng)建設(shè)部、中華人民共和國(guó)民政部等政府部門聯(lián)合或單獨(dú)公開評(píng)審的稱號(hào)名單為主,進(jìn)行標(biāo)簽構(gòu)建,其中“農(nóng)業(yè)產(chǎn)業(yè)化國(guó)家重點(diǎn)龍頭企業(yè)”和“國(guó)家自然保護(hù)區(qū)”的評(píng)審為滾動(dòng)式評(píng)選,當(dāng)年評(píng)審后,之前發(fā)布的名單作廢;國(guó)家有機(jī)食品生產(chǎn)基地會(huì)定期對(duì)前面審批的基地進(jìn)行復(fù)核,公布審核后的名單。最終確立一級(jí)標(biāo)簽3類,二級(jí)標(biāo)簽12類,三級(jí)標(biāo)簽29類,四級(jí)標(biāo)簽35類,五級(jí)標(biāo)簽35類。具體標(biāo)簽體系見(jiàn)表2。

      表2 鄉(xiāng)村畫像基本屬性標(biāo)簽體系

      4.3 鄉(xiāng)村畫像狀態(tài)屬性標(biāo)簽體系

      鄉(xiāng)村畫像狀態(tài)屬性標(biāo)簽體系,主要用來(lái)標(biāo)識(shí)當(dāng)前鄉(xiāng)村發(fā)展的基礎(chǔ)性、代表性指標(biāo)的發(fā)展?fàn)顟B(tài),反映鄉(xiāng)村發(fā)展的基本水平。通過(guò)狀態(tài)屬性可以對(duì)當(dāng)前鄉(xiāng)村的發(fā)展水平有一個(gè)概括性的了解,一般地,狀態(tài)標(biāo)簽多為長(zhǎng)期以來(lái)政府部門關(guān)注的指標(biāo)。對(duì)于狀態(tài)屬性標(biāo)簽化體系的構(gòu)建,將從“規(guī)?!薄八俣取薄敖Y(jié)構(gòu)”“效率”4個(gè)維度開展。在規(guī)模和速度維度下,主要對(duì)鄉(xiāng)村產(chǎn)業(yè)、鄉(xiāng)村人口、村集體收支的規(guī)模和速度進(jìn)行考量;在結(jié)構(gòu)維度下,對(duì)鄉(xiāng)村非農(nóng)收入、老齡化人口、農(nóng)民受教育、醫(yī)療資源配置、教育資源配置的結(jié)構(gòu)進(jìn)行考量;在效率維度下,對(duì)人均產(chǎn)值、農(nóng)業(yè)機(jī)械化效率進(jìn)行考量。鄉(xiāng)村畫像狀態(tài)屬性標(biāo)簽體系如圖3所示。

      (續(xù)表)

      鄉(xiāng)村畫像狀態(tài)屬性標(biāo)簽體系中的數(shù)據(jù)一般為常見(jiàn)性數(shù)據(jù),對(duì)于省、市層面的數(shù)據(jù),可以在《中國(guó)農(nóng)業(yè)年鑒》《中國(guó)農(nóng)村統(tǒng)計(jì)年鑒》等公開年鑒中獲??;對(duì)于鄉(xiāng)村層級(jí)的狀態(tài)數(shù)據(jù),一般保存在各縣級(jí)以上的統(tǒng)計(jì)部門,不對(duì)外公開。全國(guó)鄉(xiāng)村的狀態(tài)標(biāo)簽數(shù)據(jù)可從農(nóng)業(yè)普查數(shù)據(jù)中獲取,但一般鄉(xiāng)村級(jí)別底層微觀數(shù)據(jù)的獲取存在一定困難。對(duì)于非政府部門開展的狀態(tài)標(biāo)簽的畫像,可以考慮借助非傳統(tǒng)數(shù)據(jù),如借助遙感數(shù)據(jù)獲取農(nóng)業(yè)產(chǎn)業(yè)數(shù)據(jù),借助手機(jī)信令數(shù)據(jù)獲取鄉(xiāng)村人口流動(dòng)的信息。最終確立一級(jí)標(biāo)簽4類,二級(jí)標(biāo)簽13類,三級(jí)標(biāo)簽20類,具體狀態(tài)標(biāo)簽體系見(jiàn)表3。

      表3 鄉(xiāng)村畫像狀態(tài)屬性標(biāo)簽體系

      4.4 鄉(xiāng)村畫像行為屬性標(biāo)簽體系

      鄉(xiāng)村畫像行為屬性標(biāo)簽體系,將從鄉(xiāng)村微觀行為標(biāo)簽和鄉(xiāng)村宏觀行為標(biāo)簽兩個(gè)方面開展,微觀行為標(biāo)簽主要反映被刻畫的對(duì)象的單一行為,較為具體,而宏觀行為標(biāo)簽則為多種行為的綜合反映,較為抽象。微觀行為標(biāo)簽有2類:一是某些單時(shí)點(diǎn)原始指標(biāo)可直接被轉(zhuǎn)換為微觀行為標(biāo)簽,如集中處理生活垃圾、村集體創(chuàng)辦衛(wèi)生室、施用農(nóng)家肥;二是對(duì)連續(xù)時(shí)點(diǎn)的狀態(tài)性指標(biāo)變動(dòng)進(jìn)行加工計(jì)算,將其轉(zhuǎn)換為微觀行為標(biāo)簽,如可以通過(guò)計(jì)算“村集體支出”兩年間的變動(dòng),生成“縮減村集體支出”這一標(biāo)簽。宏觀行為標(biāo)簽可借助政策文本進(jìn)行提取,同時(shí)也可借助相關(guān)知識(shí)圖譜進(jìn)行擴(kuò)展和泛化。

      基于《國(guó)家鄉(xiāng)村振興發(fā)展戰(zhàn)略規(guī)劃(2018—2022)年》(以下簡(jiǎn)稱戰(zhàn)略規(guī)劃)和第三次全國(guó)農(nóng)業(yè)普查的數(shù)據(jù)指標(biāo),從“發(fā)展產(chǎn)業(yè)”“保護(hù)生態(tài)”“延續(xù)文明”“加強(qiáng)治理”“推動(dòng)共同富裕”5個(gè)維度,構(gòu)建了鄉(xiāng)村畫像行為屬性標(biāo)簽體系。其中,從戰(zhàn)略規(guī)劃原文提煉了鄉(xiāng)村畫像宏觀行為標(biāo)簽,標(biāo)識(shí)為“鄉(xiāng)村畫像一級(jí)標(biāo)簽和部分二級(jí)標(biāo)簽”,同時(shí)從第三次全國(guó)農(nóng)業(yè)普查指標(biāo)數(shù)據(jù)中提取了鄉(xiāng)村畫像的微觀行為標(biāo)簽,最終構(gòu)建鄉(xiāng)村畫像行為屬性標(biāo)簽體系如圖4所示。

      在鄉(xiāng)村畫像行為屬性標(biāo)簽體系的構(gòu)建中,一級(jí)標(biāo)簽是基于戰(zhàn)略規(guī)劃原文信息直接提取的,二級(jí)和三級(jí)標(biāo)簽以第三次全國(guó)農(nóng)業(yè)普查的調(diào)查表指標(biāo)為基礎(chǔ),以農(nóng)業(yè)普查中的行政村、農(nóng)業(yè)經(jīng)營(yíng)戶、規(guī)模以上農(nóng)業(yè)經(jīng)營(yíng)戶3類主體的調(diào)查信息表為依據(jù),構(gòu)建鄉(xiāng)村畫像行為屬性標(biāo)簽體系。鄉(xiāng)村畫像行為屬性包含正向?qū)傩院拓?fù)向?qū)傩?,本文的行為?biāo)簽體系多以正向?qū)傩缘男问浇o出,以期引導(dǎo)鄉(xiāng)村振興正向發(fā)展,在應(yīng)用中視鄉(xiāng)村各標(biāo)簽值的大小,加入相應(yīng)的程度副詞或否定詞進(jìn)行負(fù)向刻畫。最終確定一級(jí)標(biāo)簽5類、二級(jí)標(biāo)簽23類、三級(jí)標(biāo)簽44類、四級(jí)標(biāo)簽31類,具體行為屬性標(biāo)簽體系見(jiàn)表4。

      表4 鄉(xiāng)村畫像行為屬性標(biāo)簽體系

      (續(xù)表)

      5 大數(shù)據(jù)鄉(xiāng)村畫像的實(shí)施算法及畫像舉例

      5.1 大數(shù)據(jù)鄉(xiāng)村畫像的標(biāo)簽計(jì)算方法

      (1)鄉(xiāng)村畫像基本屬性標(biāo)簽的計(jì)算方法

      一是地理區(qū)位標(biāo)簽計(jì)算。從鄉(xiāng)村所屬行政區(qū)劃出發(fā),借助大數(shù)據(jù)工具,識(shí)別鄉(xiāng)村行政區(qū)劃邊界,借助知識(shí)圖譜,通過(guò)建立區(qū)域特征判別算法、鄰近村特征識(shí)別算法、邊界村識(shí)別算法,對(duì)臨近區(qū)域中的相鄰區(qū)域、邊界村、邊境村進(jìn)行計(jì)算識(shí)別。

      二是自然屬性標(biāo)簽計(jì)算。在鄉(xiāng)村數(shù)據(jù)較難獲得的情況下,可借助所屬縣、市自然屬性的數(shù)據(jù),進(jìn)行標(biāo)簽化處理。

      三是政策稱號(hào)標(biāo)簽計(jì)算。通過(guò)大數(shù)據(jù)技術(shù)查找比對(duì)政府部門公開評(píng)選的各類涉農(nóng)名單,政府公開評(píng)選的涉農(nóng)的各種名稱頭銜可直接用于鄉(xiāng)村畫像,直接生成鄉(xiāng)村畫像的特征標(biāo)簽。此類標(biāo)簽的生成以收集整理的政府部門公開評(píng)審的涉農(nóng)名單為前提,在收集、積累涉農(nóng)數(shù)據(jù)的基礎(chǔ)上,分類建立“村”“鎮(zhèn)”“縣”“產(chǎn)業(yè)園”等名錄。在具體開展鄉(xiāng)村畫像工作時(shí),可對(duì)被畫像的鄉(xiāng)村名稱與名錄庫(kù)中公開評(píng)選的名稱進(jìn)行查找、比對(duì),若能在名錄庫(kù)中查找到鄉(xiāng)村名稱,則記錄此鄉(xiāng)村對(duì)應(yīng)的被評(píng)選的稱號(hào),可直接將被評(píng)的稱號(hào)作為標(biāo)簽;若查找不到,則不生成標(biāo)簽,不進(jìn)行處理。對(duì)于“有進(jìn)有出”型的評(píng)選,在生成標(biāo)簽時(shí),不僅對(duì)當(dāng)年入選獲取的稱號(hào)生成標(biāo)簽進(jìn)行標(biāo)識(shí),對(duì)于曾被評(píng)選上但當(dāng)年未被評(píng)選上的對(duì)象,同樣可粘貼標(biāo)簽,如標(biāo)簽化處理可為“某年被評(píng)選為某稱號(hào),但在某年被摘掉稱號(hào)”。

      (2)鄉(xiāng)村畫像狀態(tài)標(biāo)簽的計(jì)算方法

      鄉(xiāng)村畫像狀態(tài)屬性標(biāo)簽的計(jì)算,主要對(duì)鄉(xiāng)村的“規(guī)?!薄八俣取薄敖Y(jié)構(gòu)”“效率”等數(shù)據(jù)進(jìn)行加工計(jì)算,計(jì)算其在“本鄉(xiāng)鎮(zhèn)”“本縣”“本市”“本省”以及“全國(guó)”層面中的“位次”,并篩選特征指標(biāo),進(jìn)行標(biāo)簽化處理,在具體特征標(biāo)簽計(jì)算時(shí),可采用“市內(nèi)Top3”“省內(nèi)Top10”“省內(nèi)前10%”等規(guī)則進(jìn)行標(biāo)簽化。

      (3)鄉(xiāng)村畫像行為標(biāo)簽的計(jì)算方法

      從標(biāo)簽體系出發(fā),將原始數(shù)據(jù)按照標(biāo)簽體系進(jìn)行模型化處理,最常見(jiàn)的是指數(shù)合成方法,將初始標(biāo)簽值加工計(jì)算為各級(jí)標(biāo)簽值。根據(jù)計(jì)算的各級(jí)標(biāo)簽值的大小,選定相關(guān)的程度副詞或否定詞,生成具體的行為標(biāo)簽。如經(jīng)指數(shù)合成計(jì)算,得出“改善生產(chǎn)條件”這一標(biāo)簽值為零,那么在具體生成行為屬性標(biāo)簽時(shí)生成為“未改善生產(chǎn)條件”。

      5.2 大數(shù)據(jù)鄉(xiāng)村畫像的可視化方法

      (1)鄉(xiāng)村畫像的地圖可視化方法

      在對(duì)鄉(xiāng)村進(jìn)行畫像時(shí),首先應(yīng)將鄉(xiāng)村的基本情況進(jìn)行可視化展示,其中包括地理區(qū)位、自然條件、政策稱號(hào)等基本屬性標(biāo)簽和產(chǎn)業(yè)、人口等部分狀態(tài)屬性標(biāo)簽的內(nèi)容。對(duì)于地理區(qū)位標(biāo)簽,對(duì)鄉(xiāng)村行政區(qū)劃的邊界、行政區(qū)劃的面積以及在上級(jí)行政區(qū)劃中的位置進(jìn)行展示,借助地圖對(duì)鄉(xiāng)村地理位置進(jìn)行明確展示。同時(shí)在地圖中對(duì)鄉(xiāng)村人口、用地、政策稱號(hào)等內(nèi)容進(jìn)行文字說(shuō)明。此外,對(duì)于鄉(xiāng)村發(fā)展重要的、特殊的自然條件,如江河、煤礦、氣候等標(biāo)簽,也可在地圖上標(biāo)識(shí)展示。

      (2)鄉(xiāng)村畫像之大數(shù)據(jù)詞云圖方法

      “詞云”這一概念由美國(guó)西北大學(xué)新聞學(xué)副教授、新媒體專業(yè)主任里奇·戈登提出,是對(duì)網(wǎng)絡(luò)文本中出現(xiàn)頻率較高的“關(guān)鍵詞”予以視覺(jué)上的突出,形成“關(guān)鍵詞云層”或“關(guān)鍵詞渲染”,從而過(guò)濾掉大量的文本信息,使瀏覽網(wǎng)頁(yè)者通過(guò)詞云就可以領(lǐng)略文本的主旨。當(dāng)前詞云圖被大量應(yīng)用在對(duì)政策要聞等詞頻的統(tǒng)計(jì)中。

      在鄉(xiāng)村畫像領(lǐng)域,將引入詞云圖對(duì)鄉(xiāng)村的諸多標(biāo)簽進(jìn)行詞云可視化展示。與當(dāng)前詞頻統(tǒng)計(jì)畫像不同,鄉(xiāng)村畫像詞云圖以各標(biāo)簽無(wú)量綱化處理后的標(biāo)簽值進(jìn)行畫像。在無(wú)量綱化處理時(shí),采用“累積分布函數(shù)×100”的方法進(jìn)行無(wú)量綱化處理,即將原始數(shù)據(jù)減去均值后除以標(biāo)準(zhǔn)差后的值,放入正態(tài)分布的累積分布函數(shù)中計(jì)算函數(shù)值,并將函數(shù)值乘以100。這種處理方法將原始數(shù)據(jù)映射在區(qū)間(0,100),能較好地保持各鄉(xiāng)村標(biāo)簽值之間的差距,其中得分接近100代表標(biāo)簽屬性具有突出性特征,得分接近0代表標(biāo)簽特征不明顯。經(jīng)過(guò)無(wú)量綱化處理后的得分?jǐn)?shù)據(jù),可實(shí)現(xiàn)對(duì)鄉(xiāng)村上百個(gè)標(biāo)簽的同時(shí)展示。

      (3)鄉(xiāng)村畫像之大數(shù)據(jù)綜合圖方法

      鄉(xiāng)村畫像大數(shù)據(jù)綜合圖將鄉(xiāng)村地圖、鄉(xiāng)村畫像詞云圖、數(shù)據(jù)表、統(tǒng)計(jì)圖等多種圖表分析的可視化方法進(jìn)行綜合運(yùn)用,基于鄉(xiāng)村大數(shù)據(jù)條件,充分發(fā)揮各類統(tǒng)計(jì)圖表的優(yōu)勢(shì),科學(xué)設(shè)計(jì)綜合圖的可視化展示內(nèi)容、展示形式和展示布局,最終提供大數(shù)據(jù)鄉(xiāng)村畫像的綜合圖。

      5.3 大數(shù)據(jù)鄉(xiāng)村畫像舉例

      借助第三次全國(guó)農(nóng)業(yè)普查的普查表和非傳統(tǒng)的鄉(xiāng)村數(shù)據(jù),對(duì)鄉(xiāng)村微觀的各項(xiàng)指標(biāo)數(shù)據(jù)進(jìn)行模擬,并以此作為大數(shù)據(jù)畫像可視化基礎(chǔ)。在模擬數(shù)據(jù)的基礎(chǔ)上,依據(jù)鄉(xiāng)村基本屬性標(biāo)簽體系、狀態(tài)屬性標(biāo)簽體系和行為屬性標(biāo)簽體系,對(duì)數(shù)據(jù)進(jìn)行加工處理,繪制鄉(xiāng)村地圖、詞云圖以及各項(xiàng)統(tǒng)計(jì)圖,最終確定大數(shù)據(jù)鄉(xiāng)村畫像,如圖5所示。

      鄉(xiāng)村地圖的可視化部分布置在大數(shù)據(jù)畫像圖的左上角,采用地圖與實(shí)景圖相結(jié)合的方式,在構(gòu)建系統(tǒng)時(shí)可通過(guò)鼠標(biāo)點(diǎn)擊實(shí)現(xiàn)地圖和實(shí)景圖之間的切換,其中,在地圖層面,對(duì)鄉(xiāng)村的基本屬性標(biāo)簽和部分狀態(tài)屬性標(biāo)簽進(jìn)行標(biāo)識(shí)。鄉(xiāng)村畫像標(biāo)簽詞云圖部分布置在大數(shù)據(jù)畫像圖的左下角兩塊區(qū)域:一是大數(shù)據(jù)詞云圖,將對(duì)原始數(shù)據(jù)、狀態(tài)標(biāo)簽、行為標(biāo)簽中的定量數(shù)據(jù)進(jìn)行加工處理,生成數(shù)百個(gè)鄉(xiāng)村畫像標(biāo)簽,進(jìn)行詞云展示;二是將詞云圖中標(biāo)簽值小、肉眼難以識(shí)別的標(biāo)簽提取出來(lái),單獨(dú)列為“鄉(xiāng)村振興有待提升標(biāo)簽”,以數(shù)據(jù)表格的形式進(jìn)行展示。狀態(tài)屬性標(biāo)簽可視化部分布置在大數(shù)據(jù)畫像圖的右上角,分別對(duì)鄉(xiāng)村規(guī)模、速度、結(jié)構(gòu)、效率采用“標(biāo)簽(省內(nèi)Top10等)+傳統(tǒng)統(tǒng)計(jì)圖”的方式進(jìn)行可視化展現(xiàn)。行為標(biāo)簽可視化部分布置在大數(shù)據(jù)畫像圖的右下角,對(duì)于行為標(biāo)簽各維度的標(biāo)簽值進(jìn)行可視化顯示。最后,在右側(cè)中間位置,基于3套標(biāo)簽體系,合成鄉(xiāng)村振興推進(jìn)水平指數(shù),從5個(gè)維度對(duì)本鄉(xiāng)村與全省水平進(jìn)行可視化比較展示。

      6 結(jié)束語(yǔ)

      大數(shù)據(jù)畫像技術(shù)是一種描述事物全貌、挖掘事物特征、發(fā)現(xiàn)事物發(fā)展規(guī)律的重要技術(shù),在鄉(xiāng)村畫像領(lǐng)域具有廣闊的應(yīng)用前景。本文創(chuàng)新性地構(gòu)建了鄉(xiāng)村畫像概念模型、標(biāo)簽體系,明確了大數(shù)據(jù)鄉(xiāng)村畫像的實(shí)施算法,設(shè)計(jì)了鄉(xiāng)村畫像的可視化形式,為大數(shù)據(jù)鄉(xiāng)村畫像奠定了理論與實(shí)踐的基礎(chǔ)。大數(shù)據(jù)畫像的結(jié)果可直接用于評(píng)價(jià)鄉(xiāng)村振興效果為鄉(xiāng)村振興前期發(fā)展規(guī)劃、發(fā)展路徑的制定和實(shí)施提供決策參考。但是,大數(shù)據(jù)畫像工作仍然面臨著諸多挑戰(zhàn)。未來(lái),大數(shù)據(jù)鄉(xiāng)村畫像實(shí)踐工作的研究,可以從以下幾個(gè)方面展開。

      一是系統(tǒng)性梳理鄉(xiāng)村大數(shù)據(jù)源,對(duì)數(shù)字鄉(xiāng)村建設(shè)中產(chǎn)生的鄉(xiāng)村大數(shù)據(jù)進(jìn)行前瞻性設(shè)計(jì)。鄉(xiāng)村大數(shù)據(jù)是鄉(xiāng)村畫像的基礎(chǔ)。突破當(dāng)前以農(nóng)業(yè)科學(xué)大數(shù)據(jù)為核心,以輔助農(nóng)業(yè)科研、生產(chǎn)、加工、銷售為目的建設(shè)農(nóng)業(yè)大數(shù)據(jù)庫(kù)的思想,將農(nóng)業(yè)大數(shù)據(jù)的建設(shè)擴(kuò)展到鄉(xiāng)村大數(shù)據(jù)建設(shè),對(duì)農(nóng)業(yè)之外的其他鄉(xiāng)村大數(shù)據(jù)源進(jìn)行系統(tǒng)性梳理,預(yù)判和規(guī)劃數(shù)字鄉(xiāng)村建設(shè)的數(shù)據(jù)內(nèi)容,深入研究鄉(xiāng)村大數(shù)據(jù)的應(yīng)用方向,推進(jìn)鄉(xiāng)村大數(shù)據(jù)的應(yīng)用方向從農(nóng)業(yè)精準(zhǔn)生產(chǎn)到鄉(xiāng)村振興精準(zhǔn)管理與規(guī)劃的跨越式發(fā)展。

      二是構(gòu)建鄉(xiāng)村畫像知識(shí)圖譜體系,進(jìn)一步擴(kuò)充鄉(xiāng)村畫像的標(biāo)簽體系。知識(shí)圖譜是智能化開展大數(shù)據(jù)鄉(xiāng)村畫像的關(guān)鍵。對(duì)于標(biāo)簽擴(kuò)展和標(biāo)簽泛化,均依賴于知識(shí)圖譜,而當(dāng)前鄉(xiāng)村研究領(lǐng)域尚未發(fā)現(xiàn)相關(guān)知識(shí)圖譜的構(gòu)建。鄉(xiāng)村畫像知識(shí)圖譜的構(gòu)建是一項(xiàng)系統(tǒng)工程,應(yīng)在對(duì)鄉(xiāng)村大數(shù)據(jù)、自然資源、鄉(xiāng)村經(jīng)濟(jì)和社會(huì)活動(dòng)、國(guó)家政策之間的關(guān)系進(jìn)行系統(tǒng)性梳理的基礎(chǔ)上展開。

      三是建立大數(shù)據(jù)鄉(xiāng)村畫像的標(biāo)簽篩選機(jī)制。標(biāo)簽篩選機(jī)制是鄉(xiāng)村畫像工作順利進(jìn)行的必要保障,從初始的鄉(xiāng)村大數(shù)據(jù)中可以提取大量的原始標(biāo)簽,而借助知識(shí)圖譜技術(shù)又可以擴(kuò)展和泛化出新的標(biāo)簽,標(biāo)簽數(shù)量可達(dá)數(shù)百個(gè),且隨著數(shù)字鄉(xiāng)村工作的開展,鄉(xiāng)村大數(shù)據(jù)數(shù)據(jù)量不斷增加,標(biāo)簽的數(shù)量也將不斷增加,可達(dá)上千個(gè),如不建立標(biāo)簽篩選機(jī)制,直接將全部標(biāo)簽進(jìn)行畫像展示,不僅不能通過(guò)畫像刻畫鄉(xiāng)村的特征,而且會(huì)陷入標(biāo)簽災(zāi)難,鑒于此,標(biāo)簽篩選機(jī)制在未來(lái)也將是一項(xiàng)重要的工作。

      四是探索大數(shù)據(jù)鄉(xiāng)村畫像的監(jiān)測(cè)預(yù)警體系。監(jiān)測(cè)預(yù)警是鄉(xiāng)村畫像的重要應(yīng)用方向。將電商、金融領(lǐng)域成功運(yùn)用的用戶畫像預(yù)測(cè)分析方法,尤其是把k-means、決策樹、支持向量機(jī)等機(jī)器學(xué)習(xí)方法引入鄉(xiāng)村畫像體系之中,通過(guò)構(gòu)建相應(yīng)的模型算法,實(shí)現(xiàn)對(duì)鄉(xiāng)村經(jīng)濟(jì)社會(huì)發(fā)展的監(jiān)測(cè)預(yù)警,為政府進(jìn)行政策調(diào)整提供理論依據(jù)。

      猜你喜歡
      概念模型畫像標(biāo)簽
      威猛的畫像
      “00后”畫像
      畫像
      無(wú)懼標(biāo)簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      基于“認(rèn)知提升”的體系作戰(zhàn)指揮概念模型及裝備發(fā)展需求
      標(biāo)簽化傷害了誰(shuí)
      基于多進(jìn)制查詢樹的多標(biāo)簽識(shí)別方法
      數(shù)字礦山信息集成概念模型
      金屬礦山(2014年7期)2014-03-20 14:19:57
      潛行與畫像
      莱芜市| 巴中市| 阳城县| 平远县| 新营市| 城口县| 体育| 柯坪县| 青河县| 平谷区| 宝丰县| 石门县| 荔浦县| 乌拉特前旗| 宁乡县| 车致| 普安县| 马龙县| 建阳市| 沈阳市| 张北县| 五大连池市| 北川| 浑源县| 民丰县| 无极县| 南康市| 泰州市| 洪雅县| 梧州市| 淄博市| 米林县| 苏州市| 且末县| 富裕县| 昌平区| 陆丰市| 玉屏| 乐东| 望谟县| 盐边县|