余吳浩淼,劉 倫,曾繁如,高雪松,田兆楠,陳 卓
(1.四川農(nóng)業(yè)大學(xué)資源學(xué)院,成都 611130; 2.北京大學(xué)政府管理學(xué)院,北京 100871; 3. 四川水利職業(yè)技術(shù)學(xué)院,成都 611800)
【研究意義】通信基建與電子設(shè)備的普及使得運(yùn)用大數(shù)據(jù)研究“三農(nóng)”問(wèn)題成為可能。大數(shù)據(jù)作為新的數(shù)據(jù)來(lái)源,為“三農(nóng)”問(wèn)題研究提供了新的研究方式。因此,總結(jié)分析基于大數(shù)據(jù)應(yīng)用的“三農(nóng)”問(wèn)題研究現(xiàn)狀,對(duì)于了解該領(lǐng)域研究重點(diǎn)與未來(lái)方向具有重要意義。【前人研究進(jìn)展】隨著信息技術(shù)和物聯(lián)網(wǎng)技術(shù)的發(fā)展與普及,人類社會(huì)產(chǎn)生的數(shù)據(jù)量呈現(xiàn)出爆炸性增長(zhǎng)的趨勢(shì)。這種大容量、多樣性、綜合性的數(shù)據(jù)流改變了人們的生活方式,也成為了科學(xué)研究的關(guān)注熱點(diǎn)[1]。相比于傳統(tǒng)數(shù)據(jù),大數(shù)據(jù)在內(nèi)容上呈現(xiàn)出樣本量大、動(dòng)態(tài)實(shí)時(shí)、詳細(xì)微觀等特點(diǎn),為解決現(xiàn)實(shí)問(wèn)題提供了新的方向[2]。由于其特征與區(qū)域問(wèn)題的解決有緊密的關(guān)聯(lián),大數(shù)據(jù)在近十年來(lái)被大量引入城市區(qū)域研究領(lǐng)域,國(guó)內(nèi)外學(xué)者已經(jīng)在居民時(shí)空行為[3]、城市功能分區(qū)[4]、城市空間聯(lián)系[5]及智慧城市建設(shè)[6]等方面取得了進(jìn)展。然而,針對(duì)于與城市相對(duì)應(yīng)的農(nóng)村區(qū)域,受限于數(shù)據(jù)覆蓋率與數(shù)據(jù)質(zhì)量,研究相對(duì)較少。但近年來(lái),電子設(shè)備的日益普及與政府的基礎(chǔ)設(shè)施投資使得在農(nóng)村區(qū)域運(yùn)用大數(shù)據(jù)進(jìn)行研究成為可能。特別是我國(guó)政府相當(dāng)重視新時(shí)期農(nóng)村建設(shè),發(fā)布了《數(shù)字農(nóng)村發(fā)展戰(zhàn)略綱要》,提出要建設(shè)數(shù)字鄉(xiāng)村,加快農(nóng)村信息發(fā)展,縮小城鄉(xiāng)數(shù)字鴻溝。目前,我國(guó)已累計(jì)支持13萬(wàn)個(gè)行政村光纖網(wǎng)絡(luò)建設(shè),農(nóng)村及偏遠(yuǎn)地區(qū)3.7萬(wàn)個(gè)4G基站建設(shè),全國(guó)行政村通光纖、通4G比例均超過(guò)98%。截至2020年3月,我國(guó)農(nóng)村地區(qū)互聯(lián)網(wǎng)普及率達(dá)到了46.2%[7]。這樣領(lǐng)先的農(nóng)村網(wǎng)絡(luò)覆蓋為我國(guó)農(nóng)村區(qū)域進(jìn)行大數(shù)據(jù)研究提供了可靠的基礎(chǔ)條件。學(xué)者們應(yīng)用大數(shù)據(jù)對(duì)我國(guó)農(nóng)村區(qū)域存在的農(nóng)業(yè)、農(nóng)村、農(nóng)民的“三農(nóng)”問(wèn)題展開研究,并取得了一些進(jìn)展[8-10],為傳統(tǒng)“三農(nóng)”問(wèn)題研究注入了新的研究視角與研究范式?!颈狙芯壳腥朦c(diǎn)】基于大數(shù)據(jù)應(yīng)用的我國(guó)“三農(nóng)”問(wèn)題研究尚處于起步階段,且對(duì)該領(lǐng)域研究的綜述總結(jié)還比較有限。【擬解決的關(guān)鍵問(wèn)題】本研究分析了“三農(nóng)”問(wèn)題研究中常用大數(shù)據(jù)數(shù)據(jù)類型與數(shù)據(jù)質(zhì)量,從農(nóng)業(yè)問(wèn)題研究、農(nóng)村問(wèn)題研究、農(nóng)民問(wèn)題研究三個(gè)方面等對(duì)大數(shù)據(jù)在“三農(nóng)”問(wèn)題研究中的應(yīng)用進(jìn)行了綜述,并討論了該研究領(lǐng)域未來(lái)可能的方向與挑戰(zhàn),旨在為相關(guān)研究提供參考。
雖然近年來(lái)大數(shù)據(jù)才逐漸成為研究熱點(diǎn),但早在20世紀(jì)80年代,大數(shù)據(jù)一詞就已經(jīng)出現(xiàn)在美國(guó)社會(huì)學(xué)家阿爾文·托夫勒的著作中[11]。大數(shù)據(jù),顧名思義,是指規(guī)模較大的數(shù)據(jù)。目前學(xué)界對(duì)大數(shù)據(jù)的概念暫無(wú)統(tǒng)一定義,許多機(jī)構(gòu)與學(xué)者從不同角度進(jìn)行了定義,如加特納(Gartner)咨詢公司將大數(shù)據(jù)定義為“高容量、高速度、多樣性的信息資產(chǎn),需要高效、創(chuàng)新的信息處理方式,以實(shí)現(xiàn)認(rèn)知與決策的提升以及流程的自動(dòng)化”,其中高容量(Volume)、多樣性(Variety)、高速度(Velocity)也被廣泛認(rèn)為是大數(shù)據(jù)的“3‘V’特征”[12],在此基礎(chǔ)上也延展出如變化性(Variability)、真實(shí)性(Veracity)、有效性(Validity)等更多的‘V’字特征。隨著應(yīng)用范圍的不斷擴(kuò)展,大數(shù)據(jù)的內(nèi)涵也變得更加豐富。外國(guó)學(xué)者研究指出“大數(shù)據(jù)并不在于其數(shù)據(jù)規(guī)模之大,更重要的是其搜索、匯集、交互數(shù)據(jù)的能力”[13],并將量級(jí)較小的公共部門管理數(shù)據(jù)納入大數(shù)據(jù)范疇[14]?;谶@些研究,本文認(rèn)為大數(shù)據(jù)是指“既包括公共部門主動(dòng)采集的、高度結(jié)構(gòu)化的管理數(shù)據(jù),也包括由機(jī)構(gòu)與個(gè)人的互聯(lián)網(wǎng)活動(dòng)被動(dòng)產(chǎn)生的、持續(xù)、自動(dòng)出現(xiàn)的結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的大量數(shù)據(jù)”。
關(guān)于大數(shù)據(jù)的類型劃分有多種方式,如按數(shù)據(jù)結(jié)構(gòu)可劃分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。本文選擇采用與研究應(yīng)用關(guān)聯(lián)更為直接的數(shù)據(jù)來(lái)源進(jìn)行劃分,將“三農(nóng)”問(wèn)題研究中常用的大數(shù)據(jù)分為互聯(lián)網(wǎng)使用數(shù)據(jù)、通訊傳感設(shè)備數(shù)據(jù)、地圖空間數(shù)據(jù)以及機(jī)構(gòu)管理運(yùn)行數(shù)據(jù)四類。下文將對(duì)四類數(shù)據(jù)的具體來(lái)源以及在農(nóng)村地區(qū)的可獲得性與數(shù)據(jù)質(zhì)量進(jìn)行分析(表1)。
表1 常用大數(shù)據(jù)類型在鄉(xiāng)村地區(qū)的質(zhì)量評(píng)價(jià)
隨著互聯(lián)網(wǎng)的普及,互聯(lián)網(wǎng)使用數(shù)據(jù)量激增。據(jù)統(tǒng)計(jì),百度日均搜索量已達(dá)50億次,微博日均內(nèi)容發(fā)布量超2.5億,這些都屬于互聯(lián)網(wǎng)使用數(shù)據(jù)的范疇。互聯(lián)網(wǎng)使用數(shù)據(jù)主要包括社交媒體數(shù)據(jù)、網(wǎng)頁(yè)閱覽數(shù)據(jù)、搜索數(shù)據(jù)、用戶上傳的圖片、音頻、視頻數(shù)據(jù)等內(nèi)容?;ヂ?lián)網(wǎng)使用數(shù)據(jù)在情報(bào)學(xué)[15]、經(jīng)濟(jì)學(xué)[16]、規(guī)劃學(xué)[17]等多領(lǐng)域內(nèi)均有廣泛運(yùn)用。一些互聯(lián)網(wǎng)使用數(shù)據(jù)也包含了定位數(shù)據(jù),這有助于研究用戶的活動(dòng)軌跡[18]。我國(guó)農(nóng)村地區(qū)互聯(lián)網(wǎng)覆蓋率較高,信號(hào)穩(wěn)定,全國(guó)行政村通光纖、通4G比例均超過(guò)98%;互聯(lián)網(wǎng)用戶較多,我國(guó)農(nóng)村網(wǎng)民規(guī)模為2.55億,農(nóng)村互聯(lián)網(wǎng)普及率達(dá)46.2%;年齡結(jié)構(gòu)方面我國(guó)網(wǎng)民主要集中在10~49歲,占網(wǎng)民群體的79.2%,10歲以下與50歲及以上的網(wǎng)民較少,占20.8%;我國(guó)農(nóng)村居民的互聯(lián)網(wǎng)使用率雖然不及城市地區(qū),但也具備了較高的數(shù)據(jù)覆蓋程度。由于互聯(lián)網(wǎng)數(shù)據(jù)主要來(lái)自于API下載與網(wǎng)頁(yè)抓取,因此可獲取性與城市居民的互聯(lián)網(wǎng)使用數(shù)據(jù)差異不大。事實(shí)上,現(xiàn)有的基于互聯(lián)網(wǎng)數(shù)據(jù)的研究往往并不專門區(qū)分城市與農(nóng)村用戶,但尚未見到采用互聯(lián)網(wǎng)數(shù)據(jù)對(duì)農(nóng)村問(wèn)題進(jìn)行的針對(duì)性研究。需要注意的是,農(nóng)村居民的互聯(lián)網(wǎng)使用習(xí)慣可能與城市居民有所差異,包括所訪問(wèn)的網(wǎng)站、所使用的網(wǎng)站功能等。
通訊傳感設(shè)備數(shù)據(jù)類型眾多,常見數(shù)據(jù)包括手機(jī)通訊、定位數(shù)據(jù)、道路交通傳感數(shù)據(jù)、車載GPS定位數(shù)據(jù)、空氣質(zhì)量監(jiān)測(cè)數(shù)據(jù)等。通訊設(shè)備數(shù)據(jù)主要來(lái)自手機(jī)使用,可提供手機(jī)用戶的活動(dòng)軌跡與通訊聯(lián)系,對(duì)于精細(xì)化捕捉人類活動(dòng)規(guī)律、識(shí)別人類活動(dòng)模式發(fā)揮了巨大作用;傳感設(shè)備數(shù)據(jù)來(lái)源于各類傳感器,如用于感知道路車輛數(shù)量的壓力傳感器、用于感知空氣質(zhì)量的化學(xué)物質(zhì)傳感等。農(nóng)村區(qū)域的傳感器數(shù)據(jù)主要掌握在農(nóng)業(yè)企業(yè)、科研機(jī)構(gòu)及政府部門等機(jī)構(gòu)內(nèi),目前主要應(yīng)用于農(nóng)業(yè)生產(chǎn)監(jiān)測(cè)與環(huán)境監(jiān)測(cè)方面。
手機(jī)使用數(shù)據(jù)因其高覆蓋率、高精度、高時(shí)效性的特點(diǎn)成為了大數(shù)據(jù)研究的重要數(shù)據(jù)來(lái)源,是人口、交通、城鄉(xiāng)規(guī)劃等領(lǐng)域的關(guān)注熱點(diǎn)[19],一般獲取自通訊運(yùn)營(yíng)商或采集手機(jī)GPS信息的APP運(yùn)營(yíng)管理方,與城市范圍內(nèi)的數(shù)據(jù)獲取方式無(wú)本質(zhì)差異,因此影響農(nóng)村研究中手機(jī)通訊數(shù)據(jù)應(yīng)用性的因素主要為手機(jī)用戶的覆蓋率以及手機(jī)定位精度。據(jù)2019年中國(guó)統(tǒng)計(jì)年鑒顯示我國(guó)農(nóng)村居民每百戶擁有257部手機(jī)[20],農(nóng)村地區(qū)手機(jī)擁有量高。全國(guó)行政村通4G比例超過(guò)98%,手機(jī)信號(hào)覆蓋率高。定位精度方面,由于農(nóng)村地區(qū)人口與手機(jī)基站布局相對(duì)稀疏,手機(jī)定位精度相較于城市區(qū)域較低,精度大約在1~2 km[21]。
地理空間大數(shù)據(jù)包括開放地圖數(shù)據(jù)、興趣點(diǎn)數(shù)據(jù)、街景圖片數(shù)據(jù)、夜間燈光數(shù)據(jù)等數(shù)據(jù)。這些數(shù)據(jù)已被大量應(yīng)用于城市研究,在城市熱點(diǎn)區(qū)域識(shí)別、建成區(qū)邊界識(shí)別、城市空間結(jié)構(gòu)分析等方面產(chǎn)生了大量研究成果[22-23]。目前尚未見到此類數(shù)據(jù)應(yīng)用于農(nóng)村研究的文獻(xiàn),很大程度上在于這類數(shù)據(jù)的采集往往涉及現(xiàn)場(chǎng)作業(yè),如開放地圖(Open Street Map)的貢獻(xiàn)者手持GPS進(jìn)行現(xiàn)場(chǎng)記錄,街景采集車在相關(guān)道路進(jìn)行實(shí)際行駛,因此這類數(shù)據(jù)在農(nóng)村地區(qū)的覆蓋率仍明顯低于城市地區(qū)。以四川省人口最多的5個(gè)地級(jí)市為例,根據(jù)百度地圖提供的街景圖片服務(wù)可以看出,農(nóng)村區(qū)域街景圖片覆蓋率顯著低于城市,覆蓋率約為10%,各市之間農(nóng)村覆蓋率差異不大。我國(guó)其他區(qū)域農(nóng)村街景圖片覆蓋情況還有待進(jìn)一步研究。夜間燈光數(shù)據(jù)主要通過(guò)遙感衛(wèi)星進(jìn)行收集,在覆蓋率與數(shù)據(jù)質(zhì)量方面好于其他地圖空間數(shù)據(jù)。但目前常用的夜間燈光數(shù)據(jù)的分辨率為1 km×1 km,運(yùn)用在空間尺度相對(duì)較小的農(nóng)村區(qū)域效果較差。綜合來(lái)講,除夜間燈光數(shù)據(jù)以外,此類數(shù)據(jù)在農(nóng)村區(qū)域的覆蓋率還較低,有待未來(lái)在數(shù)據(jù)可獲得性方面的進(jìn)一步發(fā)展。
機(jī)構(gòu)管理運(yùn)行數(shù)據(jù)指政府、企業(yè)等各類機(jī)構(gòu)運(yùn)行中產(chǎn)生的數(shù)據(jù),包含稅收數(shù)據(jù)、行政處罰數(shù)據(jù)、銀行轉(zhuǎn)賬數(shù)據(jù)等。雖然就數(shù)據(jù)規(guī)模而言這類數(shù)據(jù)并非嚴(yán)格意義上的大數(shù)據(jù),但考慮到這類數(shù)據(jù)經(jīng)過(guò)長(zhǎng)期積累也提供了可觀的信息量,因此在社會(huì)科學(xué)研究經(jīng)常也將其納入大數(shù)據(jù)范疇[24]。這類數(shù)據(jù)一方面反映了農(nóng)村中各類組織機(jī)構(gòu)的運(yùn)行管理狀況,另一方面也提供了關(guān)于個(gè)體活動(dòng)與社會(huì)經(jīng)濟(jì)系統(tǒng)運(yùn)行的豐富信息。隨著我國(guó)數(shù)據(jù)開放進(jìn)程的不斷推進(jìn),我國(guó)已有82個(gè)地方政府建立了政府?dāng)?shù)據(jù)開放平臺(tái),但關(guān)于農(nóng)業(yè)農(nóng)村的數(shù)據(jù)集數(shù)量較少,僅占所有數(shù)據(jù)集的5.2%[25],也有待未來(lái)進(jìn)一步整理與公開。
“三農(nóng)”問(wèn)題是指我國(guó)經(jīng)濟(jì)社會(huì)發(fā)展過(guò)程中出現(xiàn)的農(nóng)業(yè)、農(nóng)村、農(nóng)民這三個(gè)問(wèn)題[26]。自1996年溫鐵軍教授最早提出“三農(nóng)”問(wèn)題以來(lái),“三農(nóng)”問(wèn)題一直備受關(guān)注,數(shù)次登上政府工作報(bào)告與中央一號(hào)文件,其重要性也逐漸上升至“全黨工作的重中之重”。我國(guó)學(xué)術(shù)界針對(duì)“三農(nóng)”問(wèn)題開展了大量研究,取得了一些成果。隨著農(nóng)村基礎(chǔ)設(shè)施的不斷完善,“三農(nóng)”大數(shù)據(jù)成為“三農(nóng)”問(wèn)題研究新的數(shù)據(jù)來(lái)源,為“三農(nóng)”問(wèn)題研究提供了新的研究范式與研究視角。
隨著信息化與農(nóng)業(yè)現(xiàn)代化的不斷推進(jìn),大數(shù)據(jù)與農(nóng)業(yè)的深度融合在促進(jìn)農(nóng)業(yè)生產(chǎn)、解決我國(guó)農(nóng)業(yè)問(wèn)題方面顯示出了明顯潛力。我國(guó)政府先后出臺(tái)了《關(guān)于促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》《農(nóng)業(yè)部關(guān)于推進(jìn)農(nóng)業(yè)農(nóng)村大數(shù)據(jù)發(fā)展的實(shí)施意見》《農(nóng)業(yè)農(nóng)村大數(shù)據(jù)試點(diǎn)方案》等文件和政策,積極推動(dòng)大數(shù)據(jù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用。類似的,英國(guó)政府也出臺(tái)了《英國(guó)農(nóng)業(yè)技術(shù)戰(zhàn)略》,特別提到了大數(shù)據(jù)在推動(dòng)農(nóng)業(yè)領(lǐng)域創(chuàng)新中的重要作用[27],美國(guó)政府將包括農(nóng)業(yè)生產(chǎn)、糧食安全、農(nóng)村發(fā)展、自然資源等在內(nèi)的農(nóng)業(yè)數(shù)據(jù)公開,鼓勵(lì)企業(yè)與科研機(jī)構(gòu)進(jìn)行相關(guān)研究。
大數(shù)據(jù)可用于農(nóng)業(yè)生產(chǎn)的全過(guò)程中,國(guó)內(nèi)外學(xué)者圍繞氣象預(yù)報(bào)、水肥管理、作物育種、病蟲害預(yù)報(bào)、高效養(yǎng)殖等方面已經(jīng)開展了大量的研究,如Tesfaye等[28]利用地理大數(shù)據(jù)對(duì)非洲南部的干旱情況進(jìn)行分析,并對(duì)耐旱玉米品種在此環(huán)境下的表現(xiàn)進(jìn)行評(píng)估,結(jié)果表明,耐旱品種玉米在干旱環(huán)境下的產(chǎn)量?jī)?yōu)勢(shì)可能比一般品種高5%~40%;Bendre等[29]提出通過(guò)信息和通信技術(shù)服務(wù)來(lái)收集大量數(shù)據(jù),利用程序模型和分布式算法對(duì)天氣數(shù)據(jù)處理和預(yù)報(bào)應(yīng)用進(jìn)行了討論,以預(yù)警氣象災(zāi)害與病蟲害,提高農(nóng)作物產(chǎn)量,降低農(nóng)戶生產(chǎn)風(fēng)險(xiǎn);Mabalay等[30]基于遙感圖像與作物生長(zhǎng)狀況等數(shù)據(jù)開發(fā)了國(guó)家水稻系統(tǒng),以預(yù)估糧食產(chǎn)量,保障糧食安全,研究在菲律賓萊特地區(qū)進(jìn)行了系統(tǒng)模擬 ;Wolfert等[31]綜合過(guò)往研究,分析了大數(shù)據(jù)在智慧農(nóng)業(yè)中的驅(qū)動(dòng)力,將農(nóng)業(yè)生產(chǎn)中產(chǎn)生的大數(shù)據(jù)分為過(guò)程中介數(shù)據(jù)(PM)、機(jī)器生成數(shù)據(jù)(MG)和人為源數(shù)據(jù)(HS)三類,并討論了大數(shù)據(jù)的應(yīng)用過(guò)程。相關(guān)研究也在業(yè)界獲得了實(shí)際應(yīng)用,形成了一些大數(shù)據(jù)現(xiàn)代化農(nóng)業(yè)成果,如美國(guó)孟山都公司通過(guò)土壤傳感器收集田間數(shù)據(jù),結(jié)合種子數(shù)據(jù)庫(kù)、土壤數(shù)據(jù)庫(kù)和基因數(shù)據(jù)庫(kù)等多源數(shù)據(jù),建設(shè)了一體化農(nóng)田耕作系統(tǒng),通過(guò)手機(jī)農(nóng)業(yè)大數(shù)據(jù)軟件為農(nóng)戶提供農(nóng)業(yè)服務(wù)[32];美國(guó)Trimble公司開發(fā)了網(wǎng)絡(luò)農(nóng)場(chǎng)系統(tǒng),對(duì)精準(zhǔn)農(nóng)業(yè)數(shù)據(jù)進(jìn)行計(jì)算分析,可以進(jìn)行農(nóng)業(yè)自動(dòng)作業(yè)管理,為農(nóng)戶提供了全面的農(nóng)業(yè)解決方案[33]。
我國(guó)大數(shù)據(jù)農(nóng)業(yè)現(xiàn)代化研究起步晚于國(guó)外,也取得了一定成果。如杜克明[8]基于物聯(lián)網(wǎng),研究了小麥生產(chǎn)過(guò)程中的大數(shù)據(jù)獲取,為小麥生產(chǎn)管理與災(zāi)害防控提供了依據(jù);楊波等[34]運(yùn)用氣象大數(shù)據(jù)對(duì)山東省二代玉米螟的發(fā)生程度進(jìn)行預(yù)測(cè),建立了玉米螟動(dòng)態(tài)氣候預(yù)測(cè)模型;郭峰[35]利用大蒜產(chǎn)業(yè)大數(shù)據(jù),對(duì)大蒜價(jià)格波動(dòng)的主要影響因素進(jìn)行了分析,研究了大蒜價(jià)格變化趨勢(shì)的預(yù)測(cè)辦法,并構(gòu)建了大蒜價(jià)格可視化系統(tǒng);王東杰[36]利用多源大數(shù)據(jù)構(gòu)建了大數(shù)據(jù)支撐的糧食安全理性預(yù)期預(yù)警理論,開展了玉米供需預(yù)測(cè)模擬分析。在實(shí)踐領(lǐng)域,目前我國(guó)已經(jīng)形成了國(guó)家農(nóng)業(yè)數(shù)據(jù)中心、國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)共享中心、全國(guó)農(nóng)技推廣信息平臺(tái)等農(nóng)業(yè)大數(shù)據(jù)平臺(tái)[37],各省市也開展了相關(guān)實(shí)踐,如貴陽(yáng)市整合了農(nóng)業(yè)產(chǎn)業(yè)鏈資源,建成了貴陽(yáng)現(xiàn)代農(nóng)業(yè)大數(shù)據(jù)交易中心[38]。
總體而言,大數(shù)據(jù)已被應(yīng)用于農(nóng)業(yè)生產(chǎn)監(jiān)測(cè)與產(chǎn)量提升、農(nóng)產(chǎn)品市場(chǎng)趨勢(shì)預(yù)測(cè)等農(nóng)業(yè)生產(chǎn)、經(jīng)營(yíng)的各個(gè)環(huán)節(jié),其中農(nóng)業(yè)大數(shù)據(jù)的采集涉及農(nóng)田傳感器等大量新型農(nóng)業(yè)數(shù)字基礎(chǔ)設(shè)施的部署,隨著我們數(shù)字農(nóng)村戰(zhàn)略的推動(dòng),未來(lái)農(nóng)業(yè)相關(guān)大數(shù)據(jù)的來(lái)源類型與覆蓋率有可能不斷提升,也將為農(nóng)業(yè)大數(shù)據(jù)分析應(yīng)用提供更多支撐條件。
因大數(shù)據(jù)中包含大量的定位數(shù)據(jù),現(xiàn)有研究應(yīng)用大數(shù)據(jù)對(duì)農(nóng)村空間問(wèn)題進(jìn)行研究。農(nóng)村空間是生產(chǎn)、生態(tài)和生活空間的統(tǒng)一體,農(nóng)村聚落的空間結(jié)構(gòu)、空間演變特征和空間優(yōu)化等研究?jī)?nèi)容對(duì)于支撐農(nóng)村社會(huì)經(jīng)濟(jì)發(fā)展以及美麗鄉(xiāng)村建設(shè)有著重要意義。
國(guó)外學(xué)者借助手機(jī)信令數(shù)據(jù)等大數(shù)據(jù),結(jié)合復(fù)雜網(wǎng)絡(luò)理論,從不同角度對(duì)村鎮(zhèn)空間聯(lián)系進(jìn)行了分析,為鄉(xiāng)村規(guī)劃提供支撐,如Servillo等[39]基于通勤數(shù)據(jù)對(duì)意大利皮埃蒙特區(qū)37個(gè)微觀區(qū)域中心進(jìn)行研究,分析了不同等級(jí)中小村鎮(zhèn)聯(lián)系的網(wǎng)絡(luò)結(jié)構(gòu)。我國(guó)學(xué)者鈕心毅等[40]基于杭州桐廬縣和上海奉賢區(qū)的撤制鎮(zhèn)2個(gè)研究實(shí)例,分析了移動(dòng)定位大數(shù)據(jù)在鄉(xiāng)村空間研究中的2個(gè)使用場(chǎng)合,提出了移動(dòng)大數(shù)據(jù)在鄉(xiāng)村空間研究中存在時(shí)空分辨率與設(shè)備普及率2個(gè)技術(shù)阻礙。趙渺希等[9]以中山三鄉(xiāng)鎮(zhèn)為例,利用手機(jī)信令數(shù)據(jù)測(cè)算了村鎮(zhèn)聚落的多層級(jí)網(wǎng)絡(luò)聯(lián)系,結(jié)合自容性、群集性、網(wǎng)絡(luò)效率等指標(biāo)對(duì)村鎮(zhèn)聚落的網(wǎng)絡(luò)結(jié)構(gòu)特征進(jìn)行分析,結(jié)果表明,三鄉(xiāng)鎮(zhèn)呈現(xiàn)簇群式的空間聯(lián)系結(jié)構(gòu),具有自上而下的垂直聯(lián)系和多層級(jí)相互交織的復(fù)雜網(wǎng)絡(luò)特征。圖爾蓀阿依·如孜等[41]基于人口密度數(shù)據(jù)與夜間燈光數(shù)據(jù)對(duì)新疆鄉(xiāng)村聚落的空間變化與演變特征進(jìn)行研究,結(jié)果表明新疆南部、東部和北部地區(qū)鄉(xiāng)村聚落在空間分布、擴(kuò)張強(qiáng)度和空間演變程度等方面存在差異。周祥勝[42]將對(duì)廣東省四會(huì)市農(nóng)村空心化進(jìn)行了研究,利用居民月度用電數(shù)據(jù)在內(nèi)的多源數(shù)據(jù)建立了自然村空心化的分類判別方法,對(duì)自然村空心化進(jìn)行了綜合評(píng)價(jià)。
目前基于大數(shù)據(jù)的農(nóng)村問(wèn)題研究主要側(cè)重對(duì)農(nóng)村發(fā)展的現(xiàn)狀刻畫,特別是對(duì)農(nóng)村空間環(huán)境的評(píng)估,可以發(fā)現(xiàn)大量實(shí)際社會(huì)經(jīng)濟(jì)活動(dòng)驅(qū)動(dòng)下的農(nóng)村空間結(jié)構(gòu)與體系。未來(lái)研究可進(jìn)一步關(guān)注問(wèn)題與政策導(dǎo)向,在現(xiàn)狀描述的基礎(chǔ)上對(duì)農(nóng)村發(fā)展政策涉及的關(guān)鍵問(wèn)題展開研究,如農(nóng)村人居環(huán)境質(zhì)量的監(jiān)測(cè)等,為相關(guān)政策制定提供更加直接的支撐。
農(nóng)民是農(nóng)業(yè)生產(chǎn)與農(nóng)村生活的主要參與者,“三農(nóng)”問(wèn)題的核心是農(nóng)民問(wèn)題[43]。以人為本,尊重農(nóng)民意愿,真正了解農(nóng)民心中所想、所需,對(duì)于解決“三農(nóng)”問(wèn)題有重要意義。隨著信息技術(shù)與物聯(lián)網(wǎng)技術(shù)的發(fā)展,大數(shù)據(jù)分析成為精準(zhǔn)了解農(nóng)民需求的重要方式。
一方面,應(yīng)用大數(shù)據(jù)有助于精準(zhǔn)了解農(nóng)民時(shí)空行為。農(nóng)民時(shí)空活動(dòng)是農(nóng)村自然資源系統(tǒng)演變的重要驅(qū)動(dòng)力,也是農(nóng)村復(fù)雜社會(huì)經(jīng)濟(jì)問(wèn)題的體現(xiàn)。傳統(tǒng)農(nóng)民時(shí)空行為研究通常采用傳統(tǒng)調(diào)查方法獲取數(shù)據(jù),這種方式具有成本高、樣本少、存在主觀回憶或敘述偏差等缺陷。大數(shù)據(jù)技術(shù)的快速發(fā)展尤其是手機(jī)定位數(shù)據(jù)為研究農(nóng)民時(shí)空行為提供了新的數(shù)據(jù)來(lái)源。
大數(shù)據(jù)在市民時(shí)空行為領(lǐng)域已獲得了大量應(yīng)用,包括分析市民出行規(guī)律特征、得到其時(shí)空行為模式等,但在農(nóng)村地區(qū)的相關(guān)研究還方興未艾。Eagle等[44]根據(jù)手機(jī)定位數(shù)據(jù),將農(nóng)村與城市社會(huì)的活動(dòng)模式進(jìn)行了比較分析,研究發(fā)現(xiàn)農(nóng)村和城市社區(qū)在個(gè)人網(wǎng)絡(luò)拓?fù)浜托袨樘卣鞣矫娲嬖陲@著差異;Sanya和Mubangiz[45]運(yùn)用手機(jī)定位數(shù)據(jù)研究了人口在城鄉(xiāng)之間的流動(dòng)動(dòng)態(tài),并提出了層次人口流動(dòng)的概念,認(rèn)為該概念可用于空間人口流動(dòng)的可視化;Takahiro等[46]將農(nóng)民時(shí)空行為引入自然災(zāi)害研究,提出了一種基于手機(jī)定位數(shù)據(jù)與地理信息的農(nóng)村洪澇災(zāi)害探測(cè)的方法,通過(guò)檢測(cè)個(gè)體異常行為來(lái)實(shí)時(shí)推斷洪水位置,并利用日本農(nóng)村兩次嚴(yán)重洪災(zāi)的實(shí)際數(shù)據(jù)對(duì)該方法進(jìn)行評(píng)估,驗(yàn)證了該方法的可行性與準(zhǔn)確性。
國(guó)內(nèi)在市民時(shí)空行為領(lǐng)域的相關(guān)研究較少,高雪松等[10]利用手機(jī)信令數(shù)據(jù)研究了成都市農(nóng)村勞動(dòng)力的職住通勤狀況,實(shí)現(xiàn)了成都農(nóng)村勞動(dòng)力的職住聯(lián)系的可視化。結(jié)果表明,有接近7%的農(nóng)村勞動(dòng)力每個(gè)工作日通勤到市區(qū)。該研究首次精細(xì)化地展現(xiàn)了我國(guó)快速城市化時(shí)期農(nóng)村居民的就業(yè)格局與職住聯(lián)系。在此基礎(chǔ)上,高雪松等[47]進(jìn)一步研究了成都市農(nóng)村宅基地整理政策對(duì)農(nóng)民生活生產(chǎn)方式的影響。結(jié)果表明,宅基地整理增加了農(nóng)民的工作類出行距離,縮短了非工作類出行距離,提高了農(nóng)村居民的生活品質(zhì)。
另一方面,應(yīng)用大數(shù)據(jù)能精準(zhǔn)識(shí)別貧困人口助力農(nóng)村精準(zhǔn)扶貧,這是我國(guó)學(xué)術(shù)界一個(gè)熱點(diǎn)課題。Blumenstock等[48]基于手機(jī)使用數(shù)據(jù)對(duì)盧旺達(dá)人口的貧富狀況進(jìn)行了研究。聯(lián)合國(guó)與百度也在此領(lǐng)域形成了合作,建立了一個(gè)涵蓋互聯(lián)網(wǎng)條件、道路基礎(chǔ)設(shè)施在內(nèi)八個(gè)衡量標(biāo)準(zhǔn)的大數(shù)據(jù)分析網(wǎng)絡(luò),用以精準(zhǔn)識(shí)別貧困[49]。我國(guó)地方政府也進(jìn)行了大數(shù)據(jù)精準(zhǔn)扶貧的實(shí)踐,并取得了一定的成果,例如貴州省依據(jù)扶貧云平臺(tái)信息系統(tǒng),量化評(píng)價(jià)貧困戶信息,建立扶貧脫貧指標(biāo)體系,動(dòng)態(tài)掌握貧困人口狀況,實(shí)現(xiàn)了對(duì)貧困人口的精準(zhǔn)識(shí)別與監(jiān)控[50]。
可以看到,目前手機(jī)使用與信令定位數(shù)據(jù)作為反映個(gè)體行為的高覆蓋度數(shù)據(jù)是農(nóng)民問(wèn)題研究的一項(xiàng)主要大數(shù)據(jù)來(lái)源,所應(yīng)用的問(wèn)題領(lǐng)域主要包括農(nóng)民時(shí)空行為規(guī)律識(shí)別及其所反映的農(nóng)民貧富狀況與生活福祉。與對(duì)城市居民的類似研究相比,農(nóng)民問(wèn)題研究還較少采用社交媒體網(wǎng)站等互聯(lián)網(wǎng)使用數(shù)據(jù),而這類大數(shù)據(jù)可在客觀行為之外提供農(nóng)民主觀認(rèn)知信息,豐富農(nóng)民問(wèn)題分析維度,但如何從眾多網(wǎng)站用戶中識(shí)別農(nóng)民用戶、農(nóng)民群體對(duì)各類網(wǎng)站的使用存在何種偏好與差異是未來(lái)研究可進(jìn)一步探索的問(wèn)題。
雖然在大數(shù)據(jù)時(shí)代,與“三農(nóng)”問(wèn)題相關(guān)的數(shù)據(jù)在不斷增加,使“三農(nóng)”問(wèn)題研究的信息來(lái)源大為拓展,但與城市地區(qū)相比,農(nóng)村地區(qū)大數(shù)據(jù)無(wú)論在種類還是質(zhì)量方面都還存在一定差距。首先,在數(shù)據(jù)來(lái)源種類方面,由于城市政府的大量智慧城市建設(shè)投入、城市居民的高強(qiáng)度互聯(lián)網(wǎng)使用以及商業(yè)機(jī)構(gòu)數(shù)據(jù)采集對(duì)城市地區(qū)的側(cè)重等原因,目前各類大數(shù)據(jù)的可獲得性在城市與農(nóng)村之間仍存在明顯差異。例如,城市生活與經(jīng)濟(jì)運(yùn)行的大量信息都可以通過(guò)居民在互聯(lián)網(wǎng)上的瀏覽、購(gòu)物、評(píng)論等數(shù)據(jù)進(jìn)行探測(cè),而農(nóng)村居民的類似互聯(lián)網(wǎng)使用則相對(duì)較少;在人居環(huán)境方面,各類商業(yè)網(wǎng)站已積累了興趣點(diǎn)、街景等有關(guān)城市環(huán)境的大量精細(xì)數(shù)據(jù),而這些數(shù)據(jù)在農(nóng)村地區(qū)往往較為稀疏。同時(shí),與農(nóng)業(yè)生產(chǎn)經(jīng)營(yíng)相關(guān)的特色數(shù)據(jù)通常需要部署大量傳感設(shè)備,也導(dǎo)致相關(guān)數(shù)據(jù)目前主要以點(diǎn)狀覆蓋為主,尚難以在大范圍內(nèi)實(shí)現(xiàn)同等獲取。在數(shù)據(jù)質(zhì)量方面,農(nóng)村大數(shù)據(jù)也可能在數(shù)據(jù)精度、代表性等方面存在不足,如用途廣泛的手機(jī)信令定位數(shù)據(jù)在城市地區(qū)的精度一般能夠達(dá)到200~300 m,而在農(nóng)村地區(qū)由于基站分布較為稀疏,定位精度可能下降至1000 m甚至更低,為進(jìn)一步分析挖掘帶來(lái)了挑戰(zhàn)。但隨著“數(shù)字鄉(xiāng)村”等戰(zhàn)略的實(shí)施,預(yù)計(jì)上述城鄉(xiāng)之間的大數(shù)據(jù)資源差異將逐步縮小,各類新型數(shù)據(jù)將為“三農(nóng)”問(wèn)題研究帶來(lái)更多創(chuàng)新。
上述農(nóng)村大數(shù)據(jù)的數(shù)據(jù)條件限制對(duì)數(shù)據(jù)分析的方法設(shè)計(jì)提出了更多要求,以實(shí)現(xiàn)在有限數(shù)據(jù)條件下對(duì)研究對(duì)象的準(zhǔn)確刻畫。例如,如何通過(guò)在數(shù)據(jù)條件較好的片區(qū)采集的局部信息推求整個(gè)研究范圍內(nèi)的總體情況,這類問(wèn)題可能需要多種數(shù)據(jù)的聯(lián)合分析,如結(jié)合局部范圍、高粒度大數(shù)據(jù)與大范圍、粗粒度的傳統(tǒng)統(tǒng)計(jì)數(shù)據(jù),通過(guò)挖掘數(shù)據(jù)之間的映射關(guān)系實(shí)現(xiàn)局部信息到整體的擴(kuò)充。再如,某些研究問(wèn)題在城市地區(qū)可以通過(guò)多種大數(shù)據(jù)的綜合分析進(jìn)行識(shí)別,如綜合居民個(gè)體的信令軌跡、職住地點(diǎn)特征、其他訪問(wèn)地點(diǎn)特征對(duì)居民個(gè)體的社會(huì)經(jīng)濟(jì)屬性進(jìn)行識(shí)別,但在農(nóng)村地區(qū)可有效利用的大數(shù)據(jù)類型可能較為單一,這就需要借助更為豐富的研究方法實(shí)現(xiàn)分析目的,如Blumenstock等[48]使用特征工程方法從手機(jī)使用原始數(shù)據(jù)中構(gòu)造出上千個(gè)特征變量,在此基礎(chǔ)上構(gòu)建機(jī)器學(xué)習(xí)模型成功實(shí)現(xiàn)了僅依賴手機(jī)使用數(shù)據(jù)的用戶貧富水平識(shí)別。
大數(shù)據(jù)分析應(yīng)用并非單純追求方法創(chuàng)新,而是應(yīng)切實(shí)服務(wù)于“三農(nóng)”問(wèn)題治理與相關(guān)政策制定。從更抽象意義上可以認(rèn)為大數(shù)據(jù)分析是機(jī)器智能的一種形式,通過(guò)計(jì)算機(jī)的強(qiáng)大計(jì)算能力從大規(guī)模數(shù)據(jù)中挖掘人類所不能直接觀察到的現(xiàn)象與規(guī)律,而在“三農(nóng)”問(wèn)題治理方面,相關(guān)技術(shù)人員與政府管理人員也在長(zhǎng)期的實(shí)踐工作中形成大量經(jīng)驗(yàn)積累,如何將機(jī)器智能與人類經(jīng)驗(yàn)有效整合是大數(shù)據(jù)應(yīng)用于“三農(nóng)”問(wèn)題研究所要關(guān)注的深層問(wèn)題,包括算法設(shè)計(jì)中的經(jīng)驗(yàn)嵌入、決策過(guò)程中的人機(jī)交互等。對(duì)這一問(wèn)題的探索無(wú)法局限于技術(shù)研究領(lǐng)域,而是需要通過(guò)技術(shù)研究與“三農(nóng)”問(wèn)題治理實(shí)踐的循環(huán)互動(dòng),在應(yīng)用實(shí)踐中探索大數(shù)據(jù)分析的邊界與局限以及與傳統(tǒng)經(jīng)驗(yàn)的整合途徑。
由前文1、2節(jié)可以看到,雖然與城市問(wèn)題研究相比大數(shù)據(jù)在農(nóng)村區(qū)域問(wèn)題研究方面的應(yīng)用還相對(duì)較少,但國(guó)內(nèi)外學(xué)者也已陸續(xù)針對(duì)一些相關(guān)課題展開探索。在我國(guó)農(nóng)村數(shù)字基礎(chǔ)設(shè)施水平不斷提高且“三農(nóng)”問(wèn)題在國(guó)家發(fā)展中始終占據(jù)重要地位的背景下,利用多樣、精細(xì)的新型數(shù)據(jù)對(duì)各類“三農(nóng)”問(wèn)題展開深入研究具有豐富前景與重要社會(huì)經(jīng)濟(jì)意義,下文將嘗試就其中可能的研究方向進(jìn)行探討。
由2.1節(jié)可以看到,國(guó)內(nèi)外學(xué)者已針對(duì)大數(shù)據(jù)應(yīng)用于農(nóng)業(yè)增產(chǎn)展開了若干新技術(shù)探索。與此同時(shí),近年來(lái)隨著城市化的發(fā)展與互聯(lián)網(wǎng)等技術(shù)的傳播,在傳統(tǒng)農(nóng)業(yè)之外我國(guó)農(nóng)村也出現(xiàn)了多種新型業(yè)態(tài),包括“互聯(lián)網(wǎng)+”模式影響下出現(xiàn)的農(nóng)村電子商務(wù),傳統(tǒng)農(nóng)業(yè)與服務(wù)業(yè)相結(jié)合出現(xiàn)的觀光農(nóng)業(yè)、體驗(yàn)農(nóng)業(yè)、休閑農(nóng)業(yè)[51]、共享農(nóng)業(yè)等新式農(nóng)業(yè),以及農(nóng)村土地流轉(zhuǎn)后形成的農(nóng)業(yè)合作社等。這些新型業(yè)態(tài)的出現(xiàn)有利于促進(jìn)農(nóng)村發(fā)展、提高農(nóng)民收入,但其發(fā)展?fàn)顩r、發(fā)展機(jī)制、對(duì)農(nóng)業(yè)生產(chǎn)與農(nóng)村社會(huì)經(jīng)濟(jì)的綜合影響等問(wèn)題還有待深入研究。
由于許多新型業(yè)態(tài)的運(yùn)營(yíng)本身就以互聯(lián)網(wǎng)為重要平臺(tái),因此相關(guān)互聯(lián)網(wǎng)大數(shù)據(jù)也是對(duì)這類業(yè)態(tài)展開研究的直接信息來(lái)源,如電子商務(wù)平臺(tái)的價(jià)格、銷量、評(píng)價(jià)等數(shù)據(jù)直觀的反映了農(nóng)村電子商務(wù)的發(fā)展情況,新式農(nóng)業(yè)作為一類休閑旅游活動(dòng)往往也可通過(guò)旅游、點(diǎn)評(píng)類網(wǎng)站獲得其經(jīng)營(yíng)情況及消費(fèi)者評(píng)價(jià)相關(guān)信息,此外還可利用廣泛反映人群行為的手機(jī)軌跡數(shù)據(jù)對(duì)農(nóng)村新型業(yè)態(tài)的經(jīng)營(yíng)者與消費(fèi)者行為進(jìn)行分析。
科學(xué)合理的空間規(guī)劃是農(nóng)村社會(huì)經(jīng)濟(jì)發(fā)展的重要要素,近年來(lái)新農(nóng)村建設(shè)、土地整理等空間規(guī)劃工作在我國(guó)農(nóng)村大規(guī)模開展,急需開展相關(guān)研究為農(nóng)村生產(chǎn)、生活、生態(tài)空間規(guī)劃提供支撐。而現(xiàn)有研究往往主要以地形地貌、土地利用等數(shù)據(jù)為分析依據(jù)[52-53],以物質(zhì)環(huán)境評(píng)估為主,缺乏對(duì)當(dāng)前農(nóng)村物質(zhì)空間與社會(huì)經(jīng)濟(jì)活動(dòng)互動(dòng)關(guān)系的深入解析。針對(duì)這一問(wèn)題,上文提到的各類新型數(shù)據(jù)應(yīng)用于農(nóng)村產(chǎn)業(yè)與農(nóng)民生活的相關(guān)研究路徑均可進(jìn)一步延伸至農(nóng)村“三生”空間規(guī)劃研究,如基于手機(jī)軌跡數(shù)據(jù)對(duì)不同空間格局村莊的農(nóng)民生產(chǎn)、生活行為與便利度等評(píng)價(jià)指標(biāo)進(jìn)行比較研究,從而總結(jié)符合當(dāng)代農(nóng)民生產(chǎn)、生活需求的農(nóng)村空間布局模式。
此外,新型數(shù)據(jù)也可提供較傳統(tǒng)數(shù)據(jù)更為精細(xì)的農(nóng)村空間環(huán)境信息,雖然興趣點(diǎn)、街景圖像等目前已在城市空間環(huán)境研究中得到大量運(yùn)用的數(shù)據(jù)在我國(guó)農(nóng)村地區(qū)的覆蓋率還較低,但仍存在部分可適當(dāng)利用的數(shù)據(jù)類型。如航拍、遙感圖片往往覆蓋范圍較廣,通過(guò)與計(jì)算機(jī)視覺技術(shù)相結(jié)合可提取農(nóng)村房屋狀況、道路狀況等精細(xì)信息,為空心村等農(nóng)村建設(shè)問(wèn)題研究與改造規(guī)劃提供精準(zhǔn)依據(jù);各類平臺(tái)中的農(nóng)村環(huán)境圖像也可采用計(jì)算機(jī)視覺技術(shù)識(shí)別提取地域風(fēng)貌特征[54],為制定具有地域特色的農(nóng)村空間規(guī)劃與設(shè)計(jì)提供支撐。
在我國(guó)快速城市化背景下,農(nóng)民生活模式也在不斷變遷,對(duì)當(dāng)代農(nóng)民生活狀況的準(zhǔn)確認(rèn)知是各類農(nóng)村政策有效制定的重要基礎(chǔ)。有關(guān)農(nóng)民生活狀況的傳統(tǒng)信息來(lái)源主要為問(wèn)卷調(diào)查、訪談等,此類方法面臨著成本高、樣本少、樣本代表性有限等方面的挑戰(zhàn),而前文第2節(jié)中提到的手機(jī)定位、互聯(lián)網(wǎng)使用等大數(shù)據(jù)為識(shí)別、分析當(dāng)前我國(guó)農(nóng)民日?;顒?dòng)與心理感受提供了有力的信息來(lái)源,筆者基于手機(jī)軌跡數(shù)據(jù)對(duì)成都農(nóng)民職住格局與日?;顒?dòng)模式的研究即是對(duì)這一研究方向的一項(xiàng)探索。未來(lái)研究可進(jìn)一步探索采用更多類型的新型數(shù)據(jù)對(duì)當(dāng)前我國(guó)農(nóng)民生活狀況進(jìn)行更為全面的刻畫與分析,如采用空間精度更高的手機(jī)GPS定位數(shù)據(jù)可以更精準(zhǔn)地識(shí)別農(nóng)民活動(dòng)地點(diǎn)與活動(dòng)內(nèi)容,進(jìn)而對(duì)農(nóng)民生活方式、生活便利度以及更深入的農(nóng)村貧困、老齡化等社會(huì)經(jīng)濟(jì)問(wèn)題進(jìn)行解析;采集農(nóng)民群體的社交媒體數(shù)據(jù),包括內(nèi)容發(fā)布、瀏覽、評(píng)論等,可以對(duì)農(nóng)民的生活滿意度、幸福感等主觀感受進(jìn)行評(píng)估,從而主客觀相結(jié)合對(duì)當(dāng)前我國(guó)農(nóng)民的生活狀況進(jìn)行分析。