顧戈琦, 李 瑾
(北京農(nóng)業(yè)信息技術(shù)研究中心/國家農(nóng)業(yè)信息化工程技術(shù)研究中心/農(nóng)業(yè)部農(nóng)業(yè)信息技術(shù)重點(diǎn)實(shí)驗(yàn)室/北京市農(nóng)業(yè)物聯(lián)網(wǎng)工程技術(shù)研究中心,北京 100097)
眾包即為打破原有體制限制,將原來須由系統(tǒng)內(nèi)部工作人員將完整的任務(wù)置于開放平臺(tái)上,使非特定的社會(huì)大眾可以根據(jù)自己的能力選擇適合自己的采集任務(wù),而不須成為發(fā)布任務(wù)的單位中的一員[1-2]。現(xiàn)階段,采集農(nóng)業(yè)大數(shù)據(jù)多依托特定的政府部門、企事業(yè)單位建立有獨(dú)立的數(shù)據(jù)采集團(tuán)隊(duì)進(jìn)行特定農(nóng)業(yè)數(shù)據(jù)的采集,采集到的數(shù)據(jù)部分進(jìn)行公開分享,部分留于系統(tǒng)內(nèi)部使用,這種采集方式具有采集成本高、采集隊(duì)伍管理難度大等問題。眾包農(nóng)業(yè)大數(shù)據(jù)采集平臺(tái)能打破不同單位間體系,將原來以特定體系為核心的任務(wù)完成方式轉(zhuǎn)化成以特定任務(wù)為核心的網(wǎng)絡(luò)化社會(huì)生產(chǎn),只要具備數(shù)據(jù)采集能力的社會(huì)大眾都可以參與農(nóng)業(yè)大數(shù)據(jù)采集工作中,有效地?cái)U(kuò)充了數(shù)據(jù)采集隊(duì)伍,擴(kuò)大了數(shù)據(jù)采集覆蓋范圍[2-3],同時(shí),應(yīng)用先進(jìn)的大數(shù)據(jù)技術(shù),能有效減少在采集眾包數(shù)據(jù)中產(chǎn)生的誤差,在保證數(shù)據(jù)采集質(zhì)量的前提下,降低采集成本、擴(kuò)大采集范圍。
眾包別稱網(wǎng)絡(luò)化社會(huì)生產(chǎn),是指把過去由員工執(zhí)行的工作任務(wù),以自由、自愿的形式外包給非特定大眾網(wǎng)絡(luò)的做法,具有生產(chǎn)成本低、聯(lián)動(dòng)潛在生產(chǎn)資源、生產(chǎn)效率高以及滿足用戶個(gè)性化需求等優(yōu)勢(shì)[4-7]。眾包具有組織開放性,眾包發(fā)布者將公開發(fā)布需求,參與者不受組織邊界的限制,無論是否屬于發(fā)布者的組織,都可以參與解決眾包問題,組織可以借助外部資源解決內(nèi)部問題;眾包具有地域分散性,眾包發(fā)布者與參與者不受地理位置的限制,均可以通過信息技術(shù)手段溝通、討論、解決問題,具有明顯的個(gè)體分布特點(diǎn)[8];眾包具有參與自主性,參與者根據(jù)自己的能力自主選擇合適的眾包需求,用“由下至上”的需求匹配模式代替“由上至下”的任務(wù)布置模式,大幅度提高了團(tuán)隊(duì)能力和任務(wù)需求的匹配程度。
最早于1980年由著名未來學(xué)家阿爾文·托夫勒提出大數(shù)據(jù)的概念[9-10],直到2008年以后,大數(shù)據(jù)的概念才逐步被認(rèn)可,并被政府、企業(yè)以及學(xué)術(shù)界所廣泛傳播[11]。大數(shù)據(jù)有5個(gè)主要技術(shù)特點(diǎn),可總結(jié)為5V特征:(1)大體量(volume),即可從數(shù)百太字節(jié)(terabyte,簡稱TB)到數(shù)十?dāng)?shù)百拍字節(jié)(petabytes,簡稱PB)、甚至艾字節(jié)(exabytes,簡稱EB)的規(guī)模;(2)多樣性(variety),即大數(shù)據(jù)包括各種格式和形態(tài)的數(shù)據(jù);(3)時(shí)效性(velocity),即很多大數(shù)據(jù)需要在一定的時(shí)間限度下得到及時(shí)處理;(4)準(zhǔn)確性(veracity),即處理結(jié)果要保證一定的準(zhǔn)確性;(5)大價(jià)值(value),即大數(shù)據(jù)包含很多深度的價(jià)值,大數(shù)據(jù)分析挖掘和利用將帶來巨大的商業(yè)價(jià)值[12-13]。農(nóng)業(yè)大數(shù)據(jù)是指大數(shù)據(jù)技術(shù)、理念、思維在農(nóng)業(yè)領(lǐng)域的應(yīng)用,利用智慧化、智能化、網(wǎng)絡(luò)化的現(xiàn)代信息技術(shù),為農(nóng)業(yè)生產(chǎn)、流通、消費(fèi)過程服務(wù)[9,14]。農(nóng)業(yè)大數(shù)據(jù)首先要解決的問題就是數(shù)據(jù)采集,只有采集到海量、多樣、及時(shí)、準(zhǔn)確的數(shù)據(jù),農(nóng)業(yè)大數(shù)據(jù)才能發(fā)掘出數(shù)據(jù)中的價(jià)值,更好地為農(nóng)村農(nóng)業(yè)發(fā)展、農(nóng)業(yè)經(jīng)濟(jì)轉(zhuǎn)型升級(jí)服務(wù)[15]。
2.1.1農(nóng)戶農(nóng)戶受限于自身技術(shù)水平,應(yīng)用數(shù)據(jù)指導(dǎo)生產(chǎn)的能力較弱,但因其具有人數(shù)眾多、時(shí)間相對(duì)充裕、生產(chǎn)經(jīng)驗(yàn)較為豐富、收入偏低等特點(diǎn),在眾包農(nóng)業(yè)大數(shù)據(jù)采集中可以作為廣泛的數(shù)據(jù)采集源。農(nóng)戶利用閑散時(shí)間上傳相關(guān)數(shù)據(jù)信息,并結(jié)合其豐富的生產(chǎn)經(jīng)驗(yàn),對(duì)數(shù)據(jù)的準(zhǔn)確定期進(jìn)行人工審查,同時(shí),由于其收入偏低,數(shù)據(jù)采集費(fèi)用也相對(duì)較低。
2.1.2合作社農(nóng)業(yè)合作社具有一定的規(guī)模及資金實(shí)力和技術(shù)能力,每天都會(huì)產(chǎn)生大量生產(chǎn)、銷售數(shù)據(jù),如對(duì)這些數(shù)據(jù)進(jìn)行匯總分析可產(chǎn)生巨大的價(jià)值。同時(shí),合作社具有初步應(yīng)用數(shù)據(jù)能力但大多沒有專業(yè)的數(shù)據(jù)分析人員,無法針對(duì)數(shù)據(jù)進(jìn)行深入分析進(jìn)而指導(dǎo)生產(chǎn),但可以通過數(shù)據(jù)共享交換數(shù)據(jù)服務(wù)的方式,使合作社參與到眾包農(nóng)業(yè)大數(shù)據(jù)采集中。
2.1.3農(nóng)業(yè)企業(yè)農(nóng)業(yè)企業(yè)是指圍繞農(nóng)業(yè)生產(chǎn)、流通、消費(fèi)各環(huán)節(jié)提供增值服務(wù)的企業(yè),其生產(chǎn)經(jīng)營具有較強(qiáng)的專業(yè)性。企業(yè)內(nèi)部大多建有信息管理系統(tǒng),具有一定的數(shù)據(jù)意識(shí)和數(shù)據(jù)分析能力,數(shù)據(jù)對(duì)于企業(yè)生產(chǎn)經(jīng)營效率提升較為顯著,故其使用數(shù)據(jù)的意愿較為強(qiáng)烈。在眾包農(nóng)業(yè)大數(shù)據(jù)采集中,一方面可以將企業(yè)信息系統(tǒng)中的數(shù)據(jù)進(jìn)行脫敏采集,交換對(duì)應(yīng)的數(shù)據(jù),另一方面可以讓企業(yè)支付一定的費(fèi)用,獲取其需要的目標(biāo)數(shù)據(jù)。
2.2.1多源采集機(jī)制平臺(tái)集合農(nóng)業(yè)合作社、農(nóng)業(yè)企業(yè)、個(gè)體農(nóng)戶等多種采集主體,通過傳感器直采、信息系統(tǒng)接入、農(nóng)戶手機(jī)上報(bào)等多種采集方式,采集生產(chǎn)環(huán)境、生命信息、農(nóng)田變量信息、農(nóng)產(chǎn)品市場經(jīng)濟(jì)等多種類型的數(shù)據(jù),廣泛采集農(nóng)業(yè)相關(guān)數(shù)據(jù),實(shí)現(xiàn)多來源、多類型數(shù)據(jù)的全覆蓋。
2.2.2多重校驗(yàn)機(jī)制平臺(tái)采用多重校驗(yàn)機(jī)制,不同質(zhì)量級(jí)別的數(shù)據(jù)源對(duì)應(yīng)不同的數(shù)據(jù)檢驗(yàn)方法,評(píng)級(jí)低的數(shù)據(jù)源須進(jìn)行多次、多種校驗(yàn)。不同來源的數(shù)據(jù)通過智能算法進(jìn)行交叉校驗(yàn),對(duì)于部分質(zhì)量不達(dá)標(biāo)的數(shù)據(jù)會(huì)進(jìn)行二次人工審核。在使用數(shù)據(jù)的過程中,用戶也可以對(duì)數(shù)據(jù)進(jìn)行審查,如有誤,可提交糾錯(cuò),實(shí)現(xiàn)多層次、多方法的數(shù)據(jù)校驗(yàn)。
2.2.3用戶激勵(lì)機(jī)制平臺(tái)可根據(jù)用戶采集數(shù)據(jù)的數(shù)量、質(zhì)量、時(shí)效性等特征,將用戶采集的數(shù)據(jù)統(tǒng)一轉(zhuǎn)化成數(shù)據(jù)分,用戶可以使用自己的數(shù)據(jù)分交換平臺(tái)上的原始數(shù)據(jù)、數(shù)據(jù)分析報(bào)告等數(shù)據(jù)服務(wù)或者直接交換現(xiàn)金,使不同的數(shù)據(jù)采集用戶都可以在平臺(tái)上獲取有效激勵(lì)。
眾包農(nóng)業(yè)大數(shù)據(jù)采集平臺(tái)利用眾包的思想,轉(zhuǎn)變數(shù)據(jù)采集工作思路與采集人員隊(duì)伍建設(shè),將傳統(tǒng)的獨(dú)立成體系的數(shù)據(jù)采集隊(duì)伍打散,將普通社會(huì)大眾納入到農(nóng)業(yè)大數(shù)據(jù)采集隊(duì)伍中,每一個(gè)普通社會(huì)大眾利用閑散時(shí)間就可自主參與農(nóng)業(yè)大數(shù)據(jù)采集工作,平臺(tái)利用大數(shù)據(jù)技術(shù)進(jìn)行交叉校驗(yàn)、結(jié)合人工數(shù)據(jù)檢驗(yàn),可以有效保證數(shù)據(jù)質(zhì)量,數(shù)據(jù)需求方也可根據(jù)自身需求發(fā)布數(shù)據(jù)采集任務(wù),減少自建數(shù)據(jù)采集隊(duì)伍的成本。這樣既可以擴(kuò)大數(shù)據(jù)采集范圍,又可以降低數(shù)據(jù)采集成本,能有效地提高農(nóng)業(yè)大數(shù)據(jù)采集效率。
政府機(jī)關(guān)、科研單位、農(nóng)業(yè)企業(yè)及部分農(nóng)業(yè)合作社多已建有管理信息系統(tǒng),這些信息系統(tǒng)覆蓋氣象、農(nóng)產(chǎn)品市場價(jià)格、生產(chǎn)環(huán)境、土肥配方等領(lǐng)域,包含從政府宏觀層面到企業(yè)微觀層面的信息,但由于功能設(shè)計(jì)、應(yīng)用技術(shù)、數(shù)據(jù)結(jié)構(gòu)等原因,系統(tǒng)與系統(tǒng)之間的數(shù)據(jù)相互孤立,平臺(tái)通過建立通用開放接口,連通多種類型信息系統(tǒng)接入數(shù)據(jù),數(shù)據(jù)源可根據(jù)接入數(shù)據(jù)的質(zhì)量與數(shù)量獲取相應(yīng)的金錢收入或交換對(duì)應(yīng)的數(shù)據(jù)服務(wù)。
無線射頻識(shí)別(radio frequency identification,簡稱RFID)技術(shù)、空氣溫濕度傳感器、土壤溫濕度傳感器等物聯(lián)網(wǎng)設(shè)施在農(nóng)業(yè)領(lǐng)域應(yīng)用逐漸深入,采集到海量生產(chǎn)環(huán)境、物流、產(chǎn)品溯源等信息,平臺(tái)建有物聯(lián)網(wǎng)數(shù)據(jù)采集模塊直接接入物聯(lián)網(wǎng)信息采集硬件設(shè)備,直接讀取硬件設(shè)備采集的多種信息,減少信息采集中間環(huán)節(jié),減少物聯(lián)網(wǎng)設(shè)施安裝、軟件系統(tǒng)構(gòu)建成本。同時(shí),數(shù)據(jù)源可根據(jù)接入數(shù)據(jù)的質(zhì)量與數(shù)量獲取相應(yīng)的金錢收入或交換對(duì)應(yīng)的數(shù)據(jù)服務(wù)。
在農(nóng)業(yè)生產(chǎn)各個(gè)環(huán)節(jié)中,很多數(shù)據(jù)的采集還須依賴人工進(jìn)行,現(xiàn)階段采集手段多為人工記錄,然后統(tǒng)一上傳到特定的信息系統(tǒng)中,部分地區(qū)還使用原始的人工紙筆記錄,逐級(jí)上報(bào)的信息采集手段,平臺(tái)建有移動(dòng)信息采集端,可以安裝到信息采集人員的手機(jī)上,也可以適配移動(dòng)掃碼槍、移動(dòng)電子秤等移動(dòng)信息采集端,及時(shí)、完整地將采集到的信息匯集到平臺(tái)中,減少時(shí)間延誤和上報(bào)過程中的誤差。人工直采信息員可以是企業(yè)、政府等有組織的信息員,也可以是普通個(gè)人用戶,可以在私人手機(jī)上安裝信息采集端上傳數(shù)據(jù),根據(jù)接入數(shù)據(jù)的質(zhì)量與數(shù)量獲取相應(yīng)的金錢收入或交換對(duì)應(yīng)的數(shù)據(jù)服務(wù)。
互聯(lián)網(wǎng)包含海量數(shù)據(jù),很多與農(nóng)業(yè)直接相關(guān)的數(shù)據(jù),如農(nóng)產(chǎn)品價(jià)格、農(nóng)產(chǎn)品供需、氣象、政策法規(guī)等數(shù)據(jù),還有很多與農(nóng)業(yè)間接相關(guān)數(shù)據(jù),例如宏觀經(jīng)濟(jì)、市民生活、交通物流等數(shù)據(jù),在大數(shù)據(jù)技術(shù)支持下,間接數(shù)據(jù)可以作為直接數(shù)據(jù)應(yīng)用的有力補(bǔ)充,提高數(shù)據(jù)應(yīng)用效果。平臺(tái)建有互聯(lián)網(wǎng)數(shù)據(jù)爬蟲,廣泛采集互聯(lián)網(wǎng)農(nóng)業(yè)直接相關(guān)和間接相關(guān)的各類數(shù)據(jù),構(gòu)建農(nóng)業(yè)綜合數(shù)據(jù)庫。
根據(jù)數(shù)據(jù)源的獲取方式、接入渠道,對(duì)數(shù)據(jù)源進(jìn)行分級(jí),如是物聯(lián)網(wǎng)設(shè)施直采數(shù)據(jù),政府、科研單位、知名企業(yè)、大型農(nóng)場信息系統(tǒng)接入數(shù)據(jù)以及有組織的人工直采數(shù)據(jù),評(píng)級(jí)較高,進(jìn)行簡單清洗統(tǒng)一結(jié)構(gòu)即可接入平臺(tái);網(wǎng)絡(luò)抓取數(shù)據(jù)、零散的人工上報(bào)數(shù)據(jù)、小型信息化水平較低單位的信息系統(tǒng)接入數(shù)據(jù),則評(píng)級(jí)較低,須進(jìn)行數(shù)據(jù)清洗校驗(yàn)接入平臺(tái),同時(shí)保留原始數(shù)據(jù)供用戶深入分析。高級(jí)別的數(shù)據(jù)可以減少數(shù)據(jù)清洗校驗(yàn)的環(huán)節(jié),提高數(shù)據(jù)采集的時(shí)效性,同時(shí),用戶也可以參考評(píng)級(jí)分類,選擇適合自己的數(shù)據(jù)。
數(shù)據(jù)具有隱私性,部分隱私程度高的數(shù)據(jù)只能供給特定用戶使用,例如部分政府?dāng)?shù)據(jù)只能供給特定的研究機(jī)構(gòu)使用,部分企業(yè)數(shù)據(jù)也無法做到完全公開。平臺(tái)提供數(shù)據(jù)隱私評(píng)級(jí)功能,數(shù)據(jù)提供方可以在接入平臺(tái)的時(shí)候,選擇自己的數(shù)據(jù)隱私評(píng)級(jí),保護(hù)自己的數(shù)據(jù)權(quán)益,這樣才能讓更多的數(shù)據(jù)源接入采集平臺(tái)。
將數(shù)據(jù)采集到大數(shù)據(jù)平臺(tái)之后須進(jìn)行簡單的清洗,首先剔除格式錯(cuò)誤、亂碼數(shù)據(jù)等形式錯(cuò)誤,然后針對(duì)異源同類數(shù)據(jù)進(jìn)行校驗(yàn),如來源不同的同類數(shù)據(jù)出現(xiàn)不同,則標(biāo)注數(shù)據(jù)存入異常數(shù)據(jù)庫中,再將異源同類數(shù)據(jù)進(jìn)行合并匯總,減少數(shù)據(jù)重復(fù)。
受限于現(xiàn)階段的數(shù)據(jù)清洗技術(shù)單純的計(jì)算機(jī)無法高效準(zhǔn)確地清洗所有數(shù)據(jù),平臺(tái)同時(shí)開放人工數(shù)據(jù)審核功能,用戶可以根據(jù)自己的特點(diǎn)申請(qǐng)分級(jí)審核資格,在獲取分級(jí)審核資格之后,針對(duì)目標(biāo)數(shù)據(jù)進(jìn)行人工審核,可根據(jù)審核工作量、審核挑出的錯(cuò)誤數(shù),獲取相應(yīng)收入。
雖然大數(shù)據(jù)采集平臺(tái)廣泛采集各類農(nóng)業(yè)數(shù)據(jù),但部分?jǐn)?shù)據(jù)無法滿足需求,用戶可以根據(jù)自己的數(shù)據(jù)需求進(jìn)行訂單化數(shù)據(jù)懸賞,鼓勵(lì)其他數(shù)據(jù)源分享數(shù)據(jù),鼓勵(lì)個(gè)人用戶積極參與數(shù)據(jù)采集工作,既可省去自建數(shù)據(jù)采集隊(duì)伍的高昂成本,也可獲取急需的重要數(shù)據(jù)。
3.10數(shù)據(jù)交易功能
數(shù)據(jù)擁有方可以將自有數(shù)據(jù)放在大數(shù)據(jù)采集平臺(tái)上進(jìn)行交易。
現(xiàn)有的數(shù)據(jù)采集體系大多為政府、科研單位、企業(yè)等為自身目標(biāo)建立的完整的數(shù)據(jù)采集系統(tǒng),數(shù)據(jù)采集人員多為該單位雇傭人員,同時(shí),由于體系限制,特定系統(tǒng)工作人員只能采集該系統(tǒng)所需數(shù)據(jù),大多數(shù)數(shù)據(jù)采集人員的工作量遠(yuǎn)沒有達(dá)到飽和狀態(tài),導(dǎo)致了數(shù)據(jù)采集隊(duì)伍重疊,數(shù)據(jù)采集能力浪費(fèi)等問題。基于眾包的原理,眾包農(nóng)業(yè)大數(shù)據(jù)采集平臺(tái)打破原有建立的完整數(shù)據(jù)采集隊(duì)伍進(jìn)行數(shù)據(jù)采集的模式,匯集社會(huì)各界力量,使每個(gè)具有數(shù)據(jù)采集能力的人都可以參與到數(shù)據(jù)采集工作中,以數(shù)據(jù)采集目標(biāo)為核心進(jìn)行數(shù)據(jù)采集工作。
現(xiàn)有數(shù)據(jù)多分散地存儲(chǔ)于不同的信息系統(tǒng)、數(shù)據(jù)庫中,由于部門限制、商業(yè)利益等原因不能完整有效的公開,在原始數(shù)據(jù)的基礎(chǔ)上部分公開數(shù)據(jù)進(jìn)行了數(shù)據(jù)整合,處理之后的數(shù)據(jù),很多寶貴的細(xì)節(jié)信息會(huì)丟失,導(dǎo)致深入分析的價(jià)值大幅降低。通過開放信息系統(tǒng)接口的方式,眾包農(nóng)業(yè)大數(shù)據(jù)采集平臺(tái)使現(xiàn)存于各個(gè)信息系統(tǒng)、數(shù)據(jù)庫的數(shù)據(jù)能夠便捷、廣泛地匯集到平臺(tái)中,通過物聯(lián)網(wǎng)設(shè)備直采、人工采集數(shù)據(jù)直采功能,快速、高效地將原始數(shù)據(jù)采集到平臺(tái)中,保留豐富的原始數(shù)據(jù)細(xì)節(jié)。
現(xiàn)有數(shù)據(jù)采集平臺(tái)無法根據(jù)數(shù)據(jù)的隱私程度進(jìn)行數(shù)據(jù)隱私分類,但許多政府、企業(yè)單位的數(shù)據(jù)由于數(shù)據(jù)隱私性、數(shù)據(jù)敏感性等多種原因無法對(duì)全部使用者開放,由于無法控制數(shù)據(jù)傳播和使用范圍,這些單位選擇了完全不開放數(shù)據(jù)。平臺(tái)提供數(shù)據(jù)隱私評(píng)級(jí)功能,允許數(shù)據(jù)發(fā)布者選擇數(shù)據(jù)分享隱私級(jí)別,使用戶可以選擇數(shù)據(jù)分享的受眾范圍,使部分具有機(jī)密性的數(shù)據(jù)只能被部分用戶訪問、使用,最大限度的保護(hù)數(shù)據(jù)源的隱私,使更多的政府、企業(yè)愿意將自己的數(shù)據(jù)在平臺(tái)上分享。同時(shí),通過數(shù)據(jù)源分級(jí)的機(jī)制,用戶可以自行甄別數(shù)據(jù)源的質(zhì)量,信息分析能力強(qiáng)的用戶可以選擇原始數(shù)據(jù)進(jìn)行深度分析,使信息分析能力弱的用戶可以選擇經(jīng)過初步處理的數(shù)據(jù)應(yīng)用,以滿足不同人群的需求。
平臺(tái)在采集端進(jìn)行廣泛的數(shù)據(jù)接入,不僅可以接入現(xiàn)有數(shù)據(jù)庫、信息系統(tǒng)中進(jìn)行初步加工的數(shù)據(jù),還可以直接接入物聯(lián)網(wǎng)設(shè)施、人工直接采集的數(shù)據(jù),這些數(shù)據(jù)不僅存在數(shù)據(jù)結(jié)構(gòu)不同、采集誤差、傳輸誤差等系統(tǒng)問題,還由于眾包數(shù)據(jù)采集隊(duì)伍構(gòu)成人員復(fù)雜、數(shù)據(jù)采集水平高低等導(dǎo)致的采集專業(yè)性、采集連續(xù)性等人員問題。平臺(tái)通過數(shù)據(jù)挖據(jù)、人工智能等技術(shù)進(jìn)行數(shù)據(jù)交叉驗(yàn)證、補(bǔ)全,可以有效減少單一數(shù)據(jù)采集系統(tǒng)存在的系統(tǒng)性錯(cuò)誤,剔除異源同類型數(shù)據(jù)中存在的錯(cuò)誤,可以減少眾包采集人員采集到的數(shù)據(jù)誤差。
平臺(tái)不僅通過數(shù)據(jù)挖掘、人工智能等計(jì)算機(jī)技術(shù)進(jìn)行自動(dòng)化交叉驗(yàn)證,還開放了人工數(shù)據(jù)驗(yàn)證功能,具有一定數(shù)據(jù)識(shí)別能力的人可以在平臺(tái)上申請(qǐng)人工數(shù)據(jù)校驗(yàn)資格,具有數(shù)據(jù)校驗(yàn)資格后,利用空閑時(shí)間進(jìn)行數(shù)據(jù)人工查錯(cuò),如果找到錯(cuò)誤數(shù)據(jù)并進(jìn)行有效更正,即可獲得查錯(cuò)獎(jiǎng)勵(lì),這樣在數(shù)據(jù)校驗(yàn)層面上也利用眾包的思想?yún)R集社會(huì)各界力量,用人工的方式進(jìn)行數(shù)據(jù)校驗(yàn)可以發(fā)現(xiàn)機(jī)器無法發(fā)現(xiàn)的更為細(xì)致的數(shù)據(jù)錯(cuò)誤。
現(xiàn)階段,數(shù)據(jù)使用方大多只能在現(xiàn)有的數(shù)據(jù)中選擇自己需要的數(shù)據(jù)進(jìn)行使用,對(duì)于沒有現(xiàn)成數(shù)據(jù)的情況,如果實(shí)力雄厚可以自建數(shù)據(jù)采集隊(duì)伍,定向采集目標(biāo)數(shù)據(jù),但對(duì)大多數(shù)用戶來說,無法建立自己的數(shù)據(jù)采集隊(duì)伍,只能通過估算等方式獲取近似數(shù)據(jù)。眾包農(nóng)業(yè)大數(shù)據(jù)采集平臺(tái)具有定制化數(shù)據(jù)采集功能,數(shù)據(jù)需求方可以根據(jù)自己的需求按照數(shù)據(jù)采集的難度、數(shù)量、頻率等標(biāo)準(zhǔn)發(fā)布數(shù)據(jù)采集任務(wù),數(shù)據(jù)采集者可以領(lǐng)取任務(wù)進(jìn)行數(shù)據(jù)采集工作,這樣數(shù)據(jù)需求方只須專注于自己的數(shù)據(jù)需求而不用再為此建立一支數(shù)據(jù)采集隊(duì)伍,相應(yīng)的數(shù)據(jù)獲取成本也會(huì)大幅度降低。
應(yīng)用農(nóng)業(yè)大數(shù)據(jù)對(duì)農(nóng)業(yè)生產(chǎn)效率提高具有重要價(jià)值和意義,大數(shù)據(jù)得以有效應(yīng)用的前提就是廣泛采集多源多類型的農(nóng)業(yè)數(shù)據(jù)。傳統(tǒng)的農(nóng)業(yè)數(shù)據(jù)采集系統(tǒng)多有部門限制,采集隊(duì)伍管理難度大、數(shù)據(jù)采集成本高,限制了農(nóng)業(yè)數(shù)據(jù)采集的廣泛性和普遍性,眾包農(nóng)業(yè)大數(shù)據(jù)采集平臺(tái)結(jié)合互聯(lián)網(wǎng)領(lǐng)域應(yīng)用廣泛的眾包思想,將普通的社會(huì)大眾都轉(zhuǎn)化成數(shù)據(jù)采集員、數(shù)據(jù)質(zhì)量校驗(yàn)員,有效地?cái)U(kuò)充了數(shù)據(jù)采集員隊(duì)伍,擴(kuò)大了數(shù)據(jù)采集覆蓋范圍,降低了數(shù)據(jù)采集的成本,為農(nóng)業(yè)大數(shù)據(jù)的深度應(yīng)用打下堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。
參考文獻(xiàn):
[1]魏拴成. 眾包的理念以及我國企業(yè)眾包商業(yè)模式設(shè)計(jì)[J]. 技術(shù)經(jīng)濟(jì)與管理研究,2010(1):36-39.
[2]趙景明,時(shí)永梅. 圖書館眾包模式的理論與實(shí)踐研究[J]. 圖書館理論與實(shí)踐,2011(8):12-13.
[3]劉文華,阮值華. 眾包:讓消費(fèi)者參與創(chuàng)新[J]. 經(jīng)營與管理,2009(7):67-69.
[4]Jonassen D H. Learning to solve problems:an instructional design guide[M]. New york:John Wiley and Sons,2004.
[5]Terwiesch C,Xu Y. Innovation contests,open innovation,and multiagent problem solving[J]. Management Science,2008,54(9):1529-1543.
[6]Trompette P,Chanal V,Pelissier C. Crowdsourcing as a way to access external knowledge for innovation[C]//24 th EGOS Colloquium,Amsterdam,2008:1-29.
[7]Whitla P. Crowdsourcing and its application in marketing activities[J]. Contemporary Management Research,2009,5(1):15-28.
[8]Guido J,英介鈴木. Inside Cisco’s search for the next big idea[J]. Harvard Business Review,2010,35(4):64-71.
[9]孫忠富,杜克明,鄭飛翔,等. 大數(shù)據(jù)在智慧農(nóng)業(yè)中研究與應(yīng)用展望[J]. 中國農(nóng)業(yè)科技導(dǎo)報(bào),2013,15(6):63-71.
[10]許世衛(wèi). 農(nóng)業(yè)大數(shù)據(jù)與農(nóng)產(chǎn)品監(jiān)測預(yù)警[J]. 中國農(nóng)業(yè)科技導(dǎo)報(bào),2014,16(5):14-20.
[11]王文生,郭雷風(fēng). 農(nóng)業(yè)大數(shù)據(jù)及其應(yīng)用展望[J]. 江蘇農(nóng)業(yè)科學(xué),2015,43(9):1-5.
[12]陶雪嬌,胡曉峰,劉洋. 大數(shù)據(jù)研究綜述[J]. 系統(tǒng)仿真學(xué)報(bào),2013,25(增刊1):142-146.
[13]涂新莉,劉波,林偉偉. 大數(shù)據(jù)研究綜述[J]. 計(jì)算機(jī)應(yīng)用研究,2014,31(6):1612-1616.
[14]張浩然,李中良,鄒騰飛,等. 農(nóng)業(yè)大數(shù)據(jù)綜述[J]. 計(jì)算機(jī)科學(xué),2014,41(11A):387-392.
[15]郭承坤,劉延忠,陳英義,等. 發(fā)展農(nóng)業(yè)大數(shù)據(jù)的主要問題及主要任務(wù)[J]. 安徽農(nóng)業(yè)科學(xué),2014,42(27):9642-9645.