劉忠強(qiáng),王開義,趙向宇,李民贊
?
云環(huán)境下作物育種信息化模型研究
劉忠強(qiáng)1,2,王開義3,趙向宇4,李民贊1
(1.中國農(nóng)業(yè)大學(xué) 現(xiàn)代精細(xì)農(nóng)業(yè)系統(tǒng)集成研究教育部重點實驗室,北京 100083;2.國家農(nóng)業(yè)信息化工程技術(shù)研究中心,北京 100097;3.農(nóng)業(yè)部 農(nóng)業(yè)信息技術(shù)重點實驗室,北京 100097;4.北京市農(nóng)業(yè)物聯(lián)網(wǎng)工程技術(shù)研究中心,北京 100097)
在種業(yè)體制改革和兼并重組加速推進(jìn)、行業(yè)集中度大幅提升的大背景下,開展育種技術(shù)創(chuàng)新、加強(qiáng)資源交流與聯(lián)合育種是廣大中小型育種企業(yè)提升核心競爭力的必然選擇。為此,首先介紹了國內(nèi)作物育種信息管理軟件的應(yīng)用現(xiàn)狀,對云環(huán)境下開展作物育種信息化建設(shè)的優(yōu)勢進(jìn)行了深入分析;接著,以中小型育種企業(yè)育種信息化為業(yè)務(wù)基礎(chǔ),研究云服務(wù)模式與作物育種信息管理業(yè)務(wù)的契合點,提出了云環(huán)境下的作物育種信息化模型。模型充分考慮了作物育種信息管理平臺在云服務(wù)模式下的個性化、一體化及差異性等特點,支持精量播種機(jī)、測產(chǎn)測水等農(nóng)機(jī)設(shè)備的統(tǒng)一對接平臺、面向用戶特征的多層次服務(wù)提供策略和基于數(shù)據(jù)挖掘的作物育種決策支持等方案,對廣大中小型育種企業(yè)、高??蒲性核N團(tuán)隊及專業(yè)測試機(jī)構(gòu)等開展信息化建設(shè),實現(xiàn)資源共享、協(xié)同育種與聯(lián)合測試,進(jìn)而推進(jìn)現(xiàn)代種業(yè)全面均衡發(fā)展,具有借鑒意義。
育種信息化;育種軟件;云服務(wù);數(shù)據(jù)挖掘
隨著我國種業(yè)體制改革的加速推進(jìn),在兼并重組、行業(yè)集中度大幅提升的大背景下,種子企業(yè)特別是數(shù)量眾多的中小型企業(yè)面臨著前所未有的種業(yè)競爭和體制改革壓力。在創(chuàng)新種質(zhì)資源和擴(kuò)大育種規(guī)模的同時,開展育種技術(shù)創(chuàng)新、加強(qiáng)資源交流共享、注重強(qiáng)強(qiáng)聯(lián)合與協(xié)同發(fā)展是提升企業(yè)核心競爭力的必然選擇[1-2]。
信息技術(shù)是提高育種效率、實現(xiàn)高效協(xié)同育種的重要技術(shù)支撐,育種信息化程度是衡量一個企業(yè)現(xiàn)代育種技術(shù)水平的重要標(biāo)準(zhǔn)[3]。杜邦先鋒、孟山都、先正達(dá)等跨國種子集團(tuán)均投入重金構(gòu)建了依托商業(yè)化育種軟件的育種管理體系,實現(xiàn)每年幾十萬的育種材料管理、基因型與表型數(shù)據(jù)協(xié)同管理,為海量育種數(shù)據(jù)的高效分析和充分利用提供了技術(shù)保障。
我國目前有種子企業(yè)4 400家多,育種科研單位及種業(yè)從業(yè)人員數(shù)量居世界第一位。但是,僅有隆平高科、山東圣豐種業(yè)[4]、中種集團(tuán)、大北農(nóng)集團(tuán)等少數(shù)大型種業(yè)龍頭企業(yè)搭建了育種信息管理平臺,在種質(zhì)資源管理、育種過程管理及數(shù)據(jù)管理分析等育種核心業(yè)務(wù)環(huán)節(jié)發(fā)揮了重要作用。絕大多數(shù)中小型種企、育種科研院所和高等院校仍然普遍采用人工測量、紙質(zhì)記錄、經(jīng)驗決策等傳統(tǒng)工作方式,投入產(chǎn)出嚴(yán)重失衡,在很大程度上制約了我國現(xiàn)代種業(yè)的整體發(fā)展進(jìn)程。
云計算技術(shù)具有低成本、易擴(kuò)展、計算能力強(qiáng)等特點,交通云、醫(yī)療云、通訊云、教育云、氣象云等產(chǎn)品已在各自領(lǐng)域切實落地并發(fā)揮著重要作用[5-6]。研究云服務(wù)模式與作物育種信息化管理業(yè)務(wù)的契合點,構(gòu)建云環(huán)境下的作物育種信息管理平臺,為廣大中小型育種企業(yè)、育種科研院所、高校育種團(tuán)隊及專業(yè)測試機(jī)構(gòu)等提供高效優(yōu)質(zhì)的育種信息化服務(wù),推進(jìn)現(xiàn)代種業(yè)全面均衡發(fā)展,是本文的研究重點。
作物育種信息管理軟件是現(xiàn)代育種企業(yè)技術(shù)鏈管理、資源整合與共享的基礎(chǔ),旨在通過數(shù)字化、標(biāo)準(zhǔn)化和規(guī)范化育種流程,全面、高效地集成管理全業(yè)務(wù)流程的各類育種信息和育種資源,實現(xiàn)育種效率的提升與輔助分析決策。
1.1 育種軟件市場成熟度迅速提升,用戶認(rèn)可度普遍較高
目前,國內(nèi)外市場上主流的商業(yè)化育種軟件產(chǎn)品有10余種:國外有加拿大的AGROBASE、美國的PRISM和法國的DORIANE等;國內(nèi)僅有國家農(nóng)業(yè)信息化工程技術(shù)研究中心的金種子育種平臺GSM和中農(nóng)博思的農(nóng)博士NBS兩款。其中,AGROBASE應(yīng)用最為廣泛,金種子育種平臺GSM在國內(nèi)有成功案例。部分育種軟件在國內(nèi)的應(yīng)用情況如表1所示。
表1 育種軟件在國內(nèi)使用情況(部分)
國家農(nóng)業(yè)信息化工程技術(shù)研究中心歷時3年打造了面向大型育種企業(yè)的國產(chǎn)商業(yè)化育種軟件“金種子育種平臺”,并在袁隆平農(nóng)業(yè)高科技股份有限公司、山東圣豐種業(yè)科技有限公司等種業(yè)龍頭企業(yè)進(jìn)行商業(yè)化應(yīng)用。金種子育種平臺集成物聯(lián)網(wǎng)、電子標(biāo)簽等技術(shù),通過與企業(yè)商業(yè)化育種體系的深度融合,實現(xiàn)育種材料規(guī)范化管理、田間試驗可視化設(shè)計、性狀數(shù)據(jù)快速采集與無線傳輸、歷史數(shù)據(jù)田間實時查詢與系譜追溯及多維數(shù)據(jù)分析等功能,為國內(nèi)種業(yè)提供了多個具有標(biāo)桿意義的成功案例,也為育種軟件的研發(fā)與實施積累了可借鑒的推廣經(jīng)驗。
國外種業(yè)巨頭多年的成功經(jīng)驗及國內(nèi)少數(shù)大型種企的典型應(yīng)用案例,對廣大育種科研人員、育種企業(yè)管理人員深入認(rèn)識信息技術(shù)對育種工作的促進(jìn)作用起到了重要的引領(lǐng)和輻射效應(yīng),從業(yè)人員對育種軟件的回報率有了更加清晰的認(rèn)識,對信息化管理思想的認(rèn)同度正在逐年提升[7-8]。隨著我國商業(yè)化育種進(jìn)程進(jìn)入產(chǎn)業(yè)化升級新階段,育種企業(yè)及科研單位迫切需要借助信息化手段,提升自身育種技術(shù)水平和市場核心競爭力[9]。
1.2 育種軟件國內(nèi)應(yīng)用效果不顯著,中小型育種企業(yè)和科研單位迫切需要適合自身特點的軟件產(chǎn)品
國外作物育種軟件的研發(fā)工作始于20世紀(jì)90年代,在育種工作中已經(jīng)發(fā)揮著重要作用,產(chǎn)生的效益十分顯著[6]。進(jìn)入21世紀(jì),國內(nèi)種子企業(yè)開始嘗試引進(jìn)AGROBASE、PRISM等國外育種軟件,但實際應(yīng)用效果卻并不理想。分析原因,除了設(shè)計思想不適用于國內(nèi)種業(yè)現(xiàn)狀及語言障礙之外,在現(xiàn)場實施能力及個性化開發(fā)服務(wù)方面的欠缺在很大程度上制約了國外育種軟件的真正落地。
1)缺乏系統(tǒng)的產(chǎn)品售后服務(wù),現(xiàn)場實施能力弱。商業(yè)化育種軟件不同于普通的管理軟件,具有很強(qiáng)的專業(yè)性和復(fù)雜性,各功能模塊嚴(yán)格按照商業(yè)化育種體系設(shè)計,需要經(jīng)過完整育種周期的現(xiàn)場實施培訓(xùn)并在實施中不斷優(yōu)化產(chǎn)品功能,才能實現(xiàn)軟件與育種業(yè)務(wù)的深度融合并真正發(fā)揮作用。目前,多數(shù)國外育種軟件在售后服務(wù)和現(xiàn)場實施方面普遍存在不到位、不及時、不專業(yè)等現(xiàn)象,許多用戶難以自主、長期運(yùn)營,進(jìn)而導(dǎo)致軟件買而不用、大量閑置和荒廢。
2)功能無法支撐全業(yè)務(wù)鏈條,個性化定制開發(fā)成本高。不同作物間育種流程的差異性、不同育種家育種方法的多樣性及不同育種企業(yè)管理模式的靈活性,決定了市場上的任何一款育種軟件產(chǎn)品都不可能完全滿足用戶的需求,必須根據(jù)用戶特點進(jìn)行個性化定制開發(fā)。市場上絕大多數(shù)育種軟件供應(yīng)商基于成本考慮并不提供個性化開發(fā)服務(wù),直接導(dǎo)致軟件只在用戶部分業(yè)務(wù)環(huán)節(jié)應(yīng)用,或僅僅使用軟件中的少數(shù)幾個功能模塊,無法充分發(fā)揮育種軟件的最大功能,帶給用戶的輔助作用非常有限。
此外,育種企業(yè)需要培養(yǎng)具備信息技術(shù)與育種技術(shù)的混合型人才,以保障育種軟件的長期自主運(yùn)營。個性化開發(fā)、現(xiàn)場實施、人才培養(yǎng)、軟件運(yùn)行所需的服務(wù)器、防火墻等基礎(chǔ)環(huán)境建設(shè)等費(fèi)用,用戶一次性投入至少在百萬元級別,加上不定時的維護(hù)和升級費(fèi)用,遠(yuǎn)遠(yuǎn)超出了大多數(shù)育種單位的承受能力。因此,面向中小型育種企業(yè)和育種科研團(tuán)隊提供全面的育種信息化解決方案咨詢、靈活可定制的軟件產(chǎn)品研發(fā)、持續(xù)專業(yè)的售后培訓(xùn)與實施服務(wù)等工作意義重大。
云服務(wù)環(huán)境下構(gòu)建作物育種信息管理平臺,具有低成本、標(biāo)準(zhǔn)化、高性能、快速實施及易維護(hù)等多項共性優(yōu)點。除此之外,基于云計算技術(shù)開展作物育種信息化建設(shè)仍具有以下顯著優(yōu)勢。
2.1 快速推廣現(xiàn)代育種新思路,引導(dǎo)育種企業(yè)構(gòu)建現(xiàn)代育種技術(shù)體系
截至2015年底,國內(nèi)種子企業(yè)中獲得農(nóng)業(yè)部頒發(fā)的“全國育繁推一體化企業(yè)”資質(zhì)的企業(yè)不足100家,多數(shù)企業(yè)尚未建立健全商業(yè)化育種技術(shù)體系,從育種流程、管理模式、信息化、自動化水平方面不能滿足大規(guī)模商業(yè)化育種的要求。通過數(shù)字化、標(biāo)準(zhǔn)化和規(guī)范化育種流程,將模塊化、流水線式的現(xiàn)代育種思想和技術(shù)流程通過平臺進(jìn)行固化,利用云服務(wù)模式快速引導(dǎo)育種企業(yè)的育種行為由作坊式育種向商業(yè)化育種轉(zhuǎn)變,由靠經(jīng)驗育種向靠數(shù)據(jù)育種轉(zhuǎn)變,輻射帶動廣大種業(yè)從業(yè)人員提升數(shù)據(jù)標(biāo)準(zhǔn)化與操作規(guī)范化水平,以低成本、高效率的方式在全國范圍內(nèi)推動種業(yè)企業(yè)商業(yè)化育種技術(shù)體系的構(gòu)建與升級。
2.2 促進(jìn)行業(yè)規(guī)范發(fā)展,推動育種資源共享與聯(lián)合協(xié)作育種
隨著我國種業(yè)兼并重組業(yè)務(wù)的深入,能夠最終發(fā)展成為種業(yè)航母的企業(yè)畢竟只占極少數(shù),多數(shù)企業(yè)和科研單位將集中資源專注于種業(yè)鏈條的一個或幾個環(huán)節(jié),并最終通過業(yè)務(wù)轉(zhuǎn)型和技術(shù)升級發(fā)展成為細(xì)分領(lǐng)域的專業(yè)機(jī)構(gòu),如種質(zhì)資源改良、自交系選育、聯(lián)合測試及分子檢測等。在專業(yè)化分工和社會化協(xié)作的大趨勢下,只有通過加強(qiáng)聯(lián)合和優(yōu)勢互補(bǔ),充分發(fā)揮各育種單位的優(yōu)勢,才能徹底擺脫各自為戰(zhàn)的低端競爭困局,形成合力并具備競爭優(yōu)勢。
然而,長期以來由于國內(nèi)眾多種子企業(yè)多而分散,競爭激烈而缺乏交流,在數(shù)據(jù)標(biāo)準(zhǔn)、操作規(guī)范、管理理念等方面差異性較大,導(dǎo)致開展資源共享和聯(lián)合協(xié)作存在諸多困難,資源的有效利用率不足1%[10]。借助云平臺在育種資源多級加密、智能匹配推送、流程自動管控及材料多維度評價等技術(shù)優(yōu)勢,企業(yè)可以在內(nèi)部建立共同的工作語言和標(biāo)準(zhǔn)的工作方式,實現(xiàn)育種資源和信息在各個環(huán)節(jié)的無縫流轉(zhuǎn)。在此基礎(chǔ)上,逐漸形成行業(yè)內(nèi)普遍認(rèn)同的標(biāo)準(zhǔn)和規(guī)范,推動育種資源在整個行業(yè)內(nèi)的高度共享和循環(huán)利用,進(jìn)而開展基于云服務(wù)的、廣泛的協(xié)作育種,避免各單位間無效、低水平重復(fù)工作,優(yōu)化資源配置,實現(xiàn)資源有效利用率最大化的同時,達(dá)到各方共贏的目的。
2.3 多維度數(shù)據(jù)聯(lián)合分析,提升育種輔助決策力度
在日益激烈的市場競爭條件下,為了更高效地培育新品種,快速搶占市場,種企管理者及育種家對育種決策質(zhì)量、決策速度提出了更高要求。借助育種數(shù)據(jù)分析挖掘工具輔助決策成為育種決策者的重要途徑。但是,國內(nèi)多數(shù)企業(yè)的育種數(shù)據(jù)仍以紙質(zhì)或EXCEL形式存儲,無法直接利用,即便少數(shù)企業(yè)使用軟件進(jìn)行數(shù)字化管理,采用的標(biāo)準(zhǔn)和數(shù)據(jù)結(jié)構(gòu)也無法兼容整合,每個系統(tǒng)數(shù)據(jù)處理的維度固化,計算、存儲等資源動態(tài)調(diào)整能力有限,不支持?jǐn)?shù)據(jù)結(jié)構(gòu)的橫向關(guān)聯(lián),分析挖掘結(jié)果的參考價值十分有限。與此同時,不同育種家依據(jù)各自經(jīng)驗進(jìn)行決策,導(dǎo)致同一資源的描述信息因觀察能力、偏好等因素而產(chǎn)生較大的差異性,大幅降低了資源的可共享性和利用價值。
基于育種云平臺完整產(chǎn)業(yè)鏈的業(yè)務(wù)數(shù)據(jù),具備一致性、完整性、精確性及同一性等特征,每個育種單位的數(shù)據(jù)可以最大限度共享,能夠在材料數(shù)、地點數(shù)、測試年度等方面實現(xiàn)數(shù)據(jù)的多維度擴(kuò)增,通過集成利用大數(shù)據(jù)、數(shù)據(jù)挖掘、決策支持系統(tǒng)等技術(shù)和分析工具,實現(xiàn)跨企業(yè)數(shù)據(jù)的綜合分析[11],從海量數(shù)據(jù)中挖掘知識、發(fā)現(xiàn)規(guī)律,“充分利用歷史經(jīng)驗”為親本雜交、組合測配、多點測試、品種推廣等決策提供輔助指導(dǎo),提升綜合決策水平和預(yù)警能力。
2.4 資源高度共享,助推傳統(tǒng)育種方法與現(xiàn)代生物技術(shù)深度融合
現(xiàn)代育種技術(shù)體系的建立需要常規(guī)育種、分子輔助育種、轉(zhuǎn)基因育種及抗逆性檢測多項關(guān)鍵技術(shù)的共同支撐[12],涉及多個交叉學(xué)科,需要強(qiáng)大的信息平臺進(jìn)行有效的數(shù)據(jù)組織和管理。例如,分子設(shè)計育種可以實現(xiàn)育種的定向變異、準(zhǔn)確選擇的目標(biāo),但是這一技術(shù)只有借助云平臺強(qiáng)大的信息處理能力、共享機(jī)制及計算模擬集成技術(shù)才能更好地發(fā)揮作用。在云環(huán)境下,以育種目標(biāo)為紐帶,充分發(fā)揮信息技術(shù)的提升和串聯(lián)帶動作用,促進(jìn)多種常規(guī)育種技術(shù)與生物育種技術(shù)在不同產(chǎn)業(yè)鏈環(huán)節(jié)的協(xié)同發(fā)展,形成合力,建立有明確育種目標(biāo)的高效率的現(xiàn)代育種體系,共同促進(jìn)現(xiàn)代種業(yè)的發(fā)展。
本文以中小型育種企業(yè)和育種科研院所的育種信息化管理為業(yè)務(wù)基礎(chǔ),深入研究云服務(wù)模式與作物育種信息化管理業(yè)務(wù)的契合點,充分考慮了作物育種信息管理平臺在云服務(wù)模式下的個性化、一體化及差異性等特點,提出了云環(huán)境下的作物育種信息化模型,如圖1所示。模型在遵循高可用、標(biāo)準(zhǔn)化、高性能、開放接口等基本原則的基礎(chǔ)上,在行業(yè)規(guī)范性引導(dǎo)、專業(yè)性服務(wù)、可持續(xù)性運(yùn)營機(jī)制、數(shù)據(jù)安全性保障等方面設(shè)立相應(yīng)標(biāo)準(zhǔn),以便更好地滿足多用戶多作物的育種信息化需求。
模型首先抽取不同作物、不同類型育種主體的業(yè)務(wù)流程,解析業(yè)務(wù)邏輯,然后通過控制器和協(xié)調(diào)器的共同作用,面向用戶特征進(jìn)行服務(wù)的篩選和整合,最后為各類型用戶構(gòu)建合適的育種信息化產(chǎn)品。
圖1 水稻育種試驗及材料信息表
3.1 第三方應(yīng)用接口的統(tǒng)一接入方案
完整的云平臺必然會接入第三方服務(wù),接口設(shè)計的通用性、可擴(kuò)展性和可維護(hù)性直接影響著云平臺構(gòu)建的質(zhì)量。本文提出的作物育種云平臺模型采用統(tǒng)一接入方式,將第三方服務(wù)的接入、管理、維護(hù)等工作交由一個獨立的功能模塊負(fù)責(zé),極大地提高了模型的運(yùn)行效率。模型集成接口控制模塊,用來接入和管理第三方平臺、系統(tǒng)或者服務(wù),使云平臺具有良好的系統(tǒng)擴(kuò)展性和耦合性,采用加密的Web Service標(biāo)準(zhǔn)技術(shù)進(jìn)行注冊和服務(wù)調(diào)用。為了增強(qiáng)云平臺的擴(kuò)展性,允許用戶定義服務(wù)接入開發(fā)模板,進(jìn)行定制接口的接入。接口服務(wù)主要包括:性狀數(shù)據(jù)采集設(shè)備、田間視頻監(jiān)控設(shè)備、生長環(huán)境信息采集設(shè)備、精量播種機(jī)、自動化考種系統(tǒng)、育種試驗分析軟件,以及支付系統(tǒng)等第三方應(yīng)用接口的統(tǒng)一接入方案。
3.2 面向用戶特征的多層次服務(wù)提供策略
育種云平臺的用戶既包括育種家個體,也包括中小型育種企業(yè)、育種科研院所及專業(yè)測試機(jī)構(gòu)等群體,還可以是由產(chǎn)業(yè)鏈中多家育種單位組成的聯(lián)盟或聯(lián)合體等,每類用戶的需求具有多樣化、個性化、動態(tài)性等特點。模型在滿足用戶基本需求和共同需求的基礎(chǔ)上,通過提供個性化、特色育種信息服務(wù)以增強(qiáng)服務(wù)方式,更好地滿足不同用戶的特殊需要。
個體用戶具有專業(yè)性強(qiáng)、靈活性高、個體之間差異性大等特點,主要關(guān)注種質(zhì)資源改良、系譜追溯、試驗數(shù)據(jù)分析及分子標(biāo)記檢測等少數(shù)幾個育種信息服務(wù)。針對個體用戶,該模型采用主動性服務(wù)方式通過分析用戶行為和需求,獲取用戶特征描述,有針對性地主動推送服務(wù),隨著用戶特征模型的優(yōu)化服務(wù)推送應(yīng)具備動態(tài)性。
育種企業(yè)等群體用戶業(yè)務(wù)較全面,具備很強(qiáng)的系統(tǒng)性和流程性,各環(huán)節(jié)分工明確,節(jié)點間信息流轉(zhuǎn)頻繁。針對群體用戶,模型采用服務(wù)組合推薦方式,綜合分析群體用戶的業(yè)務(wù)鏈條形態(tài)類型,形成多種服務(wù)組合方案供群體用戶選擇,并允許用戶根據(jù)自身業(yè)務(wù)調(diào)整情況對方案優(yōu)化重組。
聯(lián)盟或聯(lián)合體是育種資源統(tǒng)一、集中、協(xié)同管理的有效手段,也是降低資源浪費(fèi)、實現(xiàn)資源整合和高度共享的重要途徑[5],一般由行業(yè)內(nèi)的多家種業(yè)企業(yè)組成,業(yè)務(wù)覆蓋全產(chǎn)業(yè)鏈條,聯(lián)盟企業(yè)在聯(lián)合協(xié)作的同時又具備各自業(yè)務(wù)的獨立性和完整性。針對聯(lián)盟用戶,模型基于面向多任務(wù)的服務(wù)組合選擇技術(shù),構(gòu)建全產(chǎn)業(yè)鏈條件下多層次一體化協(xié)同服務(wù)體系,既能滿足企業(yè)內(nèi)部的育種信息化需求,又可以在整個聯(lián)盟間實現(xiàn)資源共享、協(xié)同育種與聯(lián)合測試。
3.3 基于數(shù)據(jù)挖掘的作物育種決策支持
模型將大數(shù)據(jù)技術(shù)應(yīng)用到作物育種決策支持系統(tǒng)中,并結(jié)合分布式技術(shù)、虛擬化技術(shù)形成了具有高可擴(kuò)展性、高運(yùn)算性、高實時性的作物育種決策支持系統(tǒng)平臺架構(gòu)。該架構(gòu)以數(shù)據(jù)為驅(qū)動,充分發(fā)揮了“數(shù)據(jù)”在整個決策支持系統(tǒng)的核心地位,決策過程就是數(shù)據(jù)信息的交流過程,系統(tǒng)各個部件即相輔相成,又松散耦合。系統(tǒng)架構(gòu)主要包括以下部分。
1)多維數(shù)據(jù)源:育種過程形成的大量的、體現(xiàn)育種現(xiàn)實過程的原始數(shù)據(jù),包括多用戶、多年度、多地點及多種形式的數(shù)據(jù)源頭,如基因型數(shù)據(jù)庫、表現(xiàn)型數(shù)據(jù)庫、育種數(shù)據(jù)及環(huán)境數(shù)據(jù)等[13]。海量的原始數(shù)據(jù)是實現(xiàn)基于數(shù)據(jù)驅(qū)動的決策支持系統(tǒng)的基礎(chǔ)。
2)數(shù)據(jù)轉(zhuǎn)換平臺:用于從原始數(shù)據(jù)源中采集數(shù)據(jù),并對數(shù)據(jù)進(jìn)行抽取、清洗和轉(zhuǎn)換,最后將整理后的數(shù)據(jù)存儲到數(shù)據(jù)支撐平臺。
3)數(shù)據(jù)支撐平臺:主要提供對數(shù)據(jù)的存儲,數(shù)據(jù)可按照不同的格式,分別存儲到數(shù)據(jù)倉庫、分布式文件系統(tǒng)等不同存儲介質(zhì)中,用于支持大數(shù)據(jù)挖掘和分布式計算。
4)數(shù)據(jù)挖掘平臺:核心模塊,主要用于實現(xiàn)數(shù)據(jù)挖掘算法運(yùn)算和聯(lián)機(jī)分析處理(OLAP)的數(shù)據(jù)分析。模型內(nèi)置常用挖掘算法和分析工具,同時提供運(yùn)算接口,方便用戶擴(kuò)展現(xiàn)有系統(tǒng)的數(shù)據(jù)挖掘算法實現(xiàn)對新決策問題的自主分析。
該系統(tǒng)將數(shù)據(jù)倉庫、數(shù)據(jù)挖掘與傳統(tǒng)決策支持系統(tǒng)模型有機(jī)結(jié)合,具備以下特點:使用分布式文件系統(tǒng)、分布式數(shù)據(jù)倉庫形成的數(shù)據(jù)支撐平臺取代了單一的關(guān)系型數(shù)據(jù)庫,使決策支持系統(tǒng)的存儲能力在支持?jǐn)?shù)據(jù)倉庫的綜合數(shù)據(jù)存儲的同時支持海量數(shù)據(jù)的分布式集群存儲,通過分布式并行運(yùn)算,顯著提高數(shù)據(jù)挖掘效率;摒棄了智能決策支持系統(tǒng)結(jié)構(gòu)中的專家?guī)旌蛯<蚁到y(tǒng),完全使用OLAP和數(shù)據(jù)挖掘來主動獲取知識。知識獲取以數(shù)據(jù)為驅(qū)動,解決了專家系統(tǒng)獲取專家知識困難、知識更新不及時以及知識中摻雜專家主觀建議的弊端。為了能夠?qū)崟r響應(yīng)客戶需求,系統(tǒng)將獲取知識和使用知識進(jìn)行解耦,很大程度上提升了育種決策的響應(yīng)速度。
提出了一種適用于云環(huán)境下的作物育種信息化模型。該模型以中小型育種企業(yè)育種信息化為業(yè)務(wù)基礎(chǔ),通過研究云服務(wù)模式與作物育種信息管理業(yè)務(wù)的契合點,為中小規(guī)模的育種團(tuán)隊開展育種信息化建設(shè)提供可借鑒的技術(shù)方案,具有廣闊的應(yīng)用前景。下一步將選取開發(fā)技術(shù)進(jìn)行模型實現(xiàn),面向育種個體、群體和聯(lián)合體用戶開展應(yīng)用驗證。同時,在作物育種云平臺的可持續(xù)性運(yùn)營機(jī)制、專業(yè)化服務(wù)模式及數(shù)據(jù)安全性保障策略等方面進(jìn)行深入探索。
[1] 楊曉東,余學(xué)科,黃瑋琳,等.中國農(nóng)作物商業(yè)化育種現(xiàn)狀及發(fā)展對策[J].農(nóng)學(xué)學(xué)報,2014,4(2):117-120.
[2] 張世煌.種業(yè)新政以后科研單位和中小企業(yè)的改革方向[J].種子科技,2011(5):3-4.
[3] 董春水,才卓.現(xiàn)代數(shù)字育種技術(shù)的研究進(jìn)展[J].玉米科學(xué),2013,21(1):1-8.
[4] 李洪杰,趙晉銘,張小燕,等.大豆商業(yè)化育種的探索與實踐[J].中國種業(yè),2015(1):28-30.
[5] 曹誠,唐卓浩.一種智能醫(yī)療云平臺的構(gòu)建方案[J].信息通信,2015(7):79-81.
[6] 蘇顯,陳捷.B/S 結(jié)構(gòu)的種豬信息云服務(wù)平臺構(gòu)建[J].廣東農(nóng)業(yè)科學(xué),2013(1):198-212.
[7] 孫海艷,李軍民,劉哲,等.關(guān)于我國種業(yè)信息化建設(shè)的思考[J].中國種業(yè),2014(6):1-3.
[8] 蓋鈞鎰,劉康,趙晉銘.中國作物種業(yè)科學(xué)技術(shù)發(fā)展的評述[J].中國農(nóng)業(yè)科學(xué),2015,48(17):3303-3315.
[9] 劉明霞,李國威.種業(yè)新政下農(nóng)業(yè)科研院所育種創(chuàng)新問題的思考[J].農(nóng)業(yè)經(jīng)濟(jì),2012(8):127-128.
[10] 李洪杰.種籌天下,打造農(nóng)作物育種的3.0時代[J].中國種業(yè),2015(6):5-7.
[11] 馮青,余隋懷,楊延璞,等.基于云服務(wù)的產(chǎn)品決策支持系統(tǒng)模型研究[J].中國機(jī)械工程,2013,24(15):2053-2059.
[12] 張世煌.現(xiàn)代種業(yè)的重大關(guān)鍵技術(shù)[J].農(nóng)業(yè)科技與信息,2013(2):33.
[13] 樊龍江,王衛(wèi)娣,王斌.作物育種相關(guān)數(shù)據(jù)及大數(shù)據(jù)技術(shù)育種利用[J].浙江大學(xué)學(xué)報:農(nóng)業(yè)與生命科學(xué)版,2016,42(1):30-39.Abstract ID:1003-188X(2017)03-0007-EA
Research on Information Model of Plant Breeding under Cloud Environment
Liu Zhongqiang1,2, Wang Kaiyi3, Zhao Xiangyu4, Li Minzan1
(1.Key Laboratory of Modern Precision Agriculture System Integration Research,Ministry of Education,China Agricultural University, Beijing 100083, China; 2.National Engineering Research Center for Information Technology in Agriculture,Beijing 100097, China;3. Key Laboratory of Agri-informatics, Ministry of Agriculture, Beijing 100097,China;4.Beijing Engineering Research Center of Agricultural Internet of Things,Beijing 100097, China)
Under the background of seed industry structure restructuring,merger and reorganization accelerating and industry concentration increasing,to carry out breeding technology innovation, strengthen the resources exchanging and joint breeding is the inevitable choice of majority of small and medium enterprises to enhance the core competitiveness.Firstly,introduced currently application status of domestic plant breeding information management software,and discussed the advantages of information technology under the cloud environment.Next,researched the meeting point between cloud service mode and plant breeding information management business based on information of small and medium breeding enterprises,and proposed plant breeding information model under cloud environments.This model fully considered personalization,integration,differentiation and other features of plant breeding information management platform under cloud services mode,supporting unified docking platform of precision seeder, production and water test and other agricultural equipment,decision making of multi-level user-oriented features,and plant breeding decision support based on data mining, the main ideas are useful to the majority of small and medium enterprises,breeding team of research institutes and colleges,professional testing organizations to carry out information construction, resource sharing,cooperative breeding and joint testing,furthermore, to promote comprehensive and balanced development of modern seed industry.
information breeding; breeding software; cloud services; data mining
2016-03-14
北京市科技計劃項目(D151100004215002,D15110000421 5004)
劉忠強(qiáng)(1983-),男,山東莒南人,博士研究生,(E-mail)liuzq@nercita.org.cn。
李民贊(1963-),男,河北藁城人,教授,博士生導(dǎo)師,(E-mail)limz@cau.edu.cn。
S126;TP319
A
1003-188X(2017)03-0007-05