周濟(jì),陳佳瑋,沈利言,戴杰,聞楨杰,孫港,周潔,丁國輝,丁艷鋒
(1.南京農(nóng)業(yè)大學(xué)前沿交叉研究院/作物表型組學(xué)交叉研究中心,江蘇 南京 210095; 2.英國國立農(nóng)業(yè)植物研究所/劍橋作物研究中心,英國 劍橋 CB3 0LE; 3.南京農(nóng)業(yè)大學(xué)農(nóng)學(xué)院/江蘇省現(xiàn)代作物生產(chǎn)協(xié)同創(chuàng)新中心/現(xiàn)代作物生產(chǎn)省部共建協(xié)同創(chuàng)新中心,江蘇 南京 210095)
1950年英國計(jì)算機(jī)科學(xué)家、人工智能之父Alan Turning在其開拓性論文“計(jì)算機(jī)及智能”(Computing Machinery and Intelligence)中提出了通過模仿游戲(the imitation game)驗(yàn)證機(jī)器是否具有“智能”(machine intelligence)的方案[1],隨后Turing將該假設(shè)進(jìn)一步完善,繼而演變成此后廣為人知的圖靈測試(Turning test)。6年后,美國計(jì)算機(jī)科學(xué)家、圖靈獎獲得者John McCarthy在達(dá)特茅斯會議(Dartmouth workshop)上首次提出了 “人工智能”(artificial intelligence,AI)概念,并作為學(xué)科奠基者為該領(lǐng)域中的常識性推理問題(common-sense knowledge)做出了杰出的貢獻(xiàn)[2]。不過真正將AI帶入大眾視野的是米高梅公司于1968年出品的劃時(shí)代科幻電影《2001:太空漫游》(2001:A Space Odyssey)[3]。影片虛構(gòu)了具有強(qiáng)人工智慧(strong AI)的HAL 9000超級電腦,為大眾展現(xiàn)了AI和機(jī)器人技術(shù)在自然語言處理、語音交流、面部識別、行為識別及自我意志等領(lǐng)域的應(yīng)用前景,對此后各類智能系統(tǒng)的研發(fā)產(chǎn)生了深刻影響。人類世界第一臺具有弱人工智能(narrow AI或weak AI)的機(jī)器人“Shakey the Robot”(圖 1-a)于1969年由斯坦福研究所(SRI International)人工智能中心正式發(fā)布[4],這臺融合了邏輯推理和物理動作的自動化設(shè)備對機(jī)器視覺、機(jī)器人平臺和自動化控制等技術(shù)的發(fā)展和應(yīng)用產(chǎn)生了極其深遠(yuǎn)的影響,其中圖遍歷、圖像特征提取及障礙物間最優(yōu)路徑搜索等算法至今仍被應(yīng)用于圖像處理和輔助駕駛等領(lǐng)域。
由于計(jì)算機(jī)硬件算力、軟件算法和相關(guān)數(shù)據(jù)集的限制,對AI技術(shù)的應(yīng)用在20世紀(jì)70至90年代進(jìn)入發(fā)展的“冬天”。但該時(shí)期卻是各類AI基礎(chǔ)算法研發(fā)的黃金期,許多影響了現(xiàn)代AI系統(tǒng)的著名算法均發(fā)表于本階段,包括:多層感知器(multilayer perceptron)及其在特征選擇(feature selection)、模糊集(fuzzy set)和分類(classification)中的使用[5-6];現(xiàn)代深度學(xué)習(xí)模型的基礎(chǔ),即神經(jīng)網(wǎng)絡(luò)模型(neural network models)和人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANN)[7-8];用于記憶和關(guān)聯(lián)機(jī)制的Associatron簡化神經(jīng)網(wǎng)絡(luò)模型[9];可構(gòu)建自適應(yīng)學(xué)習(xí)系統(tǒng)的自組織式神經(jīng)模式識別器(self-organizing neural pattern recognition machine)[10];模仿人類注意力的類注意力機(jī)制(attention-like mechanisms),如超網(wǎng)絡(luò)(hypernetwork),并以此動態(tài)調(diào)整模型對不同輸入數(shù)據(jù)的關(guān)注權(quán)重[11];以及為因果推斷和模型評估奠基的貝葉斯網(wǎng)絡(luò)(Bayesian networks)等[12]。
1997年,由IBM開發(fā)的深藍(lán)系統(tǒng)(Deep Blue)通過窮舉法擊敗國際象棋冠軍Garry Kasparov后,AI再次受到廣泛的關(guān)注[13]。在過去20年里,AI算法的研發(fā)和應(yīng)用隨著計(jì)算機(jī)硬件算力的進(jìn)步呈指數(shù)級增長,極大地帶動了生物醫(yī)藥、數(shù)碼娛樂、教育科研和金融服務(wù)等行業(yè)的快速發(fā)展[14]。例如,2011年IBM推出的Watson認(rèn)知系統(tǒng)(cognitive systems),通過自然語言處理技術(shù)解析語意(semantic technology),相關(guān)算法被廣泛使用在自動化描述、預(yù)測統(tǒng)計(jì)和自然語言處理中[15]。雖然受到較多質(zhì)疑,2014年3名俄羅斯和烏克蘭程序員共同開發(fā)的Eugene Goostman聊天軟件被稱為人類歷史上首個(gè)可以“通過”圖靈測試的算法[16],在一定程度上證明了機(jī)器可對人類智能進(jìn)行“模仿”。2015年,當(dāng)時(shí)供職于微軟的何愷明等推出了一個(gè)數(shù)百層的殘差神經(jīng)網(wǎng)絡(luò)(residual neural network,ResNet),并開創(chuàng)性地通過跨層跳躍連接(skip connections)避免了因?yàn)樯疃染W(wǎng)絡(luò)構(gòu)架導(dǎo)致的梯度消失(the vanishing gradient problem)及精度飽和(accuracy saturation)等問題[17]。此后,Resnet及其變體(如ResNeXt和DenseNet等[18])被廣泛應(yīng)用于圖像分類和目標(biāo)檢測任務(wù),在幾乎所有基于圖像的智能系統(tǒng)中均可見其身影。2016年,谷歌子公司DeepMind開發(fā)的阿爾法狗(AlphaGo)結(jié)合啟發(fā)式蒙特卡洛樹搜索算法(Monte Carlo tree search)和ANN,通過人機(jī)對弈建立訓(xùn)練集,再針對圍棋對弈中不同著法(moves)的獲勝率通過神經(jīng)網(wǎng)絡(luò)強(qiáng)化樹搜索訓(xùn)練模型,進(jìn)而基于多次迭代產(chǎn)生更優(yōu)著法策略[19]。2016至2017年,AlphaGo及其后續(xù)版本相繼擊敗了世界頂級職業(yè)圍棋選手李世石和柯潔,在引爆世界輿論之余,也讓人類看到了AI系統(tǒng)在大數(shù)據(jù)加持下的算力優(yōu)勢和瞬時(shí)決策力。不過多年以后再看AlphaGo及通過自我對弈和強(qiáng)化學(xué)習(xí)算法(reinforcement learning)擊敗AlphaGo及后續(xù)版本的AlphaZero,這些模型仍是對人類決策過程的簡單模仿,雖然展示了人類在算力上的局限性,但這些系統(tǒng)仍只是基于“計(jì)算”(computation),并不具備人類的大局觀和通用智能(general intelligence)[20]。
2017年以來,隨著深度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)和卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)等模型的成熟,AI技術(shù)被大規(guī)模應(yīng)用到各種傳統(tǒng)和新興行業(yè)中,如人臉和文字識別系統(tǒng)[21],基于大數(shù)據(jù)的醫(yī)療診斷和醫(yī)藥研究[22],金融證券的交易和風(fēng)控模型[23],仿真類電子游戲[24],以及特斯拉和谷歌Waymo等自動駕駛技術(shù)[25]。感興趣的讀者還可通過清華大學(xué)唐杰團(tuán)隊(duì)開發(fā)的搜索模型ArnetMiner[26]對人工智能發(fā)展各階段的代表性人物和主要成果在學(xué)術(shù)網(wǎng)中進(jìn)行高效挖掘,對AI歷史進(jìn)程做進(jìn)一步的梳理和研究。
作為一門新興學(xué)科,“人工智能”自成立以來嘗試過多個(gè)發(fā)展方向,如模擬人類大腦、模仿形式邏輯(formal logic)及通過量化領(lǐng)域知識(domain knowledge)構(gòu)建超大型數(shù)據(jù)庫等[27]。由于基于數(shù)理統(tǒng)計(jì)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)為工業(yè)界和學(xué)術(shù)界解決了很多實(shí)際問題,因此該方向在現(xiàn)階段AI研究中占據(jù)了主導(dǎo)地位[28]。由此可見,專家和從業(yè)者對AI的定義與普遍認(rèn)知不盡相同,現(xiàn)階段的AI一般指區(qū)別于人類自然智能的(natural intelligence)、可通過理性行為(rational activities)和數(shù)學(xué)優(yōu)化(mathematical optimization)等方法對輸入數(shù)據(jù)進(jìn)行模式化“學(xué)習(xí)”(如擬合、特征匹配等),并在特定條件下解決“目標(biāo)問題”(如對象檢測、關(guān)聯(lián)分析、數(shù)據(jù)分類和趨勢預(yù)測等)的決策系統(tǒng)[29]。因此,現(xiàn)階段絕大多數(shù)AI算法或智能系統(tǒng)并不能真正模擬或展示人類在學(xué)習(xí)或解決問題過程中所依賴的領(lǐng)域知識和通用智能。雖然作為大多數(shù)深度學(xué)習(xí)模型基礎(chǔ)的ANN,其靈感來源于生命系統(tǒng)中的分布式通信節(jié)點(diǎn)和信息處理方式[30],但ANN與生物大腦運(yùn)作機(jī)制差異巨大;簡而言之,ANN不具備動態(tài)模擬能力,而且是靜態(tài)且不可塑的。谷歌最新的LaMDA對話模型(language models for dialog applications),已可通過參考外部數(shù)據(jù)源在量化事實(shí)性(quantify factuality)的基礎(chǔ)上對已知來源進(jìn)行合理響應(yīng)(response),而非此前其他算法的刻意模仿(simulate),但其運(yùn)行模式與人類認(rèn)知(如歸納演繹等)仍有很大差距[31]。實(shí)際上對生物大腦工作機(jī)制的模擬難度極大,以美國大腦研究計(jì)劃(The Brain Initiative)資助的研究為例,即使只對毫米級小鼠初級視覺皮層(深 0.9 mm,直徑5 mm,約230 000 個(gè)神經(jīng)元)進(jìn)行視覺刺激模擬,這個(gè)數(shù)千萬美元投資所構(gòu)建的計(jì)算平臺也只能對部分皮層回路結(jié)構(gòu)進(jìn)行還原,很難勝任對皮質(zhì)細(xì)胞類別、腦神經(jīng)組織電信號傳輸、突觸強(qiáng)度和關(guān)聯(lián)網(wǎng)絡(luò)等神經(jīng)細(xì)胞活動的模擬[32]。
盡管基于現(xiàn)階段的研究理論和技術(shù)方法,AI超越甚至接近人類智能的可能性很小,但是很多AI技術(shù)在某些特定場景中解決目標(biāo)問題的能力卻令人驚嘆。利用AI模型在大數(shù)據(jù)解析上的優(yōu)勢,通過擴(kuò)大數(shù)據(jù)集穩(wěn)步提高預(yù)測的準(zhǔn)確性和模型的泛化性,其改進(jìn)專業(yè)領(lǐng)域和提高人類生活質(zhì)量的前景令人期待。結(jié)合人類需求驅(qū)動科技進(jìn)步理論[33]和馬斯洛需求層次模型(Maslow’s hierarchy of needs)[34],AI發(fā)展可粗略分為4種類別(圖 1-b):1)單一反應(yīng)型(reactive machines),即基礎(chǔ)AI,不具備記憶(即不能利用歷史信息指導(dǎo)決策),只能對有限輸入做出功能性反應(yīng)的形式;2)有限記憶型(limited memory),即通過大量的訓(xùn)練集構(gòu)建歷史經(jīng)驗(yàn)和記憶模式,以此為基準(zhǔn)不斷改進(jìn)算法決策力和預(yù)測精度;3)心智理論型(theory of mind),這個(gè)層次的AI至今仍停留在理論階段,主要是用于理解人類在多種外部因素影響下的思想形成和情緒產(chǎn)生過程,通過模擬人類心智的運(yùn)行方式構(gòu)建可媲美人類的學(xué)習(xí)、決策和想象力的智能系統(tǒng)[35];4)自我意識型(self-awareness),這類具有自主意識的AI僅存于想象,如機(jī)器可完全模擬人腦運(yùn)作,那其超強(qiáng)算力、學(xué)習(xí)和決策力可能是智慧發(fā)展的最后階段——機(jī)器會擁有自己的思想,并可輕易達(dá)到人類智慧的極限[36]。
圖1 第一臺弱人工智能搖擺機(jī)器人(a)[4]及基于人類需求層次理論對AI的分類(b)Fig.1 The first weak artificial intelligence(AI)shakey robot(a)[4]and the classification of AI and AI-related technologies based on Maslow’s hierarchy of human needs(b)
根據(jù)以上分類,AI技術(shù)發(fā)展遵循從弱人工智能(執(zhí)行場景特定和解決能力單一)、強(qiáng)人工智能(具有人類認(rèn)知水平和通用智能,系統(tǒng)可適用于多個(gè)領(lǐng)域),到超人工智能(super AI,經(jīng)過邏輯演化和自我學(xué)習(xí)產(chǎn)生智慧,并在各方面超越人類智慧)的過程[37](圖 1-b)。現(xiàn)階段AI算法距強(qiáng)人工智能還有很大的差距,對強(qiáng)人工智能的主流研發(fā)思路有:1)提高現(xiàn)有深度神經(jīng)網(wǎng)絡(luò)的可解釋性(如通過CapsNet[38]和 NasNet[39]),通過神經(jīng)網(wǎng)絡(luò)生成模型(generative model)自主學(xué)習(xí)輸入數(shù)據(jù)[40],再結(jié)合對抗訓(xùn)練(adversarial training)[41]、多任務(wù)(mutli-task learning)[42]、知識蒸餾(knowledge distillation)[43]或增強(qiáng)學(xué)習(xí)[44]等各種方法協(xié)同提高模型的學(xué)習(xí)效率、自適應(yīng)性和魯棒性,以期逐漸構(gòu)建具有強(qiáng)人工智能的復(fù)雜網(wǎng)絡(luò)模型;2)集合多個(gè)弱AI系統(tǒng),通過構(gòu)建多系統(tǒng)間的交互模擬人類推理和決策能力,再基于下一代計(jì)算裝置(如量子計(jì)算機(jī))大規(guī)模模擬神經(jīng)元活動,重建復(fù)雜的人類思維[45]。當(dāng)然,這些嘗試都需要基于多學(xué)科交叉融合(如腦科學(xué)、認(rèn)知心理學(xué)、思維模式、數(shù)理研究、生命逆向工程和計(jì)算機(jī)軟硬件系統(tǒng)等)。值得指出的是,隨著各類“智能”算法應(yīng)用的普及(如字符識別和對象檢測等),許多AI研究者和從業(yè)人員一直尋求對“人工智能”概念的重新定義,即“AI”一詞應(yīng)指代可真正實(shí)現(xiàn)“智能”行為的算法,而并非一些常規(guī)的“計(jì)算”行為,這也被稱為人工智能效應(yīng)(AI effect)[46]。特別是當(dāng)下某些行業(yè)對AI概念的過度宣傳、對智能工具的錯誤使用(如通過深度變臉和語音模擬技術(shù)進(jìn)行詐騙)或傳播與實(shí)際不符的恐慌信息(如AI會短時(shí)間超越人類智能)等情況,均可能對AI的發(fā)展產(chǎn)生不利影響,導(dǎo)致下一輪AI寒冬的來臨[47]。
在植物研究中所使用的AI技術(shù)基本上等同于對各類傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法的應(yīng)用,為方便行文,下文中使用的“AI”一詞泛指所有與機(jī)器學(xué)習(xí)和智能系統(tǒng)相關(guān)的基礎(chǔ)算法、模型構(gòu)架和技術(shù)應(yīng)用。如圖2所示,對AI的應(yīng)用可見于各個(gè)植物研究領(lǐng)域,所用的技術(shù)一般屬于單一反應(yīng)型和有限記憶型的弱人工智能范疇,包括數(shù)據(jù)采集、多組學(xué)整合、對象檢測、性狀分析、關(guān)聯(lián)分析和趨勢預(yù)測等,為遺傳連鎖、基因挖掘、功能解析、分子育種、基因工程、栽培管理和農(nóng)業(yè)生產(chǎn)等提供解決方案[48]。最近10年來,使用了AI技術(shù)和算法的植物研究文獻(xiàn)數(shù)以10萬計(jì),在文獻(xiàn)綜述中很難做到面面俱到。因此下文將從開發(fā)框架和常用算法、基因挖掘和分子育種、病蟲害檢測預(yù)防、作物栽培和農(nóng)業(yè)生產(chǎn)等幾個(gè)方面對植物研究中的AI應(yīng)用案例進(jìn)行概述。
圖2 人工智能技術(shù)在各個(gè)植物研究領(lǐng)域中的應(yīng)用Fig.2 Applications of AI technologies in different areas of plant research
在過去10年中,針對傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型的研發(fā)獲得了飛速發(fā)展,各類開發(fā)框架和平臺(frameworks and libraries)為不同AI算法的軟件實(shí)現(xiàn)和開發(fā)調(diào)試提供了統(tǒng)一且便利的研發(fā)環(huán)境[49]。一些代表性的開發(fā)框架和平臺有:1)用于數(shù)字科學(xué)(data science)的開源機(jī)器學(xué)習(xí)庫,如Scikit-Learn[50]、深度學(xué)習(xí)庫Theano[51]和基于C++的Caffe[52]等;這些框架相對簡潔,獲得了開源社區(qū)的廣泛支持;但由于它們在工程設(shè)計(jì)和擴(kuò)展性上的局限性,很難保證它們的工業(yè)級部署和對各種加速硬件的支持(如神經(jīng)處理單元);2)2015年,谷歌推出了第一款由工業(yè)界主導(dǎo)的學(xué)習(xí)框架TensorFlow 1.0[53],憑借其良好的性能、完備的功能和基于數(shù)據(jù)流圖的框架,吸引了廣泛關(guān)注;但由于其1.0版本的開發(fā)體驗(yàn)并不友好,因此谷歌重建了生態(tài)系統(tǒng),并于2019年推出TensorFlow 2.0,包括用于移動和嵌入式設(shè)備的TensorFlow Lite和支持大規(guī)模產(chǎn)業(yè)級部署的TensorFlow Extended;2.0版本還特別集成了開源神經(jīng)網(wǎng)絡(luò)庫Keras,大大降低了開發(fā)深度學(xué)習(xí)模型的難度[54];3)2017 年,臉書AI(現(xiàn)更名為Meta AI)和微軟共同推出了PyTorch,因其簡潔的系統(tǒng)設(shè)計(jì)和可即時(shí)執(zhí)行的動態(tài)圖模式,受到了科研界的追捧[55];1年后Caffe 2并入PyTorch,使其在多系統(tǒng)部署上得到了進(jìn)一步的提升;4)現(xiàn)在流行的框架還包括亞馬遜支持的Apache MXNet、微軟推出的CNTK toolkit、基于Python的Chainer以及通過Java編寫的Deeplearning4j等[56]。
隨著深度學(xué)習(xí)重要性的不斷增加,中國的領(lǐng)軍企業(yè)也相繼推出了各類國產(chǎn)開發(fā)框架和平臺。例如:2012—2015年,曠視科技相繼推出了Face++和Brain++等AI云平臺,專注于圖像識別和深度學(xué)習(xí)算法優(yōu)化,提升了模型訓(xùn)練和預(yù)測的一體性[57];百度于2016年推出了飛槳開源框架(PaddlePaddle),通過重新設(shè)計(jì)前端編程界面和核心架構(gòu),以期兼顧高效和易用性[58];2020年,華為正式發(fā)布了MindSpore開源計(jì)算框架,借助AI處理器算力進(jìn)行全場景深度學(xué)習(xí),為分布式訓(xùn)練和多端部署提供了高效的智能解決方案[59]。在國際上,目前使用最廣泛的AI開發(fā)框架為PyTorch和TensorFlow,兩者均有開發(fā)成本低、應(yīng)用范圍廣和硬件支持完善等優(yōu)點(diǎn)。由于前者在使用上的簡潔性,該框架被廣泛應(yīng)用于科學(xué)研究中,如模型搭建及智能系統(tǒng)測試等工作;后者在生態(tài)體系和系統(tǒng)集成上具有較大優(yōu)勢,因此被大量應(yīng)用于各類產(chǎn)業(yè)級部署中。當(dāng)然,國產(chǎn)開發(fā)框架也在日益完善,隨著其可調(diào)用模塊的日趨豐富和中國廣大用戶群的支持,國產(chǎn)平臺必將在今后AI研究和生產(chǎn)中獲得更廣泛的使用。表1匯總了部分具有代表性的AI(機(jī)器學(xué)習(xí)和深度學(xué)習(xí))開發(fā)框架、平臺、團(tuán)隊(duì)及相關(guān)簡介。
表1 各類AI(機(jī)器學(xué)習(xí)和深度學(xué)習(xí))開發(fā)框架、平臺、團(tuán)隊(duì)和相關(guān)簡介Table 1 A variety of AI(machine learning and deep learning)development frameworks, libraries,R&D teams,and brief introductions
在植物研究中廣泛使用的各類AI算法基本上來自表1中介紹的框架和平臺[60]。以植物表型組學(xué)研究中經(jīng)常使用的數(shù)字化性狀提取為例,從細(xì)胞到大田層面可獲取多尺度植物表型組數(shù)據(jù)集(圖3),研究人員可根據(jù)生物學(xué)問題和對應(yīng)的對象特征,選取不同的AI算法進(jìn)行數(shù)字化性狀提取。如:1)通過語義(semantic,如U-Net,DeepLab、SegNet等[61-62])、實(shí)例(instance,如Mask R-CNN和YOLACT等[63])或全景(panoptic,如Upsnet和Panoptic-deeplab[64])等分割方法,算法可關(guān)聯(lián)可見光或多光譜圖像中特定區(qū)域和相應(yīng)的像素簇,以此提取感興趣區(qū)域(region of interest,ROI),并基于ROI中的形態(tài)或顏色空間等特征分析植物性狀參數(shù);2)基于各類圖像對植物防御機(jī)制進(jìn)行量化分析(如病蟲害類別和發(fā)病程度等),常用的AI檢測模型有AlexNet、GoogLeNet、VGG、ResNet等[65],可端到端(end-to-end)完成對輸入圖像和病蟲害分類、發(fā)病程度的預(yù)測;3)對植物重要器官的動態(tài)分析可基于其生長發(fā)育(如基于時(shí)序?qū)λ氩亢突ㄋ幍绕鞴俚臋z測),可使用的AI算法包括R-CNN、YOLO、SSD MultiBox(single shot detector)等[66],通過對圖像序列中ROI的連續(xù)檢測完成器官區(qū)域提取和其動態(tài)表型的智能解析。
圖3 從細(xì)胞到群體的多尺度植物表型組數(shù)據(jù)采集以及各類有代表性的人工智能開發(fā)框架和平臺(圖片來源:周濟(jì)實(shí)驗(yàn)室)Fig.3 Multi-scale plant phenotyping datasets collected from cellular to population levels together with a range of representative AI development frameworks and libraries (image source:Zhou Ji Laboratory)
在植物基因挖掘和分子育種中,各類AI算法被應(yīng)用于基因表達(dá)分析、定位分子標(biāo)記、品種間表型差異分類等研究問題。在整合遺傳多樣性(genetic diversity)、跨物種轉(zhuǎn)錄組分析、基因挖掘和基因型-表型預(yù)測等方面,對AI的應(yīng)用取得了良好的效果。例如:Bheemanahalli等[67]使用Mask R-CNN對從數(shù)百個(gè)高粱品種采集的葉片氣孔密度(stomatal density)和氣孔復(fù)合面積(stomatal complex area)表型進(jìn)行統(tǒng)計(jì),通過全基因組關(guān)聯(lián)分析(GWAS)鑒定了71個(gè)單核苷酸多態(tài)性(SNP),其中約一半與先前報(bào)道的位點(diǎn)重合;Ferguson等[68]結(jié)合光學(xué)斷層掃描(optical tomography)和CNN分析了不同高粱品種的葉片氣孔密度和葉面積質(zhì)量比的差異,再通過GWAS和TWAS分析鑒定了394個(gè)候選基因,其中75個(gè)是擬南芥葉片發(fā)育或水分利用的同源基因(putative orthologs);Colmer等[69]開發(fā)了表型采集和分析平臺SeedGerm,對小麥、大麥、玉米、番茄和油菜等作物的種子萌發(fā)過程進(jìn)行自動化采集,并基于監(jiān)督式機(jī)器學(xué)習(xí)(如隨機(jī)梯度下降算法)提取萌發(fā)表型組,繼而通過油菜群體的TWAS分析定位到了多個(gè)可靠候選位點(diǎn);Cheng等[70]基于進(jìn)化理論的機(jī)器學(xué)習(xí)方法(evolutionarily informed machine learning)對基因型-表型關(guān)系進(jìn)行預(yù)測,通過分析擬南芥和玉米轉(zhuǎn)錄組數(shù)據(jù),鑒定了進(jìn)化上較保守的氮素響應(yīng)基因,再使用XGBoost和GENIE3分別根據(jù)性狀特征和轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)中轉(zhuǎn)錄因子的關(guān)聯(lián)性,對鑒定的基因進(jìn)行排序,最后通過突變體構(gòu)建鑒定了8個(gè)與氮素利用率(nitrogen use efficiency)相關(guān)的轉(zhuǎn)錄因子;Hu等[71]整合了基因組、轉(zhuǎn)錄組及代謝組數(shù)據(jù),通過ML-LASSO(multi-layered least absolute shrinkage & selection operator)分析了3種組學(xué)數(shù)據(jù)及其對應(yīng)的遺傳特征(genetic features),并通過預(yù)測模型提升了水稻測產(chǎn)的準(zhǔn)確性;Sprenger等[72]結(jié)合轉(zhuǎn)錄組及代謝組標(biāo)志物預(yù)測馬鈴薯耐旱性,使用隨機(jī)森林模型提取轉(zhuǎn)錄組及代謝組標(biāo)志,先實(shí)現(xiàn)耐旱性的正確預(yù)測(95.7%),再通過簡化得到的20個(gè)代謝物和轉(zhuǎn)錄本構(gòu)成的最小標(biāo)志物組合(a minimal combination of metabolite and transcript markers),為育種中耗時(shí)耗力的干旱脅迫試驗(yàn)提供了新的解決方案;華中農(nóng)業(yè)大學(xué)的熊立仲和張建團(tuán)隊(duì)結(jié)合無人機(jī)可見光相機(jī)對水稻抗旱動態(tài)響應(yīng)的關(guān)鍵階段進(jìn)行采集,基于改進(jìn)后的VGG-16網(wǎng)絡(luò)提取水稻群體抗旱表型組(如卷葉、含水量及抗旱指數(shù)等),最后通過GWAS鑒定了111個(gè)候選位點(diǎn),除已報(bào)道的抗旱位點(diǎn)外,還包含了34個(gè)潛在的抗旱位點(diǎn)[73];中國科學(xué)院分子植物科學(xué)卓越創(chuàng)新中心的韓斌院士團(tuán)隊(duì)和南京農(nóng)業(yè)大學(xué)的周濟(jì)團(tuán)隊(duì)合作,先通過經(jīng)濟(jì)型無人機(jī)對多點(diǎn)多季的水稻群體低空采集大量基于時(shí)序圖像序列,再通過開源AirMeasurer平臺融合二維三維圖像處理和機(jī)器學(xué)習(xí)算法,提取不同生育時(shí)期的水稻靜態(tài)(如植株高度、冠層覆蓋度和各類植被指數(shù)等)和動態(tài)表型組(即不同農(nóng)藝性狀在關(guān)鍵生育期中的變化速率),并以此構(gòu)建預(yù)測模型對關(guān)鍵生育期(如抽穗期)進(jìn)行動態(tài)預(yù)測,最后還對提取的各類生長表型進(jìn)行QTL定位和GWAS分析,鑒定了多個(gè)可靠的基因位點(diǎn)及全新的候選位點(diǎn)[74]。
在全球氣候變化導(dǎo)致極端氣候頻發(fā)的大背景下,農(nóng)作物病蟲害發(fā)生呈種類多、程度重、頻次高、區(qū)域廣的趨勢,嚴(yán)重影響全球的糧食安全,據(jù)估病蟲害每年造成的全球農(nóng)作物損失高達(dá)2 200億美元[75]。近年來,AI在植物病蟲害自動識別、程度分類和預(yù)測預(yù)報(bào)等領(lǐng)域的應(yīng)用得到了長足發(fā)展,其研發(fā)策略可分為傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)2個(gè)方向。使用傳統(tǒng)機(jī)器學(xué)習(xí)首先需要基于領(lǐng)域知識選取與農(nóng)作物病蟲害高度相關(guān)的特征(如顏色、形態(tài)、紋理等),以此構(gòu)建特征向量;然后利用不同的監(jiān)督式機(jī)器學(xué)習(xí)算法(如支持向量機(jī)、貝葉斯決策、隨機(jī)森林等)完成對象識別和特征分類[76]。這類方法需要對病害類型、發(fā)病進(jìn)程和嚴(yán)重性等有深入的了解,基于特征工程(feature engineering)構(gòu)建分類器(classifier)。該方向的缺點(diǎn)是開發(fā)過程較為繁瑣,人工選取的特征較敏感,因此構(gòu)建的模型可能會缺乏泛化性,難以在田間復(fù)雜環(huán)境中區(qū)分相似或并發(fā)型病害(concurrent diseases);此外,如果獲取的病蟲害數(shù)據(jù)包含不完整或錯誤的特征,精心構(gòu)建的分類器也將無法正常運(yùn)行[77]。
深度學(xué)習(xí)算法的應(yīng)用為病蟲害特征提取提供了魯棒性較高的解決方案[78]。特別是大量開源標(biāo)記數(shù)據(jù)集的出現(xiàn)(如Plant Village、IP102、AI Challenger 2018等[79]),使AI模型的開發(fā)效率、訓(xùn)練和測試集構(gòu)建、算法調(diào)試及應(yīng)用場景都得到了大幅提升[38]。但開源數(shù)據(jù)集大多在可控條件下采集,并不能代表田間復(fù)雜多變的病蟲害情況,尤其是這類病害集缺少不同基因型、生長時(shí)期、地區(qū)和發(fā)病程度的元數(shù)據(jù)(metadata);因此,基于這些數(shù)據(jù)集訓(xùn)練的模型在不同生育期中識別田間病害時(shí)準(zhǔn)確率較低,很難在農(nóng)作環(huán)境下大規(guī)模應(yīng)用[80]?,F(xiàn)階段的病蟲害檢測一般還會結(jié)合不同成像技術(shù)(如熱成像、多光譜或高光譜成像、熒光成像和核磁共振成像等獲取植物散發(fā)的各類輻射)和病蟲害引起的植物顏色、形態(tài)、蒸騰速率、植被冠層和密度等特征信息開發(fā)AI算法[81]。其中一些較成功案例有:Itakura等[82]利用CNN對柑橘的熒光光譜進(jìn)行分析,通過熒光光譜峰值變化監(jiān)測柑橘的成熟度和染病程度;Nagasubramanian等[83]通過高光譜成像設(shè)備拍攝大豆健康或感染炭疽病的葉片樣本,再基于3D-CNN學(xué)習(xí)高光譜圖像中的關(guān)鍵波段中的光譜變化,以此完成對健康和感染大豆樣本的分類;Wu等[84]通過無人機(jī)搭載的高清可見光相機(jī)獲取數(shù)百個(gè)玉米品種的田間圖像(2 526張健康、3 741張病害),再通過CNN實(shí)現(xiàn)對玉米葉枯病的精細(xì)化分類;華南農(nóng)業(yè)大學(xué)和嶺南現(xiàn)代農(nóng)業(yè)實(shí)驗(yàn)室通過手機(jī)拍攝的方式獲取數(shù)萬張稻瘟病、假黑穗病、稻頸瘟、紋枯病、水稻白斑病和水稻褐斑病的圖像集,再從5種與ResNet相關(guān)的模型中選取3個(gè)最佳子模型,通過集成學(xué)習(xí)(ensemble learning)完成最終預(yù)測模型的訓(xùn)練和終端部署[85]。
AI在栽培管理和農(nóng)業(yè)生產(chǎn)中也有著廣闊的應(yīng)用前景。以預(yù)測不同生長條件下農(nóng)作物產(chǎn)量和品質(zhì)為例:1)在溫室環(huán)境下,通過整合時(shí)間卷積網(wǎng)絡(luò)(temporal convolutional network,TCN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),Gong等[86]基于溫室參數(shù)(溫度、濕度、二氧化碳、光輻射等)及不同番茄品種的產(chǎn)量來預(yù)測溫室內(nèi)其他經(jīng)濟(jì)作物的理論產(chǎn)量;2)Moon等[87]結(jié)合CNN 和MLP檢測甜椒坐果、膨大和成熟期的不同發(fā)育階段,并使用模型預(yù)測甜椒在田間生長環(huán)境下的各種可能生長形態(tài)和品質(zhì)分級;3)Riera等[88]以VGG-19為主干的RetinaNet 模型測算大豆豆莢數(shù),并根據(jù)田間獲取的大豆圖像估計(jì)產(chǎn)量,完成了對不同大豆基因型農(nóng)藝價(jià)值的排序;4)Bauer等[89]通過在線學(xué)習(xí)(online learning)動態(tài)優(yōu)化淺層CNN模型,基于超大規(guī)模航空圖像中將種植園中的生菜分為大、中、小3個(gè)類別,并以此評估生菜質(zhì)量和預(yù)測可投放市場的產(chǎn)量(marketable yield);5)Ma等[90]綜合利用多個(gè)公開數(shù)據(jù)集(如衛(wèi)星圖像、連續(xù)氣象數(shù)據(jù)、土壤屬性和玉米歷史產(chǎn)量等),開發(fā)了基于Bayesian networks的超大規(guī)模玉米測產(chǎn)模型,并在多年(2010—2019年)數(shù)據(jù)驗(yàn)證中取得優(yōu)于其他機(jī)器學(xué)習(xí)模型的結(jié)果;6)陳佳瑋等[91]將輕量級MobileNetV2-YOLOV4檢測模型集成于安卓智能手機(jī)中,通過手機(jī)俯拍的小麥冠層圖像,在田間通過手機(jī)算力離線完成了單位面積麥穗計(jì)數(shù)和不同小麥品種的小區(qū)測產(chǎn);7)東京大學(xué)的郭威團(tuán)隊(duì)基于主動學(xué)習(xí)(active learning)標(biāo)注數(shù)據(jù),為谷物穗檢提供了詳細(xì)的算法對比和多重優(yōu)化后深度學(xué)習(xí)檢測模型[92]。
農(nóng)業(yè)人工智能也已成為世界現(xiàn)代農(nóng)業(yè)發(fā)展的趨勢,如國家農(nóng)業(yè)信息化工程技術(shù)研究中心的趙春江院士[93]提出的“農(nóng)業(yè)從信息化發(fā)展到數(shù)字化、網(wǎng)絡(luò)化、再到智能化”,將大幅度提高中國農(nóng)業(yè)生產(chǎn)的“效率、效能、效益”等戰(zhàn)略目標(biāo)。AI與物聯(lián)網(wǎng)、農(nóng)機(jī)和各類農(nóng)業(yè)終端的結(jié)合既減少了作物栽培和農(nóng)業(yè)生產(chǎn)中的人工干預(yù),還提高了相關(guān)決策的準(zhǔn)確性和時(shí)效性,增進(jìn)了生產(chǎn)效率。例如:El Hoummaidi等[94]通過無人機(jī)繪制了迪拜的農(nóng)業(yè)區(qū)地圖,再結(jié)合可見光和近紅外波段和ArcGIS中的深度學(xué)習(xí)檢測算法分析了種植區(qū)中的植被覆蓋程度和樹林地理位置,為大規(guī)模可持續(xù)農(nóng)業(yè)測繪提供了大數(shù)據(jù)支撐;華中農(nóng)業(yè)大學(xué)的楊萬能團(tuán)隊(duì)通過結(jié)合超像素和重量級Panicle-SEG-CNN模型對田間拍攝的水稻穗部圖像進(jìn)行分割,通過對不同水稻品種、田間環(huán)境、拍攝角度和生育時(shí)期的室內(nèi)、外水稻圖像的擴(kuò)展訓(xùn)練,提高了算法的魯棒性,為量化水稻關(guān)鍵產(chǎn)量構(gòu)成因素提供智能系統(tǒng)[95];Reynolds等[96]結(jié)合分布式物聯(lián)網(wǎng)傳感器、表型工作站和云平臺構(gòu)建了CropSight 平臺,將小麥生長預(yù)測模型部署到分布式工作站上,完成了對不同小麥品種的田間全生育期評估。此外,AI技術(shù)還被應(yīng)用于農(nóng)用車輛和無人機(jī)導(dǎo)航定位和性能監(jiān)控上,如中國農(nóng)業(yè)大學(xué)的張漫團(tuán)隊(duì)[97]和南京農(nóng)業(yè)大學(xué)的周俊團(tuán)隊(duì)[98]結(jié)合激光雷達(dá)、全球?qū)Ш叫l(wèi)星系統(tǒng)、多傳感器同步、坐標(biāo)系配準(zhǔn)和實(shí)時(shí)牽引力控制等智能系統(tǒng),基于RANSAC、crop-box和Bekker等算法,提高了在大田環(huán)境下農(nóng)用車輛檢測與識別障礙物的能力,優(yōu)化了智慧農(nóng)機(jī)的控制效率;此外,華南農(nóng)業(yè)大學(xué)的羅錫文院士團(tuán)隊(duì)通過結(jié)合智能農(nóng)機(jī)和近實(shí)時(shí)數(shù)據(jù)交互,在水稻生產(chǎn)中提出了智能無人農(nóng)場模式,為今后智慧農(nóng)業(yè)的發(fā)展提供了有益借鑒[99]。
全球氣候的快速變化更加劇了全球范圍內(nèi)的政治和社會不穩(wěn)定、勞動力短缺、農(nóng)業(yè)用地萎縮、病蟲害頻發(fā)和極端天氣等問題。因此如何經(jīng)濟(jì)高效保護(hù)農(nóng)作物種質(zhì)資源、加速新品種選育和各類農(nóng)作物相關(guān)研究,其重要性和緊迫性不言而喻。作為中國七大“新基建”中的重點(diǎn)發(fā)展領(lǐng)域,在可見的將來AI會擔(dān)負(fù)起應(yīng)對全球挑戰(zhàn),高效助力習(xí)總書記提出的“促進(jìn)農(nóng)業(yè)全面升級、農(nóng)村全面進(jìn)步、農(nóng)民全面發(fā)展”的鄉(xiāng)村振興戰(zhàn)略。
通過AI技術(shù)與植物研究結(jié)合,實(shí)現(xiàn)世界領(lǐng)先的種質(zhì)資源分類、品種選配、優(yōu)質(zhì)基因挖掘、農(nóng)藝性狀預(yù)測以及智能栽培和生產(chǎn)決策,需要從海量生物數(shù)據(jù)集中提取優(yōu)質(zhì)農(nóng)藝性狀與環(huán)境關(guān)聯(lián)規(guī)律,通過基因工程和精準(zhǔn)化育種設(shè)計(jì)、高效實(shí)現(xiàn)突破性品種的培育。當(dāng)然對AI技術(shù)的選擇需要根據(jù)各類植物研究中的應(yīng)用場景進(jìn)一步細(xì)分,在日益依靠大數(shù)據(jù)的生命科學(xué)領(lǐng)域發(fā)揮現(xiàn)階段AI系統(tǒng)特有的大數(shù)據(jù)解析優(yōu)勢,為廣大農(nóng)業(yè)工作者提供可靠的解決方案。對于AI在植物研究中的發(fā)展,引用清華大學(xué)張鈸院士提出“第三代人工智能”的理論體系[100]:未來的AI算法研發(fā)和應(yīng)用可基于改善模型的可解釋和魯棒性,發(fā)展安全、可靠、可信及可擴(kuò)展的AI技術(shù)。在尋求AI和植物研究高度融合的基礎(chǔ)上,逐漸完成從“感知”進(jìn)入“認(rèn)知”的創(chuàng)新應(yīng)用。
筆者領(lǐng)導(dǎo)的中國南京農(nóng)業(yè)大學(xué)和英國劍橋作物研究中心聯(lián)合表型實(shí)驗(yàn)室以多尺度植物表型組研究為切入點(diǎn),通過各類AI模型構(gòu)建了從細(xì)胞組織、器官植株,到小區(qū)大田等各層面的自動化、智能化性狀提取算法系列(圖4)。此外,該實(shí)驗(yàn)室還對融合領(lǐng)域知識和高維度生物數(shù)據(jù)集對AI在植物研究中的創(chuàng)新應(yīng)用進(jìn)行了有益嘗試,包括:1)通過高光譜成像系統(tǒng)對植物豐富光譜特征完成采集后,基于數(shù)百個(gè)光譜波段及其光譜變化與各種植物生理生化指標(biāo)進(jìn)行關(guān)聯(lián),以此分析對應(yīng)的植物健康和脅迫(如各類生物和非生物脅迫)狀況;然而傳統(tǒng)方法實(shí)現(xiàn)多維數(shù)據(jù)集的精細(xì)化分類非常困難,因此實(shí)驗(yàn)室先通過少量人工標(biāo)記構(gòu)建基底分類模型,再基于不同場景下數(shù)據(jù)擴(kuò)展、在線學(xué)習(xí)和特征工程融合的方法擴(kuò)充基底模型,以期生成泛化性高的高光譜植物表型分類算法;2)隨著智能手機(jī)的普及,實(shí)驗(yàn)室還將AI模型通過模型壓縮及部署技術(shù)(如TensorFlow Lite)在手機(jī)端離線完成數(shù)據(jù)采集、特征檢測和分類預(yù)測,并通過與云平臺互聯(lián)動態(tài)改進(jìn)分析精度(即通過強(qiáng)化學(xué)習(xí)同步改進(jìn)終端和云端的模型),從而在田間通過智能手機(jī)算力近實(shí)時(shí)檢測關(guān)鍵生育時(shí)期、產(chǎn)量構(gòu)成因素和對植物病蟲害定級;3)實(shí)驗(yàn)室還與劍橋大學(xué)Eves-van den Akker團(tuán)隊(duì)開展深度合作,通過實(shí)例和全景分割相結(jié)合的方法,基于對神經(jīng)網(wǎng)絡(luò)的逆向工程(reverse engineering)解析網(wǎng)絡(luò)中梯度引導(dǎo)進(jìn)化的方法,以此動態(tài)改進(jìn)不同生育期中目標(biāo)對象在檢測網(wǎng)絡(luò)中的權(quán)重分配,對TB級圖像序列中的百萬個(gè)線蟲進(jìn)行了精確且快速提取,并基于動態(tài)表型算法[74]預(yù)測全生育期的線蟲表型差異,為基因組關(guān)聯(lián)分析、重要分子標(biāo)記精確定位及結(jié)果在分子育種中的快速應(yīng)用提供了全新的思路。
圖4 各類機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型在自動化性狀分析中的應(yīng)用(圖片來源:周濟(jì)實(shí)驗(yàn)室)Fig.4 Applications of varied machine learning and deep learning models in automated trait analysis (Image source:Zhou Ji Laboratory)
然而,現(xiàn)階段各植物研究領(lǐng)域中對AI技術(shù)的應(yīng)用還只是停留在對數(shù)據(jù)采集、處理和分析等特定任務(wù)上。AI算法和技術(shù)應(yīng)用應(yīng)該在融合多尺度、多生境、多源異構(gòu)植物數(shù)據(jù)集、大規(guī)模校驗(yàn)和標(biāo)準(zhǔn)化生物數(shù)據(jù),提高性狀解析適應(yīng)力和泛化力,以及結(jié)合軟、硬件和自動化技術(shù)為育種、栽培和農(nóng)業(yè)生產(chǎn)提供智能解決方案等方向上更進(jìn)一步:幫助我們從海量的植物數(shù)據(jù)中獲取生長規(guī)律;通過多組學(xué)融合和智能功能解析對環(huán)境變化下的選育趨勢做出精準(zhǔn)預(yù)測;加快基因挖掘和分子育種與栽培管理和農(nóng)業(yè)生產(chǎn)的對接;在氣候變化背景下,根據(jù)我國多元化的農(nóng)業(yè)生態(tài)資源和品系差異提供定制化的應(yīng)對措施。當(dāng)然,這一輪AI浪潮中的創(chuàng)新和技術(shù)應(yīng)用浩如煙海、燦若星辰。本文也只能以點(diǎn)帶面,以期為AI創(chuàng)新應(yīng)用在中國植物研究、遺傳育種、栽培管理和農(nóng)業(yè)生產(chǎn)中早日普及,為中國盡快達(dá)到并超越國際領(lǐng)先水平拋磚引玉、集思廣益。