2015年11月,23位生物學頂級科學家策劃了一個生物學領域的登月計劃,地球生物基因組計劃(Earth BioGenome Project,EBP),旨在用10年時間對地球上所有真核生物(約150萬種物種)進行測序、分類和表征,估計耗資高達47億美元。2018年4月24日,24位跨學科科學家組成的工作小組在PNAS期刊發(fā)文概述對EBP的科研展望。
十年路線圖
EBP計劃分三個階段完成。第一階段(3年),在每個科(總計約9300個)中至少詳細解讀一個代表性成員的基因組序列;第二階段(3年),在每個屬(總計約15萬個)中選一個物種進行較為粗略的測序;第三階段(4年),完成對剩下物種的粗略測序。
機遇與挑戰(zhàn)
樣品采集:制定憑證標本收集的全球戰(zhàn)略、完整保存標本以進行高質量的基因組組裝是目前面臨的主要挑戰(zhàn)。這需要博物館、植物園、動物園和水族館等以實現(xiàn)和保護生物多樣性為使命的機構積極參與。
運算和數(shù)據(jù)科學:存儲序列數(shù)據(jù)、組裝基因組序列、將相關物種的基因組與注釋對應起來等相關的運算挑戰(zhàn)已解決;目前學術超算機中心已接近后期所需運行規(guī)模,但在效率、準確性和應用于復雜基因組方面有待進一步改良;新的計算工具和分析方法也需要新的架構、算法和軟件等來提高質量、效率,降低成本,并實現(xiàn)數(shù)據(jù)分析、大數(shù)據(jù)可視化和數(shù)據(jù)共享等。
信息獲取和利用共享:為確保遺傳資源的合理記錄和共享惠益的合規(guī)獲取,EBP將促進基因和基因組資源利用的下游監(jiān)控和追蹤,并為滿足國家和國際層面的需求,開發(fā)獲取和惠益共享承諾的相關系統(tǒng)。
丁陳君(中國科學院成都文獻情報中心)編譯自
http://www.pnas.org/content/115/17/4325
原文標題:Earth BioGenome Project:Sequencing life for the future of life