朱學泰 景雪梅
(西北師范大學生命科學學院 甘肅蘭州 730070)
生物標本是將生物的局部或整體加工整理后保持其形狀和特征,用于學科教學、科學研究及陳列觀摩的實物[1]。它是人類認識自然的歷史見證,蘊含著與生物有關(guān)的大量信息,是人們進行生物物種鑒別的主要依據(jù),也是研究物種分布和系統(tǒng)發(fā)育的實物證據(jù)材料。在實驗教學中,生物標本作為專業(yè)的教具,起著訓練專業(yè)能力、提高實踐能力、培養(yǎng)科研能力的重要作用[2]。隨著分子生物學技術(shù)的迅猛發(fā)展,人們對生物標本的研究內(nèi)容已經(jīng)不局限于形態(tài)特征,標本的特定遺傳標記信息(例如特定的DNA序列)已經(jīng)成為物種分子鑒定和系統(tǒng)發(fā)育學分析的重要內(nèi)容。
目前很多生物學家在對生物標本進行研究的過程中,都會獲得相應標本的遺傳信息,這些遺傳信息的公布方式主要是上傳至某個基因序列庫(例如GenBank),從而獲得一個相應的登錄號,然后將這些登錄號在科研成果(如科研論文)中呈現(xiàn)。所以普遍存在著標本與其已有的遺傳標記信息相分離的現(xiàn)象,標本使用者若想獲得該標本已有的遺傳標記信息,主要通過以下幾種方法:①通過查找引用該標本的文獻,根據(jù)其館藏號獲得其特定遺傳標記信息的登錄號,去相應的數(shù)據(jù)庫下載后使用;②遺傳標記信息未上傳至數(shù)據(jù)庫中時,使用者只能自己重新測序,這不僅破壞了生物標本,還造成了研究工作的重復和浪費;③某些標本館將遺傳標記信息(例如DNA序列)打印后附于生物標本上,但打印出的DNA序列冗長,被使用時需要逐個字母輸入計算機使用,使用很不方便,且在輸入過程中極易發(fā)生錯誤,最終導致遺傳信息分析結(jié)果錯誤。因此標本的使用者在得到生物標本的同時,若能獲得該標本已有的特定遺傳標記信息,則對于該生物標本的使用將會更加準確和高效。
本方法利用二維碼技術(shù),將生物標本的遺傳標記信息(核酸序列、氨基酸系列等)轉(zhuǎn)化成為二維碼圖片,將該二維碼圖片打印后附于標本的標簽、記錄等處。使用者在借閱標本時,只要使用手機等具備二維碼掃描功能的設(shè)備,就能掃描獲得該標本的遺傳信息,用于生物學分析。
二維碼是按一定規(guī)律將特定的幾何圖形在平面(二維方向上)分布為黑白相間的矩形方陣,是用于記錄數(shù)據(jù)符號信息的條碼技術(shù),具有儲存量大、抗損性強、成本便宜等特性[3]。生物標本的遺傳標記信息主要是核苷酸序列和氨基酸序列,都是以英文字母的排列順序體現(xiàn)遺傳信息,可被轉(zhuǎn)化成為二維碼圖片,產(chǎn)生的二維碼圖片被掃描后又會以字母的形式呈現(xiàn)。
現(xiàn)行二維碼生成器較多,均可將攜帶生物遺傳信息的核酸或蛋白質(zhì)序列轉(zhuǎn)化為二維碼,其中“草料網(wǎng)”二維碼生成器尤其適合較長的DNA序列[4]。ITS序列是目前在生物學物種分子鑒定和系統(tǒng)發(fā)育學研究中最常用的分子標記之一[5-6],本文以一份大型真菌標本的ITS序列為例,使用“草料網(wǎng)”二維碼生成器和手機二維碼掃描工具,介紹DNA序列信息與二維碼的轉(zhuǎn)換方法。
2.1 序列來源 ITS序列來源為中國科學院昆明植物研究所隱花植物標本館一份厚瓤牛肝菌Hourangia cheoi標本,館藏號為HKAS 56182,該序列的GenBank登錄號為 KP136995,序列如下:GGATCATTATCCAAACAGAACAGGAAAGGATGGCGGGTAGAGATC AGACCCAACACTACACTTTCGATTAGATTCCGATTAGAAGACTTTG AAAGGAATTGAAAGAAATGGAATGGGAAAGACTTTGCCTCCTTGAT TTTCCTATTCATACTCACACCTGTGCACCTTTTGTAGATCCCTCTTGA AAGAGAGGGTATCTATGTCTTCATCATATCACACACAATGTATGGC CAGAATGTTAATAATAAAATACAACTTTCAGCAACGGATCTCTTGG CTCTCGCATCGATGAAGAACGCAGCGAATTGCGATAAGTAATGTGA ATTGCAGATTTCCAGTGAATCATCGAATCTTTGAACGCATCTTGCGC TCCTTGGTATTCCGAGGAGCATGCCTGTTTGAGTGTCATTAAATCAT CAACCGTCCTCTTTGTTTCAAGGAGGGACGGATTGGACTTGGGGGTT GCTGGCAGCAATGTCAGCTCTCCTTAAATGTATTAGCGATCGAGTTG GCTAGTCTTTCGGCATGCACGGCTTCGGACGTGATAAATATTTAGAT CGTCCTGGCTGGAGCGTCAATTCCTAGACTGTCCAAGTTAGATAGCT TCTAACCAGATCGATGGATAAAGTCTCGTCACTATGTGGGTCTATGG AGCTTAGTTACTAGACAGAGTCGAACACAAGCAAGATAGATCGCTC GAGATGAAAACTAGATCCAGATTTGATTTCTATCAAGTGAAATGAA AATGAAAACGAATGAGGAAAGACAAGCAAGAGCTTGGAGGACAGT GTCTGGTGGAAGTGGGTTCATGGAGCTTAGCTACTAGGCAGTCATT AGGTTGGCTGGCGAAGACGAGCGAGATGAACACATAAAGACCAAG GATGCTTGATCTCTTTCTTTCTATCTTTGTTTGATTTG
2.2 操作方法
1)瀏覽器搜索"草料網(wǎng)二維碼生成器",點擊進入工作頁面。
圖1 “草料二維碼”工作界面
2)復制上述序列,粘貼于在線二維碼生成器的文本空白欄處(圖2)。
圖2 序列轉(zhuǎn)換二維碼工作界面
3)點擊"生成活碼",系統(tǒng)自動生成該ITS序列的二維碼(圖3)。
圖3 序列二維碼
4)打印二維碼,附著于生物標本的標簽等處。
5)使用者通過二維碼掃描設(shè)備,掃描該二維碼后,可迅速獲得該標本的ITS序列。
圖4 掃描二維碼后得到原序列界面
將生物標本的遺傳標記信息轉(zhuǎn)化成二維碼,將有如下優(yōu)勢:①實現(xiàn)有效的信息共享。使用者在得到標本的同時,就能通過掃描二維碼迅速獲得其遺傳標記信息,避免查找文章、查找數(shù)據(jù)庫登錄號等繁冗的步驟,提高工作效率;②保證標本完整性,節(jié)約科研成本。研究者在獲得標本的遺傳標記信息后,很容易將其轉(zhuǎn)化為二維碼附在標本之上,后續(xù)使用者就不必再次在標本上取材料并進行重復的測序工作。③避免遺傳信息分析時的序列輸入錯誤。對二維碼進行掃描可獲得該遺傳信息的完整序列,可避免在人工輸入打印出的冗長序列時發(fā)生的錯誤。
隨著社會經(jīng)濟的發(fā)展,農(nóng)業(yè)、醫(yī)藥衛(wèi)生、環(huán)境科學、資源管理和生物技術(shù)等行業(yè)均要求生物學家能夠快速、準確而全面地提供某些生物標本的相關(guān)生物信息,生物遺傳信息以二維碼的形式附于生物標本上,將會給生物學家?guī)砗艽蟮谋憷?,使生物標本的使用效率大為提高?/p>