吳亞君,楊艷歌,李 莉,王 斌,劉鳴暢,陳 穎*
(中國檢驗檢疫科學研究院,北京 100123)
高通量二代測序基因條碼技術在油料作物種類鑒別中的應用
吳亞君,楊艷歌,李 莉,王 斌,劉鳴暢,陳 穎*
(中國檢驗檢疫科學研究院,北京 100123)
對高通量二代測序基因條碼技術在油料作物種類鑒別中的應用進行探索。采用Ion Torrent PGMTM測序技術,分別對橄欖、花生、大豆、油葵、玉米等14 種油料作物和小麥、大米的葉綠體核酮糖二磷酸羧化酶/氧化酶大亞基(ribulose-1,5-bisphosphate carboxylase/oxygenase large subunit,rbcL)基因246 bp聚合酶鏈式反應(polymerase chain reaction,PCR)產物混合物,及上述作物DNA混合液擴增得到的rbcL基因片段進行測序。結果表明,除小麥外,所有其他作物成分均獲得了鑒定。其中,PCR產物混合物中每種作物成分的測序讀數(shù)數(shù)量比例和該成分PCR產物在總產物中的比例接近,說明該技術可以用于定量分析。實驗結果初步證實了該技術對混合樣品中各作物種類鑒別的準確性,并具有檢測效率、流程簡便的特點,有望在未來成為食用油標識符合性查驗的有力工具。
二代測序;基因條碼;油料;檢測
食用油作為關系國計民生的大宗食品,質量監(jiān)管始終受到社會普遍關注。隨著各類高端小品種食用油的快速發(fā)展,一方面滿足了現(xiàn)代消費的需求,另一方面也受到摻假造假等市場亂象的困擾[1-3]。因此,建立快速準確的食用油身份鑒定方法,對完善現(xiàn)有的管理體系具有重要的現(xiàn)實意義。目前國內外對食用油的質量鑒別方法主要有兩種,第一種是感官判斷,這種方法雖然簡單,但缺乏嚴格標準,具有主觀性;第二種是理化指標,包括質譜、核磁共振、光譜及高效液相色譜等技術,主要依靠食用油中脂肪酸等化學組分判定食用油品種,雖然較為快速,但許多食用油品種之間缺乏顯著的特征成分指標,化學計量學方法依賴龐大的數(shù)據(jù)收集和處理,且不同加工工藝和產地來源樣品數(shù)據(jù)差異容易帶來判別不確定性。
在物種鑒別方面,基于基因序列的檢測方法相比于其他方法具有唯一性、穩(wěn)定性、易于標準化等優(yōu)點。目前,聚合酶鏈式反應(polymerase chain reaction,PCR)和實時熒光PCR技術已經成為食品質量安全關鍵技術,應用于食品真?zhèn)舞b別[4-9]、微生物快速檢測[10-11]、飼料中動物成分監(jiān)控[12-13]、過敏原檢測[14-15]等。近年來隨著測序技術的發(fā)展,基因條碼成為全球分類學、生態(tài)學、進化學等領域的研究熱點[16-17]。該技術是利用標準的、具有足夠變異、易擴增且相對較短的DNA片段自身在物種內的特異性和種間的多樣性而創(chuàng)建的一種新的生物身份識別系統(tǒng),從而實現(xiàn)對物種的快速自動鑒定[18]。與傳統(tǒng)的Sanger測序技術相比,二代測序結合模板分離和快速測序,擺脫了混合樣品克隆分離等復雜步驟的限制,可以在一次實驗中實現(xiàn)對復雜樣品中各種成分的高通量檢測[19-20]。本研究采用PGM芯片二代測序儀開展了14 種油料作物和小麥、大米核酮糖二磷酸羧化酶/氧化酶大亞基(ribulose-1,5-bisphosphate carboxylase/oxygenase large subunit,rbcL)基因小片段快速測定方法研究,以期為進一步開展混合食用油中油料成分的高通量檢測提供參考依據(jù)。
1.1 材料與試劑
14 種油料材料橄欖、花生、大豆、油葵、玉米、芝麻、山茶、菜籽、棕櫚粕、松子、腰果、榛子、棉籽、葵花籽以及小麥、大米,陰性材料豬、羊均為實驗室保存材料。
NucleoSpin?Food核酸提取試劑盒 德國Macherey-Nagel公司;Wizard?Magnetic核酸提取試劑盒 美國Promega公司;末端修復DNA純化試劑盒(gencourt?AMPure?XP Kit)、Ion Xpress Barcode Adapters試劑盒、Ion Library定量試劑盒、One Touch、Ion Torrent 314芯片和200bp讀長測序試劑盒 美國Life Technologies公司。
1.2 儀器與設備
Invitrogen Qubit?2.0、PGM芯片二代測序儀 美國Life Technologies公司;DU?640核酸蛋白分析儀 德國Beckman公司;2100 Bioanalyzer毛細管電泳儀 美國安捷倫公司;Veriti? 96梯度PCR儀 美國Applied Biosystems公司。
1.3 方法
1.3.1 引物設計
以植物葉綠體rbcL基因為目標序列,在GenBank數(shù)據(jù)庫內搜索多種植物的rbcL序列并用軟件進行比對,找到既具有種內保守性又具種間特異性的區(qū)域并設計植物通用引物,引物序列為F:5’ TTGGCAGCATTCCGAGTAAC-3’,R:5’-AGTAAACATGTTAGTAACAG -3’。
1.3.2 DNA提取
棕櫚粕采用NucleoSpin?Food核酸提取試劑盒提取DNA,其余樣品均采用Wizard?Magnetic核酸提取試劑盒提取DNA。通過DU?640核酸蛋白分析儀測定提取的DNA濃度和純度,每個樣品重復3次取平均值,并用無菌水將質量濃度調整至5 ng/μL,存于-20 ℃?zhèn)溆谩?/p>
1.3.3 PCR及電泳檢測
PCR擴增體系:10×Multi HotStart Buffer 5 μL,dNTP(2.5 mmol/L)2 μL,MgCl2(25 mmol/L)1.5 μL,上、下游引物(10 μmol/L)各0.5 μL,Multi HotStart Taq酶(5 U/L)0.2 μL,模板DNA(10 ng/L)5 μL,加滅菌雙蒸水(dd H2O)補齊至總體積25 μL。
PCR擴增程序:95 ℃預變性10 min;95 ℃變性30 s,50 ℃退火30 s,72 ℃延伸30 s,35個循環(huán),72 ℃再延伸5 min;4 ℃保存。PCR產物用2100毛細管電泳儀進行分析。
1.3.4 PCR產物處理
采用Invitrogen Qubit?2.0測定PCR產物濃度。
PCR產物的DNA末端修復按如下步驟進行:50 ng PCR產物,20 ?L 5×末端修復Buffer,1 ?L末端修復酶,加滅菌雙蒸水(dd H2O)補齊至總體積100 ?L,室溫(25 ℃)靜置20 min。
DNA純化步驟為:在修復后的PCR產物中加入180 ?L(1.8 倍)Agencourt?AMPure?Kit磁珠,混勻,室溫放置5 min,置于磁力架上至溶液澄清,去除上清液,加入新鮮配制的70%乙醇溶液,充分洗脫2次,待乙醇充分揮發(fā)后加入25 ?L 低鹽 TE緩沖液 (pH 8.0),渦旋10 s,置磁力架上約2~3 min,轉移上清液至1.5 mL離心管。
采用Ion Xpress Plus Fragment Library Kit進行接頭連接和缺口修復。反應體系為DNA 25 ?L;10×Ligase Buffer 10 ?L;Adapters 2 ?L;dNTP Mix 2 ?L;去除核酸酶的水51 ?L;DNA Ligase 2 ?L;缺口修復酶 8 ?L;共100 ?L。置PCR儀上25℃保持15 min;72℃保持5 min;4 ℃保存。
采用Ion Xpress Barcode Adapters 1-16 Kit分別加標簽以區(qū)分樣品,標簽1、2分別對應DNA mix和PCR mix。反應體系:DNA 25 ?L,10×Ligase Buffer 10 ?L,Ion P1 Adapter 2 ?L,Ion Xpress? Barcode X 2 ?L,dNTP Mix 2 ?L,去除核酸酶的水 49 ?L,DNA 連接酶 2 ?L,缺口修復酶8 ?L,共100 ?L。加入140 ?L(1.4 倍)Agencourt?AMPure?Kit磁珠,室溫放置5 min,置磁力架上重復DNA純化過程。用20 ?L低鹽TE緩沖液(pH 8.0)重懸。采用Ion Library定量試劑盒進行文庫定量。
1.3.5 測序
分別采用Ion template preparation kit、One Touch以及Ion Xpress template kit MyOne streptavidin C1 beads進行PCR乳化和ISPs富集。
Ion Torrent PGM平臺的序列檢測:采用Ion PGM Sequencing kit及Ion Torrent 314芯片,進行測序反應共65 個測序循環(huán),使用電阻率為18.2 MΩ?cm純化水標準壓縮氬氣驅動PGM內液體的流動,每個樣品設置重復3 次。
1.3.6 數(shù)據(jù)處理
采用Clustal Omega[21]進行DNA靶序列比對。根據(jù)Ion torrent PGMTM服務器自帶分析軟件對測序結果初步分析,得到整體數(shù)據(jù)量平均測序深度和參考序列匹配程度等數(shù)據(jù),并生成FASTA文件,采用NextGENe軟件(DEMO v 2.3.0)進行后續(xù)的序列數(shù)據(jù)結果分析。
2.1 通用引物的設計及PCR擴增
基因條碼技術一般通過1對通用引物,或多對通用引物的混合物,實現(xiàn)對廣譜物種的擴增。本研究對14 種油料和小麥、大米rbcL靶序列246 bp長度的基因片段進行序列比對,根據(jù)保守區(qū)域設計了1 對植物擴增通用引物(圖1)。并驗證其對14 種油料和小麥、大米的DNA以及DNA混合物的擴增情況。擴增結果表明:所有樣品均獲得明亮的條帶,產物目的片段在243~253 bp之間,除玉米、芝麻有微弱的非目標條帶外,其他物種均無非特異擴增(圖2)。說明所設計的通用引物對目標作物具有較好的特異性和覆蓋性。
圖1 14 種油料和小麥、大米rrbbccLL靶序列的比對結果Fig.1 Alignment of target sequences of rbcL genes in wheat, rice and 14 kinds of oil crops
圖2 通用引物rrbbccLL擴增產物2100毛細管電泳結果Fig.2 Amplification results of the rbcL universal primers by using 2100 capillary electrophoresis
2.2 測序分析
在序列匹配過程中,需要對物種的匹配率閾值做一個統(tǒng)一限制,故本研究對14 種油料和小麥、大米rbcL靶序列之間匹配率進行了兩兩比對。比對結果表明,靶序列平均相似度91.30%,其中油葵和普通葵花相似性最大,相似度為97.56%,其次為大豆和橄欖,相似度為96.75%(表1),據(jù)此將本實驗測序的物種匹配閾值定為98%。
表1 14 種油料和小麥、大米rbcL靶序列兩兩比對結果(相似度)Table 1 Results of pairwise sequence alignment of rbcL gene-target sequences in wheat, rice and 14 kinds of oil crops%
測序實驗針對4 個樣品分別進行:將橄欖、花生、大豆、油葵、玉米、芝麻、山茶、菜籽、棕櫚粕9 種油料PCR產物等體積混合,得到樣品1;將上述9種油料DNA混合擴增后得到的PCR產物為樣品2;將小麥、大米和14 種油料及2種陰性樣品的PCR產物等體積混合,得到樣品3;將上述和14 種油料以及小麥、大米、2 種陰性對照DNA混合擴增后的PCR產物為樣品4。按照1.3.4~1.3.6節(jié)的方法對4個樣品進行前處理和測序。其中第1次實驗包括樣品1和2,第2次實驗包括樣品3和4,2 次實驗分別在兩張芯片上進行。根據(jù)原始數(shù)據(jù)統(tǒng)計(圖譜未示),第1次實驗總通量為116.12 Mb,樣品1和樣品2的通量分別為60.4 Mb和54.5 Mb,平均讀長大于200 bp,最長讀長達330 bp。第2次實驗總通量為79.7 Mb,樣品3通量為37.1 Mb,樣品4通量為39.39 Mb,平均長度為179 bp。2次實驗4 個樣品的數(shù)據(jù)質控情況顯示,成功率99%以上(結果未示)。
圖3 油料成分和小麥、大米序列讀數(shù)統(tǒng)計結果Fig.3 Statistical results of components of wheat, rice and the oil crops by reading sequences
對測序結果進行數(shù)據(jù)分析,圖3是2 次實驗樣品序列與數(shù)據(jù)庫序列比對情況,包括等量模板擴增后PCR產物的比例,實驗樣品的PCR產物的等量混合物以及其DNA混合物的PCR產物的各成分讀數(shù)占所有讀數(shù)的比例,這里只計算與數(shù)據(jù)庫序列匹配率達到98%以上讀數(shù)的總和。其中讀數(shù)數(shù)量指每個物種匹配序列的數(shù)量,讀數(shù)比例指該物種匹配序列總和占一個芯片上所有有效序列的比例。從圖3可以看出,除了小麥的讀數(shù)數(shù)量太低不做計算外,其他所有物種均有匹配讀數(shù),但不同物種的讀數(shù)數(shù)量相差較大。
如圖3A顯示,除棕櫚粕外,PCR產物混合物(斜紋)中各油料成分的讀數(shù)比例與PCR產物比例數(shù)值比較接近,說明各個成分的PCR產物在芯片上分布均勻,對微孔的占有率和產物比例相當,芯片微孔與各種PCR產物的結合選擇差異性很小。油料DNA混合物的PCR產物(方塊)測序結果顯示各個成分讀數(shù)比例與PCR產物比例差異較大,說明通用引物對混合物中不同模板的擴增有選擇性,模板之間存在競爭或相互干擾,導致一些成分優(yōu)先擴增,例如大豆和芝麻,其序列在總體序列中比例較高,而其他成分序列比例明顯下降。
為檢驗樣品數(shù)的容量對測序是否有影響,本實驗將檢測物種增加至16 種(圖3B),PCR產物混合物(斜紋)的測序結果顯示,與相應PCR產物比例相比,棕櫚粕和油葵所占比例較低,葵花籽和芝麻比例較高,其他成分的讀數(shù)比例和PCR產物比例接近;而DNA混合物的PCR產物(方塊)中仍以大豆和芝麻居高,各個物種讀數(shù)比例與PCR產物比例差異較大。兩次檢測結果說明,在對混合成分的檢測中,由于不同物種擴增效率的差異和競爭等因素的存在,各成分的檢出率受影響,讀數(shù)比例與各個成分的實際比例之間的關系也變得復雜。
以上數(shù)據(jù)是針對14 種油料作物和小麥、大米的已知序列進行匹配的結果。而在食用油實際檢測過程中,摻假物種的成分及含量未知,因此將本研究中測得的序列直接在NCBI GenBank進行搜索,以驗證在物種身份未知的情況下樣品鑒定的準確性(結果未示)。除小麥和橄欖外,其他物種的測序序列均在NCBI數(shù)據(jù)庫中得到最佳匹配。但這種針對大數(shù)據(jù)庫的搜索受多種因素干擾,主要是植物基因組復雜,有關植物基因條碼的候選基因很多,目前還沒有定論。本研究嘗試了246 bp的rbcL靶序列,數(shù)據(jù)庫的檢索顯示許多無關物種也得到很高的匹配率,提示在油料物種的鑒定中,可以采取兩種方式提高鑒別準確性,第一是建立油料物種的小數(shù)據(jù)庫,減少無關物種的干擾;第二是增加基因數(shù)量,提高匹配的特異性。
基因條碼的概念由加拿大圭爾夫大學教授Hebert等[22]于2003年首次提出,即利用一段短的標準DNA序列對物種進行快速、準確的識別和鑒定,并希望以此建立起物種名稱和生物實體之間一一對應的關系,其原理與零售業(yè)中對商品進行辨認的商品條形碼相似,故而稱為基因條碼,代表了生物分類學研究的一個新方向?;驐l碼通過對一組來自不同生物個體的短的同源DNA序列進行PCR擴增和測序,隨后對測得的序列進行多重序列比對和聚類分析,從而將某個體精確定位到一個已描述過的分類群中。序列的選擇需要滿足兩個條件:1)必須具有相對的保守性,便于用通用引物擴增出來;2)要有足夠的變異能夠將物種區(qū)別開來。目前國際上針對動物基因條碼有比較一致的標準,即線粒體細胞色素C氧化酶亞基Ⅰ(cytochrome c oxidaseⅠ,COI)基因進行物種鑒定和發(fā)現(xiàn)隱種或新物種。相對于動物,COI基因在高等植物中進化速率較慢,因此植物條形碼研究以葉綠體基因組作為重點,但研究進展相對緩慢,目前尚處于對所提議各片段的比較和評價階段,還未獲得一致的標準片段,候選片段包括葉綠體上的rpoB、rpoC1、matK、rbcL、trnH-PSA及核基因組中ITS區(qū)域編碼序列等[23]。
本研究證實了二代測序技術對14 種油料作物和小麥、大米DNA混合物的檢測能力,并驗證了該技術的準確性和對油料物種的覆蓋度。雖然還有一些技術的細節(jié)有待進一步驗證,包括序列長度、成分數(shù)量的容量、樣品數(shù)的容量、序列匹配率閾值、食用油樣品DNA提取的效率等對準確性的影響,但總體上,基于二代測序的短片段基因條碼技術完全適用于油料混合成分的鑒別。下一步將開展該技術對其他基因檢測的有效性,探討該技術對食用油樣品的適用性。
[1] 丁俊. 進口橄欖油市場起風波[N]. 江蘇經濟報, 2012-01-10(A02).
[2] 姚芃. 進口橄欖油并非都貨真價實[N]. 中國國門時報, 2006-09-18(008).
[3] PE?A F, CóRDENAS S, GALLEGO M, et al. Direct olive oil authentication: detection of adulteration of olive oil with hazelnut oil by direct coupling of headspace and mass spectrometry, and multivariate regression techniques[J]. Journal of Chromatography A, 2005, 1074(1/2): 215-221.
[4] WU Yajun, CHEN Ying, GE Yiqiang, et al. Detection of olive oil using the Evagreen real-time PCR method[J]. European Food Research and Technology, 2008, 227(4): 1117-1124.
[5] BOTTERO M T, CIVERA T, ANASTASIO A, et al. Identification of cow’s milk in “Buffalo” cheese by duplex polymerase chain reaction[J]. Journal of Food Protection, 2002, 65(2): 362-366.
[6] DE S, BRAHMA B, POLLEY S, et al. Simplex and duplex PCR assays for species specific identification of cattle and buffalo milk and cheese[J]. Food Control, 2011, 22(5): 690-696.
[7] DALMASSO A, CICERA T, NEVE F L, et al. Simultaneous detection of cow and buffalo milk in mozzarella cheese by real-time PCR assay[J]. Food Chemistry, 2011, 124(1): 362-366.
[8] COSTA J, MAFRA I, AMARAL J S, et al. Monitoring genetically modi ed soybean along the industrial soybean oil extraction and re ning processes by polymerase chain reaction techniques[J]. Food Research International, 2010, 43(1): 301-306.
[9] D?BROWSKA A, WA?ECKA E, BANIA J, et al. Quality of UHT goat’s milk in Poland evaluated by real-time PCR[J]. Small Ruminant Research, 2010, 94(1/3): 32-37.
[10] 許業(yè)莉, 相大鵬, 蔡穎. 食源性致病微生物中應用于PCR檢測的靶基因[J]. 檢驗檢疫科學, 2003, 13(6): 52-54.
[11] YU Shuijing, CHEN Wanyi, WANG Dapeng, et al. Species-specific PCR detection of the food-borne pathogen Vibrio parahaemolyticus using the irgB gene identified by comparative genomic analysis[J]. FEMS Microbiology Letters, 2010, 307(1): 65-71.
[12] CHEN Ying, WU Yajun, WANG Jing, et al. Identification of cervidae DNA in feedstuff using a real-time polymerase chain reaction method with the new fluorescence intercalating dye Evagreen[J]. Journal of AOAC International, 2008, 92(1): 175-180.
[13] MANE B G, MENDIRATTA S K, TIWARI A K, et al. Polymerase chain reaction assay for identification of chicken in meat and meat products[J]. Food Chemistry, 2009, 116(3): 806-810.
[14] NéMEDI E, UJHELYI G, GELENCSER é. Detection of gluten contamination with PCR method[J]. Acta Alimentaria, 2007, 36(2): 241-248.
[15] DEMMEL A, HUPFER C, HAMPE E I, et al. Development of a realtime PCR for the detection of lupine DNA (Lupinus Species) in foods[J]. Journal of Agricultural Food Chemistry, 2008, 56(12): 4328-4332.
[16] KERR K C R, STOECKLE M Y, DOVE C J, et al. Comprehensive DNA barcode coverage of North American birds[J]. Molecular Ecology Notes, 2007, 7(4): 535-543.
[17] NEWMASTER S G, FAZEKAS A J, STEEVES R A D, et al. Testing candidate plant barcode regions in the Myristicaceae[J]. Molecular Ecology Resources, 2007, 8(3): 480-490.
[18] 任保青, 陳之端. 植物DNA條形碼技術[J]. 植物學報, 2010, 45(1): 1-12.
[19] YANG Lin, WANG Huijun, WU Bailin, et al. Preliminary application of next-generation ion torrent PMGTM platform on genetic diseases in pediatrics[J]. Chinese Journal of Evidence-Based Pediatric, 2013, 8(3): 210-215.
[20] LI Yuanyuan, WU Yajun, HAN Jianxun, et al. Species-specific identification of seven vegetable oils based on suspension bead array[J]. Journal of Agricultural Food Chemistry, 2012, 60(9): 2362-2367.
[21] Clustal Omega Cookies on EMBL-EBI website[EB/OL]. http://www. ebi.ac.uk/Tools/msa/clustalo/.
[22] HEBERT P D N, CYWINSKA A, BALL S L, et al. Biological identifications through DNA barcodes[J]. Proceedings of the Royal Society Biological Sciences, 2003, 270: 313-321.
[23] HOLLINGSWORTH P M, FORREST L L, SPOUGE J L, et al. A DNA barcode for land plants[J]. Proceedings of the National Academy of Sciences of the United States of America, 2009, 106(31): 12794-12797.
Application of High Throughput Next-Generation Sequencing Based on DNA Barcoding Technology in Species Identification of Edible Oils
WU Ya-jun, YANG Yan-ge, LI Li, WANG Bin, LIU Ming-chang, CHEN Ying*
(Chinese Academy of Inspection and Quarantine, Beijing 100123, China)
This study aimed to testify the application of second-generation sequencing based on DNA barcoding technology in the species identification of edible oils. Totally 14 species of oil crops including olive, peanut, soybean, oil sunflower, maize, sesame, camellia, rapeseed, palm and pine nut as well as rice and wheat were selected. Mixtures of the polymerase chain reaction (PCR) products of the 240 bp ribulose-1,5-bisphosphate carboxylase/oxygenase large subunit (rbcL) genes and the rbcL genes amplified from DNA mixtures of these 16 crop species were sequenced by Ion Torrent PGMTMrespectively. The results demonstrated that all crop species except wheat were successfully identified. As for two mixture samples, the reading ratio of each plant was consistent with the proportion of its PCR product. This study preliminarily proved that the combined technique is capable of identifying the plant species in blended oils accurately and efficiently. The procedure could be streamlined to be a promising detection method for oil product supervision in the near future.
next-generation sequencing; DNA barcoding; edible oil crops; detection
TS227
B
1002-6630(2014)24-0348-05
10.7506/spkx1002-6630-201424067
2014-03-26
國家高技術研究發(fā)展計劃(863計劃)項目(2011AA100807);公益性(質檢)行業(yè)科研專項(201110015)
吳亞君(1975—),女,副研究員,博士,研究方向為食品安全。E-mail:wuyajuncaiq@163.com
*通信作者:陳穎(1972—),女,研究員,博士,研究方向為食品安全。E-mail:chenyingcaiq@163.com