陳永孜,楊麗雯,李強,陳駿,王冬園,陳秋月,王卓智,李居怡,鄧艾平,韓勇,呂永寧,張玉
(1.天津醫(yī)科大學(xué)腫瘤醫(yī)院腫瘤細胞生物學(xué)實驗室,天津市腫瘤防治重點實驗室,國家腫瘤臨床醫(yī)學(xué)研究中心,天津市惡性腫瘤臨床醫(yī)學(xué)研究中心,天津 300060;2.華中科技大學(xué)同濟醫(yī)學(xué)院附屬協(xié)和醫(yī)院藥學(xué)部,湖北省重大疾病精準用藥醫(yī)學(xué)研究中心,武漢 430022;3.天津醫(yī)科大學(xué)生物醫(yī)學(xué)工程與技術(shù)學(xué)院,天津 300070;4.武漢市中心醫(yī)院,武漢 430024)
癌癥是由細胞基因組變化引起的遺傳疾病,包括點突變、插入突變、缺失突變和染色體易位。隨著研究技術(shù)的發(fā)展,在癌癥基因組學(xué)研究過程中,數(shù)據(jù)的收集呈爆炸式增長,從而引發(fā)癌癥基礎(chǔ)遺傳學(xué)研究的變革。在這種情況下,腫瘤生物信息學(xué)應(yīng)運而生,它采用各種生物信息學(xué)的方法對大數(shù)據(jù)包括DNA(基因組)、mRNA(轉(zhuǎn)錄組),蛋白質(zhì)序列(蛋白質(zhì)組)以及表觀遺傳組學(xué)等多組學(xué)數(shù)據(jù)進行分析,從而促進后基因組時代的科學(xué)技術(shù)進步,促使分子生物學(xué)家以一個全新的視角對癌癥的機制進行研究。雖然目前有許多成功的癌癥治療方法,但根據(jù)癌癥亞型和疾病階段的不同,許多患者對治療沒有完全反應(yīng),或者后期出現(xiàn)耐藥性轉(zhuǎn)移性疾病。
新一代測序技術(shù)是對現(xiàn)代各種測序技術(shù)的總稱,又被稱之為高通量測序,用于檢測給定DNA和RNA的核苷酸序列。與第一代測序和Sanger測序相比,新一代測序技術(shù)速度快,價格低,因此被廣泛應(yīng)用于基因組變異檢測、轉(zhuǎn)錄組分析以及miRNA表達譜等研究中[1-3]。新一代測序技術(shù)主要有3種:① Illumina (Solexa) 測序,它是目前世界范圍內(nèi)應(yīng)用最為廣泛的新一代測序技術(shù)。它主要基于邊合成邊測序的方法,優(yōu)點為覆蓋度高、速度快、拼接方法簡單,包括MiSeq,HiSeq以及NextSeq等多個系列。② Roche 454,基于焦磷酸測序的方法,比Illumina測序讀長要長一些,單端測序讀長可以達到400 bp,經(jīng)常用于基因組骨架的組裝。由于454測序技術(shù)存在一些缺點,比如無法填補測序缺口和無法準確測量同聚物的長度等,導(dǎo)致很多用戶在實際應(yīng)用時不會選擇此技術(shù)。③ABI SOLID,是基于磁珠的大規(guī)模并行克隆連接DNA測序法,它的準確度非常高,但由于系統(tǒng)通量難以提升,且讀長短、成本高,以及拼接復(fù)雜,目前也不被廣泛應(yīng)用。
新一代測序技術(shù)在基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)中的應(yīng)用,使研究者能夠?qū)Ω鞣N新的假設(shè)進行驗證,從而促進癌癥研究的發(fā)展。而這些大規(guī)模測序技術(shù)的應(yīng)用也可以獲取大量與特定癌癥相關(guān)的基因變異和表達情況,并能夠整合分子特征和臨床特征來預(yù)測不同藥物對癌癥治療的反應(yīng)。在精準醫(yī)學(xué)的時代背景下,從患者那里收集大量臨床和組學(xué)數(shù)據(jù),從而找到潛在的藥物靶點,并將結(jié)果應(yīng)用到臨床是當(dāng)前的主流方向。更為重要的是,這項研究有助于解釋由腫瘤異質(zhì)性引起的耐藥性。通過將藥物反應(yīng)數(shù)據(jù)與表型、基因組學(xué)數(shù)據(jù)以及患者臨床信息相結(jié)合,制定個性化的治療策略是精準醫(yī)療的主要目的。筆者擬對新一代測序技術(shù)在抗癌藥物精準治療中的應(yīng)用逐一闡述。
1.1WGS簡介 WGS是癌癥和復(fù)雜遺傳性疾病等許多醫(yī)學(xué)研究項目的主要研究手段。研究人員發(fā)現(xiàn),外顯子以外的DNA變異也會影響基因活動和蛋白質(zhì)的生成,并導(dǎo)致遺傳性疾病——而全外顯子基因測序則無法捕捉這一變化。WGS通過全自動DNA測序方法和計算機軟件來組裝高通量的序列片段,對個體DNA中所有核苷酸順序進行測定,從而檢測基因組任何部分的變化。研究者可以通過對腫瘤的基因組進行測定,將腫瘤進一步細化成各種亞型,并找到相應(yīng)的藥物治療靶點。
1.2WGS的應(yīng)用 目前,WGS已經(jīng)被用作研究工具廣泛應(yīng)用到臨床上。特別是對個性化醫(yī)療和藥物抗性的檢測,全基因組序列數(shù)據(jù)都是指導(dǎo)治療干預(yù)的一個重要工具。通過臨床試驗,根據(jù)患者的基因情況和對藥物的反應(yīng)來決定藥物試驗的參與者,可以使得新藥開發(fā)的成本更低、周期更短。因此,對于一次能夠快速、廉價地為數(shù)千個樣本測定數(shù)千個單核苷酸多態(tài)性(single nucleic acid polymorphism,SNPs)的技術(shù)非常受歡迎。隨著人類基因組計劃完成,迄今已發(fā)現(xiàn)約1200萬個真正的SNPs。然而,大多數(shù)尚未與疾病易感性或藥物反應(yīng)有關(guān)。在需要治療的患者中尋找與藥物反應(yīng)相關(guān)的SNPs,對于個性化治療以及選擇正確的藥物和劑量非常重要。很多制藥公司和研究機構(gòu)都致力于識別與多基因性狀相關(guān)的SNPs,對癌癥進行基因分型以便發(fā)現(xiàn)新的治療靶點。目前,已有很多研究通過WGS對SNPs進行測定來發(fā)現(xiàn)與藥物治療反應(yīng)有關(guān)的SNPs。比如,NIVEDITHA 等[4]通過對成骨肉瘤的血液細胞進行WGS,從26個與復(fù)發(fā)有關(guān)的基因中發(fā)現(xiàn)與藥物反應(yīng)有關(guān)的SNPs。 NASTASE等[5]通過對IIIA期非小細胞肺癌化療患者全基因組數(shù)據(jù)進行分析,來預(yù)測患者是否對誘導(dǎo)化療有所反應(yīng),通過確定患者是否含有特定的突變來決定是否進行手術(shù),類似的研究還有三陰性乳腺癌,肺癌和卵巢癌等[6-9]。
2.1WES簡介 外顯子(基因組的蛋白質(zhì)編碼區(qū)域)在整個基因組中占比<2%,而WES則覆蓋超過95%的外顯子,其中含有與人類疾病表型相關(guān)大多數(shù)基因變異。WES 使研究人員能夠更高效地利用測序和分析資源,集中研究基因組中最重要的部分,促進常見和稀有變異的發(fā)現(xiàn)和驗證??傮w來講,WES除了價格比WGS有優(yōu)勢以外,還具有WGS的許多優(yōu)勢,可以有效地識別各種變異。
WES可以快速準確對腫瘤及其配對正常組織樣本的外顯子區(qū)域進行測定,從而確定每種癌癥類型的癌癥驅(qū)動基因。雖然研究者們在癌癥療法方面取得了一定進展,但這一進程仍然比較緩慢。WES在抗癌藥物治療中的應(yīng)用與WGS基本上是一致的。比如,通過比較藥物反應(yīng)組和藥物抗性組來發(fā)現(xiàn)與藥物敏感性有關(guān)的基因突變,SNP和腫瘤突變負荷以及拷貝數(shù)變異等[10-13]。雖然這些研究都取得很多進展,但是仍迫切需要強大穩(wěn)定的生物標志物來預(yù)測一些患者對于治療的耐藥性。隨著測序技術(shù)的飛速發(fā)展和成本的降低,利用基因組信息為患者選擇最有效的治療方案并盡量減少副作用將很快成為現(xiàn)實。
2.2WES的應(yīng)用 WES的主要應(yīng)用之一便是腫瘤突變負荷(tumor mutation burden,TMB),它通常以每百萬腫瘤基因組區(qū)域中包含的腫瘤體細胞突變總數(shù)來表示,單位為mutations/Mb,可以用來代表蛋白編碼區(qū)的非同義突變分布的密度,在生物標志物研究中受到廣泛關(guān)注。一般來講,TMB主要針對蛋白編碼區(qū)中有可能使腫瘤細胞產(chǎn)生新抗原的非同義突變。TMB越高,其腫瘤細胞中能被免疫系統(tǒng)識別的腫瘤新抗原的數(shù)量可能越多,被免疫系統(tǒng)識別的概率越高,免疫檢查點抑制劑激活機體自身的抗腫瘤免疫應(yīng)答反應(yīng)后,殺傷這些腫瘤細胞概率越大。一般來講,每兆序列中含有超過10個突變的患者被認為是高腫瘤突變負荷,有些研究也把>20 mutations/Mb認為是高腫瘤突變負荷。目前,最直接有效計算TMB的方法就是WES,然而考慮到實驗周期和成本,也有根據(jù)不同靶向基因設(shè)計的各種檢測組合(panel),從而降低成本,然而得到的TMB分值沒有全外顯子得到準確。通過比較患者腫瘤組織和配對正常組織的全外顯子或者靶向測序序列,可以得到腫瘤中體細胞突變的數(shù)量,進而計算TMB,再結(jié)合統(tǒng)計學(xué)方法進行建模,從而對患者預(yù)后或者藥物反應(yīng)進行預(yù)測。比如,研究者為TMB分析開發(fā)一種新的算法,用于預(yù)測檢查點抑制劑免疫療法的反應(yīng)[14]。而通過分析不同基因或者基因集與TMB的關(guān)聯(lián)性,尋找與化療或者免疫治療相關(guān)的生物標志物,也是非常熱門的研究[14-18]。
3.1轉(zhuǎn)錄組測序 RNA分子在各種生物過程中扮演重要角色,在抗癌藥物的治療研究過程中非常重要。測序是研究RNA非常重要的工具,比如對于信使RNA來講,常用的高通量手段有RNAseq和基因表達譜芯片。而RNAseq與表達譜芯片比較,可以提供更大的測序范圍和更高的靈敏度,同時消除芯片固有的偏差。此外,有研究表明,特定的轉(zhuǎn)錄本與藥物反應(yīng)有關(guān),因此,RNAseq在尋找與藥物反應(yīng)有關(guān)的生物標志物時更有優(yōu)勢。
3.2轉(zhuǎn)錄組測序的應(yīng)用 基因表達分析是RNA測序的主要應(yīng)用之一,已被制藥公司和研究機構(gòu)廣泛使用,用來檢測SNPs、基因融合和拼接事件等水平。通過二代測序技術(shù)對mRNA進行測定首先需要制備mRNA文庫。對于文庫的構(gòu)建來講,最終目的都是盡可能提高文庫的復(fù)雜度。目前,也有很多成熟的商業(yè)化試劑盒,用戶可以根據(jù)需要來進行選擇。信使RNA測序技術(shù)已成為功能基因組學(xué)研究中一項非常關(guān)鍵的實用技術(shù),它主要通過檢測人類基因組的表達情況,找到兩組患者(藥物敏感和藥物抗性)顯著差異表達基因,通過通路富集分析或者進一步實驗驗證,即可發(fā)現(xiàn)與癌癥耐藥有關(guān)的基因,及其信號通路等信息[19-20]。
在個性化醫(yī)學(xué)的發(fā)展中,通過RNA測序發(fā)現(xiàn)的生物標志物,最終目的是為癌癥患者的診斷、監(jiān)測和分類提供更高的應(yīng)用價值。通過RNA測序進行高通量生物標志物篩選后,研究人員通常會進行配套診斷檢測并開發(fā)驗證,最后申請藥物監(jiān)督部門批準。比如,在 2014 年,RIMSZA等[21]發(fā)現(xiàn)一個由20個基因組成的表達譜能夠?qū)浡源驜細胞淋巴瘤(diffuse large B cell lymphoma,DLBCL)進行分類。塞爾金公司隨后與NanoString合作,根據(jù)研究結(jié)果開發(fā)配套診斷測試,對參與DLBCL治療的臨床試驗患者進行篩查,最終成功地應(yīng)用到臨床上。
小RNA是一類的非編碼RNA分子,長度<200 nt。小RNA的種類包括miRNA、siRNA、piRNA、snoRNA、tsRNA、srRNA和snRNA。這些小RNA在基因沉默和基因表達的轉(zhuǎn)錄后調(diào)節(jié)中起著至關(guān)重要的作用,涉及許多生物過程,包括細胞增殖、分化以及凋亡。一些研究結(jié)果表明,小RNA與癌癥的發(fā)生和發(fā)展,以及抗腫瘤耐藥性有關(guān)。例如,通過miRNA測序分析,研究人員發(fā)現(xiàn)miR-17的過度表達與結(jié)腸癌的化療抗性有關(guān)[22]。miR-34參與胃癌、前列腺癌和乳腺癌耐藥性的調(diào)節(jié)[23-25]。在腫瘤組織中發(fā)現(xiàn)piR-4987、piR-20365、piR-20485 和 piR-20582 的表達水平顯著上調(diào)[26]。
一種成功的新藥必須滿足當(dāng)前的醫(yī)療需求,在安全性或療效方面應(yīng)明顯優(yōu)于當(dāng)前的標準。最近的動物和人類試驗數(shù)據(jù)表明,抗miRNA化合物通過抑制特定miRNA,有可能成為一個全新的藥物類型。此外,miRNA 有幾個顯著的優(yōu)點,首先它們很小,并且是由已知序列組成,而且在物種之間非常保守,從藥物開發(fā)的角度來看,這些優(yōu)點非常有吸引力。近年來,miRNA測序為鑒定新藥靶點提供了更多的機遇?;趍iRNA在疾病狀態(tài)中的作用及其在疾病細胞調(diào)節(jié)中的作用,miRNA的調(diào)控在藥物研究中是非常具有潛力的。因此,研究小RNA在腫瘤學(xué)中的作用,將促進研究者們對腫瘤病理進展的認識,加速發(fā)現(xiàn)新的抗腫瘤療法。
對免疫系統(tǒng)的深入了解是現(xiàn)代醫(yī)學(xué)與治療相關(guān)發(fā)展的核心。免疫組庫是指在任何時間,某個個體的循環(huán)系統(tǒng)中所有功能多樣性B細胞和T細胞的組合。免疫組庫測序主要以T/B淋巴細胞為研究目標,對B細胞受體和T細胞受體的互補決定區(qū)進行擴增。該區(qū)域包含三個部分,在抗原識別中起著很重要的作用。結(jié)合高通量測序技術(shù)對此區(qū)域的DNA或RNA進行測定,可以全面評估免疫系統(tǒng)的多樣性,深入挖掘免疫組庫與癌癥之間的關(guān)系。免疫組庫分析可以在生物醫(yī)學(xué)研究各個階段對免疫系統(tǒng)進行研究。由于免疫調(diào)節(jié)藥物旨在改變免疫系統(tǒng)的動態(tài)性質(zhì),免疫療法往往伴隨嚴重的副作用。通過對免疫組庫測序數(shù)據(jù)進行分析,將捕獲的信息進一步轉(zhuǎn)化為預(yù)測性生物標志物,以便更好檢測患者免疫檢查點的治療療效。比如,REUBEN等[27]通過免疫組庫測序發(fā)現(xiàn),病灶特有的突變會導(dǎo)致新抗原的內(nèi)部表達差異,從而改變腫瘤免疫原性,并形成T細胞克隆性差異。T細胞受體的腫瘤內(nèi)異質(zhì)性增高與術(shù)后疾病復(fù)發(fā)以及低生存率有關(guān)。此外,免疫組庫測序還可以用于癌癥亞型的分類[28]、生物標志物的發(fā)現(xiàn)[29]和微小殘留病的檢測[30]等。
不同細胞類型的功能往往是不同的,而具體哪種細胞類型會導(dǎo)致疾病是很多科學(xué)家一直致力于解決的問題。以往大多數(shù)研究是在整個組織樣本上進行的,這些樣本由數(shù)百萬種不同類型和功能混合在一起的細胞組成。雖然這種研究對于比較組織(例如藥物治療之前和之后)的一般特征非常有用,但它們在了解組織內(nèi)不同細胞類型的特征和反應(yīng)能力方面非常有限。最近,單細胞RNA測序(scRNA-seq)技術(shù)的進步可以大規(guī)模對單個細胞中的基因表達進行深入分析,為探索細胞類型內(nèi)部和細胞類型之間表達的異質(zhì)性提供無限可能。它為研究組織中所有細胞的類型和研究單個細胞類型在疾病環(huán)境中的表達特征、表達豐度和相互作用方面的變化提供了一個新的機會。而且,scRNA-seq也可以揭示與疾病相關(guān)的意外新亞型或功能狀態(tài)。在癌癥研究中,對單個細胞的DNA進行測序可以提供各個小細胞群所攜帶的突變信息。而對單個細胞的mRNA進行測序則可以深入了解不同細胞類型的存在和它們的生物學(xué)行為。由于腫瘤異質(zhì)性的存在,單細胞測序可以很好地鑒定不同細胞對不同藥物的反應(yīng),從而揭示潛在的分子學(xué)機制[31]。它還可以通過對疾病過程和治療干預(yù)措施中的新藥靶點進行識別,從而在醫(yī)學(xué)領(lǐng)域提供尖端應(yīng)用[32]。
作為一個復(fù)雜型疾病,癌癥的治療受到多方面的影響。醫(yī)生和科學(xué)家們也一直在尋找更好的方法來治療癌癥患者。為此,他們開發(fā)并研究新的腫瘤藥物以及尋找新的治療方案來使用已有的藥物。一種新的腫瘤藥物從實驗室到臨床應(yīng)用是一個漫長的開發(fā)和審批過程,而這個過程往往需要很多時間和大量的資源。因此,老藥新用作為一種藥物研發(fā)策略,不僅可以縮短研發(fā)時間,降低研發(fā)成本,還可以減少研發(fā)風(fēng)險,受到越來越多的重視。新一代測序可以對基因組、表觀基因組、轉(zhuǎn)錄組、蛋白質(zhì)組以及代謝組數(shù)據(jù)進行測定,而計算機分析和處理能力的迅速發(fā)展和生物信息學(xué)的崛起使研究者們能夠從不同的數(shù)據(jù)中挖掘與癌癥治療藥物有關(guān)的生物標志物,進而得到可以穩(wěn)定應(yīng)用到臨床中的生物標志物,從而更為精準、系統(tǒng)地揭示不同疾病的分子機制。雖然通過科學(xué)家的不懈努力,發(fā)現(xiàn)很多可以用于指導(dǎo)藥物治療的生物標志物,然而由于數(shù)據(jù)的質(zhì)量和單個研究的數(shù)量問題,在應(yīng)用的時候會產(chǎn)生不穩(wěn)定的結(jié)果。也就是說單個研究發(fā)現(xiàn)的生物標志物缺乏可靠的魯棒性(Robustness)。如果研究者們可以將完整的數(shù)據(jù),尤其是用藥及其藥物反應(yīng)等臨床數(shù)據(jù)進行公開,那么對于發(fā)現(xiàn)穩(wěn)定的生物標志物無疑是非常有幫助的。此外,將多層次的數(shù)據(jù)進行整合對于抗癌藥物治療效果的研究來說也是一個非常有效的方法。鑒于癌癥的復(fù)雜程度,單個基因的突變或者表達有時很難對一種癌癥進行解釋。目前,各種組學(xué)的數(shù)據(jù)都可以通過新一代測序數(shù)據(jù)獲得,如果將這些數(shù)據(jù)進行整合分析,相信可以更加深入的了解不同藥物在癌癥治療中的作用。