王燕青 孟依依
好奇心打開了人類本源魔盒。
白曉海點開手機上那個白底彩字的圖標,里面躺著一份關于他的基因檢測報告。報告的第一項是“祖源”,可以告知他的民族血統(tǒng),也意味著窺見祖先的繁衍、遷徙和發(fā)展史。此前他對自己的祖源沒有任何了解,并且很難了解。他看到在男性特有的家族溯源那一項中寫著“你可能是趙匡胤家族的后裔或同宗”。
“自己生得有點晚了。”白曉海想。
他花一個多小時看完了報告中所有基因信息,內向、能喝酒、沉穩(wěn)抗壓力、學習能力強被印證,擔心的事情最終也被印證——和姥爺、媽媽一樣,他有極大的風險會患上糖尿病。
去年4月,他在網(wǎng)上購買了一份基因檢測服務,在一個郵寄過來的透明收集管中留下2毫升唾液,然后寄回四川。
這是近兩年在市場上逐漸興起的消費級基因檢測,提供唾液后十天左右會為消費者反饋包括祖源、遺傳風險、營養(yǎng)需求、運動健身或個性特點等在內的個人報告。按照各色DNA創(chuàng)始人郭婷婷的定義,消費級基因檢測應該是經(jīng)過充分互聯(lián)網(wǎng)化并且可以形成持續(xù)更新報告的檢測,2006年創(chuàng)辦的美國基因檢測公司23andMe是其中典型。
唾液來到實驗室,從唾液中的上皮細胞和白細胞中提取 DNA后,檢測中心使用基因芯片檢測 75 萬個基因位點,機器將完成芯片的雜交、洗滌、掃描基因信號,然后你會看到一張蜂窩狀的熒光數(shù)據(jù)圖,將同一位點的熒光數(shù)據(jù)進行聚類分析,最后得到分型數(shù)據(jù)——原始基因數(shù)據(jù),一份英語字母和數(shù)字密密麻麻排列的txt文檔,包含每個人與生俱來的所有編碼。
更被人關心的則是對數(shù)據(jù)的解碼。
27歲的銷售總監(jiān)梁宵在各色DNA做過一次檢測,最近更新的一項數(shù)據(jù)顯示,在八個更易感到社交恐懼的基因中,他占據(jù)了五個。中學時代一直內向和不善與人相處的梁宵,曾經(jīng)在自責的情緒中花了很大力氣試圖讓自己變得外向。直到十天前,他看到報告上的“重度社恐”四個字才突然釋懷。
但是,人類在更加深入掌握了基因技術后,正逐漸向半神的方向演化。最近,俄羅斯和日本科學家正試圖通過基因技術復活猛犸象。
早在2018年,俄羅斯就投資590萬美元在世界上最寒冷的城市雅庫茨克建設克隆中心,支持科學家克隆冰河期滅絕的遠古巨獸們。一旦猛犸象被復活,大自然循環(huán)法則將被人為打破,人或將超越自然。
在這些聳人聽聞的事件背后,不可否認的事實是,人類掌握基因技術的深度已到了令人驚訝的地步。同時,基因技術在現(xiàn)實生活中的應用也越來越廣泛,各式基因檢測成為人們探尋生命本源的主要用途之一。
至本醫(yī)療科技創(chuàng)始人兼CEO王凱 圖/受訪者提供
美國是基因檢測最發(fā)達的國家,早在十多年前,就出現(xiàn)了23andMe、Ancestry、Helix和Human Longevity等為大眾提供消費級基因檢測的創(chuàng)業(yè)公司。美國一些知名人物也都是最早嘗試基因檢測的人。蘋果公司創(chuàng)始人斯蒂夫·喬布斯在罹患胰腺癌后曾花費10萬美元做了基因檢測,好萊塢明星安吉麗娜·朱莉也曾在2013年通過基因檢測切除了乳房,避免生乳腺癌的風險。
2013年,中國也迎來了基因檢測行業(yè)發(fā)展的浪潮,尤其是面向個體消費者的基因檢測產品。有兩百多家創(chuàng)業(yè)公司如雨后春筍般興起,上海至本醫(yī)療科技、23魔方、藥明康德等創(chuàng)業(yè)公司都是其中的頭部創(chuàng)業(yè)公司。而華大基因(300676.SZ)和貝瑞和康(000710.SZ)則是基因檢測行業(yè)里的龍頭企業(yè)。
2017年至2018年,美國FDA批準了一系列面向消費者的消費基因檢測產品,包括10種遺傳疾病的易感性測試產品和癌癥風險基因檢測項目,推動了整個行業(yè)的縱深發(fā)展。
王凱是上海至本醫(yī)療科技創(chuàng)始人,也是中國最早接觸基因檢測行業(yè)、并且持續(xù)投身于這個領域進行深入研究的從業(yè)者。從2001年至今,他在18年的時間里見證了全球基因檢測行業(yè)的發(fā)展,親身經(jīng)歷了從一代到二代測序技術的跨越,也見證了基因檢測技術從實驗室走向大眾社會的全過程。
2001年,王凱從白求恩醫(yī)科大學臨床專業(yè)畢業(yè),在中國科學院院士、中國科學院生物物理研究所研究員陳潤生的引領下,進入基因檢測領域,加入了華大基因公司。他也因此接觸到Sanger一代測序儀和生物信息學。
那時的生物信息學,完全是一門全新的學科,甚至在國內它還不能稱為一門學科。事實上,生物信息學是非常體現(xiàn)人類創(chuàng)造性的學科之一。在這門學科的邏輯框架下,可以用最基本的編程邏輯,通過程序去探測人類基因密碼。
華大基因為王凱打開了基因檢測世界的大門。在華大基因工作期間,他參與了“人類基因組計劃”的收尾工作,這個計劃于1990年啟動,由美、英、日、德、法、中六國共同參與,2000年公布了人類基因組草圖。
成立于1999年的華大基因是當時中國參加人類基因組計劃的主要力量之一。曾任北京華大基因研究中心總工程師的胡松年用“生命之書”來比喻人類基因組計劃,基因組測序相當于把字印在了書上,基因的功能與表達方式形成了詞句,但能不能讀懂這本書則取決于閱讀者自己的理解。“破譯生命之書”成為科學家、研究者的畢生追求。
這也在王凱的心中埋下了一顆種子。他想,有一天,基因研究會改變整個人類的進程和歷史。在人類浩瀚無窮的自我探索中,這將是意義非凡的一刻。他也由此堅定了自己在生物信息學方面深造的決心。
2003年人類基因組計劃公布了更為精細的人類基因圖譜,該項目研究結束后,王凱從華大基因辭職,到世界生物信息學最權威的丹麥科技大學生物序列分析中心(CBS)攻讀生物信息學研究生。
王凱的導師Soren Brunak教授是生物信息學的早期奠基人之一,曾任著名的Ensemble數(shù)據(jù)庫主席、ISMB主席,以及歐洲生物信息學中心主席等。王凱也是當時為數(shù)不多的中國學生之一。在導師的指導下,王凱把癌癥基因分析作為自己的研究方向。這也是后來在中國基因檢測市場成為最具商業(yè)價值和現(xiàn)實意義的領域之一。
在CBS讀書期間,王凱接觸了全球最為前沿的基因檢測項目。他參與了DNA元件百科全書計劃(Encyclopedia of DNA Elements,簡稱ENCODE計劃)。ENCODE計劃是美國國家人類基因組研究所在2003年9月發(fā)起的項目,也是繼“人類基因組計劃”后,全球最重要的基因檢測項目,在人類基因測序基礎上,研究序列的基因結構和功能的識別。
2007年,基因二代測序(Next Generation Sequencing,以下簡稱NGS)技術逐漸成熟, Illumina推出了第二代測序平臺,王凱有機會接觸到最先進的基因測序技術。與此同時,基因檢測的價格也顯著下降,23andMe消費基因檢測的價格已經(jīng)下降到了999美元,消費者只需要提供一管口水就可以檢測。
到2008年,基因檢測的成本進一步下降,全基因組檢測成本從2007年初的1000萬美元下降到10萬美元,降幅達到99%。價格的下降催生了美國消費基因檢測行業(yè)創(chuàng)業(yè)浪潮的興起。
此時,王雯靜正在德國攻讀商業(yè)戰(zhàn)略管理碩士。她對基因檢測的了解僅限于科研文獻。那一年,家人罹患肺癌正在尋醫(yī)問診,心急如焚的她聽說易瑞沙能延長肺癌患者的生命周期。王雯靜向一些專家學者、醫(yī)生打聽怎么用藥,一位在德國馬普實驗室工作的學長告訴她這個藥可能有效,但服用前最好做一下EGFR檢測,看看是陰性還是陽性。
王雯靜一聽懵了,“去醫(yī)院問,很多醫(yī)生也不知道”。后來學長就跟她說了一個適用人群的范疇:亞洲人、女性、不吸煙、小細胞癌,“如果符合這幾種特性的話,先試試易瑞沙。”
她后來才知道,從基因檢測角度來看,以上幾點是易瑞沙藥物反應的不同亞組的患者所具有的普遍特征,他們高度敏感的腫瘤中多數(shù)含有體細胞突變的EGFR基因。試過之后病情很快得到了控制,延長了26個月的生存期,達到了這個藥當時能延長的最長生存期。
王雯靜內心一直有一個情結。她本人是藥物不良反應的受害者,小時候因為急性肺炎打慶大霉素產生藥物毒性導致右耳完全失聰,這種藥物性致聾是不可逆的。王雯靜后來想,很多基于歐美人群基因數(shù)據(jù)庫研究的藥物對中國患者會不會產生療效上的差異甚至藥物毒性?有沒有屬于中國人的藥物基因組學數(shù)據(jù)庫來支撐研發(fā)新藥并指導臨床用藥?
此時的王凱也還沒有感受到校園外的這股創(chuàng)業(yè)潮,他獲得資助進入美國加州洛杉磯分校(UCLA)生物信息學系主任克里斯托弗·李(Christopher Lee)教授的實驗室專注做癌癥NGS項目。這也是他的博士課題。
王凱的追求已經(jīng)不滿足于基礎性的科學研究,而是更進一步探索科研與實踐的轉化關系。他的研究對于癌癥研究的涉及越來越深。他想從突變的層面解決更為本質的探索,“DNA到RNA有一個剪輯、轉錄的過程,RNA再翻譯才能變成蛋白質”,王凱把垂直領域的研究集中在前端,“DNA和RNA之間”,“我想搞清楚,蛋白質之間是怎么樣的(關系),誰和誰親,到什么程度,形成什么功能?”更重要的是,“這個功能對于癌癥有什么作用,偏預測性?!?/p>
2010年,博士畢業(yè)后,王凱進入哈佛大學的Dana Farber癌癥研究所,開始博士后學習階段。他加入了牛人李程教授的實驗室。李程是生物信息學的傳奇人物,他所在的研究組開發(fā)了DCHIP軟件,主要用于基因表達和SNP生物芯片的數(shù)據(jù)剖析和可視化。
王凱選擇繼續(xù)從事癌癥和NGS的相關臨床研究。雖然當時研究生物信息的人越來越多了,但總體上仍然偏少,尤其是中國人。
王凱研究的二代測序成為基因檢測商業(yè)化的基礎。二代測序從2006年左右開始出現(xiàn),取代之前主流的一代測序,整體的通量、準確性都有了非常大的提高。王凱是二代測序資深研究人員,他稱之為“一個跨越性的變化”,這個大膽的突破成為人類自由探索基因奧秘的重要工具,“雖然一代、二代都叫測序,但是原理上、產能上和效率上已經(jīng)不是一個概念了?!?/p>
李程教授一直致力于研究高通量基因組學數(shù)據(jù)處理算法、軟件開發(fā)和在癌癥基因組學研究中的應用。2013年,李程教授全職加入北京大學生命科學學院后,建立了干濕結合的癌癥基因組學實驗室。
2011年秋天,王凱結束了哈佛大學的博士后研究工作,加入到Foundation Medicine公司(簡稱FMI),在生信組負責優(yōu)化基因拷貝數(shù)分析流程和建設數(shù)據(jù)可視化,F(xiàn)MI是世界級基因檢測領域的明星公司。
FMI成立后,微軟創(chuàng)始人比爾·蓋茨、Google Ventures、俄羅斯億萬富翁尤里·米納爾和美國診斷界的傳奇人物埃文·瓊斯都是首輪投資者。
王凱本就出生在一個醫(yī)學世家。他自然而然地選擇上醫(yī)學院、治病救人,又自然而然地想要通過技術的精進解決更多人類無能為力的時刻。在FMI工作期間,王凱最后的成就感和最感到無能為力的都是同一件事——救人。他親眼見證了NGS測序結果挽救了一個垂危病人生命的案例。
當時,一位不到36歲的骨肉瘤患者已經(jīng)出現(xiàn)肺部轉移病癥,大部分時間昏迷在ICU,無法吞咽。家人接到了他的病危通知書。他的兩個女兒一個四歲、一個兩歲,他的愛人是一名老師。當醫(yī)生都要放棄他時,F(xiàn)MI決定給他做NGS測序,“病人家屬說無論如何要嘗試一下,不然人就沒有了?!?/p>
在家屬的堅持下,NGS測序結果提示針對某個基因擴增的用藥,但由于沒有任何先例,醫(yī)生一開始是反對這樣治療的。后來病人嘗試用藥后48小時就出了ICU,兩周后出院。
基因檢測技術能成功挽救生命,這讓王凱體會到了前所未有的成就感,他用了“震撼”二字形容當時的心情。但基因檢測的進一步縱深化是無窮無盡的,至今為止我們對此還有太多未能解決的難題。
有時候,即使作為最前沿的研究者,王凱也不得不接受一些事實,那就是基因檢測不管在中國還是在美國都會有假陽性和假陰性的問題,“任何醫(yī)學檢測都是如此的,沒有人能做到100%”,“如果回到二代測序對癌癥這塊,又有更高的質量和算法的要求,這個準確性可能就要下來一些,這個是一個客觀的問題,在人類歷史上,醫(yī)學的檢驗和病理這塊是沒有100%的,但我們的目標肯定是往這個方向去努力。”
至本醫(yī)療獲得CAP和CLIA雙認證的NGS測序實驗室
王凱在美國求學、工作的時候,國內基因檢測行業(yè)的發(fā)展也迎來了春天。2012年,23andMe推出了99美元的消費級基因檢測產品,隨后,家譜公司Ancestry也推出了類似價格的產品,在行業(yè)頭部公司的推動下,美國消費基因檢測市場進入發(fā)展的高潮期。
美國市場刮起的這股風潮漫卷過寬闊的太平洋,在彼岸的中國創(chuàng)投圈激起一股很大的浪花。從2013年開始,大量資本和創(chuàng)業(yè)者進入這個領域,阿里巴巴、軟銀中國等頂尖投資者紛紛布局這個市場。
2014年,Illumina進一步降低了基因測序的成本,它推出了新系統(tǒng) HiSeq X Ten,將全基因組的測序成本降到了1000美元,這個成本包括了儀器折舊、DNA 提取、文庫制備以及典型的高通量基因組學實驗室的預計勞動力成本等各類開支,低廉的成本讓中國創(chuàng)業(yè)者看到了基因檢測市場風口正在起來,當年底,微基因、23 魔方、水母基因等中國基因檢測公司相繼成立。
祖源分析、運動基因、皮膚特質、天賦基因、個性天賦、藥物反應、營養(yǎng)代謝等各種消費娛樂級別的基因檢測產品也頻頻出現(xiàn)。到目前為止,中國從事此類基因檢測應用的創(chuàng)業(yè)公司數(shù)量超過200家。
“(各個機構對基因的解讀)各有側重,有的擅長祖源和人類學,有的擅長疾病的檢測,像我們更擅長心理和行為,因為可解讀的項目實在是太多了。”郭婷婷偏瘦,講一口不那么標準的普通話,她從事心理學研究十多年,帶有某種使命感。
2015年,她就拿到過一份自己的基因數(shù)據(jù),那時候已經(jīng)能夠找到科研外包實驗室或者醫(yī)療檢驗所獲得基因原始數(shù)據(jù),“好玩,我想搞清楚這些對人來說意味著什么。”
同一年,她創(chuàng)辦了各色科技有限公司,初創(chuàng)團隊都是來自于生物工程、心理測評、認知科學、行為遺傳學等領域的年輕研究者。
各色DNA創(chuàng)始人郭婷婷 圖/受訪者提供
COMT基因,這是她幾年前最先關注到的基因。這個經(jīng)典的心理學研究基因位于 22 號染色體,參與多巴胺和去甲腎上腺素降解的過程,跟注意力、學習能力、疼痛和情緒穩(wěn)定性都有關系。
繼續(xù)解碼需要借助大量研究文獻,比如COMT中關注較多的變異位點rs4680,有研究將這個位點的兩種表達總結成:warrior(戰(zhàn)士)和worrier(擔憂者),各約占人群的50%。前者遲鈍、神經(jīng)大條,但能更好地處理壓力與合作;后者靈活、有創(chuàng)意,但總是焦慮和敏感。
對照基因數(shù)據(jù)后,郭婷婷屬于前者?!斑@些特征都是多基因影響的,其他的基因位點也有待挖掘?!睆碗s性正是郭婷婷覺得有意思的地方。
這樣做的生物學基礎是基因的重要作用,有時候它對我們的影響超出我們的想象,郭婷婷在一次演講中提到,研究表明數(shù)學能力的遺傳率大概是40%-60%,語言是50%-70%,離婚的遺傳率是30%-0%,煙癮是50%,所以幾乎一切人類的特征都和遺傳有關系。
盡管如此,基因并不能告訴你全部,它只是一個了解自己的起點,“基因檢測告訴你一個概率,了解基因和生活經(jīng)歷的影響,可以知道像你這樣的人應該用什么樣的生活方式去提升自己?!?/p>
目前已經(jīng)有將近三萬人在各色DNA上做過基因檢測,他們大多是22-32歲,居住在北上廣深杭,擁有本科及以上的學歷?!埃ɑ驒z測)的認知門檻是很高的,對用戶來說產生影響的前提是,他/她對這個事兒投入得足夠多?!绷私庾约菏羌L又費力的事情,需要有足夠的對人的好奇心,以及勇氣。
“這個東西對普通人來說有什么用,以及提供的這份解讀在數(shù)據(jù)解釋率各個層面上達到了一個什么樣的水平,我覺得可以很好地回答這兩個問題才是成熟的適用于大眾的產品?!惫面谜f,“現(xiàn)在只是一個好奇心驅動的生意,只有突破了好奇心層面,才能有更實際的用途?!?h3>中國無創(chuàng)產檢火爆
2014年左右,中國也開始逐步規(guī)范基因檢測行業(yè)的發(fā)展,原衛(wèi)計委和原國家食品藥品監(jiān)管總局加強基因測序行業(yè)監(jiān)管,無創(chuàng)產檢和腫瘤測序等臨床級別的基因測序產品和服務開始逐步走向規(guī)范。
在這些基因檢測類型中,產前與母嬰診斷中的NIPT(無創(chuàng)產前基因檢測)業(yè)務是最先火爆的一個領域。
中國是新生兒出生缺陷率較高的國家,約為5.6%。隨著國家放開二胎政策,每年將比政策放開前增加400萬新生兒,高齡孕婦由于年齡增加,其所懷胎兒罹患多種染色體綜合癥的風險也在加大?;驒z測相比于傳統(tǒng)檢測更加安全高效。