• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      醫(yī)學信息學在罕見病診療中的研究進展及應用

      2018-03-28 05:57:36姜召蕓盧宇藍弓孟春史文釗張抒揚周文浩
      協(xié)和醫(yī)學雜志 2018年2期
      關鍵詞:信息學表型基因組

      姜召蕓,盧宇藍,余 樂,弓孟春,史文釗,張抒揚,周文浩

      1神州數(shù)碼醫(yī)療科技股份有限公司,北京 100080 2復旦大學附屬兒科醫(yī)院 兒科研究所,上海 201102 3復旦大學兒童發(fā)育與疾病轉化醫(yī)學中心,上海 201102 4上海市出生缺陷重點實驗室,上海 201102 5中國醫(yī)學科學院罕見病研究中心,北京 100730 6中國醫(yī)學科學院 北京協(xié)和醫(yī)學院 北京協(xié)和醫(yī)院,北京 100730

      1 概述

      目前國際上尚無對罕見病的統(tǒng)一定義。在美國,罕見病被定義為影響少于20萬美國人的疾病;在歐盟,罕見病被定義為發(fā)病率在萬分之五以下的疾病[1]。目前公認的罕見病數(shù)量為6000~7000種[1]。其中近75%為兒童罕見病,約5000種,影響全世界數(shù)百萬兒童[2]。一項對歐洲17個國家8種罕見病的調查研究顯示,25%的患者需要等待5~30年才被確診,40%的患者最初診斷不正確,部分患者未被診斷[3]。盡管這些疾病通常是慢性和進行性的,但若能早期診斷(如新生兒篩查),并通過標準和/或靶向治療進行最佳管理,則長期并發(fā)癥可被減輕或延遲[4]。

      大多數(shù)罕見病由單基因突變引起,這些罕見的遺傳性疾病也被稱為孟德爾遺傳病或單基因疾病。因此,罕見病是很好的病因研究模型,可為很多常見疾病的發(fā)病機制研究提供重要線索。隨著新興技術尤其是基因組學分析和相關序列分析技術的興起,以及個性化醫(yī)療的出現(xiàn),可發(fā)現(xiàn)更多致病基因,增加疾病的亞型數(shù)量,進一步促進罕見病研究方法的發(fā)展[1]。

      醫(yī)學信息學是新興交叉學科,研究者為追求科學探究、問題解決和決策制定,對生物醫(yī)學數(shù)據(jù)、信息、知識進行有效利用,以提高人類健康[5]。醫(yī)學信息學研究的最新進展,包括電子病歷、生物信息技術、醫(yī)院信息系統(tǒng)、決策支持系統(tǒng)、影像信息技術、遠程醫(yī)療與互聯(lián)網(wǎng)以及數(shù)據(jù)標準等。罕見病作為病因研究模型,有利于研究整合不同來源數(shù)據(jù),這些來源不同的數(shù)據(jù)包括臨床和生理數(shù)據(jù)(如肌張力檢查和肌酸激酶濃度)、分子數(shù)據(jù)(如基因表達和基因型)、生物樣本庫數(shù)據(jù)和模式生物/疾病模型信息[6]。對罕見病不同維度的數(shù)據(jù)進行研究會促進醫(yī)學信息學技術的發(fā)展。本文將詳細闡述醫(yī)學信息學的關鍵技術及其在罕見病診療中的應用。

      2 醫(yī)學信息學關鍵技術

      2.1 罕見病臨床術語標準化

      罕見病種類繁多且表型復雜多樣,不僅在不同疾病間存在差異,同一疾病的不同患者在表型上也可能不同,具有高度的臨床異質性,為罕見病數(shù)據(jù)整合帶來很大挑戰(zhàn)[7]。目前國際上已形成一批廣泛認可、應用效果良好的醫(yī)學語義標準,如國際衛(wèi)生術語標準制定組織研發(fā)的SNOMED-CT(systematized nomencl-ature of medicine-clinical terms)[1]、美國國立圖書館研發(fā)的統(tǒng)一醫(yī)學語言系統(tǒng)UMLS(unified medical language system)[8]、德國柏林夏里特醫(yī)學院研發(fā)的人類表型本體(the human phenotype ontology,HPO)[9]等,這些本體系統(tǒng)在規(guī)范描述不同類別的臨床數(shù)據(jù)方面發(fā)揮重要作用。其中SNOMED-CT是世界上最全面、多語言的臨床醫(yī)學術語產(chǎn)品,包含大多數(shù)方面的臨床信息,如人體結構、臨床發(fā)現(xiàn)、臨床操作、事件、藥物等19個臨床領域,超過50個國家在使用。但SNOMED-CT目前缺少中文版,在中文電子病歷中的應用受限。UMLS包括超級敘詞表(metathesaurus)、語義網(wǎng)絡(semantic network)、情報源圖譜(information sources map)和專家詞典(SPECIALIST lexicon)4部分。其中超級敘詞表是生物醫(yī)學概念、術語、詞匯及其涵義、等級范疇的廣泛集成。UMLS的語義網(wǎng)絡不僅運用了常規(guī)語義控制手段,如語義等級、屬分、相關關系控制,且在語義規(guī)范和語義關系分析、延伸等多方面有許多創(chuàng)新。HPO解決了對罕見病表型標準化詞匯表的需求[10],在數(shù)項大型國際項目中用來對患者進行編碼。HPO是一個有向無環(huán)圖,表示超過10 000個表型異常,其中節(jié)點(HPO項)通過“is a”關系彼此連接。 HPO由諸多醫(yī)學領域專家創(chuàng)建,以適應不同來源表型數(shù)據(jù)的編碼,如實驗室試驗、圖像、圖表和臨床解釋[11]。由歐洲生物信息研究所(the European Bioinformatics Institute,EMBL-EBI)、葛蘭素史克(Glaxo Smith Kline, GSK)和威康信托桑格研究所(the Wellcome Trust Sanger Institute, WTSI)合作開發(fā)的基于基因組實驗的藥物靶點證據(jù)知識庫CTTV(the center for therapeutic target validation),將生成的數(shù)據(jù)與EMBL-EBI、GSK和WTSI 資源中的現(xiàn)有數(shù)據(jù)進行整合,使用EFO(experimental factor ontology)作為其應用本體。EFO為其他本體提供整合框架,例如ORDO、ChEBI,the gene ontology 和Uberon[12]。

      建立統(tǒng)一的罕見病語義網(wǎng)絡,規(guī)范疾病癥狀描述,對罕見病研究至關重要。 構建語義網(wǎng)絡的基礎是對雜亂無章的非結構化臨床文本信息結構化處理。臨床自然語言處理(nature language processing,NLP)利用多層算法融合,對文本信息進行分詞、邏輯關系處理、特征提取,以完成對非結構化文本信息的處理。臨床NLP為臨床醫(yī)生提供關鍵的患者病例詳細信息,這些詳細信息通常被鎖定在非結構化臨床文本中,并散布在患者的健康記錄中。語義分析是臨床NLP研究的主要目標之一,通過鑒定臨床實體(如患者、臨床醫(yī)生)和事件(如疾病、治療)并呈現(xiàn)其關系來解鎖文本的意義[13]。語義互操作性是實現(xiàn)語義網(wǎng)絡的關鍵,通常以本體和可控詞匯的形式存在。本體是“概念化的明確說明”,是一種以結構化的方式描述領域知識的方法[14]。如果以一個本體作為參考(如the gene ontology和SNOMED-CT),那么其對真實世界數(shù)據(jù)的表示則成為個標準,數(shù)據(jù)整合也會變得容易[15]。

      2.2 影像組學數(shù)據(jù)分析

      影像組學被定義為數(shù)量映射,即對大量醫(yī)學圖片特征進行提取、分析和建模[16]。影像組學的研究可分為數(shù)據(jù)選擇、醫(yī)學成像、特征提取、探索分析和構建模型5個階段:(1)數(shù)據(jù)選擇:影像組學的分析始于成像步驟、感興趣體積(volume of interest, VOI)和預期靶點的選擇。(2)醫(yī)學成像:VOI可被手動或半自動化切割[17]。切割決定圖像中被分析元素,切割的多樣性在影像特征的評價中引入了偏差。(3)特征提?。河跋窠M學的本質是定量圖像特征的高通量提取以表征VOI。特征值依賴于圖像預處理(如濾波或強度離散化)和重構(如濾波反投影或迭代重建)等因素。此外,在特征命名、數(shù)學定義、方法論和特征提取算法的軟件實現(xiàn)中存在差異[18]。(4)探索分析:影像特征和非影像特征可與預測目標相結合以創(chuàng)建單個數(shù)據(jù)集。高度相關的影像特征組可以通過聚類來識別,而這些特征可以簡化為每個聚類的單一原型特征。從多重分割、多次成像和幻影研究中收集的輔助特征數(shù)據(jù)可以用來評估特征的魯棒性。(5)構建模型:影像組學建模涉及3個主要方面,即特征選擇、建模方法學和驗證。特征選擇應該是數(shù)據(jù)驅動的,因為可能的影像特征范圍廣,這種分析應該以強有力和透明的方式進行。關于建模方法的選擇,確定最佳的機器學習方法是邁向臨床決策支持的關鍵一步。因此,在理想的情況下,應該采用多種機器學習方法[19],全面記錄實施情況。未經(jīng)驗證的模型價值有限,驗證也是完整的影像分析不可缺少的組成部分。

      影像組學在罕見病應用中很重要的一個方面是患者人臉識別功能。Face2Gene通過對來自真實患者的數(shù)據(jù)、數(shù)以百萬計的數(shù)據(jù)點進行訓練,結合基因組學,通過患者面部特征對疾病進行診斷。將面部識別軟件與臨床知識(特征注釋和人體測量)相結合,從二維面部照片中能夠檢測畸形特征和可識別的人類畸形模式。所進行的測量形成臉部描述符,可與其他描述符進行比較,并以圖形方式顯示為面具[20]。

      雖然目前影像組學處理流程已經(jīng)比較完善,但很多流程的優(yōu)化仍是難題,如其中關鍵的分割算法的改進仍是挑戰(zhàn)性問題,人工分割耗時耗力,自動分割魯棒性和精度難以保證。隨著近期深度學習浪潮的推動,基于深度機器學習的分析預測方法將是影像學未來發(fā)展方向之一,為預測準確率的提高提供了突破方向。另一方面,由于目前醫(yī)院患者人數(shù)眾多,影像檢查費時費力,影像組學也應盡可能與臨床特征相融合,成為臨床醫(yī)師更加信賴和認可的方法,從真正意義上發(fā)展為一種輔助診斷工具,提供更為便捷和放心的服務。

      2.3 基因組學數(shù)據(jù)分析

      目前基因組學分析已廣泛應用于罕見病的研究。基因組及相關技術近幾年在醫(yī)學領域的應用發(fā)展迅速。隨著全基因組、全外顯子組測序價格的下降、計算速度的加快以及精度的提高,科學家們已經(jīng)能夠在單核苷酸分辨率的水平上測序整個基因組[21]?;蚪M學的大規(guī)模分析使單基因遺傳病的致病病因可在分子水平或細胞水平進行定義,治療也更加個性化和有針對性。

      用于罕見病研究的基因組檢測方法主要有3種:(1)基因panel:對相似表型相關的若干個基因的編碼序列進行平行測序;(2)全外顯子組測序(whole exome sequencing,WES):對人類基因組的所有已知編碼區(qū)進行測序;(3)全基因組測序(whole genome sequencing,WGS):對整個人類基因組進行測序。 WES近年來主導了罕見病研究,外顯子序列約占人類全部基因組序列的1%,卻涵蓋了大約85%的變異[22]。與WGS相比,WES在收集和分析基因組數(shù)據(jù)方面更為經(jīng)濟有效,基因panel測序提供了比WES更快的周轉時間,但不能發(fā)現(xiàn)新的致病基因[23]。

      2.4 表型組學和基因組學數(shù)據(jù)融合分析

      表型組學是測量表型組的生物學領域,包括物理和生物化學特征,會隨著基因突變和環(huán)境影響而發(fā)生改變[24]。表型信息對臨床診斷決策至關重要,包括基因檢測之前和基因檢測之后?;驒z測之前,表型信息可輔助鎖定要研究的區(qū)域,幫助篩選檢驗項目?;驒z測之后,表型信息可和基因信息關聯(lián)起來對疾病進行解釋。將表型信息和基因型信息結合起來進行研究對疾病的判別至關重要。

      2.4.1 全基因組關聯(lián)分析

      全基因組關聯(lián)分析(genome-wide association studies, GWAS)是研究某種基因變異與特定疾病表型之間關系的方法,屬于正向遺傳學研究范疇, 一般應用于檢測單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)和疾病之間的關系,如心臟病、糖尿病、自身免疫性疾病和精神疾病等[25]。針對群體中個體的表型(如是否患有某種疾病)進行研究,然后從成千上萬種SNP中找出與該表型相關的基因型。若能從統(tǒng)計學上確認這些SNP與該表型之間具有聯(lián)系,就可初步認定其是與該表型相關的基因型。隨后,還需要在另一個種群中進行試驗,驗證上述發(fā)現(xiàn)是否正確。標準GWAS統(tǒng)計方法包括回歸建模(線性和邏輯),并調整相關協(xié)變量,如性別、年齡、種族或民族。對于多重檢驗調整顯著性閾值,普遍接受的全基因組顯著性閾值為P<5.0×10-8[26]。GWAS已經(jīng)走過10年的發(fā)展歷史,數(shù)百個復雜性狀的GWAS結果已被報道。目前,GWAS研究主要依賴于SNP 芯片,但是這些芯片無法覆蓋所有的遺傳變異,未來將以全基因組測序為基礎。隨著研究規(guī)模的擴大,發(fā)現(xiàn)的新致病位點對疾病的影響往往更小,對于發(fā)病率低的罕見病而言,研究受樣本數(shù)量的限制,需提升技術來克服這些挑戰(zhàn)[27]。

      2.4.2 全表型組關聯(lián)分析

      全表型組關聯(lián)分析(phenome-wide association studies,PheWAS)旨在研究與已知的基因變異相關聯(lián)的表型,是與GWAS相反的研究方法,屬于反向遺傳學范疇。PheWAS方法已通過已知的基因型-表型關系得到驗證,且使用PheWAS已能區(qū)分真正的多效性和臨床共病,增加遺傳發(fā)現(xiàn)的背景,還有助于定義疾病亞型。同時,PheWAS有利于研究數(shù)據(jù)收集,可能會改變藥物用途。深入理解電子健康記錄(electronic health record,EHR)數(shù)據(jù),整合廣泛且強大的表型數(shù)據(jù), 將會創(chuàng)造豐富的資源,可以產(chǎn)生更多有效且詳細的基因組-表型組分析,促進精準醫(yī)學的新發(fā)現(xiàn)[26]。受具有多種表型隊列的限制,PheWAS 2010年才被開發(fā)使用[28]。應用PheWAS算法分析7個已知關聯(lián)的SNP-疾病對,其中4個被重復且P值在2.8×10-6和0.011之間。PheWAS算法還鑒定了19個之前未知的SNP與疾病在統(tǒng)計學上的關聯(lián)(P<0.01)。

      關于PheWAS的開放性的研究問題:是否能夠從流行病學數(shù)據(jù)或通過重新利用收集到的EHR數(shù)據(jù)中全面捕捉到人類基因組的變異?考慮到不同表型組定義在特異性和粒度方面的差異,表征不同表型之間的表型相關性以及建立PheWAS特異性、顯著性閾值成為目前研究熱點[29]。

      2.5 罕見病數(shù)據(jù)庫/知識庫

      通過先進的醫(yī)學信息學技術整合不同來源的數(shù)據(jù),形成罕見病表型和遺傳多樣性之間的知識關聯(lián),建立相關數(shù)據(jù)庫和知識庫,對于罕見病診療至關重要。目前國際上已有很多數(shù)據(jù)庫或知識庫提供罕見病基因型與表型之間的關聯(lián):(1)OMIM(online mendelian inheritance in man)是一個綜合且權威的關于人類基因與遺傳變異的數(shù)據(jù)庫[30],主要針對遺傳性疾病,內容包括文本信息、相關參考信息、序列紀錄、圖譜和相關其他數(shù)據(jù);(2)Orphanet是一個罕見病和治療藥物及其他資料的綜合知識庫,收錄了近6000種罕見病各種相關信息,是目前世界上最權威和豐富的罕見病知識庫[31];(3)DECIPHER(databasE of genomiC varIation and phenotype in humans using ensembl resources)是一個基于網(wǎng)絡的可交互數(shù)據(jù)庫,整合了一套旨在幫助解釋基因組變異的工具,從患者遺傳變異相關的各種生物信息學資源中檢索信息以增強臨床診斷[32];(4)GeneReviews主要由兩大部分組成,即包含描述特定遺傳疾病的標準化同行評議的論文和包含單個基因和表型信息的章節(jié),目前共包含691個章節(jié),在PubMed中可被索引;(5)ClinVar是一個公共數(shù)據(jù)庫,其主要目的在于整合不同來源的數(shù)據(jù),將基因變異位點、臨床表型、實證數(shù)據(jù)以及功能注釋等方面的信息,形成一個標準的、可信的、穩(wěn)定的遺傳變異-臨床表型相關數(shù)據(jù)庫,可免費訪問[33];(6)HGMD(the human gene mutation database) 可提供人類遺傳性疾病突變的綜合性數(shù)據(jù),已被廣泛應用于臨床,可實現(xiàn)針對單一突變的快速查詢,同時支持各種先進的搜索應用[34];(7) GeneCards是人類基因綜合數(shù)據(jù)庫,提供基因組、蛋白質組、轉錄、遺傳和功能上所有已知和預測的人類基因[35];(8)MalaCards是一個可搜索人類疾病及其注釋的綜合數(shù)據(jù)庫,收錄了約2萬種疾病,在15個部分中描繪了廣泛的注釋主題,包括摘要、癥狀、解剖背景、藥物、基因測試、變異和相關文獻[36]。

      對基因變異的最全面解讀不僅需精心設計的數(shù)據(jù)庫、分離分析和數(shù)據(jù)共享,還應進行適當?shù)墓δ芊治?,如評估變異對剪接或基因表達的影響[37]。在當前基因組學時代,意義不明變異仍最常見[38]。

      3 醫(yī)學信息學技術在罕見病診療中的應用

      3.1 罕見病致病基因的發(fā)現(xiàn)及診斷

      罕見病由于其遺傳性較好,可利用二代測序技術方便尋找致病基因[39]。WES在疾病致病基因的鑒定研究中取得了較大成果,不僅在單基因遺傳病,還在多基因影響的復雜疾病中發(fā)現(xiàn)了大量相關基因。2010年,華盛頓大學孟德爾基因組學研究中心的研究小組發(fā)現(xiàn)了Miller綜合征的遺傳病因,其特征是嚴重小頭畸形、唇裂和/或腭裂、四肢發(fā)育不良、眼瞼和多余的乳頭[40]。同一年,同樣的方法成功鑒定了Kabuki(MLL2)[41],Schinzel-Giedion(SETBP1)[42]和Sensenbrenner(WDR35)[43]綜合征的致病基因。2014年,加拿大FORGE(finding of rare disease genes)組織花費兩年時間,匯集了加拿大各地21個遺傳中心和3個科技創(chuàng)新中心的臨床醫(yī)生和科學家,對246例罕見病患者進行WES分析,發(fā)現(xiàn)了引發(fā)疾病的146個突變位點和67個異?;騕44]。

      GWAS技術也被成功應用于罕見病致病基因的發(fā)現(xiàn)。GWAS已經(jīng)鑒定了數(shù)千種與特定人類表型相關的常見遺傳變異[45]。Duan等[46]利用GWAS分析方法對1492例煙霧病病例和5084例對照組進行研究,發(fā)現(xiàn)了煙霧病的新易感基因。同樣,PheWAS在研究SNP-疾病對中也被成功應用,成為研究SNP-疾病對的關聯(lián)性可用方法[28]。

      3.2 罕見病藥物的研發(fā)

      因罕見病病因復雜、基因異質性高、病理機制未明、參與臨床試驗的患者數(shù)量少等問題,治療罕見病的藥物(也稱孤兒藥)在研發(fā)上具有很大的局限性。而醫(yī)學信息學技術的發(fā)展對于突破這些局限性提供了有力幫助,在新藥研發(fā)、老藥新用等方面展示出良好的前景,如組學和信息學技術的發(fā)展為藥物靶點發(fā)現(xiàn)提供了新契機;同時,臨床記錄與基因組學數(shù)據(jù)、藥物間相互作用等多維度信息的整合分析,對安全、高效的老藥新用策略具有重要意義。隨著高通量技術的發(fā)展,人們對基因組的研究逐步深入,對罕見病發(fā)病機制的認識越來越清晰。一些用于治療常見疾病的藥物被發(fā)現(xiàn)可用于罕見病的治療,如美國食品藥品監(jiān)督管理局(Food and Drug Administration,F(xiàn)DA)2009年批準將治療勃起功能障礙的他達拉非(tadalafil)用于肺動脈高壓的治療[47]。FDA已批準約400種孤兒藥,但這些孤兒藥僅對5%的罕見病起作用,大多數(shù)罕見病的治療仍依賴癥狀治療甚至安慰劑治療[48]。隨著信息數(shù)據(jù)庫和網(wǎng)絡技術的發(fā)展,新的計算機模型將有助于加速罕見病臨床前藥物開發(fā)的目標識別和過程優(yōu)化[49]。

      3.3 罕見病注冊登記平臺的建立

      在罕見病領域,注冊登記系統(tǒng)被認為是開展臨床研究的有力工具,有助于規(guī)劃臨床試驗,改善患者的護理和醫(yī)療保健計劃。數(shù)據(jù)質量被定義為數(shù)據(jù)集特征和特性的總和,這些數(shù)據(jù)集的特征和能力滿足數(shù)據(jù)預期使用所產(chǎn)生的需求。在注冊登記中,“產(chǎn)品”是數(shù)據(jù),質量是指數(shù)據(jù)質量,意味著進入注冊登記系統(tǒng)的數(shù)據(jù)已得到驗證,可供分析和研究使用。通過對數(shù)據(jù)進行多維度的評估來確定數(shù)據(jù)的質量,包括評估數(shù)據(jù)的完整性、有效性、一致性、可比性、可訪問性、實用性、及時性和預防重復記錄[50]。醫(yī)學信息學技術在罕見病注冊登記平臺中起到重要支撐作用。

      4 展望

      隨著精準醫(yī)學的發(fā)展,醫(yī)學信息學關鍵技術(圖1)在罕見病診斷、孤兒藥開發(fā)等領域發(fā)揮巨大的推動作用。但這些技術的應用仍存在一定局限性,面臨多種挑戰(zhàn)。比如基因分析技術的發(fā)展,克服了罕見病致病基因未知、突變類型多變的困難,為罕見病能得到及時、準確的診斷創(chuàng)造了條件。但目前二代測序技術的應用還僅局限于大型醫(yī)學或遺傳學研究中心,且由于高通量測序數(shù)據(jù)的產(chǎn)生,數(shù)據(jù)保存和結果解讀仍面臨巨大挑戰(zhàn)。

      圖 1 罕見病研究中的醫(yī)學信息學技術路線

      盡管目前存在各種挑戰(zhàn),但是精準醫(yī)學的發(fā)展和醫(yī)學信息學的不斷進步,為罕見病的診斷和個性化治療帶來了前所未有的機遇。相信隨著對罕見病研究的不斷深入,醫(yī)學信息學相關技術的不斷發(fā)展,高通量測序等技術將在罕見病診斷和治療中發(fā)揮越來越關鍵的作用。

      [1] Fung KW, Richesson R, Bodenreider O. Coverage of rare disease names in standard terminologies and implications for patients, providers, and research [J]. AMIA Annu Symp Proc, 2014: 564- 572.

      [2] Boycott KM, Dyment DA, Sawyer SL, et al. Identification of genes for childhood heritable diseases [J]. Annu Rev Med, 2014,65: 19- 31.

      [3] Schieppati A, Henter JI, Daina E,et al. Why rare diseases are an important medical and social issue [J]. Lancet, 2008,371: 2039- 2041.

      [4] Boycott KM, Rath A, Chong JX, et al. International cooperation to enable the diagnosis of all rare genetic diseases [J]. Am J Hum Genet, 2017,100: 695- 705.

      [5] Liang J, Wei K, Meng Q, et al. Development of medical informatics in China over the past 30 years from a conference perspective and a Sino-American comparison [J]. Peer J, 2017, 5: e4082.

      [6] Roos M, López Martin E,Wilkinson MD. Preparing data at the source to foster interoperability across rare disease resources [J]. Adv Exp Med Biol, 2017,1031: 165- 179.

      [7] Ma’ayan A, Rouillard AD, Clark NR, et al. Lean big data integration in systems biology and systems pharmacology [J]. Trends Pharmacol Sci, 2014, 35: 450- 460.

      [8] He Z, Chen Y, de Coronado S, et al. Topological-pattern-based recommendation of UMLS concepts for national cancer institute thesaurus [J]. AMIA Annu Symp Proc, 2016: 618- 627.

      [9] K?hler S, Vasilevsky NA, Engelstad M, et al. The human phenotype ontology in 2017 [J]. Nucleic Acids Res, 2017, 45: D865-D876.

      [10] K?hler S, Doelken SC, Mungall CJ, et al. The human phenotype ontology project: linking molecular biology and disease through phenotype data [J]. Nucleic Acids Res, 2014, 42: D966-D974.

      [11] Greene D, BioResource N, Richardson S, et al. Phenotype similarity regression for identifying the genetic determinants of rare diseases [J]. Am J Hum Genet, 2016, 98: 490- 499.

      [12] Sarntivijai S, Vasant D, Jupp S, et al. Linking rare and common disease: mapping clinical disease-phenotypes to ontologies in therapeutic target validation [J]. J Biomed Semantics, 2016, 7: 8.

      [13] Velupillai S, Mowery D, South BR, et al. Recent advances in clinical natural language processing in support of semantic analysis [J]. Yearb Med Inform, 2015, 10: 183- 193.

      [14] Machado CM, Rebholz-Schuhmann D, Freitas AT, et al. The semantic web in translational medicine: current applications and future directions [J]. Brief Bioinform, 2015, 16: 89- 103.

      [15] De Silva TS, MacDonald D, Paterson G, et al. Systematized nomenclature of medicine clinical terms (SNOMED CT) to represent computed tomography procedures [J]. Comput Methods Programs Biomed, 2011, 101: 324- 329.

      [16] Lambin P, Leijeaar RTH, Deist TM, et al. Radiomics: the bridge between medical imaging and personalized medicine [J]. Nat Rev Clin Oncol, 2017, 14: 749- 762.

      [17] Polan DF, Brady SL,Kaufman RA.Tissue segmentation of computed tomography images using a random forest algorithm: a feasibility study [J]. Phys Med Biol, 2016, 61: 6553- 6569.

      [18] Zhang L, Fried DV, Fave XJ, et al. IBEX: an open infrastructure software platform to facilitate collaborative work in radiomics [J]. Med Phys, 2015, 42: 1341- 1353.

      [19] Parmar C, Grossmann P, Bussink J, et al. Machine learning methods for quantitative radiomic biomarkers [J]. Sci Rep, 2015, 5: 13087.

      [20] Liehr T, Acquarola N, Pyle K, et al. Next generation phenotyping in emanuel and pallister-killian syndrome using computer-aided facial dysmorphology analysis of 2D photos [J]. Clin Genet, 2018,93:378- 381.

      [21] Katsanis SH,Katsanis N. Molecular genetic testing and the future of clinical genomics [J]. Nat Rev Genet, 2013, 14: 415- 426.

      [22] Bamshad MJ, Ng SB, Bigham AW, et al. Exome sequencing as a tool for mendelian disease gene discovery [J]. Nat Rev Genet, 2011, 12: 745- 755.

      [23] Fernandez-Marmiesse A, Gouveia S,Couce ML. NGS technologies as a turning point in rare disease research, diagno-sis, and treatment [J]. Curr Med Chem, 2018,25:404- 432.

      [25] Visscher PM, Brown MA, McCarthy MI, et al. Five years of GWAS discovery [J]. Am J Hum Genet, 2012, 90: 7- 24.

      [26] Denny JC, Bastarache L, Roden DM. Phenome-wide association studies as a tool to advance precision medicine [J]. Annu Rev Genomics Hum Genet, 2016, 17: 353- 373.

      [27] Visscher PM, Wray NR, Zhang Q, et al. 10 Years of GWAS discovery: biology, function, and translation [J]. Am J Hum Genet, 2017, 101: 5- 22.

      [28] Denny JC, Ritchie MD, Basford MA, et al. PheWAS: demonstrating the feasibility of a phenome-wide scan to discover gene-disease associations [J]. Bioinformatics, 2010, 26: 1205- 1210.

      [29] Bush WS, Oetjens MT,Crawford DC.Unravelling the human genome-phenome relationship using phenome-wide association studies [J]. Nat Rev Genet, 2016, 17: 129- 145.

      [30] McKusick VA. Mendelian Inheritance in Man and its online version, OMIM [J]. Am J Hum Genet, 2007, 80: 588- 604.

      [31] Pavan S, Rommel K, Mateo Marquina ME, et al. Clinical practice guidelines for rare diseases: the orphanet database [J]. PLoS One, 2017, 12: e0170365.

      [32] Swaminathan GJ, Bragin E, Chatzimichali EA, et al. DECIPHER: web-based, community resource for clinical interpretation of rare variants in developmental disorders [J]. Hum Mol Genet, 2012, 21: R37- R44.

      [33] Zhang X, Minikel EV, O’Donnell-Luria AH, et al. ClinVar data parsing [J]. Wellcome Open Res, 2017, 2: 33.

      [34] Stenson PD, Ball EV, Mort M, et al. The human gene mutation database (HGMD) and its exploitation in the fields of personalized genomics and molecular evolution [J]. Curr Protoc Bioinformatics, 2012, Chapter 1: Unit1.13.

      [35] Stelzer G, Rosen N, Plaschkes I, et al. The gene cards suite: from gene data mining to disease genome sequence analyses [J]. Curr Protoc Bioinformatics, 2016, 54:1.30.1- 1.30.33.

      [36] Rappaport N, Twik M, Plaschkes I, et al. MalaCards: an amalgamated human disease compendium with diverse clinical and genetic annotation and structured search [J]. Nucleic Acids Res, 2017, 45: D877-D887.

      [37] Pepin MG, Murray ML, Bailey S, et al. The challenge of comprehensive and consistent sequence variant interpretation between clinical laboratories [J]. Genet Med, 2016, 18: 20- 24.

      [38] Richards S, Aziz N, Bale S, et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology [J]. Genet Med, 2015, 17: 405- 424.

      [39] Van Dijk EL, Auger H, Jaszczyszyn Y, et al. Ten years of next-generation sequencing technology [J]. Trends Genet, 2014, 30: 418- 426.

      [40] Ng SB, Buckingham KJ, Lee C, et al. Exome sequencing identifies the cause of a mendelian disorder [J]. Nat Genet, 2010, 42: 30- 35.

      [41] Ng SB, Bigham AW, Buckingham KJ, et al. Exome sequencing identifies MLL2 mutations as a cause of Kabuki syndrome [J]. Nat Genet, 2010, 42: 790- 793.

      [42] Hoischen A, van Bon BW, Gilissen C, et al. De novo mutations of SETBP1 cause Schinzel-Giedion syndrome [J]. Nat Genet, 2010, 42: 483- 485.

      [43] Gilissen C, Arts HH, Hoischen A, et al. Exome sequencing identifies WDR35 variants involved in Sensenbrenner syndrome [J]. Am J Hum Genet, 2010, 87: 418- 423.

      [44] Beaulieu CL, Majewski J, Schwartzentruber, et al. FORGE Canada Consortium: outcomes of a 2-year national rare-disease gene-discovery project [J]. Am J Hum Genet, 2014, 94: 809- 817.

      [45] Welter D, MacArthur J, Morales J, et al. The NHGRI GWAS Catalog, a curated resource of SNP-trait associations [J]. Nucleic Acids Res, 2014, 42: D1001-D1006.

      [46] Duan L, Wei L, Tian Y, et al. Novel susceptibility loci for moyamoya disease revealed by a genome-wide association study [J]. Stroke, 2018, 49: 11- 18.

      [47] Sardana D, Zhu C, Zhang M, et al.Drugrepositioningforor-phandiseases[J]. Brief Bioinform, 2011,12: 346- 356.

      [48] Stockklausner C, Lampert A, Hoffmann GF, et al. Novel treatments for rare cancers: the U.S. orphan drug act is deli-vering-A cross-sectional analysis [J]. Oncologist, 2016, 21: 487- 493.

      [49] Zhao M,Wei DQ. Rare diseases: drug discovery and informatics resource [J]. Interdiscip Sci, 2018,10:195- 204.

      [50] Kodra Y,Posada de la Paz M, Coi A,et al. Data quality in rare diseases registries [J]. Adv Exp Med Biol, 2017, 1031: 149- 164.

      猜你喜歡
      信息學表型基因組
      牛參考基因組中發(fā)現(xiàn)被忽視基因
      雞NRF1基因啟動子區(qū)生物信息學分析
      初論博物館信息學的形成
      中國博物館(2018年2期)2018-12-05 05:28:50
      建蘭、寒蘭花表型分析
      GABABR2基因遺傳變異與肥胖及代謝相關表型的關系
      慢性乙型肝炎患者HBV基因表型與血清學測定的臨床意義
      miRNA-148a在膀胱癌組織中的表達及生物信息學分析
      72例老年急性白血病免疫表型分析
      基因組DNA甲基化及組蛋白甲基化
      遺傳(2014年3期)2014-02-28 20:58:49
      有趣的植物基因組
      世界科學(2014年8期)2014-02-28 14:58:31
      汝城县| 河津市| 南乐县| 麦盖提县| 太白县| 邳州市| 富锦市| 铜陵市| 高阳县| 大同县| 石泉县| 咸宁市| 沁源县| 陇西县| 余庆县| 南乐县| 牙克石市| 新野县| 远安县| 上饶县| 荔波县| 滁州市| 兰州市| 林芝县| 东乌珠穆沁旗| 兰州市| 博爱县| 阿尔山市| 车险| 安西县| 保康县| 施甸县| 和龙市| 鄂伦春自治旗| 卓尼县| 嘉鱼县| 自治县| 北辰区| 横峰县| 内黄县| 垣曲县|