鄭 陽
(南京市第二醫(yī)院信息中心,江蘇 南京 210003)
人工智能(artificial intelligence,AI)是建立在計算機科學之上,利用模型算法對人的智能進行模擬和應用的一種多學科交叉的前沿科技,其目的是為機器賦予人類思維和行為,以幫助人們計算、識別、分析、預測等工作。隨著科技的進步,AI 的發(fā)展和應用已逐漸滲入到人們生活工作各個領域之中。其中,AI 技術在醫(yī)療領域的應用是近年來研究的熱門領域之一,將AI 技術結(jié)合其他新興科技,融入醫(yī)療服務、臨床診療、影像識別、藥物研發(fā)、精準醫(yī)學研究等領域[1,2],創(chuàng)新醫(yī)療服務內(nèi)容、模式和場景,能夠提升醫(yī)療機構(gòu)的工作效率和診療質(zhì)量,為大眾醫(yī)療健康提供更優(yōu)質(zhì)的服務,同時,還能給醫(yī)療科研領域提供新的技術途徑以更深入、更廣泛的探索新維度。為此,本文對AI 在醫(yī)療領域的應用進行分析,總結(jié)其技術優(yōu)勢與不足,旨在為醫(yī)療人工智能技術的發(fā)展提供幫助。
1.1 機器學習 機器學習是醫(yī)療AI 的重點核心技術,從不同的學科角度,如統(tǒng)計學、概率論、近似理論等設計不同的理論模型,用于計算機模擬人類思維或行為,使機器具備一定的學習、分析、分類、識別等能力,并通過累積經(jīng)驗不斷的自我完善,提高性能和泛化能力。在醫(yī)療領域,機器學習是進行疾病診斷預測、預后評估、健康管理、精準醫(yī)療、圖像診斷等智能化應用的關鍵基礎技術。根據(jù)模型學習方式的不同,可分為監(jiān)督學習、非監(jiān)督學習、半監(jiān)督學習和強化學習[3]。
1.1.1 監(jiān)督學習 在監(jiān)督學習中,數(shù)據(jù)樣本集分為訓練庫和測試庫,其中訓練庫是有描述樣本屬性標記的集合,樣本的屬性一般是人為標注。構(gòu)造學習模型,建立輸入與輸出的關系,以推斷預測測試庫中未知數(shù)據(jù)集的目標屬性值,并通過調(diào)整參數(shù)使模型最優(yōu)化。其目標是對大批量未知數(shù)據(jù)進行離散值分類或連續(xù)值回歸。通過對某一疾病對應的相關體征數(shù)據(jù)進行學習,獲得可預測該疾病的模型,然后通過分析獲取的檢查數(shù)據(jù),預測病人患有該種疾病的概率,以方便臨床決策。常用算法如下:最近鄰節(jié)點算法(KNN):以預先設定的分類節(jié)點為初始值,計算未知節(jié)點到各類之間的抽象距離,判定其所屬類別;決策樹算法:根據(jù)測試庫訓練得到?jīng)Q策樹模型,由屬性分類節(jié)點和分支構(gòu)成,可以對未知數(shù)據(jù)按照各層次節(jié)點屬性逐級判別分支走向,近而獲得最終類別;樸素貝葉斯分類器是一種基于概率論的典型的生成學習方法,給定先驗概率,從訓練集數(shù)據(jù)學習中獲得聯(lián)合概率分布,計算未知數(shù)據(jù)后驗概率分布;人工神經(jīng)網(wǎng)絡(ANNs)是通過激活函數(shù)傳遞激活響應來模擬大腦神經(jīng)突觸傳遞處理信息的一種模型,由輸入層、隱藏層、輸出層組成,隱藏層包含一系列的線性方程,可以通過層次反饋自我調(diào)整模型參數(shù),學習能力、魯棒性強,應用范圍廣。
1.1.2 非監(jiān)督學習 非監(jiān)督學習算法能夠通過挖掘數(shù)據(jù)潛在的規(guī)律,將無標記的數(shù)據(jù)集按照各自特性進行自學習的聚類。迭代計算樣本間和類間的距離,使類內(nèi)差距最小化、類間差距最大化,通常用于缺乏先驗知識,缺少標簽的情況[3]。典型算法有K-均值聚類(K-means):先假定類簇數(shù)量并選擇類中心,對雜亂無章的數(shù)據(jù)計算到中心的距離,歸類并更新簇類中心,依次迭代自動聚類;主成分分析法(PCA):通過正交變換,可以將大量有關聯(lián)變量降維成非相關主成分變量,來代替原始數(shù)據(jù)進行下一步處理,降低復雜度的同時保留了數(shù)據(jù)的基本特征。最大期望算法(EM):假定初始分布參數(shù),計算每個數(shù)據(jù)元組隱藏變量的期望,即對其歸類,根據(jù)歸類結(jié)果計算分布參數(shù)的最大似然估計,然后再反向計算數(shù)據(jù)元組隱藏變量期望,迭代往復最終得到穩(wěn)定的估計值;高斯混合模型(GMM):利用高斯概率密度函數(shù)將類量化為若干基于高斯概率密度函數(shù)的模型,目標是找到合適參數(shù)的高斯分布使得產(chǎn)生已知樣本的可能性最大,則說明該樣本屬于該類。實際中,根據(jù)具體情況選擇合適的模型算法。
1.1.3 半監(jiān)督學習 半監(jiān)督學習方式針對已對部分數(shù)據(jù)集做標記的情況,利用部分標記學習引導全局,提高準確性的同時能夠盡可能少的要求人為參與,符合大多數(shù)的實際情況。通常是對監(jiān)督和非監(jiān)督學習算法的融合,綜合利用有標記的樣本集和無標記的樣本集,可以增強分類準確性。如基于概率論的生成模型可以融合高斯混合模型或貝葉斯模型等;基于圖論的推理算法建立已標記和未標記樣本之間的關聯(lián),并通過相似性度量構(gòu)造聚類圖;半監(jiān)督支持向量機在存在無標簽數(shù)據(jù)的前提下能夠構(gòu)造最優(yōu)分類超平面。
1.1.4 強化學習 強化學習是將輸入的數(shù)據(jù)再作為反饋輸入模型中,而非對輸入固定數(shù)據(jù)集完全信賴,模型按照反饋多步修正,不斷提高分類精度。不同于監(jiān)督學習中有訓練數(shù)據(jù)的輸出值,強化學習中有“獎勵值”作為強化信號,用于延后評價智能體與外界交互的狀態(tài),智能體根據(jù)反饋的獎勵值和狀態(tài)選擇下一動作,依次迭代獲得最大獎賞,以此來增強優(yōu)化學習效果。常見算法有基于值算法的Q-Learning、基于策略算法的Actor-Critic 框架,時間差分學習算法等,可以和深度學習結(jié)合形成主流的深度強化學習。
1.2 醫(yī)療大數(shù)據(jù)處理技術 大數(shù)據(jù)技術能夠幫助從海量的醫(yī)療數(shù)據(jù)中獲取有價值的信息,作為機器學習或其他數(shù)據(jù)挖掘方式的處理對象,構(gòu)造數(shù)據(jù)模型,進而應用于臨床診斷或醫(yī)學研究。主要包括數(shù)據(jù)的采集、預處理、存儲和管理、分析和挖掘四個關鍵技術[4]。
1.2.1 數(shù)據(jù)采集 醫(yī)療大數(shù)據(jù)采集的任務是從單一或多個醫(yī)療機構(gòu)中獲取診療、影像、檢驗、病理等業(yè)務數(shù)據(jù),包括結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化等多種形式。可通過傳感、監(jiān)控、接入數(shù)據(jù)庫等技術直接獲取,通過區(qū)域、省、國家級數(shù)據(jù)監(jiān)管平臺以接口傳輸方式采集轄域內(nèi)所有機構(gòu)的醫(yī)療數(shù)據(jù),進行統(tǒng)一組織、整合形成原始醫(yī)療大數(shù)據(jù)資源。
1.2.2 數(shù)據(jù)預處理 數(shù)據(jù)預處理是對采集的原始數(shù)據(jù)通過辨析、抽取、清洗等一系列操作。先將雜亂、復雜的多種數(shù)據(jù)結(jié)構(gòu)和類型轉(zhuǎn)化為單一或便于處理的構(gòu)型,然后對數(shù)據(jù)“去噪”處理,最后提取出有效的醫(yī)療大數(shù)據(jù)。
1.2.3 大數(shù)據(jù)存儲和管理 建立合理數(shù)據(jù)庫存儲醫(yī)療大數(shù)據(jù),高效的對各種構(gòu)型數(shù)據(jù)進行管理和調(diào)用,是數(shù)據(jù)存儲的目標。需要結(jié)合數(shù)據(jù)建模、去冗余、異構(gòu)數(shù)據(jù)融合、大數(shù)據(jù)索引以及可視化等技術實現(xiàn)。實施大數(shù)據(jù)安全技術,嚴格控制過程中數(shù)據(jù)的訪問、加解密、審計、隱私保護、完整性驗證等操作,這是安全利用醫(yī)療大數(shù)據(jù)的保障。
1.2.4 大數(shù)據(jù)分析和挖掘 數(shù)據(jù)分析和挖掘是大數(shù)據(jù)技術的核心,對獲取的醫(yī)療大數(shù)據(jù)進行統(tǒng)計學分析,通過機器學習、網(wǎng)絡、圖、特異群等數(shù)據(jù)挖掘技術,提取出隱含在數(shù)據(jù)內(nèi)部有用的信息或知識,用于分類、預測、異常或趨勢發(fā)現(xiàn)等。
1.3 計算機視覺 諸如影像、病理、超聲等醫(yī)學圖像在醫(yī)療領域的輔助診療中有重要決策性作用,利用計算機視覺技術,模擬人眼觀察、定位和感知圖像的過程,從而提取出感興趣的知識。涉及圖像處理、模式識別、語義理解等關鍵性技術,這里的圖像可以擴展應用于視頻,因為視頻是一組連續(xù)的圖像序列[5]。
1.3.1 圖像處理 圖像處理是將成像設備獲取的并轉(zhuǎn)換的數(shù)字圖像進行操作運算,以滿足對圖像質(zhì)量或特定場景的需求。例如基于像素級的增強、銳化、去噪、融合、分割,基于頻率域的圖像變換、解壓縮,基于數(shù)學形態(tài)學的膨脹腐蝕、填充,基于水平集的分割、跟蹤等。
1.3.2 模式識別 圖像識別技術是模式識別領域的一大重要分支,是在圖像處理基礎之上抽取圖像的特征與信息,作為機器學習模型的數(shù)據(jù)集進行訓練,從而對圖像內(nèi)容進行特定目標的認知。常針對圖像中的某些部分,如分割區(qū)域的分類或識別,涉及圖像檢測、分類、檢索、匹配等技術。
1.3.3 圖像語義理解 圖像理解是對圖像內(nèi)容更深一步的高層次語義認知,基于上下文特征信息,研究圖像中的目標、目標之間的聯(lián)系以及場景等。為了縮小圖像表達和語義之間的鴻溝,建立圖像與語義標簽之間的對應關系,包括語義分析生成、叛別和句法描述等處理策略。
2.1 以數(shù)據(jù)為驅(qū)動的應用
2.1.1 輔助診療 以歷史檢查、檢驗、診斷等大數(shù)據(jù)為樣本集,利用機器學習技術,訓練構(gòu)造針對某一疾病預測模型。根據(jù)病人當前檢查客觀值,結(jié)合公有知識庫、專業(yè)文獻,預測出患有某種疾病的概率,如已有的心血管病、阿爾茲海默癥等,將被動診治的過程轉(zhuǎn)換成主動防御,將治療過程前移,能夠早預防、早治療,提高治療的有效性。針對疾病,以歷史用藥、開立檢查作為樣本集,在醫(yī)生的診治過程中給予相應用藥、檢查推薦提醒,或為醫(yī)生提供查詢、鑒別、合理用藥等服務,以防人為疏漏和錯誤,輔助臨床決策,間接提高診治水平[3]。在智能問診、導診方向的應用也較為廣泛。
2.1.2 健康評估與管理 隨著社會的發(fā)展,人們對自身的健康日益重視,國內(nèi)針對個人或家庭的健康管理技術和產(chǎn)業(yè)尚處于起步階段。利用傳感器、傳輸、物聯(lián)網(wǎng)等數(shù)據(jù)采集技術獲取人的各項生命體征,建立個人電子健康檔案,利用AI 結(jié)合云服務技術,對個人的健康狀態(tài)進行計算、評估,預測潛在風險并給出有針對性的預防和改善策略。通過應用載體和軟件,能夠?qū)ι芷趦?nèi)的各項體征實時、動態(tài)、持續(xù)采集、監(jiān)控和分析處理,全方位多維度評估健康狀況。對于慢病、亞健康、老年病、母嬰等人群的健康管理尤為重要[2]。
2.1.3 精準醫(yī)療 作為新一代診療技術,精準醫(yī)療借助人類基因測序技術,以個體蛋白質(zhì)組、基因組為對象,以大數(shù)據(jù)技術為基礎研究其與特定疾病之間的關聯(lián),精確定位某些疾病的原始基因性起因,從而確定精準治療靶點,預測重大缺陷性疾病。相對于傳統(tǒng)的治療方式,精準醫(yī)療不止精確而且便捷高效,減少甚至避免對病人的創(chuàng)傷,對于已病和未病的治療和防御均有重要的臨床價值。目前在遺傳病、腫瘤、婦科等領域具有廣泛深入的應用。
2.1.4 藥物挖掘 傳統(tǒng)藥物研發(fā)效率低、周期長、成本高,將人工智能技術融入藥物挖掘流程的各個階段,為科研人員開創(chuàng)了新的思維,有效縮短研發(fā)時間,合理控制成本。在臨床前能夠提高化合物的篩選效率、選擇合適劑量,臨床中結(jié)合醫(yī)療大數(shù)據(jù)迅速找到符合條件的病人進行臨床試驗,對治療和配伍效果進行預測和評估、控制不良反應。借助深度學習,已有企業(yè)在心血管藥物、抗腫瘤藥物、常見傳染病治療藥等領域取得突破性進展。
2.2 以圖像為驅(qū)動的應用
2.2.1 醫(yī)學圖像分析診斷 隨著醫(yī)療成像設備的發(fā)展,醫(yī)學圖像的呈現(xiàn)方式愈加多樣化,如X 線、CT、核磁MRI、超聲、內(nèi)窺鏡、病理等。借助圖像處理與分析技術,對獲取的醫(yī)學圖像進行基礎的預處理,將圖像根據(jù)特定需求提取特征、定位勾畫、增強或分割;再進行基于機器學習的圖像高級語義識別、標注、分類等操作,根據(jù)局部病灶區(qū)域特征,智能定量檢測分析、篩查并預測可能的疾病或潛在風險,不僅可以提高醫(yī)生的讀片診斷效率,還提升準確率,降低人為疏忽造成的遺漏。例如,目前在肺部、腦部、心臟、眼部等組織器官的圖像病變識別中均有較為深入的研究[5]。
2.2.2 三維圖像建模技術 以二維圖像為基礎,利用三維AI 可視化技術,對人體目標進行全方位立體識別分析,并進行三維建模,直觀形象的構(gòu)造虛擬解剖組織結(jié)構(gòu),模擬病灶與周圍結(jié)構(gòu)的幾何位置關系。醫(yī)生以人機交互的方式對病灶區(qū)域旋轉(zhuǎn)、平移或模擬剖開手術等,幫助醫(yī)生精確快速診斷并制定可行、科學的治療或手術方案。不僅能提高治療或手術的有效性,還減少病人不必要的創(chuàng)傷。在腫瘤、頭顱、血管、婦產(chǎn)科、骨骼牙齒修復等領域的診斷觀察和手術操作中,三維重建技術都有重要的應用。
2.3 綜合新技術應用
2.3.1 醫(yī)療機器人 醫(yī)療機器人是服務于醫(yī)療機構(gòu)各項業(yè)務的機器,由特定的程序控制其動作行為,并可融入AI 使其具有對自身或環(huán)境的意識。其中,運送機器人可以代替人工配送藥品、三餐,回收垃圾或運送病人,減少人的重復勞動,在傳染病隔離病房中降低接觸感染幾率;護理機器人可協(xié)助護士確認病人身份,測量體溫等生命體征,并準確為其配藥,緩解繁瑣的護理工作;手術機器人協(xié)助外科醫(yī)生手術操作,彌補人醫(yī)生體能、耐力和精度的不足,融入智能的手術機器人,借助全方位的影像系統(tǒng),能夠自主分析病灶并提供合適的方案,實現(xiàn)微創(chuàng)、數(shù)字、智能的手術模式。
2.3.2 遠程醫(yī)療 5G 網(wǎng)絡的發(fā)展對推動問診、會診等基礎遠程診療的發(fā)展,將AI 融入遠程診療,輔助醫(yī)生線上影像的分析、診斷決策、用藥和檢查推薦等,提高遠程診療質(zhì)量。醫(yī)生和病人擺脫了地域的限制,拓展應用場景。通過醫(yī)療可穿戴設備采集生命體征,實現(xiàn)遠程智能監(jiān)護;醫(yī)生甚至可以通過5G 遠程手術技術控制機械臂,對異地患者進行精準的手術,可以實現(xiàn)共享優(yōu)質(zhì)醫(yī)療服務和資源。
3.1 醫(yī)療人工智能意義 人工智能給醫(yī)療行業(yè)帶來了前所未有的發(fā)展機遇,貫穿于醫(yī)療診治全過程,在疾病預防、預測、診療、預后評估等階段均有重要的輔助甚至主導作用,拓展了醫(yī)療服務場景和領域[6]。對于臨床醫(yī)務人員,能夠幫助提高診治效率和質(zhì)量,在一定程度上彌補技術、人力、及時性、準確性上的不足;對于患者,能夠享受傳統(tǒng)醫(yī)療基礎之上的新型服務模式,尤其在個人健康防御、管理和監(jiān)測方面具有優(yōu)于傳統(tǒng)方式的用戶體驗;對于管理者,借助AI工具能夠輕松獲取科學、準確的分析評估和預測,以便合理調(diào)配資源,做出相應決策;對于醫(yī)療機構(gòu),提升了自身的醫(yī)療服務能力和質(zhì)量,緩解醫(yī)患矛盾,有利于擴大公眾影響力;對于科研人員,開拓了實際應用前景,為醫(yī)療行業(yè)打開發(fā)展新局面。
3.2 醫(yī)療人工智能面臨的挑戰(zhàn) 醫(yī)療AI 在研究和實施過程中存在很多問題和挑戰(zhàn),需要在探索發(fā)展中不斷完善。首先,醫(yī)療大數(shù)據(jù)分散、復雜、多樣,數(shù)據(jù)融合和共享存在一些技術和非技術的客觀困難;數(shù)據(jù)來源的準確性和完整性關系到后續(xù)研究的精確性和有效性,對數(shù)據(jù)的安全性保護是整個研究過程的保障性前提。其次,醫(yī)療AI 需要計算機和醫(yī)學學科綜合雙面人才,這種專業(yè)性雙面人才培養(yǎng)較為缺失,一定程度上阻礙了醫(yī)療AI 的研究進展。最后,受現(xiàn)有技術制約,AI 系統(tǒng)學習時間長,醫(yī)務人員使用需要長期磨合;AI 器械安裝調(diào)試復雜,維護和處置難度大、成本高,給AI 的實施推廣增加困難[6]。另外,醫(yī)療AI 服務于患者,缺乏配套的監(jiān)管和法律問責機制,存在一定的風險和隱患,需要在實施中不斷健全相關政策規(guī)則。
醫(yī)療人工智能不僅是一種新興技術手段,更是一個融合多門專業(yè)學科的重要學術和應用領域。以機器學習、大數(shù)據(jù)分析處理、計算機視覺等關鍵性技術為基礎,在輔助診斷、精準醫(yī)療、醫(yī)學圖像分析、醫(yī)療機器人等領域已形成初具規(guī)模的應用,擁有廣闊的發(fā)展前景。醫(yī)療AI 為患者、醫(yī)生、醫(yī)療機構(gòu)提供了高科技的服務和幫助,從各方面助力提高診療質(zhì)量和效率、創(chuàng)新服務場景,變革了傳統(tǒng)的診療模式。同時,在實際研究和應用中,醫(yī)療AI 存在技術、安全、人才、法律權(quán)責等諸多方面的障礙和挑戰(zhàn),需要多方協(xié)作應對,共同推動醫(yī)療事業(yè)的進步和發(fā)展。