趙陽光
中國信息通信研究院 北京 100191
人工智能已經(jīng)非常廣泛的應(yīng)用于醫(yī)療領(lǐng)域,人工智能技術(shù)與醫(yī)療領(lǐng)域呈現(xiàn)出不斷融合的趨勢。醫(yī)療行業(yè)長期存在優(yōu)質(zhì)醫(yī)生資源分配不均,診斷誤診漏診率較高,醫(yī)療費(fèi)用成本過高,放射科、病理科等科室醫(yī)生培養(yǎng)周期長,醫(yī)生資源供需缺口大等問題。隨著近些年深度學(xué)習(xí)技術(shù)的不斷進(jìn)步,人工智能逐步從前沿技術(shù)轉(zhuǎn)變?yōu)楝F(xiàn)實(shí)應(yīng)用。在醫(yī)療健康行業(yè),人工智能的應(yīng)用場景越發(fā)豐富,人工智能技術(shù)也逐漸成為影響醫(yī)療行業(yè)發(fā)展、提升醫(yī)療服務(wù)水平的重要因素。與互聯(lián)網(wǎng)技術(shù)在醫(yī)療行業(yè)的應(yīng)用不同,人工智能對醫(yī)療行業(yè)的改造包括生產(chǎn)力的提高、生產(chǎn)方式的改變、底層技術(shù)的驅(qū)動、上層應(yīng)用的豐富。通過人工智能在醫(yī)療領(lǐng)域的應(yīng)用,可以提高醫(yī)療診斷準(zhǔn)確率與效率;提高患者自診比例,降低患者對醫(yī)生的需求量;輔助醫(yī)生進(jìn)行病變檢測,實(shí)現(xiàn)疾病早期篩查;大幅提高新藥研發(fā)效率,降低制藥時間與成本[1]。
人工智能與醫(yī)療的結(jié)合方式較多,就醫(yī)流程方面包括診前、診中、診后;適用對象方面包括醫(yī)院、醫(yī)生、患者、藥企、檢驗(yàn)機(jī)構(gòu)等;從賦能醫(yī)療行業(yè)的角度分析,包括降低醫(yī)療成本,提高診斷效率等多種模式。我國醫(yī)療人工智能企業(yè)聚焦的應(yīng)用場景集中在虛擬助理、病歷與文獻(xiàn)分析、醫(yī)療影像輔助診斷、藥物研發(fā)、基因測序等領(lǐng)域。
健康管理助手是指通過語音識別、自然語言處理等技術(shù),將患者的病癥描述與標(biāo)準(zhǔn)的醫(yī)學(xué)指南作對比,為用戶提供醫(yī)療咨詢、自診、導(dǎo)診等服務(wù)的信息系統(tǒng)。多數(shù)疾病都是可以預(yù)防的,但是由于疾病通常在發(fā)病前期表征并不明顯,到病況加重之際才會被發(fā)現(xiàn)。雖然醫(yī)生可以借助工具進(jìn)行疾病輔助預(yù)測,但人體的復(fù)雜性、疾病的多樣性會影響預(yù)測的準(zhǔn)確程度。人工智能技術(shù)與醫(yī)療健康可穿戴設(shè)備的結(jié)合可以實(shí)現(xiàn)疾病的風(fēng)險預(yù)測和實(shí)際干預(yù)。風(fēng)險預(yù)測包括對個人健康狀況的預(yù)警,以及對流行病等公共衛(wèi)生事件的監(jiān)控;干預(yù)則主要指針對不同患者的個性化的健康管理和健康咨詢服務(wù)(如圖1)。
健康管理助手在醫(yī)生端和用戶端均發(fā)揮了較大的作用。在醫(yī)生端,智能問診可以輔助醫(yī)生診斷,尤其是受限于基層醫(yī)療機(jī)構(gòu)全科醫(yī)生數(shù)量、質(zhì)量的不足,醫(yī)療設(shè)備條件的欠缺,基層醫(yī)療成為了我國分級診療發(fā)展的瓶頸。人工智能虛擬助手可以幫助基層醫(yī)生進(jìn)行一些常見病的篩查,以及重大疾病的預(yù)警與監(jiān)控,幫助基層醫(yī)生更好地完成轉(zhuǎn)診的工作,這是人工智能問診在醫(yī)生端的價值體現(xiàn)。在用戶端,健康管理助手能夠幫助普通用戶完成健康咨詢、導(dǎo)診等服務(wù)。在很多情況下,用戶身體只是稍感不適,并不需要進(jìn)入醫(yī)院進(jìn)行就診。健康管理助手可以根據(jù)用戶的描述定位到用戶的健康問題,提供輕問診服務(wù)和用藥指導(dǎo)?;颊咴诰驮\前使用預(yù)問診系統(tǒng)填寫病情相關(guān)信息,由系統(tǒng)生成規(guī)范、詳細(xì)的門診電子病歷發(fā)送給醫(yī)生。預(yù)問診系統(tǒng)采用層次轉(zhuǎn)移的設(shè)計(jì)架構(gòu)模擬醫(yī)生進(jìn)行問診,既能有邏輯地像醫(yī)生一樣詢問基本信息、疾病、癥狀、治療情況、既往史等信息,同時,可以圍繞任一癥狀、病史等進(jìn)行細(xì)節(jié)特征的問診。除問診外,預(yù)問診系統(tǒng)基于自然語言生成技術(shù)自動生成規(guī)范、詳細(xì)的問診報(bào)告,主要包括:患者基本信息、主訴、現(xiàn)病史、既往史和過敏史五個部分[2]。
電子病歷是在傳統(tǒng)病歷基礎(chǔ)上,記錄醫(yī)生與病人的交互過程以及病情發(fā)展情況的電子化病情檔案,包含病案首頁、檢驗(yàn)結(jié)果、住院記錄、手術(shù)記錄、醫(yī)囑等信息。其中既有結(jié)構(gòu)化數(shù)據(jù),也包括大量自由文本輸入的非結(jié)構(gòu)化數(shù)據(jù)。對電子病歷及醫(yī)學(xué)文獻(xiàn)中的海量醫(yī)療大數(shù)據(jù)進(jìn)行分析,有利于促進(jìn)醫(yī)學(xué)研究,同時,也為醫(yī)療器械、藥物的研發(fā)提供了基礎(chǔ)。人工智能利用機(jī)器學(xué)習(xí)和自然語言處理技術(shù)可以自動抓取來源于異構(gòu)系統(tǒng)的病歷與文獻(xiàn)數(shù)據(jù),并形成結(jié)構(gòu)化的醫(yī)療數(shù)據(jù)庫。國內(nèi)眾多相關(guān)企業(yè)正是基于自己構(gòu)建的知識圖譜,形成了供醫(yī)生使用的臨床決策支持產(chǎn)品,為醫(yī)生的診斷提供輔助,包括病情評估、診療建議、藥物禁忌等服務(wù)。
圖1 人工智能+健康管理:預(yù)測+干預(yù)
醫(yī)療影像數(shù)據(jù)是醫(yī)療數(shù)據(jù)的重要組成部分,從數(shù)量上看90%以上的醫(yī)療數(shù)據(jù)都是影像數(shù)據(jù),從產(chǎn)生數(shù)據(jù)的設(shè)備來看包括CT、X光、MRI、PET等醫(yī)療影像數(shù)據(jù)。據(jù)統(tǒng)計(jì),醫(yī)學(xué)影像數(shù)據(jù)年增長率為63%,而放射科醫(yī)生數(shù)量年增長率僅為2%,放射科醫(yī)生供給缺口很大。人工智能技術(shù)與醫(yī)療影像的結(jié)合有望緩解此類問題。人工智能技術(shù)在醫(yī)療影像的應(yīng)用主要指通過計(jì)算機(jī)視覺技術(shù)對醫(yī)療影像進(jìn)行快速讀片和智能診斷。人工智能在醫(yī)學(xué)影像中應(yīng)用主要分為兩部分: 一是感知數(shù)據(jù),即通過圖像識別技術(shù)對醫(yī)學(xué)影像進(jìn)行分析,獲取有效信息;二是數(shù)據(jù)學(xué)習(xí)、訓(xùn)練環(huán)節(jié),通過深度學(xué)習(xí)海量的影像數(shù)據(jù)和臨床診斷數(shù)據(jù),不斷對模型進(jìn)行訓(xùn)練,促使其掌握診斷能力[3]。目前,人工智能技術(shù)與醫(yī)療影像診斷的結(jié)合場景包括肺癌檢查、糖網(wǎng)眼底檢查、食管癌檢查以及部分疾病的核醫(yī)學(xué)檢查和病理檢查等。
以肺結(jié)節(jié)檢出為例,利用人工智能技術(shù)進(jìn)行肺部腫瘤良性惡性的判斷步驟主要包括:數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、圖像分割、肺結(jié)節(jié)標(biāo)記、模型訓(xùn)練、分類預(yù)測。首先要獲取放射性設(shè)備,如CT掃描的序列影像,并對圖像進(jìn)行預(yù)處理以消除原CT圖像中的邊界噪聲,然后利用分割算法生成肺部區(qū)域圖像,并對肺結(jié)節(jié)區(qū)域進(jìn)行標(biāo)記。數(shù)據(jù)獲取后,對3D卷積神經(jīng)網(wǎng)絡(luò)的模型進(jìn)行訓(xùn)練,以實(shí)現(xiàn)在肺部影像中尋找結(jié)節(jié)位置并對結(jié)節(jié)性質(zhì)進(jìn)行分類判斷。
藥物研發(fā)需經(jīng)歷靶點(diǎn)篩選、藥物挖掘、臨床試驗(yàn)、藥物優(yōu)化等階段。利用傳統(tǒng)手段的藥物研發(fā)需要進(jìn)行大量的模擬測試,周期長、成本高,傳統(tǒng)藥物研發(fā)需要投入大量的時間與金錢,制藥公司平均成功研發(fā)一款新藥需要10億美元及10年左右時間。目前,業(yè)界已嘗試?yán)萌斯ぶ悄荛_發(fā)虛擬篩選技術(shù),發(fā)現(xiàn)靶點(diǎn)、篩選藥物,以取代或增強(qiáng)傳統(tǒng)高通量篩選(HTS)過程,提高潛在藥物的篩選速度和成功率。通過深度學(xué)習(xí)和自然語言處理技術(shù)可以理解和分析醫(yī)學(xué)文獻(xiàn)、論文、專利、基因組數(shù)據(jù)中的信息,從中找出相應(yīng)的候選藥物,并篩選出針對特定疾病有效的化合物,從而大幅縮減研發(fā)時間與成本。
基因測序是一種新型基因檢測技術(shù),它通過分析測定基因序列,可用于臨床的遺傳病診斷、產(chǎn)前篩查、罹患腫瘤預(yù)測與治療等領(lǐng)域。單個人類基因組擁有30億個堿基對,編碼約23000個含有功能性的基因,基因檢測就是通過解碼從海量數(shù)據(jù)中挖掘有效信息。目前高通量測序技術(shù)的運(yùn)算層面主要為解碼和記錄,較難以實(shí)現(xiàn)基因解讀,所以從基因序列中挖掘出的有效信息十分有限。人工智能技術(shù)的介入可改善目前的瓶頸。通過建立初始數(shù)學(xué)模型,將健康人的全基因組序列和RNA序列導(dǎo)入模型進(jìn)行訓(xùn)練,讓模型學(xué)習(xí)到健康人的RNA剪切模式。之后通過其他分子生物學(xué)方法對訓(xùn)練后的模型進(jìn)行修正,最后對照病例數(shù)據(jù)檢驗(yàn)?zāi)P偷臏?zhǔn)確性。
數(shù)據(jù)是人工智能技術(shù)最重要的因素之一。對于機(jī)器學(xué)習(xí)而言,模型越復(fù)雜、越具有強(qiáng)表達(dá)能力越容易降低對未來數(shù)據(jù)的解釋能力,而專注于解釋訓(xùn)練數(shù)據(jù)。這種現(xiàn)象會導(dǎo)致訓(xùn)練數(shù)據(jù)效果很好,但遇到未知的測試數(shù)據(jù)預(yù)測效果會大幅降低,即發(fā)生過擬合現(xiàn)象,從而也就需要更多的數(shù)據(jù)來避免該問題的發(fā)生,以保證訓(xùn)練的模型對新的數(shù)據(jù)也能有良好的預(yù)測表現(xiàn)。對于醫(yī)療人工智能而言,數(shù)據(jù)的重要性更為明顯。以醫(yī)療影像輔助診斷公司為例,企業(yè)訓(xùn)練模型的數(shù)據(jù)來源通常是公開數(shù)據(jù)集,或者企業(yè)與個別醫(yī)院合作獲取的影像數(shù)據(jù)。這種模式在企業(yè)創(chuàng)業(yè)初期可以維持,但是當(dāng)企業(yè)發(fā)展到一定階段時弊端會開始出現(xiàn)。以肺結(jié)節(jié)CT篩查為例,企業(yè)通常與個別醫(yī)院展開合作,獲取該醫(yī)院CT設(shè)備的數(shù)據(jù)。但是,目前,市面上廣泛流通的CT設(shè)備商有七到八家,機(jī)型則達(dá)到了上百種,企業(yè)在與醫(yī)院合作時是針對某一機(jī)型的設(shè)備進(jìn)行的數(shù)據(jù)訓(xùn)練,該模型在適用于其他機(jī)型時,如果一些諸如層厚、電流、電壓、掃描時間等參數(shù)不同,模型需要重新針對新機(jī)型進(jìn)行數(shù)據(jù)預(yù)訓(xùn)練。除此以外,病人受檢測時的姿勢(平躺或者趴窩),CT長寬512像素或者768像素的差別,不同排數(shù)機(jī)器的層厚差異以及薄層重構(gòu)算法都是對模型訓(xùn)練產(chǎn)生影響的因素。因此,數(shù)據(jù)問題的解決是保證醫(yī)療影像輔助診斷產(chǎn)品是否能夠廣泛應(yīng)用的關(guān)鍵,廣泛開展合作,加深數(shù)據(jù)的積累以及技術(shù)上的創(chuàng)新或是下一步行業(yè)發(fā)展的重點(diǎn)。
醫(yī)療AI產(chǎn)品需要實(shí)現(xiàn)從試驗(yàn)向臨床應(yīng)用的突破。目前,業(yè)內(nèi)針對肺結(jié)節(jié)、糖網(wǎng)病檢查等場景的醫(yī)療人工智能產(chǎn)品診斷準(zhǔn)確率普遍很高,但是真實(shí)情況并非如此樂觀。企業(yè)在訓(xùn)練自己模型時通常都有自己的數(shù)據(jù)庫,各自的算法都是按照自己的數(shù)據(jù)進(jìn)行訓(xùn)練,然后以自己的數(shù)據(jù)來驗(yàn)證準(zhǔn)確性。在沒有得到臨床驗(yàn)證前,基于標(biāo)準(zhǔn)或特定數(shù)據(jù)集的實(shí)驗(yàn)室測試結(jié)果并不具備較大的意義,因?yàn)閷?shí)際臨床應(yīng)用的場景是非常復(fù)雜的。以糖網(wǎng)病篩查為例,瞳孔較小、晶狀體渾濁等人群的免散瞳眼底彩照,圖像質(zhì)量往往達(dá)不到篩查的要求。此外,受限于成本因素,很多基層醫(yī)療機(jī)構(gòu)使用的是手持眼底相機(jī),成像質(zhì)量堪憂。
另外,目前圖像識別技術(shù)在醫(yī)療影像輔助診斷上的應(yīng)用已經(jīng)取得了比較好的應(yīng)用,技術(shù)上也取得了較大的突破,但是醫(yī)療影像輔助診斷產(chǎn)品下一步應(yīng)當(dāng)完善自己的算法,避免“就圖論圖”。以甲狀腺結(jié)節(jié)診斷為例,醫(yī)生診斷的依據(jù)并非只是彩超的拍片結(jié)果,還要結(jié)合甲狀腺功能化驗(yàn),查看抗體的相關(guān)表現(xiàn);因此,將臨床表征信息、患者基本信息、LIS指標(biāo)、隨訪記錄等都作為預(yù)測模型的因子,實(shí)現(xiàn)多模態(tài)的診斷體系將是醫(yī)療影像輔助診斷產(chǎn)品下一步重點(diǎn)突破的方向。
現(xiàn)在的醫(yī)療人工智能企業(yè)多數(shù)是依靠單點(diǎn)醫(yī)療機(jī)構(gòu)開展工作,合作方式較為單一,數(shù)據(jù)作為醫(yī)院資產(chǎn)也難以供企業(yè)放置于院外使用[4];此外,醫(yī)療人工智能產(chǎn)品想以銷售軟件的形式讓醫(yī)院付費(fèi),不論從計(jì)費(fèi)方式、軟件資質(zhì)等方面都較為困難;因此,建立可持續(xù)的商業(yè)模式是醫(yī)療人工智能行業(yè)長久發(fā)展的關(guān)鍵。
人工智能協(xié)助進(jìn)行輔助診斷在醫(yī)療責(zé)任認(rèn)定方面也存在問題和挑戰(zhàn)。例如,用戶在使用醫(yī)療虛擬助手表達(dá)主訴時,可能會漏掉甚至錯誤地進(jìn)行描述,導(dǎo)致虛擬助手提供的建議是不符合用戶原本的疾病情況的;因此,目前監(jiān)管部門禁止虛擬助手軟件提供任何疾病的診斷建議,只允許提供用戶健康輕問診咨詢服務(wù)。我國監(jiān)管部門對于利用人工智能技術(shù)提供診斷功能的審核要求非常嚴(yán)格,對于能夠?qū)Σ∽儾课贿M(jìn)行自動識別并提供明確診斷提示的產(chǎn)品,必須按照第三類醫(yī)療器械進(jìn)行臨床試驗(yàn)認(rèn)證管理。未來,應(yīng)進(jìn)一步明確針對AI診斷進(jìn)入臨床應(yīng)用的法律標(biāo)準(zhǔn),做出AI診斷的主體在法律上是醫(yī)生還是醫(yī)療器械,AI診斷出現(xiàn)缺陷或醫(yī)療過失的判斷依據(jù)等問題。
雖然我國醫(yī)療人工智能領(lǐng)域近幾年取得了應(yīng)用層面的突破,但我國醫(yī)療人工智能整體發(fā)展水平與發(fā)達(dá)國家相比仍存在差距,在前沿基礎(chǔ)設(shè)施建設(shè)、產(chǎn)業(yè)應(yīng)用、人才培養(yǎng)和監(jiān)管體系等方面都亟待建立和完善。
尤其在基層建設(shè)層面,有效的醫(yī)療大數(shù)據(jù)的積累將是醫(yī)療人工智能產(chǎn)業(yè)未來發(fā)展的核心因素。醫(yī)療數(shù)據(jù)的有效性包括三個方面:電子化程度、標(biāo)準(zhǔn)化程度以及共享機(jī)制。電子化程度強(qiáng)調(diào)數(shù)據(jù)和病歷的供給量;標(biāo)準(zhǔn)化程度強(qiáng)調(diào)數(shù)據(jù)之間的可比性和通用型;共享機(jī)制強(qiáng)調(diào)數(shù)據(jù)獲取渠道的便利性和合法性。只有滿足上述三個方面的條件,醫(yī)療大數(shù)據(jù)才能得到有效搜集和應(yīng)用,進(jìn)而為人工智能打下基礎(chǔ)。在醫(yī)療大數(shù)據(jù)策略方面,美國聯(lián)邦制定了各種數(shù)據(jù)標(biāo)準(zhǔn),包括數(shù)據(jù)交換格式、數(shù)據(jù)模型表達(dá)方法等,因此,美國醫(yī)療大數(shù)據(jù)的積累擁有大量底層、標(biāo)準(zhǔn)、數(shù)據(jù)規(guī)范、標(biāo)準(zhǔn)代碼等作為基礎(chǔ)支撐。我國在醫(yī)療數(shù)據(jù)質(zhì)量控制方面存在一定的問題,不同醫(yī)療機(jī)構(gòu)間的數(shù)據(jù)差異性非常大,導(dǎo)致構(gòu)建一致性的數(shù)據(jù)集難度較大,即便在醫(yī)院內(nèi)部,數(shù)據(jù)分別存儲在不同臨床業(yè)務(wù)系統(tǒng),沒有實(shí)現(xiàn)互聯(lián)互通,數(shù)據(jù)間的鴻溝導(dǎo)致大量的數(shù)據(jù)未實(shí)現(xiàn)大數(shù)據(jù)的價值。
由于國內(nèi)醫(yī)學(xué)影像數(shù)量年增長率很高,而相應(yīng)的放射科醫(yī)師增長率較低,因此,供需缺口是推動國內(nèi)AI技術(shù)在醫(yī)學(xué)影像應(yīng)用的重要因素。我國人工智能+醫(yī)學(xué)影像的公司數(shù)量眾多,而且應(yīng)用領(lǐng)域也較為廣泛,在放射影像、糖網(wǎng)圖像、甲狀腺圖像、宮頸癌病理圖像等方面都有很深入的研究,產(chǎn)業(yè)界實(shí)力在世界范圍內(nèi)屬于前列。但是,除醫(yī)學(xué)影像外,我國對于AI技術(shù)利用的多樣性較發(fā)達(dá)國家存在一定差距。例如,美國許多企業(yè)在研究利用算法分析動物的血管和疾病,這對行業(yè)上下游非常重要。再比如腸道微生物有大量的數(shù)據(jù),微生物數(shù)據(jù)量達(dá)到百萬級別,甚至高于基因測序測的數(shù)據(jù)量,對于此部分?jǐn)?shù)據(jù)的分析也具備巨大價值。根據(jù)國家《新一代人工智能發(fā)展規(guī)劃》的總體戰(zhàn)略部署,以及《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計(jì)劃(2018-2020年)》中關(guān)于醫(yī)療領(lǐng)域的具體實(shí)施目標(biāo),我國正在重點(diǎn)培育和發(fā)展醫(yī)療影像輔助診斷系統(tǒng)等醫(yī)療人工智能產(chǎn)品,并通過搭建醫(yī)療行業(yè)訓(xùn)練資源庫、標(biāo)準(zhǔn)測試集及知識產(chǎn)權(quán)服務(wù)平臺夯實(shí)人工智能產(chǎn)業(yè)發(fā)展的軟硬件基礎(chǔ),完善醫(yī)療人工智能發(fā)展環(huán)境。未來醫(yī)療人工智能行業(yè)需要加強(qiáng)上下游協(xié)同,形成產(chǎn)業(yè)發(fā)展閉環(huán)。在構(gòu)建醫(yī)療輔助診斷系統(tǒng)過程中,應(yīng)結(jié)合患者基本信息、臨床表現(xiàn)、影像學(xué)特征、病理檢驗(yàn)結(jié)果、隨訪等多種因素,研發(fā)多模態(tài)人工智能輔助診斷系統(tǒng),從而逐步推進(jìn)醫(yī)療人工智能產(chǎn)品實(shí)現(xiàn)從試驗(yàn)向臨床應(yīng)用的突破。
[1] 徐國平,王家驥.基礎(chǔ)醫(yī)療衛(wèi)生服務(wù)應(yīng)該在中國新醫(yī)改中得到正確理解和全面實(shí)施[J].中國全科醫(yī)學(xué),2015:18-20
[2] 王斌,杜方冬.醫(yī)院信息化的相關(guān)理論問題研究[J].中國現(xiàn)代醫(yī)學(xué)雜志,2013:108-112
[3] 鉛筆道.人工智能與影像診斷相結(jié)合的醫(yī)生界阿爾法狗[J].中國醫(yī)學(xué)計(jì)算機(jī)成像雜志,2016:282-282
[4] 聶金福.人工智能在生物醫(yī)療領(lǐng)域的應(yīng)用和機(jī)遇[J].軟件和集成電路,2017(04)