劉延晶,王少鵬,徐喜卿,翟改霞,王作芬,封霄
(山東省淄博中心醫(yī)院,淄博 255000)
眼健康是國(guó)民健康的重要組成部分,貫穿于全年齡段、全生命周期,我國(guó)是世界上盲和視覺(jué)損傷人數(shù)最多的國(guó)家之一[1]。2016年,國(guó)家《“十三五”全國(guó)眼健康規(guī)劃(2016—2020年)》明確指出,防治導(dǎo)致盲和視覺(jué)損傷的主要眼病,鼓勵(lì)城市三級(jí)醫(yī)院眼科、眼科??漆t(yī)院與縣級(jí)綜合醫(yī)院眼科、基層醫(yī)療衛(wèi)生機(jī)構(gòu)建立協(xié)作醫(yī)聯(lián)體,為基層眼科提供醫(yī)療服務(wù)技術(shù)指導(dǎo),落實(shí)眼科分級(jí)診療,提升眼科診療和眼健康服務(wù)整體水平[4]。
目前我國(guó)致盲疾病中,眼底疾病是不可逆盲的首位病因,占全部致盲眼病的54.7%[5]。其中糖尿病造成的增殖性糖尿病視網(wǎng)膜病變(proliferative diabetic retinopathy,PDR)和糖尿病性黃斑水腫(diabetic macular edema,DME)是最常見(jiàn)的眼底血管性疾病發(fā)病率逐年增高,而這類疾病通過(guò)早期篩查和干預(yù),眼損害是可以逆轉(zhuǎn)的[6-7]。但我國(guó)現(xiàn)有醫(yī)療資源分布不均,眼科醫(yī)生數(shù)量明顯不足,無(wú)法實(shí)現(xiàn)大規(guī)模人工篩查,且人工智能(artificial intelligence,AI)技術(shù)應(yīng)用于視網(wǎng)膜疾病診斷和分類研究等方面已有大量證據(jù)支持[8-10]。以AI輔助的基層眼科全病種篩查轉(zhuǎn)診系統(tǒng)不僅可以釋放大量的基層眼科診療需求,還有利于基層患者的眼科疾病的早發(fā)現(xiàn)、早診斷、早治療。本研究所使用的人工智能技術(shù)VoxelCloud Retina已在4萬(wàn)余人的全國(guó)糖尿病患者隊(duì)列中進(jìn)行前瞻性篩查驗(yàn)證,滿足糖尿病視網(wǎng)膜病變(diabetic retinopathy,DR)的篩查要求[19]?;诖?,將AI技術(shù)應(yīng)用于眼底視網(wǎng)膜疾病的篩查,可為本市相關(guān)眼病患者提供了一種高效、低成本、廣覆蓋的解決方案。
2019年,淄博市成立了糖尿病眼病AI篩查聯(lián)盟。淄博市中心醫(yī)院眼科作為牽頭單位,借助于AI眼底篩查遠(yuǎn)程接轉(zhuǎn)診系統(tǒng),為醫(yī)聯(lián)體內(nèi)社區(qū)衛(wèi)生中心、鄉(xiāng)鎮(zhèn)衛(wèi)生院等基層醫(yī)療機(jī)構(gòu)就診的人群進(jìn)行技術(shù)指導(dǎo)和診療管理,可稱之為“患者-社區(qū)-醫(yī)院”遠(yuǎn)程篩查模式,目前這一模式在澳大利亞[11]、非洲偏遠(yuǎn)地區(qū)[12]及上海[13]等地均取得顯著成效。本研究通過(guò)分析篩查聯(lián)盟工作開(kāi)展和取得成效情況,為地市級(jí)醫(yī)療機(jī)構(gòu)開(kāi)展眼底疾病AI篩查工作提供經(jīng)驗(yàn)借鑒。
2019年8月7日—2021年1月19日,來(lái)自醫(yī)聯(lián)體內(nèi)社區(qū)衛(wèi)生中心、鄉(xiāng)鎮(zhèn)衛(wèi)生院等基層醫(yī)療機(jī)構(gòu),通過(guò)眼底AI系統(tǒng)就診,眼底成像清晰的人群。記錄年齡、性別、慢病史、眼底癥狀等臨床資料。該項(xiàng)目已經(jīng)由淄博市中心醫(yī)院倫理委員會(huì)批準(zhǔn),批準(zhǔn)號(hào)202102002。
由基層接診醫(yī)師完成雙眼免散瞳眼底彩照拍攝,并記錄完整的病史信息,由AI當(dāng)場(chǎng)出具初篩結(jié)果供接診醫(yī)生參考。上級(jí)眼科醫(yī)師通過(guò)云端系統(tǒng)實(shí)時(shí)進(jìn)行遠(yuǎn)程審核,并簽發(fā)報(bào)告及轉(zhuǎn)診建議,基層將最終篩查診斷報(bào)告交給患者,并進(jìn)行患者眼健康教育。
遠(yuǎn)程審核參考AI診斷結(jié)果給出閱片結(jié)論,對(duì)后極部眼底彩照所見(jiàn)疾病進(jìn)行篩查診斷。對(duì)發(fā)現(xiàn)需眼科專科干預(yù)的眼底疾病,通過(guò)簽發(fā)報(bào)告的文字備注建議來(lái)淄博市中心醫(yī)院眼科就診。具體流程見(jiàn)圖1。
圖1 AI診斷系統(tǒng)工作流程Figure 1 AI diagnostic system workflow
AI篩查軟件通過(guò)采集后極部眼底彩照可以對(duì)DR進(jìn)行五分級(jí)診斷,參考《中國(guó)2型糖尿病防治指南2020》;對(duì)DME進(jìn)行鑒別診斷,篩查參考標(biāo)準(zhǔn)為觀察黃斑中心兩個(gè)視盤(pán)直徑范圍內(nèi)是否檢出硬性滲出[2];對(duì)年齡相關(guān)性黃斑變性(AMD)進(jìn)行鑒別診斷,篩查參考標(biāo)準(zhǔn)為黃斑中心一個(gè)視盤(pán)直徑范圍內(nèi)是否檢出>63 μm直徑玻璃膜疣[3];對(duì)眼底血管阻塞診斷標(biāo)準(zhǔn)參考發(fā)現(xiàn)視網(wǎng)膜靜脈阻塞或動(dòng)脈阻塞典型征象。
記錄篩查病例數(shù)最多的時(shí)段為2020年4月—7月,對(duì)在基層就診且到上級(jí)眼科完成轉(zhuǎn)診的居民人數(shù)和基層戶籍地到上級(jí)醫(yī)院就診的居民人數(shù)進(jìn)行評(píng)估疾病譜差異及篩查轉(zhuǎn)診效果。其中基層就診后轉(zhuǎn)診到上級(jí)眼科的病例為基層醫(yī)療機(jī)構(gòu)日常接診并轉(zhuǎn)診的全部病例,本研究篩查的轉(zhuǎn)診病例是基層就轉(zhuǎn)診病例的子集。
本研究還對(duì)DR、DME、年齡相關(guān)性黃斑變性、三大類AI診斷疾病的表現(xiàn)進(jìn)行篩檢評(píng)價(jià),分析性能指標(biāo)。
對(duì)AI診斷與人工復(fù)核結(jié)果不一致的疾病,在上述時(shí)段按照拍攝來(lái)源分層抽取樣本50例,進(jìn)行錯(cuò)誤圖像原因分析,總結(jié)錯(cuò)誤的具體原因類型和頻次。
篩查產(chǎn)品Voxel Cloud Retina由蘇州體素信息科技有限公司提供,已取得國(guó)家二類醫(yī)療器械注冊(cè)證批件,軟件可以對(duì)需轉(zhuǎn)診的DR進(jìn)行自動(dòng)輔助診斷,該功能已申報(bào)三類醫(yī)療器械注冊(cè)證;軟件其余診斷能力:DR五分類、DME、AMD以及眼底血管阻塞的自動(dòng)輔助診斷尚在臨床前階段,首次在本地區(qū)進(jìn)行前瞻性篩檢試驗(yàn)驗(yàn)證。采用SPSS 20.0、R3.6.1進(jìn)行統(tǒng)計(jì)數(shù)據(jù)的處理,計(jì)量資料使用均數(shù)和標(biāo)準(zhǔn)差,篩檢試驗(yàn)采取靈敏度、特異度、陽(yáng)性預(yù)測(cè)值、陰性預(yù)測(cè)值進(jìn)行篩檢評(píng)價(jià),樣本率使用點(diǎn)估計(jì)和95%區(qū)間估計(jì)。
本研究共納入自7家基層或非眼科醫(yī)療機(jī)構(gòu)4 996例,按來(lái)源統(tǒng)計(jì),排名前三的醫(yī)療機(jī)構(gòu)納入患者占總患者數(shù)的95.95%,其余各機(jī)構(gòu)納入患者相對(duì)較少。
經(jīng)審核后,納入4 886例,共9 378張眼底照片,其中雙眼均有照片4 492例,占91.94%,僅有單眼照片394例,占8.06%。見(jiàn)表1。
表1 研究對(duì)象來(lái)源與照片收集情況Table 1 Source of research objects and photo collection
納入研究的4 886例患者病史中,發(fā)生頻次前三位的分別是高血壓1 842例(37.70%)、視物模糊1 491例(30.52%)、糖尿病1086(22.23%),3種病史占總例數(shù)的62.99%(3 078/4 886)。其余頻次較高的病史有視力低下436例(8.94%)、黑影飄動(dòng)或重影317例(6.49%)、眼科手術(shù)史或病史246例(5.03%)。
研究對(duì)象的年齡主要分布在60~80歲之間,共計(jì)3 989例,占81.64%;男性2 890例,女性1 960例,性別信息缺失36例,見(jiàn)圖2A。
圖2 研究對(duì)象年齡、性別構(gòu)成(A)和篩查時(shí)間-人數(shù)分布(B)Figure 2 (A)Age and sex composition of the subjects;(B) Screening time distribution of subjects
根據(jù)研究對(duì)象的就診時(shí)間分布圖(圖2 B)可知:在系統(tǒng)上線初期及新冠疫情形勢(shì)嚴(yán)峻的幾個(gè)月,患者的數(shù)量較少。2020年3月—8月,就診人數(shù)增幅較大,在6月份達(dá)到峰值,為1 383例。
2020年4月—7月共完成 4 041例患者7 711眼的篩查工作,占整項(xiàng)研究篩查工作的82.71% (4 041/4 886例),其中博山區(qū)2 530例患者4 984眼;衛(wèi)固鎮(zhèn)1 352例患者2 418眼,一區(qū)一鎮(zhèn)占當(dāng)期篩查工作量的96.07%(3 882/4 041)。
淄博市中心醫(yī)院眼科(上級(jí)院)在2020年4月—7月篩查峰值期間,門(mén)診系統(tǒng)中共記錄到來(lái)自博山區(qū)、衛(wèi)固鎮(zhèn)基層醫(yī)療機(jī)構(gòu)轉(zhuǎn)診就診380例和251例,占當(dāng)?shù)貞艏偩驮\人群的比例分別為9.50%、9.37%。從分級(jí)診療系統(tǒng)數(shù)據(jù)可知,實(shí)際完成轉(zhuǎn)診就診的患者為631人,占眼底篩查報(bào)告異常建議轉(zhuǎn)診的患者比例約26.75%,見(jiàn)表2。
表2 分級(jí)診療數(shù)據(jù)Table 2 Hierarchical diagnosis and treatment data
在全部時(shí)段內(nèi),納入研究的所有篩查受檢者中,經(jīng)過(guò)上級(jí)醫(yī)師審核,以人為單位疾病陽(yáng)性檢出統(tǒng)計(jì)如下,DR篩查陽(yáng)性率為4.69%,AMD篩查陽(yáng)性率5.30%,病理性近視篩查陽(yáng)性率0.29%;高血壓視網(wǎng)膜病變篩查陽(yáng)性率0.53%;白內(nèi)障篩查陽(yáng)性率48.94%;青光眼篩查陽(yáng)性率2.27%;視網(wǎng)膜靜脈阻塞篩查陽(yáng)性率1.66%(表3)。值得注意的是,DR篩查陽(yáng)性病例中,有糖尿病病史195例,占85.15%,篩查高血壓眼底病陽(yáng)性病例中,有高血壓病史23例,占88.46%。
表3 各主要篩查陽(yáng)性疾病轉(zhuǎn)診就診情況Table 3 referrals and screening for major detection
在2020年4月—7月,轉(zhuǎn)診病例頻次排名前三的疾病分別為DR、老年性白內(nèi)障、AMD。建議轉(zhuǎn)診頻次和實(shí)際基層轉(zhuǎn)診人數(shù)最接近的疾病分別為DR、青光眼、老年黃斑變性(表3)。
2.3.1 DR篩查情況
按照ETDRS分級(jí)標(biāo)準(zhǔn),以單只眼為單位進(jìn)行統(tǒng)計(jì),AI獨(dú)立閱片和上級(jí)醫(yī)生審核情況見(jiàn)表4。DR五分類的一致率為94.35%(95%CI:93.88~94.82),kappa系數(shù)為0.56(95%CI:0.53~0.59),平方加權(quán)kappa系數(shù)為0.63(95%CI:0.49~0.77)。
表4 DR 五分類診斷AI 與醫(yī)生審核結(jié)果的混淆矩陣Table 4 Confusion matrix between AI and doctor's audit results of DR 5 grades
篩查試驗(yàn)中,上級(jí)醫(yī)生和AI的意見(jiàn)結(jié)果比較如下表5所示。醫(yī)生DR檢出陽(yáng)性率3.22%;AI檢出率6.87%。陽(yáng)性預(yù)測(cè)值44.41%(95%CI:40.54~48.35),陰性預(yù)測(cè)值99.81%(95%CI:99.70~99.90)。一致率為96.01%(95%CI:95.62~96.41)。
表5 AI 預(yù)測(cè)與上級(jí)醫(yī)生診斷意見(jiàn)行列表Table 5 AI prediction vs golden standard confusion matrices
以上級(jí)醫(yī)生的診斷意見(jiàn)為金標(biāo)準(zhǔn),按需轉(zhuǎn)診DR為檢出陽(yáng)性,得出AI檢出率的靈敏度為94.70%(95%CI 91.37~96.84),特異度96.06%(95%CI 95.63~96.44),為進(jìn)一步檢測(cè)AI診斷效果,進(jìn)一步繪制ROC曲線(圖3A),AUC=0.961,性能最高的閾值下靈敏度、特異度分別為94.70%、96.06%,表明AI診斷DR效果較好。
圖3 AI診斷DR的ROC曲線圖Figure 3 ROC curve of DR diagnosed by AI
2.3.2 DME篩查情況
按照DME的篩查標(biāo)準(zhǔn),在黃斑中心2 DD(視盤(pán)直徑)范圍內(nèi)發(fā)現(xiàn)硬性滲出為陽(yáng)性;未發(fā)現(xiàn)則為陰性。醫(yī)生DME的檢出陽(yáng)性率1.49%;AI檢出率4.84%。陽(yáng)性預(yù)測(cè)值29.74%(95%CI 25.61~34.21),陰性預(yù)測(cè)值99.94%(95%CI 99.86~99.98),一致率為96.55%。
以篩檢結(jié)果為金標(biāo)準(zhǔn),A I 相較于醫(yī)生篩查DME的靈敏度96.43%(95%CI 91.44~98.68),特異度96.55%(95%CI 96.15~96.91),通過(guò)ROC曲線(圖3B)可知,AUC=0.974,性能最高的閾值下靈敏度、特異度分別為96.42%、98.03%,進(jìn)一步證明AI在DME診斷中具有較高的應(yīng)用價(jià)值。
2.3.3 年齡相關(guān)性黃斑變性篩查情況
根據(jù)《AAO年齡相關(guān)性黃斑病變臨床指南》的篩查標(biāo)準(zhǔn),若發(fā)現(xiàn)黃斑中心2 DD有>63 μm的玻璃膜疣為陽(yáng)性;若未發(fā)現(xiàn)則為陰性。篩查AMD陽(yáng)性率為3.13%;AI為6.56%。陽(yáng)性預(yù)測(cè)值37.07%(95%CI 3 3.2 7~4 1.0 4),陰性預(yù)測(cè)值9 9.2 5%(9 5%C I 99.04~99.41)。一致率為95.17%。依據(jù)篩檢結(jié)果計(jì)算,AI相對(duì)于醫(yī)生篩查的靈敏度為77.55%(95%CI 72.26~82.10),特異度95.74%(95%CI 95.30~96.14),繪制ROC曲線圖(圖3C)可知,AUC=0.866,性能最高的閾值下靈敏度、特異度分別為77.55%、95.74%,說(shuō)明AI診斷AMD的準(zhǔn)確性相比其他疾病仍存在一定問(wèn)題。
2.3.4 AI智能誤判案例分析
根據(jù)以上篩查統(tǒng)計(jì),收集2020年4月—7月隨機(jī)抽取衛(wèi)固鎮(zhèn)和博山區(qū)的AI篩查誤判數(shù)據(jù)50例(博山區(qū)32例,衛(wèi)固鎮(zhèn)18例),其中AMD誤判38例、DR轉(zhuǎn)診誤判14例、眼底血管阻塞誤判8例。分析各疾病AI篩查誤判的原因,得到AI誤判傾向的四個(gè)主要原因:在能正確識(shí)別病灶的情況下,對(duì)病灶位置把握不清(56%);鏡頭污漬和病灶共存影響AI準(zhǔn)確性(18%);RVO、AMD典型病灶A(yù)I不熟悉(10%),與DR病灶張冠李戴;出血、硬滲、棉絮斑等同影異病問(wèn)題,AI鑒別不清(16%)。見(jiàn)圖4。
眼底多病種AI篩查不同于以往的DR單病AI篩查,可以同時(shí)關(guān)注多種致盲性眼病,是一種全新的篩查模式。上海瑞金醫(yī)院Zhang等[19]在47 269例糖尿病患者隊(duì)列中使用AI篩查得到24.4%的DR轉(zhuǎn)診率,而人工閱片DR轉(zhuǎn)診率僅12.4%;這與本研究在基層就診人群中經(jīng)AI篩查獲得6.9%的DR轉(zhuǎn)診率和3.2%的人工閱片DR轉(zhuǎn)診率的比例近似,本研究AI還能檢出DME和AMD,適用于基層篩查老年人群。
目前國(guó)內(nèi)外尚未有多眼底疾病篩查醫(yī)療器械軟件面市,此次基于淄博醫(yī)聯(lián)體患者的眼底多病篩查是對(duì)多病AI技術(shù)在真實(shí)臨床場(chǎng)景、真實(shí)臨床疾病分布下的臨床驗(yàn)證性研究。同樣進(jìn)行多病種AI真實(shí)世界研究的還有中山眼科中心Lin等[20]團(tuán)隊(duì),他們對(duì)擁有能夠檢出14種疾病或正常眼底的AI進(jìn)行多中心驗(yàn)證,該研究值得借鑒。
經(jīng)過(guò)為期一年半的基層篩查工作我們發(fā)現(xiàn),存在原發(fā)病未確診但眼底并發(fā)癥篩查陽(yáng)性的情況,排除基層病史錄入質(zhì)量因素外,大量確診患者亟需完善相關(guān)檢查確診原發(fā)病,開(kāi)展早干預(yù)、早治療及健康宣教等工作。
淄博市自20世紀(jì)90年代初就進(jìn)入了人口老齡化社會(huì)[14]。據(jù)統(tǒng)計(jì),截至2017年底,全市60歲及以上老年人口占比22.6%?,F(xiàn)有的基層首診再轉(zhuǎn)診上級(jí)的系統(tǒng)尚未全負(fù)荷運(yùn)轉(zhuǎn),在試點(diǎn)區(qū)縣博山區(qū)和衛(wèi)固鎮(zhèn)大范圍眼底篩查后,DR、老年性白內(nèi)障、AMD的需轉(zhuǎn)診例數(shù)和轉(zhuǎn)診就診例數(shù)基本相當(dāng)。因此,通過(guò)AI輔助技術(shù)與遠(yuǎn)程醫(yī)療技術(shù)的協(xié)同,可以擴(kuò)大篩查規(guī)模和轉(zhuǎn)診規(guī)模[16],有利于搭建分級(jí)診療新型醫(yī)療體系,推進(jìn)分級(jí)診療和雙向轉(zhuǎn)診實(shí)施,提升淄博地區(qū)基層眼科醫(yī)療服務(wù)的公平性與可獲得性。
本研究的不足之處在于國(guó)內(nèi)開(kāi)展AI輔助遠(yuǎn)程篩查基本整體尚屬起步階段[15,17],AI輔助系統(tǒng)與分級(jí)轉(zhuǎn)診系統(tǒng)未打通,患者的診療數(shù)據(jù)無(wú)法共享,無(wú)法完全區(qū)分分級(jí)診療系統(tǒng)中的轉(zhuǎn)診患者和AI篩查需轉(zhuǎn)診患者是否為同一患者,未來(lái)將篩查記錄、診療記錄與轉(zhuǎn)診系統(tǒng)相互連通,為患者篩查、診療、隨訪提供更大的便利。AI通過(guò)眼底彩照單張信息進(jìn)行識(shí)別閱片,未來(lái)還需要結(jié)合病史和其他多模態(tài)檢查一同分析明確診斷。因此,在后續(xù)研究中,需要納入更多眼科檢查結(jié)果,通過(guò)大數(shù)據(jù)技術(shù)建成基于深度學(xué)習(xí)的眼底疾病篩查診斷系統(tǒng)[18],不斷更新AI診斷系統(tǒng),使醫(yī)療服務(wù)更加智能化和高效化。
AI閱片是黑盒問(wèn)題,對(duì)于一些人類不易混淆而AI理解不了的分類失敗案例,需要補(bǔ)充更多的相似圖像數(shù)據(jù)進(jìn)行訓(xùn)練,提高深度學(xué)習(xí)模型的魯棒性。
綜上所述,上級(jí)醫(yī)生審核下的AI輔助遠(yuǎn)程篩查新模式在淄博地區(qū)取得較大成效,有一定的借鑒和推廣意義。AI輔助遠(yuǎn)程篩查系統(tǒng)對(duì)于絕大多數(shù)眼底疾病有較高的靈敏度和特異度,適用于眼底疾病的篩查工作,特別有利于基層醫(yī)院或社區(qū)醫(yī)院對(duì)于眼底疾病的初步診斷,落實(shí)眼科分級(jí)診療。本研究也有一定的局限,主要表現(xiàn)在篩查病種的局限性,部分病種的樣本量較小,未采用其他檢查作為診斷參考標(biāo)準(zhǔn)等。
利益沖突所有作者均聲明不存在利益沖突
開(kāi)放獲取聲明
本文適用于知識(shí)共享許可協(xié)議(Creative Commons),允許第三方用戶按照署名(BY)-非商業(yè)性使用(NC)-禁止演繹(ND)(CC BY-NC-ND)的方式共享,即允許第三方對(duì)本刊發(fā)表的文章進(jìn)行復(fù)制、發(fā)行、展覽、表演、放映、廣播或通過(guò)信息網(wǎng)絡(luò)向公眾傳播,但在這些過(guò)程中必須保留作者署名、僅限于非商業(yè)性目的、不得進(jìn)行演繹創(chuàng)作。詳情請(qǐng)?jiān)L問(wèn):https://creativecommons.org/licenses/by-ncnd/4.0/。