張騰
(北方民族大學計算機學院 寧夏銀川 750021)
DICOM標準在醫(yī)學CT圖像語義自動標注中的應用構想
張騰
(北方民族大學計算機學院 寧夏銀川 750021)
如今醫(yī)學 CT圖像的標注還處于人工標注和半人工標注,使用的技術與其他圖像的標注技術一樣,都是從圖像特征入手,對圖像的紋理、顏色、外形等信息進行處理,之后進行標注,面對一些失真圖像無法進行準確的標注。為解決這個問題,本文提出了結合DICOM標準對醫(yī)學CT圖像進行語義標注,并在一定程度上實現(xiàn)語義自動標注。
DICOM;CT圖像;本體;語義標注;自動標注
隨著計算機技術和數(shù)字成像技術的發(fā)展,醫(yī)學信息化也在快速發(fā)展。核磁共振(MRI)、計算機斷層掃描(CT)、超聲成像(US)等醫(yī)學成像技術也在逐步走向成熟,由這些技術所生成的 DICOM圖像不僅為醫(yī)生診斷病例提供了重要的診斷依據(jù),而且可以進行遠程傳輸,面對疑難雜癥醫(yī)生不僅可以利用自身醫(yī)院的醫(yī)學資料,還可以通過網(wǎng)絡獲取其他醫(yī)院的圖像信息等,從而對病例做出更加準確的判斷,在一定程度上減少誤診的出現(xiàn)頻率,使患者可以得到有效的治療。影像歸檔與通訊系統(tǒng)(PACS)是對醫(yī)學圖像信息進行數(shù)字化采集、存儲、管理、傳輸和重現(xiàn)的系統(tǒng)。而如何快速有效的尋找到所需圖像資料便成為擺在人們面前的一個新問題。以往的檢索方式是基于關鍵詞的檢索,如果需要某一種病例的信息,必須將這種病例作為關鍵詞進行檢索,使用簡單且方便,但是所得到的圖像信息比較局限,與其相關的信息比如并發(fā)癥等無法顯示出。于是醫(yī)學圖像的語義標注由此產(chǎn)生,結合語義技術與醫(yī)學圖像可以更好的實現(xiàn)醫(yī)學圖像的檢索,使得檢索結果更加豐富且準確,對醫(yī)生診斷病例提供了更加準確的醫(yī)學資料。
DICOM標準即數(shù)字影像和通信標準,在醫(yī)學影像信息學的發(fā)展和 PACS的研究過程中,由于醫(yī)療設備生產(chǎn)廠商的不同,造成與各種設備有關的醫(yī)學圖像存儲格式、傳輸方式千差萬別,使得醫(yī)學影像及其相關信息在不同系統(tǒng)、不同應用之間的交換受到嚴重阻礙。為此美國放射學會(ACR)和全美電子廠商聯(lián)合會(NEMA)認識到急需建立一種標準,以規(guī)范醫(yī)學影像及其相關信息的交換,DICOM標準就是在這樣的背景下產(chǎn)生的。
如今醫(yī)學 CT圖像的語義標注仍處于人工標注和半人工標注階段,所使用技術與對其他圖像進行標注的技術一樣,一般有兩種:①提取圖像視覺信息,從紋理,顏色,外形等方面入手,對圖像信息進行加工處理,之后進行標注;②從圖像的內容入手,通過算法對圖像進行標注。這兩種方法都暴露出一個問題,面對失真圖像無法標注。
DICOM文件不僅包含了圖像信息,還包含了患者姓名、時間、地點和病歷信息等后期附加信息。這些附加信息的加工便可對醫(yī)學 CT圖像進行準確標注,而且面對失真圖像也不會出現(xiàn)無法標注的情況。
(一)DICOM標準
DICOM標準從屬于醫(yī)學信息學領域。在這個領域內,它負責醫(yī)學成像設備之間數(shù)字信息的交換。因為醫(yī)學成像設備可以與其他的醫(yī)學設備互操作,標準的范圍需要與醫(yī)學信息學領域的其他部分重疊,DICOM 3.0由下面九個部分組成:
第一部分:介紹和概述;第二部分:兼容性;第三部分:信息對象定義;第四部分:服務類規(guī)范;第五部分:數(shù)據(jù)結構和語義學;第六部分:數(shù)據(jù)字典;第七部分:消息交換;第八部分:消息交換的網(wǎng)絡通訊支持;第九部分:消息交換的點對點通訊支持。各部分關系描述圖見文末圖1。
(二)dcm4che和dcm4chee
dcm4che是使用Java語言開發(fā)的一個開源類庫,官方網(wǎng)站為 h ttp://www.dcm4che.org/,支持JDK1.4以上。dcm4che的核心是實現(xiàn)了 DICOM 標準的應用。dcm4che-1.x中的工具包在世界上許多應用產(chǎn)品中得到應用,現(xiàn)階段在 dcm4che-2.x在 dcm4che-1.x基礎上重新設。目前為止,最新的版本為2012年1月24日發(fā)布的dcm4che-2.0.26。由于完全符合DICOM標準,所以就其本身而言對于學習 DICOM標準的研究人員來說學習dcm4che也是學習DICOM標準的一個方法。
dcm4chee使用的是 J2EE架構,基于 JBoss服務器,提供了一系列的臨床應用,主要有兩種用處,一種是用于 DICOM圖片的存儲管理;另一種是結合OsiriX,K-PACS,ClearCanvas,Ginkgo CADx等查看器形成一個圖片存檔通信系統(tǒng),也就是 dcm4cheePACS,這個系統(tǒng)開源,支持多平臺,免費且是企業(yè)級的 PACS服務器,支持 DICOM和 HL7協(xié)議,可在 dcm4 chee PACS上輕松管理上 T級別的數(shù)據(jù)(1 TB=1000 GB=1000,000 MB=1000,000,000 KB)。
③查詢報銷憑證。對于一些財務檔案管理規(guī)范、賬目清楚的村莊,如果機井建設時間確定,可以通過查詢報銷憑證的方法獲得機井設備型號。
在dcm4che2中包含了一系列的連接dcm4chee和存儲器的方法,還提供了一些處理 DICOM對象的方法,比如 dcm2txt,dcm2xml,dcmdir,jpg2dcm,pdf2dcm,txt2dcm,xml2dcm等等。其中 dcm2xml是在設想中需要用到的一個方法。
(三)語義標注
在了解語義標注之前,首先需要明確提出語義標注的目的在哪,語義標注的最終目的就是智能化,讓計算機知道操作者的目的,之后對應目的使用本體和推理作出正確的反饋,其中的本體原本是一個哲學理論中的概念,用于描述事物本質,現(xiàn)在作為信息抽象和知識描述的工具被計算機領域采用,本體的構建需要領域專家與計算機人員合作完成。本體構建的基礎是領域概念的抽象表示和描述,以及領域中概念的層次描述和潛在的關系及公理,在構建本體的過程中一般不會考慮實例,因為在一個領域中實例往往很多而且動態(tài)性比較強,不可能描述所有的實例,所以只有當本體和實例結合時才有意義,找到實例中的對應的領域本體,構建映射實例與本體的映射關系,這就是語義標注,在語義層面上指出資源的特征,比如,圖書館里給書分類可以視為語義標注,它使用本體(分類法)為資源(書)賦予語義特征(分類號),為博客文章添標簽也可以視為語義標注,它使用本體(已有標簽集合)為資源(文章)賦予語義特征(標簽),語義標注的結果是語義元數(shù)據(jù),如一本書的分類號是什么,一篇文章的標簽是什么都是語義元數(shù)據(jù),可以用于檢索,owl是本體表示語言。
語義標注的方法一般有兩種,第一種是人工標注,將標注信息手工標注到需標注的事物上,建立標注信息與需標注事物之間的聯(lián)系,這種方法標注準確率最高,除非出現(xiàn)人為差錯,不然不會出現(xiàn)問題;第二種方法是自動標注,通過算法,模型,機器學習等一系列的方法將信息標注到需標注事物上,建立標注信息與需標注事物間聯(lián)系,自動標注相較于人工標注準確率上有所下降,但排除了人為差錯,且節(jié)省人力資源,減少資源浪費,自動標注已成為時下研究的重點。語義標注工具如SHOE Knowledge Annotator,Annotea,SMPRE,Yawas,Melita,GATE等,有很多。
(四)基于 DICOM標準的醫(yī)學 CT圖像語義自動標注實現(xiàn)方法構想
1.本體構建
本體作為共享的概念模型的形式化的規(guī)范說明,它反映的是某一個領域的概念層次描述和潛在的關系及公理,在構建本體的過程中一般不會考慮到實例,因為在一個領域中實例往往很多且動態(tài)多變,不能能描述出所有的實例。
本體構建工具很多,Ontolingua Server、Ontosaurus、WebOnto、Protégé-2000、OntoEdit、WebODE、OILEd和DUET都比較著名,其中 Protégé是斯坦福大學基于 Java語言開發(fā)的本體編輯和知識獲取軟件,屬于開放源代碼軟件,主要用于語義網(wǎng)中本體的構建,是語義網(wǎng)中本體構建的核心開發(fā)工具軟件,由于其優(yōu)秀的設計和眾多的插件,已經(jīng)成為目前最廣泛使用的本體編輯軟件之一,相較于其他的本體構建工具而言,Protégé最大的好處是支持中文,且插件很多,所以使用的越來越廣泛。
醫(yī)學 CT圖像本體構建方法很多,下面介紹兩種劃分方法,第一種是按照 CT的檢查范圍來進行劃分,分為頭部、胸部、腹部、脊柱和四肢。其中頭部疾病又分為頭骨類、腦類等;胸部可分為肺部病和骨類;腹部可分為結石類和腫瘤、出血、炎癥等;脊柱四肢可分為骨類、結核、腫瘤等。第二種按照所屬病變來進行劃分,分為炎癥、腫瘤、骨類、出血、外傷、結核、結石等。炎癥中有腦部炎癥、胸部炎癥和腹部炎癥等。腫瘤分為腦部腫瘤、胸部腫瘤和腹部腫瘤等。骨類分為腦部骨類、胸部骨類、腹部骨類、脊柱和四肢骨類。出血分為腦部出血、胸部出血和腹部出血等;外傷分為腦部外傷、腹部外傷、脊柱四肢外傷等。結核分為肺結核、脊柱四肢結核病等;結石分為膽結石、泌尿系統(tǒng)結石等。
按照這兩種劃分方法可以構建出這些概念之間的層次關系和潛在的關系等,之后再使用 Protégé軟件進行本體的構建。
2.工具的編寫及工具目的
對醫(yī)學 CT圖像進行語義自動標注時首先需要讀取到 DICOM圖像中的文本信息,所以需要編寫一款可以對DICOM圖像進行編輯的軟件,可以實現(xiàn) DICOM圖像的顯示以及圖像內部文本信息讀取及修改。除此之外,還需要自動生成 XML文檔,文檔具有對專業(yè)詞匯的標注信息。
由于有 dcm4che這個開源的 Java類庫,所以使用Java相對于其他語言在編寫工具軟件是會有很大的優(yōu)勢。在 dcm4che類庫中有許多方法可以調用,比如dcm2txt,dcm2xml,dcmdir等等,可以通過這些方法來實現(xiàn)所需要的功能。
3.對文本信息的處理
在讀取到 DICOM圖像中的文本信息之后,需要對文本信息進行處理得到專業(yè)詞匯,而如何得到專業(yè)詞匯便成為自動標注的一個關鍵問題。對于這種問題一般會使用中文分詞算法,傳統(tǒng)的中文分詞算法有很多,比如機械分詞法(基于字符串匹配的分詞法),基于理解的分詞法,基于語義的分詞法和基于統(tǒng)計的分詞法。而與Java結合比較緊密的是庖丁解牛分詞器,庖丁系統(tǒng)是個完全基于 lucene的中文分詞系統(tǒng),庖丁解牛分詞器有一個很明顯的缺點,在分詞時無法根據(jù)語境來進行分詞,可能會出現(xiàn)分詞錯誤,比如對“發(fā)展社區(qū)老年活動場所和服務設施”進行分詞,有可能會將“和服”分解出來,根據(jù)語境這兩個字完全沒有意義。DICOM圖片中的文本信息十分專業(yè),觀察一段CT診斷報告:“左側基底節(jié)區(qū)見不規(guī)則片狀低密度影,右側內囊前肢小片狀低密度影,腦室系統(tǒng)未見明顯異常,腦溝裂顯示清晰,中線結構無移位”,由此可見,CT診斷中的用語十分專業(yè),語義確定,且簡單無修辭,所以當使用庖丁解牛分詞器對其進行分詞時,在一定程度上會減少上述情況的發(fā)生。
4.專業(yè)詞匯的標注
使用分詞器對 DICOM圖像中的文本信息處理完之后就會得到一個個的專業(yè)詞匯,之后的工作便是對專業(yè)詞匯進行標注,使之與對應本體建立聯(lián)系。
可擴展標記語言(Extensible Markup Language,XML),用于標記電子文件使其具有結構性的標記語言,可以用來標記數(shù)據(jù)、定義數(shù)據(jù)類型,是一種允許用戶對自己的標記語言進行定義的源語言。在工具軟件編寫階段還會編寫出自動生成 XML文檔的功能部件,這個部件的主要功能就是對專業(yè)詞匯進行自動的語義標注,并生成 XML文檔,在文檔中有語義標注信息。當分解出的專業(yè)詞匯與本體名完全一致時,會自動生成相應的 XML文檔,而當專業(yè)詞匯與本體名不完全一致時,會進行語義相似度計算,通過算法將相似度最高的本體標注到專業(yè)詞匯上,并生成 XML文檔,當然這種情況會降低標注的準確率,最好的解決辦法就是在本體構建階段將所有本體構建出來。
通過本文的分析,我們會發(fā)現(xiàn)醫(yī)學 CT圖像的語義自動標注是可行的,而且不僅 CT圖像,任何 DICOM圖像的語義自動標注都是可行的,惟一的影響因素就是本體的構建,若想自動標注任何 DICOM圖像就需要在本體構建階段將所有的醫(yī)學概念、概念之間的層次關系、隱含關系以及公理構建出來,這個工程十分龐大,不是單獨個人可以完成的,但是可以預想的是這個本體庫可以構建完成,醫(yī)學圖像的語義標注會向前邁進一大步,再加上語義檢索技術,往后醫(yī)生看病時出現(xiàn)誤診的幾率會大大降低,這對與人類的健康事業(yè)無異于是一個巨大的貢獻。
[1]H Lilian Tang,Rudolf Hanka,Horace H S. Histological Image Retrieval Based on Semantic Content Analysis[J]. IEEE Transactions on information technology in biomedicine,2003(l).
[2]Hong SHAO,Ji-Wu ZHANG, Wen-cheng CUI,etal.Automatic Feature Weight Assignment Based Genetic Algorithm for Image Retrieval[C]. IEEE International Conference on Robotics,Intelligent Systems and Signal Processing,2003,P731-735(ISTP收錄000189506600128).
[3]W. Wei,P. M. Barnaghi. Semantic support for medical image search and retrieval. Proceedings of the Fifth IASTED International Conference on Biomedical Engineering. Anaheim,CA,USA:ACTA Press,2007,P315-319.
[4]Xiaohang,Ma.Semantics Modeling based Image Retrieval System Using Neural Networks[C]∥IEEE Conf. Image Processing,2005(1),P1165-1168.
[5]向前.基于本體的圖像檢索系統(tǒng)[博士學位論文].北京交通大學,2008.
[6]盧漢清,劉靜.基于圖學習的自動圖像標注.計算機學報,2008(9),P1629-1639
[7]韋娜,耿國華,周明全.基于相關反饋的文物圖像語義標注[J].西北大學學報,2008,P387-390.
[8]王梅,周向東,施伯樂,et a1.基于擴展生成語言模型的圖像自動標注方法[J].軟件學報,2008(9),P2449-2460.
張騰(1988-),男,山西省垣曲縣人,北方民族大學計算機科學與工程學院計算機應用技術專業(yè)碩士。
2012-03-11