成福春 張平 劉華 房敏
摘要:本文討論了編碼之中常用到的按位累加取模、多項(xiàng)式乘法累加取模等校驗(yàn)位算法的優(yōu)缺點(diǎn),尤其是對(duì)系統(tǒng)化醫(yī)學(xué)術(shù)語(yǔ)集(SNOMED)編碼采用二面體群D5校驗(yàn)位算法作了較深入的討論。二面體群D5算法不僅可以校驗(yàn)出所有一位錯(cuò)誤及相鄰位置換位錯(cuò)誤,而且不需要增加字母x,是一種非常理想的校驗(yàn)位算法。國(guó)內(nèi)目前尚無(wú)一套既具有信息技術(shù)特征,又具有中醫(yī)學(xué)科本身特征的編碼化的術(shù)語(yǔ)集,SNOMED編碼采用二面體群D5校驗(yàn)位算法,對(duì)于中醫(yī)術(shù)語(yǔ)編碼具有重要的借鑒意義。
關(guān)鍵詞:中醫(yī)術(shù)語(yǔ);術(shù)語(yǔ)編碼;系統(tǒng)化醫(yī)學(xué)術(shù)語(yǔ)集;校驗(yàn)位算法;二面體群D5
醫(yī)學(xué)術(shù)語(yǔ)及其編碼化,對(duì)于規(guī)范臨床數(shù)據(jù)采集,數(shù)據(jù)檢索分析利用、提升醫(yī)療質(zhì)量以及研究的深度,具有重要意義。系統(tǒng)化醫(yī)學(xué)術(shù)語(yǔ)集臨床術(shù)語(yǔ)(systematized nomenclature of medicine clinical terms,SNOMED CT)通過(guò)編碼進(jìn)行世界范圍內(nèi)的統(tǒng)一術(shù)語(yǔ)交流,即代碼唯一,或稱(chēng)概念唯一。但是代碼所代表的內(nèi)容其形式可以多樣,如英文形式、中文形式或者各國(guó)語(yǔ)言形式。通過(guò)定義代碼與代碼之間的關(guān)系,來(lái)體現(xiàn)學(xué)科本身的邏輯與語(yǔ)義。
1.系統(tǒng)化醫(yī)學(xué)術(shù)語(yǔ)集一臨床術(shù)語(yǔ)編碼簡(jiǎn)介
在SNOMED CT術(shù)語(yǔ)體系中,賦予每一個(gè)特定術(shù)語(yǔ)一個(gè)代碼,即擴(kuò)展版的SNOMED CT概念標(biāo)識(shí)符(SCTID字段)。代碼本身不要求有特別的含義,只是代表這個(gè)術(shù)語(yǔ)本身,利于計(jì)算機(jī)處理。
在代碼結(jié)構(gòu)中,具有相關(guān)的屬性信息,如extension item identifier(擴(kuò)展項(xiàng)目標(biāo)識(shí)符),共8位,代表具體的項(xiàng)目編碼;namespace identifier(名稱(chēng)空間標(biāo)識(shí)符),共7位,代表維護(hù)代碼的機(jī)構(gòu);partition identifier(部分標(biāo)識(shí)符),2位,10代替概念,20代表描述,30代表關(guān)系;最后一位是check-digit(校驗(yàn)位),便于計(jì)算機(jī)自動(dòng)糾錯(cuò)。SNOMED通過(guò)3張表來(lái)體現(xiàn),即概念表、定義表、關(guān)系表。SCTID是概念表中的最重要的字段。目前擴(kuò)展版的SCTID字段結(jié)構(gòu)如圖1。