• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于相容性分析的醫(yī)療診斷專家系統(tǒng)

      2018-12-04 02:14:46季長清李媛媛唐曉君
      關(guān)鍵詞:群體決策權(quán)值準(zhǔn)確率

      肖 鵬,劉 娜,季長清,李媛媛,路 瑩,唐曉君

      1.大連工業(yè)大學(xué) 信息科學(xué)與工程學(xué)院,遼寧 大連 116034

      2.大連大學(xué) 物理科學(xué)與技術(shù)學(xué)院,遼寧 大連 116622

      3.大連交通大學(xué) 軟件學(xué)院,遼寧 大連 116052

      1 引言

      醫(yī)療專家系統(tǒng)[1]是專家系統(tǒng)研究的一個(gè)重要方向,其目標(biāo)是通過具有大量專門知識(shí)的計(jì)算機(jī)程序來模擬醫(yī)學(xué)專家的分析過程,以解決醫(yī)療診斷中的各種復(fù)雜問題。因此,作為人工智能應(yīng)用的一個(gè)重要分支,醫(yī)療診斷專家系統(tǒng)比醫(yī)學(xué)專家擁有更多的專業(yè)知識(shí)和更快的解答問題能力,已經(jīng)在醫(yī)療診斷領(lǐng)域發(fā)揮著良好的輔助作用。

      如圖1所示,一個(gè)典型的醫(yī)療診斷專家系統(tǒng)[2]主要由以下6部分組成:病例數(shù)據(jù)庫、醫(yī)學(xué)知識(shí)庫、知識(shí)獲取、推理模型、解釋機(jī)制和用戶GUI。其中,病例數(shù)據(jù)庫,醫(yī)學(xué)知識(shí)庫是醫(yī)療診斷專家系統(tǒng)數(shù)據(jù)的來源和基礎(chǔ);用戶GUI和解釋機(jī)制屬于人機(jī)交互部分;知識(shí)獲取的有效性及其數(shù)據(jù)處理決定了推理過程要用到的數(shù)據(jù)正確性;推理模型實(shí)現(xiàn)知識(shí)推導(dǎo)求解進(jìn)而得出診斷結(jié)論,其好壞直接決定了最后結(jié)論的正確與否。因此,知識(shí)獲取和推理模型是醫(yī)療診斷專家系統(tǒng)的核心部分,采用什么樣的數(shù)據(jù)處理方式和知識(shí)推理模型是醫(yī)療診斷專家系統(tǒng)研究的重要內(nèi)容。

      圖1 醫(yī)療診斷專家系統(tǒng)組成

      近年來,醫(yī)學(xué)診斷專家系統(tǒng)的研究[3-19]得到了廣泛關(guān)注,其關(guān)鍵技術(shù)在醫(yī)學(xué)臨床上也得到了深入的應(yīng)用。隨著醫(yī)學(xué)診斷專家系統(tǒng)的不斷發(fā)展,其推理模型也成為醫(yī)學(xué)專家系統(tǒng)研究的一個(gè)熱點(diǎn)和關(guān)鍵點(diǎn),并有了一些相關(guān)的研究。醫(yī)學(xué)診斷專家系統(tǒng)的推理模型主要有處方產(chǎn)生式推理模型[3-7]、模糊推理模型[8-13]和機(jī)器學(xué)習(xí)推理模型[14-19]等。大部分推理模型都依賴于權(quán)值設(shè)定,而權(quán)值設(shè)定又完全依賴于醫(yī)生的經(jīng)驗(yàn)值。因此,權(quán)值給定質(zhì)量直接影響了診斷結(jié)果,有待進(jìn)一步研究和改進(jìn),以期找到更實(shí)用的權(quán)值設(shè)定和自動(dòng)賦值方法。

      本文研究了大量醫(yī)學(xué)病例數(shù)據(jù)的自身相容性問題,這些數(shù)據(jù)在某些屬性上具有相容性,即病例的相似性和關(guān)聯(lián)性。例如,在肺炎病人眾多的表現(xiàn)癥狀中,發(fā)燒是常見的表現(xiàn)癥狀,是其重要屬性;同時(shí)發(fā)燒和咳嗽又具有一定的關(guān)聯(lián)性。如何利用數(shù)據(jù)相容性分析來建立屬性權(quán)值自動(dòng)設(shè)定模型,以增加醫(yī)學(xué)診斷的準(zhǔn)確度,是推理模型研究的一個(gè)新方向。另一方面,在實(shí)際應(yīng)用中醫(yī)學(xué)專家系統(tǒng)會(huì)對(duì)所有屬性進(jìn)行分析,這大大增加了計(jì)算量和分析問題的復(fù)雜性。如何對(duì)屬性進(jìn)行有效的降維也有待進(jìn)一步研究。

      本文針對(duì)醫(yī)學(xué)病例數(shù)據(jù)的特點(diǎn)及相容性分析進(jìn)行了研究,提出了一種基于屬性相容性分析的醫(yī)療診斷方法。此方法先利用屬性相容性分析對(duì)醫(yī)療數(shù)據(jù)進(jìn)行數(shù)字化處理,根據(jù)屬性之間的關(guān)聯(lián)度構(gòu)造屬性相關(guān)矩陣;接著利用屬性相關(guān)矩陣對(duì)屬性進(jìn)行剪枝處理,以減少無效屬性的計(jì)算;基于相容性分析構(gòu)造較為實(shí)用的權(quán)值設(shè)定數(shù)學(xué)模型;最后在進(jìn)行病例相似度計(jì)算時(shí)采用群體決策策略來完成最終診斷。

      2 相關(guān)工作

      醫(yī)學(xué)診斷推理模型是從大量病理知識(shí)和病例中推導(dǎo)求解進(jìn)而得出最后診斷結(jié)果。對(duì)于醫(yī)學(xué)診斷推理模型人們做了大量的研究工作,早期的工作主要集中在簡單的產(chǎn)生式系統(tǒng)推理模型中。陳漫紅[3]等人將產(chǎn)生式系統(tǒng)推理引入到青光眼診斷專家系統(tǒng)中,其推理機(jī)制的核心是采用深度優(yōu)先語義遍歷和正向啟發(fā)式推理策略。產(chǎn)生式系統(tǒng)推理模型簡單明了,但無法診斷癥狀復(fù)雜且與其他疾病存在共同癥狀的疾病,其應(yīng)用有限并且缺乏有效篩選機(jī)制。

      針對(duì)多種疾病可能性的癥狀難診斷這一難題,很多研究人員將概率理論引入到診斷推理過程中。于佳[4]等人將統(tǒng)計(jì)分析應(yīng)用到甲狀腺超聲診斷中。文獻(xiàn)[5-7]試圖利用貝葉斯定理推算出引發(fā)癥狀的癥病置信度,當(dāng)置信度達(dá)到某一概率時(shí),診斷規(guī)則才會(huì)被觸發(fā),減少了不確定性誤診的可能性。但在現(xiàn)實(shí)生活中這些概率數(shù)據(jù)收集困難,其往往是通過大量數(shù)據(jù)統(tǒng)計(jì)得到,或是由權(quán)威專家給出。這些統(tǒng)計(jì)數(shù)據(jù)自身的可靠性和代表性直接決定了推理結(jié)論的正確與否。

      模糊邏輯能模擬人腦方式進(jìn)行模糊綜合判斷,推理解決常規(guī)方法難以應(yīng)付的規(guī)則型模糊信息問題。因此,模糊推理模型自提出以來就成為診斷專家系統(tǒng)的經(jīng)典模型,后續(xù)很多學(xué)者在模糊邏輯基礎(chǔ)之上進(jìn)行了相關(guān)模型的研究[8-13]。研究者普遍采用模糊集規(guī)則來進(jìn)行醫(yī)療診斷系統(tǒng)的設(shè)計(jì),然而模糊診斷知識(shí)獲取困難,自我學(xué)習(xí)能力差,容易發(fā)生誤診。另外,加權(quán)模糊規(guī)則的設(shè)置還有賴于醫(yī)生的經(jīng)驗(yàn)。這些都影響了基于模糊邏輯的醫(yī)療診斷專家系統(tǒng)的實(shí)際應(yīng)用。

      目前機(jī)器學(xué)習(xí)推理在醫(yī)療專家系統(tǒng)中的研究已成為熱點(diǎn)。機(jī)器學(xué)習(xí)推理能擺脫主觀因素和不確定性帶來的干擾,直接進(jìn)行確定性推理,被廣泛地應(yīng)用在各種專家系統(tǒng)中。陳藹祥[14]等人提出了一個(gè)ADST系統(tǒng),利用支持向量機(jī)、決策分類樹和樸素貝葉斯三種不同的方法進(jìn)行結(jié)節(jié)病和肺結(jié)核的診斷。鄭明杰[15]等人關(guān)注機(jī)器學(xué)習(xí)方法在肺音分類中的應(yīng)用。隨著機(jī)器學(xué)習(xí)和人工智能算法的不斷發(fā)展,越來越多的復(fù)雜算法[16-19]被引入到醫(yī)療診斷專家系統(tǒng)研究中來。Inbarani[16]等人提出了粒子群算法和粗糙集相結(jié)合的醫(yī)療診斷方法。馮嬌嬌[17]等人將人工神經(jīng)網(wǎng)絡(luò)模型應(yīng)用到慢性腎病診斷中。文獻(xiàn)[18]將數(shù)據(jù)挖掘應(yīng)用到醫(yī)療專家系統(tǒng)中,借助數(shù)據(jù)挖掘技術(shù)提取醫(yī)院數(shù)據(jù),加快了醫(yī)療數(shù)據(jù)的利用。文獻(xiàn)[19]將TF-IDF權(quán)重改進(jìn)算法應(yīng)用到智能導(dǎo)醫(yī)系統(tǒng)中,依據(jù)患者癥狀進(jìn)行兩類TF-IDF權(quán)重計(jì)算得到可能疾病,以引導(dǎo)患者準(zhǔn)確掛號(hào)。

      機(jī)器學(xué)習(xí)大大加快了醫(yī)療診斷專家系統(tǒng)學(xué)習(xí)獲取知識(shí)的過程和效率,提高了系統(tǒng)的智能化和準(zhǔn)確化。然而,機(jī)器學(xué)習(xí)也存在著局限性和不足:機(jī)器學(xué)習(xí)推理模型過分依賴于以往的診斷數(shù)據(jù),學(xué)習(xí)效果和實(shí)用性有限,如不同癥狀屬性對(duì)診斷結(jié)果的影響不同,其權(quán)值的設(shè)定原則也受診斷數(shù)據(jù)影響;機(jī)器學(xué)習(xí)訓(xùn)練對(duì)所需的病例樣本在數(shù)量上和代表性上有較高要求,系統(tǒng)設(shè)計(jì)人員很難用一個(gè)有效固定標(biāo)準(zhǔn)來衡量。與上述工作不同,本文考慮的是基于相容性分析的機(jī)器學(xué)習(xí)方法。針對(duì)現(xiàn)有診斷推理模型在病例推理過程中過于依賴權(quán)值設(shè)定和醫(yī)生經(jīng)驗(yàn)值的問題,本文提出了一種基于屬性相容性分析的醫(yī)療診斷方法,以解決屬性冗余和權(quán)值賦值的難題。

      3 相容性分析

      醫(yī)學(xué)病例庫一般由大量屬性組成,這些屬性大部分為文本型數(shù)據(jù),不利于數(shù)據(jù)的分析處理。對(duì)這些屬性進(jìn)行數(shù)字化處理之后,需要對(duì)所有屬性進(jìn)行降維簡約化處理以減少計(jì)算量和分析復(fù)雜性。相容性分析作為一種有效的特征屬性提取方法,被普遍應(yīng)用于網(wǎng)絡(luò)流量分析[20]、圖像處理[21]等領(lǐng)域。本文所提的醫(yī)療診斷專家系統(tǒng)首先對(duì)病例庫的文本屬性進(jìn)行數(shù)字化處理,然后利用相容性分析進(jìn)行剪枝并提取有效屬性和設(shè)定權(quán)值,最后根據(jù)相似度計(jì)算結(jié)果和群體決策理論進(jìn)行輔助診斷。

      現(xiàn)在假設(shè)有病例數(shù)據(jù)庫集合L={L1,L2,…,Ln,…,LN},集合中每一個(gè)病例記錄由多個(gè)屬性和疾病結(jié)果組成,即某病例記錄Ln由向量<f1,f2,…,fm,…,fM,r>構(gòu)成。其中 f1,f2,…,fm,…,fM為病例的M個(gè)屬性特征,r為所患疾病結(jié)果。其數(shù)據(jù)形式未處理前如表1所示。

      表1 某醫(yī)學(xué)病例數(shù)據(jù)庫樣例

      現(xiàn)有待診斷病例集合Q={q1,q2,…,qk,…,qK},對(duì)于任意一個(gè)q,存在著相似度向量<d1(q,l),d2(q,l),…,dm(q,l),…,dM(q,l)>,其中 q∈Q,l∈L ,dm(q,l)代表著待診斷病例q和病例記錄l在第m個(gè)屬性特征上的距離。基于dm(q,l)公式,可以計(jì)算集合Q和L之間所有dm距離,以方便進(jìn)行相容性分析計(jì)算。

      對(duì)每一個(gè)病例重復(fù)這個(gè)過程,可以得到一個(gè)M×M的協(xié)方差矩陣A,其第i行和第 j列的協(xié)方差A(yù)ij如公式(1)所示:

      于是,協(xié)方差矩陣A如下所示:

      計(jì)算出協(xié)方差矩陣A,下面就可利用相容性分析的方法進(jìn)一步分析。相容性分析是針對(duì)數(shù)據(jù)各屬性成員之間的相關(guān)性進(jìn)行分析,并構(gòu)造屬性相關(guān)矩陣。針對(duì)已有 M 個(gè)屬性特征 f1,f2,…,fm,…,fM,利用公式(3)來構(gòu)造屬性相關(guān)矩陣。

      其中Rij表示第i個(gè)屬性 fi和第 j個(gè)屬性 fj之間的相關(guān)性,其值越大,相關(guān)性越大。

      于是,得到了屬性相關(guān)矩陣如下:

      利用屬性相關(guān)矩陣,可以從眾多屬性特征中提取相關(guān)性較大的屬性進(jìn)行后續(xù)的計(jì)算處理,并對(duì)相關(guān)性較小的屬性進(jìn)行剪枝處理。相容性分析能有效地減少病癥的冗余屬性,達(dá)到了降維和減少計(jì)算的作用。

      4 基于相容性分析的醫(yī)療診斷算法

      本文針對(duì)醫(yī)療病例數(shù)據(jù)提出的醫(yī)療診斷推理模型如圖2所示。

      圖2 推理模型流程圖

      系統(tǒng)主要由數(shù)據(jù)數(shù)字化處理、病例屬性提取、權(quán)值設(shè)定、相似度計(jì)算和群體決策等幾個(gè)步驟組成。相容性分析是整個(gè)推理模型的基礎(chǔ),其強(qiáng)大分析能力能很好地解決屬性剪枝和權(quán)值自動(dòng)設(shè)定的處理要求。

      首先,病例數(shù)據(jù)由臨床產(chǎn)生,形成的大規(guī)模病例數(shù)據(jù)庫可用于分析計(jì)算。在針對(duì)病例數(shù)據(jù)庫自身特點(diǎn)進(jìn)行數(shù)據(jù)數(shù)字化處理之后,利用相容性分析方法計(jì)算出病癥屬性的相容性,并進(jìn)行重要屬性特征的提取,減少了無效屬性的計(jì)算,實(shí)現(xiàn)了數(shù)據(jù)的剪枝處理。針對(duì)各屬性特征的重要性不同,利用相容性進(jìn)行權(quán)值的自動(dòng)設(shè)定計(jì)算。系統(tǒng)在接收到用戶的診斷請(qǐng)求即查詢點(diǎn)q之后,計(jì)算其與病例數(shù)據(jù)庫中所有樣本的加權(quán)相似度。最后根據(jù)相似度計(jì)算結(jié)果進(jìn)行群體決策,并將最終診斷結(jié)果返回給用戶。

      接下來本文將重點(diǎn)介紹此流程中的重要數(shù)學(xué)模型及關(guān)鍵處理技術(shù)。

      4.1 權(quán)值設(shè)定模型

      考慮到屬性的值對(duì)結(jié)果影響不同,傳統(tǒng)的基于權(quán)重的數(shù)字化方法常根據(jù)屬性貢獻(xiàn)大小來賦值。貢獻(xiàn)大的屬性在數(shù)字化時(shí)賦一個(gè)較大的值,貢獻(xiàn)小的就賦一個(gè)較小的值,而不是把是非邏輯的文本屬性值簡單地設(shè)定為1或0。但是屬性的數(shù)字化賦值往往由人為經(jīng)驗(yàn)得出,不可避免受醫(yī)學(xué)專家主觀意識(shí)的影響。為了使權(quán)值客觀地反映出屬性對(duì)診斷結(jié)果的影響,本文通過對(duì)病例數(shù)據(jù)庫進(jìn)行相容性分析,自動(dòng)學(xué)習(xí)得到各屬性權(quán)值。在數(shù)字化過程中,對(duì)于是非邏輯的文本型屬性值可設(shè)定為1或0,通過機(jī)器學(xué)習(xí),根據(jù)不同屬性的重要性來自動(dòng)獲取其權(quán)值,客觀地反映了臨床病例數(shù)據(jù)經(jīng)驗(yàn),排除人為因素干擾。

      現(xiàn)有病例數(shù)據(jù)庫集合L={L1,L2,…,Ln,…,LN},其中任一個(gè)病例記錄Ln由向量<f1,f2,…,fm,…,fM,r>組成,f1,f2,…,fm,…,fM為病例的M個(gè)屬性特征,r為所患疾病結(jié)果。

      通過數(shù)據(jù)相容性分析可得到各屬性對(duì)結(jié)果影響程度的百分比統(tǒng)計(jì)信息,其集合形式為S={s1,s2,…,sn,…,sM}。假設(shè)存在著權(quán)重影響因子集合 α={α1,α2,…,αn,…,αM},其值由公式(5)決定。

      根據(jù)權(quán)重影響因子集合α,可以計(jì)算得到權(quán)重集合W={ω1,ω2,…,ωn,…,ωM},其計(jì)算公式如下:

      其中,i的取值范圍為i=1,2,…,M。

      權(quán)值自動(dòng)設(shè)定模型從病例數(shù)據(jù)庫中學(xué)習(xí)得到權(quán)值。由概率統(tǒng)計(jì)理論可知,如果屬性 fi為真使得某疾病結(jié)果r被診斷的頻率高,那么屬性 fi對(duì)診斷結(jié)果為r是重要的,其權(quán)重ωi就高,反之亦然。本文的權(quán)值設(shè)定模型通過機(jī)器學(xué)習(xí)自動(dòng)得到權(quán)重集合,減少了人為設(shè)定權(quán)值所帶來的干擾和誤差。有了權(quán)重集合,就可以根據(jù)學(xué)習(xí)來的權(quán)重大小,在編碼過程中自動(dòng)賦予相應(yīng)數(shù)值,實(shí)現(xiàn)查詢病例與病例數(shù)據(jù)庫樣本之間相似度計(jì)算。

      4.2 相似度計(jì)算

      本文通過基于權(quán)值的疾病相似度計(jì)算來進(jìn)一步確定疾病的可能性。所用到的部分符號(hào)定義如前文所示。對(duì)于任意待診斷病例q,其與任一病例數(shù)據(jù)樣本l之間的相似度計(jì)算如下:

      其中q∈Q,l∈L,di(q,l)代表著待診斷病例q和病例記錄l在第i個(gè)屬性特征上的距離。

      在相似度計(jì)算中,將病例的不同病癥屬性基于樣本庫的統(tǒng)計(jì)分析進(jìn)行差別化對(duì)待,使其不受量綱的影響,自動(dòng)化設(shè)定權(quán)值,滿足了實(shí)際應(yīng)用需求。

      4.3 群體決策策略

      臨床診斷的正確性和醫(yī)學(xué)不確定因素有直接關(guān)系,不確定信息來源于知識(shí)庫中的不確定性、病人數(shù)據(jù)中的不確定性和推理中的不確定性等。例如,很多疾病具有極其相似的病癥屬性,給推理過程帶來很大不確定性。尤其在基于最大相似度的判斷方法中,單個(gè)病例的不確定因素對(duì)醫(yī)學(xué)決策過程影響更大。為了解決這一問題,提出了診斷過程群體決策概念,如圖3所示。以二維空間為例,三種疾病數(shù)據(jù)樣本和待診斷病例x被映射到體溫和白細(xì)胞數(shù)兩屬性的二維坐標(biāo)系中。為減少單一的最大相似度計(jì)算帶來的誤差和不確定性診斷,以群體決策投票來決定最終診斷結(jié)果。

      圖3 群體決策策略

      以群體決策人數(shù)D=5為例,先根據(jù)公式(7)計(jì)算待診斷病例x和所有病例樣本之間的相似度,取與其相似度最大的前五個(gè)病例樣本,即距離最短的前五個(gè)數(shù)據(jù)點(diǎn)。這五個(gè)病例樣本中的絕大多數(shù)所患疾病結(jié)果r決定了待診斷病例x的診斷結(jié)果。如圖所示,最終待診斷病例x被診斷為肺炎。由于篇幅所限,本文所給例子是以二維空間為例,但所提方法可以任意擴(kuò)展到高維,滿足病癥屬性多樣性需要。

      現(xiàn)有病例數(shù)據(jù)庫集合L={L1,L2,…,Ln,…,LN}、待診斷病例集合Q={q1,q2,…,qk,…,qK}、疾病類別集合R={r1,r2,…,rj,…,rJ}。其中某病例記錄 Ln由向量<f1,f2,…,fm,…,fM,r>構(gòu)成,f1,f2,…,fm,…,fM為病例的M個(gè)屬性特征,r為所患疾病結(jié)果且r∈R。

      給定一個(gè)待診斷病例x∈Q,其屬于哪種疾病的先驗(yàn)概率P(r|x),其最大似然分類如公式(8)所示:

      若群體決策人數(shù)為D,則群體決策的概率為:

      其中a(x)表示前D個(gè)最相似病例樣本,sim(x,li)表示待診斷病例x與樣本li的相似度計(jì)算,y(li,rj)為指示函數(shù),其值由公式(10)得到:

      即當(dāng)li∈rj時(shí),y(li,rj)值為1,否則 y(li,rj)值為0。

      由于在相似度計(jì)算中值越小相似度越大,待診斷病例x所屬疾病類別為:

      對(duì)于病癥屬性交叉和重疊普通存在的醫(yī)學(xué)病例數(shù)據(jù)而言,群體決策策略能有效地減少誤診率和提高診斷效率。

      5 實(shí)驗(yàn)評(píng)測(cè)

      在本章中,介紹了實(shí)驗(yàn)環(huán)境及測(cè)試數(shù)據(jù)情況,本文中所提到的方法采用MATLAB編寫,均在Windows平臺(tái)下實(shí)現(xiàn)。

      5.1 實(shí)驗(yàn)配置

      所有實(shí)驗(yàn)均在Windows 7 64位系統(tǒng)中實(shí)現(xiàn)運(yùn)行,主機(jī)配置如下:Intel?Core? i3-2350 2.30 GHz CPU,500 GB SCSI硬盤,4 GB內(nèi)存。

      實(shí)驗(yàn)數(shù)據(jù)來源于某醫(yī)院信息系統(tǒng)數(shù)據(jù)庫中的真實(shí)病例。這些數(shù)據(jù)包含了病人病癥特征和醫(yī)生給出的正確診斷結(jié)果。它真實(shí)地反映了臨床醫(yī)學(xué)數(shù)據(jù)庫中的數(shù)據(jù)特征。為了實(shí)現(xiàn)病歷數(shù)據(jù)到實(shí)驗(yàn)數(shù)據(jù)的轉(zhuǎn)化,進(jìn)行了數(shù)字化處理,并對(duì)原數(shù)據(jù)屬性特征做了最大化的保留。實(shí)驗(yàn)中將數(shù)據(jù)集隨機(jī)分成兩部分,一部分作為病例數(shù)據(jù)庫集合,另一部分作為待診斷病例集合。

      5.2 實(shí)驗(yàn)結(jié)果

      圖4展示了病例樣本數(shù)量對(duì)診斷準(zhǔn)確率的影響,實(shí)驗(yàn)從病歷數(shù)據(jù)庫中隨機(jī)抽取病例作為病例樣本,且每種疾病按100條和1 000條兩種比例抽取。為了驗(yàn)證群體決策的效果,實(shí)驗(yàn)將群體決策人數(shù)D設(shè)置成從2到50之間變化,參與計(jì)算的病癥屬性數(shù)目為6。

      圖4 病例樣本數(shù)量與診斷準(zhǔn)確率關(guān)系

      由圖4可知,病例數(shù)據(jù)庫集合的樣本密度對(duì)診斷準(zhǔn)確率的影響很大,樣本越多,診斷準(zhǔn)確率越高。而且采用1 000樣本/疾病種類的診斷精度要遠(yuǎn)遠(yuǎn)高于采用100樣本/疾病種類的診斷精度。另外,還能看出D的取值并不是越大越好,在本實(shí)驗(yàn)中,D=5具有較好的實(shí)驗(yàn)效果。在最開始決策人數(shù)較少時(shí),群體決策達(dá)到了應(yīng)有的少數(shù)服從多數(shù)的效果。一旦D值過大,相反還影響了診斷準(zhǔn)確度。這也是和不同疾病的病癥數(shù)據(jù)相融合有很大關(guān)系,過分?jǐn)U大決策人數(shù)數(shù)量相反還加重了疾病診斷的模糊性。因此,在群體決策中針對(duì)不同數(shù)據(jù)集特點(diǎn)探索適當(dāng)?shù)臎Q策人數(shù)是很有必要的。

      圖5展示了病癥屬性數(shù)量與診斷準(zhǔn)確率關(guān)系,即屬性相容性對(duì)實(shí)驗(yàn)精度的影響。實(shí)驗(yàn)中的病例數(shù)據(jù)集合樣本按1 000樣本/疾病種類比例抽取,屬性特征的提取按相容性分析中的高值依次獲取。

      如圖5所示,顯然診斷準(zhǔn)確率隨著屬性數(shù)量的增大而增長,病癥屬性越多,計(jì)算所得診斷結(jié)果準(zhǔn)確率越高。在群體決策人數(shù)D相同的情況下,參與診斷的病癥屬性多的準(zhǔn)確率遠(yuǎn)遠(yuǎn)高于病癥屬性少的準(zhǔn)確率。正如所預(yù)測(cè)的那樣,相容性分析對(duì)準(zhǔn)確率的影響是明顯的。當(dāng)然,參與計(jì)算的屬性數(shù)目多,計(jì)算開銷也會(huì)相應(yīng)增大,這一點(diǎn)在后面的時(shí)間開銷實(shí)驗(yàn)中作評(píng)估。

      圖5 病癥屬性數(shù)量與診斷準(zhǔn)確率關(guān)系

      圖6 展示了病癥屬性數(shù)量及D取值對(duì)運(yùn)行時(shí)間的影響。實(shí)驗(yàn)采用4種屬性數(shù)目和6種屬性數(shù)目進(jìn)行對(duì)比。待診斷病例集合記錄數(shù)為5 000條數(shù)據(jù),病例數(shù)據(jù)集合樣本密度為1 000樣本/疾病種類,群體決策人數(shù)D設(shè)置為從2到50之間變化。

      圖6 運(yùn)行時(shí)間對(duì)比

      如圖6所示,隨著D數(shù)目的增長,診斷時(shí)間也隨著增長。在相同D值的情況下,屬性數(shù)目越多,診斷執(zhí)行時(shí)間越長,并且兩者差距越來越大。當(dāng)D=50時(shí),計(jì)算復(fù)雜度更是急劇增長??梢?,數(shù)據(jù)維數(shù)和D所帶來的計(jì)算次數(shù)對(duì)運(yùn)行時(shí)間有著深遠(yuǎn)的影響。

      圖7展示了不同樣本密度情況下兩種方法的運(yùn)行時(shí)間對(duì)比,其中本文采用的權(quán)值自動(dòng)設(shè)定方法由相容性分析學(xué)習(xí)所得,權(quán)值人工設(shè)定方法中各權(quán)值由人工設(shè)定。為公平起見和減少人為經(jīng)驗(yàn)干擾,人工設(shè)定方法各權(quán)值為平均值,歸一化為1。實(shí)驗(yàn)中的病例數(shù)據(jù)集合樣本按樣本/疾病種類比例抽取,從100到600之間變化。屬性特征的提取按相容性分析中的高值依次獲取。群體決策人數(shù)D=5。

      圖7 不同方法比較

      如圖7所示,權(quán)值自動(dòng)設(shè)定方法診斷準(zhǔn)確率要高于權(quán)值人工設(shè)定方法。且在當(dāng)樣本密度較小的情況下,這一優(yōu)勢(shì)更明顯,這也驗(yàn)證了權(quán)值自動(dòng)設(shè)定借助機(jī)器學(xué)習(xí)的優(yōu)勢(shì)。還可以看出,兩種方法診斷準(zhǔn)確率都隨著樣本密度的提高而提高,這和個(gè)體數(shù)量及其相容性特征有著很大關(guān)系。

      從實(shí)驗(yàn)結(jié)果可以看出,無論是所需測(cè)試樣本密度還是診斷準(zhǔn)確率上,基于相容性分析的診斷方法都具有較高的準(zhǔn)確率和性能。

      6 結(jié)束語

      本文研究了醫(yī)療診斷病例數(shù)據(jù)的相容性分析問題。為了解決醫(yī)療診斷專家系統(tǒng)權(quán)值設(shè)定和自動(dòng)賦值的難題,將相容性分析引入到醫(yī)療診斷中,并提出了一種基于屬性相容性分析的醫(yī)療診斷方法。針對(duì)權(quán)值賦值問題,利用基于屬性的相容性分析對(duì)醫(yī)療數(shù)據(jù)進(jìn)行數(shù)字化處理,提出了較為實(shí)用的權(quán)值設(shè)定數(shù)學(xué)模型;針對(duì)疾病癥狀屬性多影響診斷結(jié)果問題,利用屬性之間的關(guān)聯(lián)度構(gòu)造屬性相關(guān)矩陣,并對(duì)屬性進(jìn)行剪枝處理;為了減少誤診率,系統(tǒng)采用群體決策策略來完成診斷。最后,針對(duì)所提方法進(jìn)行了實(shí)驗(yàn)?zāi)M。實(shí)驗(yàn)結(jié)果表明,該方法具有一定的有效性和實(shí)用價(jià)值。

      猜你喜歡
      群體決策權(quán)值準(zhǔn)確率
      一種融合時(shí)間權(quán)值和用戶行為序列的電影推薦模型
      乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
      健康之家(2021年19期)2021-05-23 11:17:39
      不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
      2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
      CONTENTS
      CONTENTS
      高速公路車牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
      基于權(quán)值動(dòng)量的RBM加速學(xué)習(xí)算法研究
      財(cái)務(wù)管理案例教學(xué)課堂討論的組織方案設(shè)計(jì)思路
      群體決策中隱性社團(tuán)組織的識(shí)別
      安岳县| 孝昌县| 敦化市| 文化| 寿光市| 清原| 徐水县| 开封市| 浪卡子县| 晋江市| 河津市| 盈江县| 高平市| 区。| 张家口市| 无棣县| 丹棱县| 泸水县| 津市市| 宜良县| 赣州市| 封开县| 余庆县| 桐乡市| 江西省| 绵阳市| 越西县| 肥西县| 理塘县| 民丰县| 乌海市| 洪泽县| 北票市| 景洪市| 玛纳斯县| 石台县| 湖南省| 平乡县| 游戏| 四会市| 涞源县|