• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于主成分分析的帕金森量表優(yōu)化

      2015-05-04 05:34:14雷少正王崇駿謝俊元
      數(shù)據(jù)采集與處理 2015年5期
      關(guān)鍵詞:貢獻度帕金森帕金森病

      雷少正 王崇駿 謝俊元

      (1.南京大學(xué)計算機科學(xué)與技術(shù)系,南京,210023;2.南京大學(xué)軟件新技術(shù)國家重點實驗室,南京,210023)

      ?

      基于主成分分析的帕金森量表優(yōu)化

      雷少正1,2王崇駿1,2謝俊元1,2

      (1.南京大學(xué)計算機科學(xué)與技術(shù)系,南京,210023;2.南京大學(xué)軟件新技術(shù)國家重點實驗室,南京,210023)

      西醫(yī)量表是評估帕金森病(Parkinson′s disease,PD)的重要依據(jù),而這些量表包含大量交叉重復(fù)問題,不利于快速評估帕金森病。因此,優(yōu)化這些西醫(yī)量表對快速診斷帕金森病有非常重要的意義。針對該問題,提出了基于主成分分析(Principal component anaysis, PCA)的量表問題的優(yōu)化算法。本文提出的算法先是基于主成分分析提取出加權(quán)投影向量,然后在投影向量的基礎(chǔ)上采用基于大津閾值(Otsu)局部遞歸分割算法劃分量表,最后基于貢獻度因子(Contribution factor, CF)設(shè)計新量表。實驗通過采用支持向量機(Support vector machine,SVM)識別帕金森病,發(fā)現(xiàn)用僅占原西醫(yī)量表總問題數(shù)的21%的新量表能達到與原量表相當(dāng)?shù)淖R別水平。

      帕金森病; 量表優(yōu)化; 主成分分析; 大津閾值局部遞歸分割; 加權(quán)投影向量; 貢獻度因子

      引 言

      帕金森病[1-4]是一種常見于中老年人群的中樞神經(jīng)系統(tǒng)變性疾病,首先由英國醫(yī)生James Parkinson在一篇《震顫麻痹》的論文中進行了描述性研究,該病會致使患者出現(xiàn)如下癥狀:四肢顫抖、肌肉僵直、行動遲緩、步伐拖曳、憂郁及癡呆等[5]。量表是一種試圖確定主觀的或者抽象概念的定量化測量的程序,對事物的特性變量可以用不同的規(guī)則分配數(shù)值。西醫(yī)量表是評估帕金森病的重要手段[6-7],然而西醫(yī)量表包含大量交叉重復(fù)的量表問題,不利于醫(yī)生快速診斷帕金森病。因此,優(yōu)化帕金森量表對帕金森病的進一步深入研究具有重要的意義。一般在首次診斷帕金森量表時,會對所有的西醫(yī)量表進行全面測評,以便從整體上評估帕金森病。目前西醫(yī)量表都是從評估某一種癥狀而設(shè)計的,并沒有從帕金森病全局的視角上設(shè)計評估標(biāo)準(zhǔn),導(dǎo)致了許多量表有很多交叉重復(fù)的量表問題。在這種情況下就會導(dǎo)致有些重復(fù)出現(xiàn)的量表問題會被反復(fù)測評,或者有些量表問題對實際的測評結(jié)果影響很小。目前關(guān)于帕金森量表的研究主要是針對某一特定癥狀進行研究,采用數(shù)據(jù)挖掘的方法從統(tǒng)計特征上來研究量表至今還沒有受到重視,而本文試圖從這一視角來優(yōu)化帕金森病量表。本文提出的基于主成分分析的量表優(yōu)化方法,主要是通過降低數(shù)據(jù)的噪聲和冗余來優(yōu)化帕金森病的西醫(yī)量表。

      1 基于主成分分析的帕金森量表優(yōu)化算法框架

      西醫(yī)量表比中醫(yī)量表具有更好地規(guī)范性,評價標(biāo)準(zhǔn)量化程度高,而且樣本數(shù)據(jù)也比較豐富,基于此本文選取帕金森病的西醫(yī)量表所包含的量表問題作為研究對象。本文提出了基于主成分分析的帕金森量表優(yōu)化算法,該算法框架分3個階段:(1)提取基于PCA的加權(quán)投影向量;利用PCA模型計算出投影矩陣,根據(jù)貢獻效率閾值提取若干主成分,采用加權(quán)累加主成分對應(yīng)的特征向量,獲取一個投影向量。該投影向量分量代表原數(shù)據(jù)空間相應(yīng)的量表問題權(quán)重,權(quán)重越大,代表該量表問題越重要。(2)采用基于Otsu局部遞歸分割法分割量表問題?;诖蠼蜷y值(Otsu)局部遞歸分割算法獲取量表問題的分組,同一組的量表問題表示具有最相似的權(quán)重。(3)設(shè)計基于貢獻度因子的新量表。利用第2階段的分組,定義一個貢獻度因子,對各個分組進行排序,根據(jù)排名設(shè)計一張新量表。

      2 基于PCA的加權(quán)向量提取

      主成分分析(Principal component analysis,PCA)是用原有的變量的線性組合來表示樣本最主要的特征,是應(yīng)用線性代數(shù)最有價值的結(jié)果之一[8-10]。文獻[11]首先將該變換引入生物學(xué)領(lǐng)域,并重新對線性回歸進行了分析;文獻[12]又將PCA應(yīng)用在心里測驗學(xué),把離散變量變換成無關(guān)聯(lián)系數(shù);隨后文獻[13]對該變換進行整理歸納,因此也被稱為K-L變換。由于PCA簡單無參限制的優(yōu)點,使得它廣泛應(yīng)用在各個領(lǐng)域,從神經(jīng)科學(xué)到計算機圖形學(xué)[14]。

      λiui=Cuii=1,…,n

      (1)

      式中:λi是協(xié)方差矩陣C的一個特征值;ui為相應(yīng)的特征向量。

      對應(yīng)特征值按降序排列,當(dāng)僅用前p個特征向量(p根據(jù)貢獻效率選取)時,獲得新的樣本矩陣

      Y=UTX

      (2)

      新的主成分即是前p個特征值,矩陣UT的列向量就是主成分對應(yīng)的特征向量,各個特征向量是相互正交的。PCA可以有效地找出數(shù)據(jù)中最重要的結(jié)構(gòu),降低噪聲和去除冗余,抽取隱含在復(fù)雜數(shù)據(jù)的背后的關(guān)系?;诖?,本文提出了提取基于PCA的帶權(quán)重的特征向量算法,該算法主要用于提取加權(quán)重投影向量,用以刻畫量表問題的權(quán)重。

      算法1 基于PCA的加權(quán)投影向量提取算法

      輸入:診斷記錄的樣本矩陣A,每一個行向量代表一個樣本點,每一列代表一個量表問題變量;

      輸出:加權(quán)的投影向量v。

      步驟1 對原始數(shù)據(jù)的樣本矩陣A進行規(guī)范化處理,每個維度的分量按如下進行變換

      (3)

      步驟2 求出規(guī)范化后的樣本矩陣X的協(xié)方差矩陣C。

      步驟3 采用雅克比(Jacobi)迭代算法求解C的特征值λ1, …,λn,對應(yīng)的特征向量為v1, …,vn。

      步驟4 對特征值按降序排列得到λ1′,…,λn′,并調(diào)整對應(yīng)的特征向量v1′, …,vn′。

      步驟5 采用施密特(Schmitt)正交化法單位正交化特征向量得到α1, …,αn。

      步驟6 計算各個主成分的累積貢獻率A1, …,An,根據(jù)給定的效率閾值γ,若Ap≥γ且Ap-1<γ,則提取前p個主成分A1, …,Ap。

      3 基于Otsu局部遞歸分割法劃分量表

      (4)

      算法2描述了基于Otsu閾值的一種局部遞歸分割的劃分量表問題的算法,按量表問題的權(quán)重分組,使得同一分組包含的量表問題的權(quán)重盡可能接近。

      算法2 基于Otsu局部遞歸分割劃分問題算法

      輸入:量表問題的加權(quán)投影向量v;

      輸出:量表問題的分割閾值集合T以及對應(yīng)的量表問題分組集合Q。

      步驟1 對特征向量v的元素按降序排列w,并對其按式(1-3)進行歸一化,得到向量s。

      步驟2 針對規(guī)范化的向量s,把該代表量表問題權(quán)重的向量s的元素投射到區(qū)間[0, 250]上,并進行頻數(shù)統(tǒng)計,得到一個頻數(shù)數(shù)組H。

      步驟3 計算頻數(shù)數(shù)組H所包含的量表問題數(shù)目n。

      步驟4 如果n大于閾值p,則轉(zhuǎn)到步驟5,否則,則轉(zhuǎn)到步驟7。

      步驟5 對頻數(shù)數(shù)組H按式(4)求Ostu閾值τ,記錄閾值τ劃分H得到的兩個分組H1,H2,并把該閾值加入到閾值集合T中。

      步驟6 對于獲得的分組H1,H2,分別計算其所對應(yīng)的量表問題數(shù)n1,n2,轉(zhuǎn)至步驟4。

      步驟7 對閾值集合T進行排序,按照閾值對特征向量進行分組,并把對應(yīng)的量表問題序號分配到對應(yīng)的分組Q中。

      4 實驗結(jié)果與分析

      4.1 實驗數(shù)據(jù)及其環(huán)境

      實驗數(shù)據(jù)來源于某腦科醫(yī)院2008—2013年之間的患者測評的量表數(shù)據(jù)。這里選取測評參與人數(shù)最多的15張西醫(yī)量表,其中包含統(tǒng)一帕金森量表、漢密頓焦慮量表、漢密頓抑郁量表、抑郁自評量表、焦慮自評量表、帕金森睡眠量表、日常生活量表、MOCA量表、PDNMS問卷量表、帕金森隨訪量表以及運動并發(fā)癥量表等,總共包含337個量表問題,參與測評人數(shù)為3 620。

      過濾掉參評人數(shù)低于100的量表問題,余下245個量表問題。另外,有些患者單次診斷參與評估的量表問題數(shù)也很少,這里把參與評估的量表問題數(shù)低于總數(shù)的70%的患者也過濾掉,最終留下了樣本數(shù)為1 122。余下的不完整的數(shù)據(jù),采用量表問題的正常值取代空值。為便于分析,把所有的量表問題進行統(tǒng)一編號,預(yù)處理后的輸入樣本矩陣為1 122×245。實驗環(huán)境為:處理器Intel(R)Pentium(R)G640 2.8GHz,內(nèi)存2GB,硬盤500GB,操作系統(tǒng)Windows7 32位旗艦版,編程平臺為MatlabR2012a,并采用了Matlab的模式識別工具箱PRtools。

      4.2 量表問題權(quán)重的實驗分析

      采用算法1對樣本進行主成分分析,得到主成分累積貢獻率如圖1所示。從圖中可以看到前60個主成分的累積貢獻率達到75%。這里選取前60個主成分作為有效主成分,由此計算出加權(quán)投影向量。這個向量的每個元素與原樣本矩陣的量表問題編號相對應(yīng),向量的元素代表相應(yīng)量表問題的貢獻度。表1列出了貢獻度排前20的量表問題,從表中可以看出,這些量表問題主要來自于抑郁自評量表、焦慮自評量表及統(tǒng)一帕金森量表。經(jīng)腦科醫(yī)院的帕金森病研究專家認定,這些問題明顯與帕金森的典型癥狀相關(guān),在評估帕金森病相關(guān)癥狀時具有重要作用。

      圖1 主成分的累積貢獻率Fig.1 Cumulative contribution rate based on PCA

      表1 貢獻度Top20的量表問題

      4.3 量表問題分割的實驗分析

      利用算法2對4.2節(jié)獲得的加權(quán)投影向量進行Otsu閾值分割,得到107個分組。為了比較每個分組的重要性,定義一種貢獻度因子

      (5)

      (6)

      按照式(6)計算樣本的單位量表問題分值,并求出每個分組的均值和方差的無偏估計量,然后按式(5)計算出相應(yīng)分組的貢獻度因子。

      表2為量表貢獻度因子前20的問題分組。實驗中的量表問題編號的命名規(guī)則為原量表編號+問題序號,而47, 48, 49分別為UPDRS第2、第3、第4分量表,7為PDNMS問卷量表,4為PDSS量表,10為MOCA量表。可以看出,UPDRS量表對應(yīng)的問題所占的比重最高,而評估帕金森病最重要的量表就是統(tǒng)一帕金森量表(UPDRS)[18-19]。

      表2 貢獻度因子Top20的量表問題分組

      本文把貢獻度因子排名前20的量表問題組合并成一張新的大量表,共計53個量表問題,占總問題數(shù)的21%。針對這張新量表,這里隨機抽取原始數(shù)據(jù)庫中的200條診斷記錄,評估的分值占總量表問題數(shù)的比例見圖2,其中均值為0.6,方差為0.013。

      圖2 新量表評估的分值占比Fig.2 Scores accounting of the new sacle

      4.4 新量表識別帕金森病的實驗分析

      為了驗證新量表識別帕金森病的效果,本文采用SVM對病人是否患帕金森病進行分類,并與原量表進行對比。SVM是基于風(fēng)險結(jié)構(gòu)最小化原理來提高學(xué)習(xí)系統(tǒng)的泛化能力的,能夠采用較少的樣本達到較好地分類效果[20-22]。

      實驗中采用的SVM的參數(shù)設(shè)置如下:核函數(shù)為徑向基函數(shù),Gamma設(shè)為1/2。表3為SVM在新量表和原量表上識別帕金森病的實驗結(jié)果。

      表3 SVM識別帕金森病的結(jié)果

      實驗結(jié)果表明:針對識別帕金森病的分類問題,SVM分類器在新量表的準(zhǔn)確率(Precision)和召回率(Recall)都略低于原量表相應(yīng)的準(zhǔn)確率和召回率。這說明了新量表能達到與原量表識別帕金森病的相當(dāng)?shù)乃?。注意到新量表的問題數(shù)僅占西醫(yī)量表總問題數(shù)的21%,這為醫(yī)生快速診斷帕金森病提供了一種新的思路。

      5 結(jié)束語

      本文提出了基于主成分分析的帕金森量表優(yōu)化算法框架,利用了主成分分析可以去除復(fù)雜數(shù)據(jù)的噪聲和冗余的特性,進而設(shè)計了一種基于貢獻度因子概念的新量表,最后采用SVM分類器對新量表的識別帕金森病的能力進行了驗證,發(fā)現(xiàn)新量表能夠達到與原量表識別帕金森病的相當(dāng)?shù)乃?。該算法框架可以為醫(yī)生從全局上快速把握帕金森病提供了一種新的思路。帕金森病的量表研究在傳統(tǒng)上一直以單一癥狀診斷為核心設(shè)計量表,缺乏全局的量表設(shè)計,導(dǎo)致了量表之間的有些問題重復(fù)出現(xiàn),或者相似程度很高,不利于醫(yī)生在首次快速判斷帕金森病。而本文基于PCA設(shè)計的新量表在一定程度上可以快速診斷帕金森病。值得注意的是,本文設(shè)計的新量表只是在醫(yī)生首次診斷帕金森病有幫助,因為新量表設(shè)計的目的是為醫(yī)生從全局上把握帕金森病。如果需要進一步確定病人在某一些特定癥狀的輕重,還需要病人去評估傳統(tǒng)的針對帕金森病單一癥狀設(shè)計的量表。本文接下來需要對新量表進行修正,新量表評估的分值并沒有達到與原量表的識別帕金森病的水平。注意到貢獻度因子僅僅考慮了量表問題分組的均值和方差,并沒有考慮不同量表之間的差異性,量表之間并不是對等的關(guān)系,未來嘗試對不同量表提出一種統(tǒng)一的評判標(biāo)準(zhǔn)。另外,由于原始數(shù)據(jù)存在缺失,采用過濾和正常值取代法并不是一個合理的手段,未來也需要研究直接在殘缺的數(shù)據(jù)上做主成分分析的算法,同時考慮中醫(yī)量表,以使得最終設(shè)計的新量表能達到較高的識別帕金森病的水平。

      [1] Cummings J L. Depression and Parkinson′s disease: A review[J].The American Journal of Psychiatry, 1992, 12(1): 55-74.

      [2] Barbeau A.L-dopa therapy in Parkinson′s disease: A critical review of nine years’s experience[J].Canadian Medical Association Journal, 1969, 101(13): 59.

      [3] Twelves D, Perkins K S M, Counsell C.Systematic review of incidence studies of Parkinson′s disease[J].Movement Disorders, 2003, 18(1): 19-31.

      [4] 褚玉霞,汪靜.帕金森病研究進展分析[J].醫(yī)學(xué)綜述, 2006, 12(18): 1112-1113.

      Chu YuXia,Wang Jing.An analysis of the progress in Parkinson′s disease[J].Medical Recapitulate, 2006, 12(18): 1112-1113.

      [5] Parkinson J.An essay on the shaking palsy[M].London: Whittingham and Rowland for Sherwood, Neely, and Jones, 1817.

      [6] 陳海波,王新德.統(tǒng)一帕金森病評定量表[J].中華老年醫(yī)學(xué)雜志, 1999, 18(1): 61-62.

      Chen Haibo,Wang Xinde.Unified Parkinson′s disease rating scale[J].China Academic Journal, 1999,18(1):61-62.

      [7] 董青, 李建萍, 劉建軍, 等.帕金森病患者紋狀體多巴胺轉(zhuǎn)運體顯像與帕金森病臨床量表評分的相關(guān)性[J].臨床神經(jīng)病學(xué)雜志, 2005, 18(3): 167-169.

      Dong Qing, Li Jianping, Liu Jianjun, et al.Correlation of striatum dopamine transporter imaging and the scores of Parkinsonian clinical scale in patients with Parkinson′s disease[J].Journal of Clinical Neurology, 2005,18(3): 167-169.

      [8] Smith L I.A tutorial on principal component analysis[M].New York:Cornell University, 2002.

      [9] Daffertshofer A, Lamoth C J C, Meijer O G, et al.PCA in studying coordination and variability: A tutorial[J].Clinical Biomechanics, 2004, 19(4): 415-428.

      [10]Geladi P, Kowalski B R.Partial least-squares regression: A tutorial[J].Analytica Chimica Acta, 1986, 185: 1-17.

      [11]Pearson K.Principal components analysis[J].The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science, 1901, 6(2): 559.

      [12]Anderson T W.Harold Hotelling′s research in statistics[J].The American Statistician, 1960, 14(3): 17-21.

      [13]Carayannis G, Gueguen C.The factorial linear modelling: A Karhumen-Loeve approach to speech analysis[C]//Acoustics, Speech, and Signal Processing, IEEE International Conference on ICASSP′76.Vancouver, Canada: IEEE, 1976, 1: 489-492.

      [14]Karhunen J, Joutsensalo J.Representation and separation of signals using nonlinear PCA type learning[J].Neural Networks, 1994, 7(1): 113-127.

      [15]Otsu N.A threshold selection method from gray-level histograms[J].System Man & Cybemetics IEEE Transaction on, 1979, 9(1): 62-66.

      [16]Arifin A Z, Asano A.Image segmentation by histogram thresholding using hierarchical cluster analysis[J].Pattern Recognition Letters, 2006, 27(13): 1515-1521.

      [17]Ng H F.Automatic thresholding for defect detection[J].Pattern Recognition Letters, 2006, 27(14): 1644-1649.

      [18]Drake C, Nickel C, Burduvali E, et al.The pediatric daytime sleepiness scale (PDSS): Sleep habits and school outcomes in middle-school children[J].Sleep: Journal of Sleep and Sleep Disorders Research, 2003,41(1): 272-278.

      [19]Goetz C G, Fahn S, Martinez M P, et al.Movement disorder society-sponsored revision of the unified Parkinson′s disease rating scale (MDS—UPDRS): Process, format, and clinimetric testing plan[J].Movement Disorders, 2007, 22(1): 41-47.

      [20]Chang C C, Lin C J.LIBSVM: A library for support vector machines[J].ACM Transactions on Intelligent Systems and Technology (TIST), 2011, 2(3): 27.

      [21]Cortes C, Vapnik V.Support vector machine[J].Machine Learning, 1995, 20(3): 273-297.

      [22]Lee C P, Lin C.Large-scale linear rank SVM[J].Neural Computation, 2014, 26(4): 781-817.

      Optimization of Parkinson′s Scale Using Principal Component Analysis

      Lei Shaozheng1,2, Wang Chongjun1,2, Xie Junyuan1,2

      (1.Department of Computer Science and Technology,Nanjing University, Nanjing, 210023, China; 2.State Key Laboratory for Novel Software Technology, Nanjing University, Nanjing, 210023, China)

      Western scales are a significant basis for assessment of Parkinson′s disease(PD), while these scales contain a large number of cross-duplicates scales, which hampers rapid assessment of PD. Therefore, optimizing these wetern scales is significant for rapid diagnosis of PD. And the method of the optimization of Parkinson’s scale based on principal component analysis(PCA) is raised. The weighted projective vector is extracted based on principal component analysis, and scale problems are divided on the basis of the projected vector using local recursive segmentation algorithm based on Ostu threshold, Finally, based on contribution factors(CF), a new scale is designed. Experiment results confirm that the new combinations of scale which accounts for 21% of the original western scales is highly comparable to original western scales for identifying PD support vector machine(SVM).

      Parkinson′s disease; optimization of scale; principal component analysis; local recursive Otsu threshold segmentation;projected vector;contribution factor

      國家自然科學(xué)基金(61105069)資助項目;江蘇省科技支撐計劃(BE2012161)資助項目。

      2014-03-25;

      2014-05-12

      TP391

      A

      雷少正(1988-),男,碩士研究生,研究方向:數(shù)據(jù)挖掘。

      王崇駿(1975-),男,教授,研究方向:智能信息化處理、分布式人工智能、社會網(wǎng)絡(luò)分析和嵌入式智能系統(tǒng),E-mail:chjwang@nju.edu.cn。

      謝俊元(1961-),男,教授,博士生導(dǎo)師,研究方向:人工智能和智能信息化處理。

      猜你喜歡
      貢獻度帕金森帕金森病
      手抖一定是帕金森病嗎
      一對一心理護理對帕金森伴抑郁癥患者的影響
      多巴胺不敏感型帕金森綜合征診斷及治療的研究進展
      充分把握教育對經(jīng)濟社會發(fā)展的貢獻度
      基于貢獻度排序的腎透明細胞癌串?dāng)_通路分析
      帕金森病科普十問
      活力(2019年22期)2019-03-16 12:47:04
      2013~2015年廣東同江醫(yī)院門診抗帕金森藥應(yīng)用分析
      需求側(cè)資源促進可再生能源消納貢獻度綜合評價體系
      帕金森病的治療
      中西醫(yī)結(jié)合治療帕金森病98例
      弥勒县| 东阳市| 察雅县| 扶风县| 郯城县| 黄陵县| 沂源县| 洪湖市| 宁夏| 五指山市| 中阳县| 南丹县| 济源市| 临湘市| 红桥区| 广宗县| 筠连县| 大城县| 漾濞| 城市| 阿合奇县| 长顺县| 彭山县| 汝州市| 鄂托克旗| 雷波县| 通州市| 凤阳县| 马边| 开鲁县| 黄大仙区| 闵行区| 贵州省| 舞钢市| 大名县| 宜丰县| 略阳县| 清原| 靖西县| 临西县| 虹口区|