趙碩
(齊齊哈爾大學 網(wǎng)絡(luò)信息中心,黑龍江 齊齊哈爾 161006)
對骨質(zhì)疏松早預防、早發(fā)現(xiàn)是一個重要的研究課題。有些學者對不同年齡健康人群不同部位骨密度調(diào)查分析[1];有些學者對肥胖男性體成分與骨密度相關(guān)性進行研究[2];有些學者對河北地區(qū)不同年齡健康男性不同部位骨密度與體成分分析[3];有些學者研究COPD患者骨密度與其他指標的相關(guān)性[4];有的學者研究Wards三角骨密度與年齡、腰圍、總體脂肪質(zhì)量和總體肌肉質(zhì)量的相關(guān)性[5],但是有病史是否影響骨密度的含量,以及應用數(shù)據(jù)挖掘的方法對骨密度與相關(guān)因素關(guān)系的研究未見報道。本文應用數(shù)據(jù)挖掘的方法對齊齊哈爾地區(qū)男性骨密度與相關(guān)因素的關(guān)系進行研究。首先對20~89歲男性的骨密度與相關(guān)因素的原始數(shù)據(jù)進行采集,然后對原始數(shù)據(jù)按不同種類進行分類統(tǒng)計,得到各種統(tǒng)計表。再應用改進的決策樹算法找到不同分類標準下骨密度的變化規(guī)律。建立決策樹,用決策樹判斷患者患病的概率。
1.1.1 決策樹算法
決策樹算法是數(shù)據(jù)挖掘的常用方法之一。決策樹是一種常用于預測模型的算法,它通過一系列規(guī)則將大量數(shù)據(jù)有目的分類,從中找到一些有價值的、潛在的信息。
1.1.2 骨密度
骨密度又叫做骨骼礦物質(zhì)密度(Bone mineral density),簡稱BMD。是骨質(zhì)量的一個重要指標,以克/每平方厘米表示(g/cm2),反映骨質(zhì)疏松的程度,是預測骨折危險性的重要指標和依據(jù)。
1.1.3 T值
T值是將測得的骨密度值與同性別、同種族的正常人群骨峰值的比較值:
T值=(被測人骨密度-正常人群平均骨密度峰值)/正常人群平均骨密度的標準差
1.1.4 Z值
Z值是將測得的骨密度值與同年齡、同性別、同種族的正常人群比較值:
Z值=(被測人骨密度-同齡人群平均骨密度值)/同齡人群平均骨密度的標準差
1.1.5 脂肪率
脂肪率是指身體成分中,脂肪組織所占的比率。用公式表示為
1.1.6 身高體重指數(shù)
體質(zhì)指數(shù):即身高體重指數(shù)(BMI)。
BMI=體重(kg)/身高2(m2)
專家指出最理想的體重指數(shù)是22,BMI指數(shù)不適用于兒童。
體成分分析相關(guān)指標:中國成年人身體質(zhì)量指數(shù),輕體重:BMI<18.5;健康體重:18.5≤BMI<24;超重:24≤BMI<28;肥胖:28≤BMI,最理想的體重指數(shù)是22。
一般來說,絕經(jīng)后婦女和50歲以上男性的BMD報告原則使用T值和WHO骨密度測量的分類標準;絕經(jīng)前婦女和50歲以下的男性BMD報告原則使用Z值,不能使用T值,尤其是兒童。Z值等于或小于-2.0表示:“骨密度低于同齡人”;Z值大于-2.0表示:“骨密度在同齡人范圍內(nèi)?!眴为氁罁?jù)BMD不能診斷50歲以下男性患骨質(zhì)疏松癥。WHO診斷標準可能適用于絕經(jīng)婦女。
實際檢測病人的標準是:當T值為-1~+1時,骨量正常;當T值為-2.5~-1時,骨量減少;當T值小于-2.5時,是骨質(zhì)疏松。
原始數(shù)據(jù)統(tǒng)計表,主要收集2015年以來,在齊齊哈爾市第一醫(yī)院門診及住院的20~89歲男性患者信息,共560人。其中20~29歲有21人;30~39歲有91人;40~49歲有152人;50~59歲有186人;60~69歲有62人;70~79歲有37人;80~89歲有11人。原始數(shù)據(jù)信息統(tǒng)計部分數(shù)據(jù)如表1所示。
表1 原始數(shù)據(jù)信息統(tǒng)計部分數(shù)據(jù)
50歲以下男性使用Z值進行檢測骨密度,50歲及以上男性使用T值檢測骨密度。
1.3.1 按照有無病史進行分類
有病史患者共279人。其中,20~29歲有6人;30~39歲有39人;40~49歲有73人;50~59歲有101人;60~69歲有28人;70~79歲有24人;80~89歲有8人??梢郧蟪鲇胁∈坊颊逿值或Z值偏低、正常和偏高的人數(shù),從而可求出有病史患者T值或Z值偏低、正常、偏高的比率表,如表2所示。
表2 有病史患者Z(T)值比率表
通過統(tǒng)計發(fā)現(xiàn),對于有病史的患者,20~29歲時,正常范圍的比率最高,其次是40~49歲。50~89歲,T值的正常比率與年齡呈負相關(guān)。T值偏低的比率所有年齡段整體趨勢隨年齡增加而增加。T值偏高的比率,50~89歲隨年齡增加,偏高的比率增加。T值偏高的比率與年齡增長正相關(guān),發(fā)現(xiàn)30~39歲,有病史的患者,比20~29歲和40~49歲有病史的患者骨密度偏低的比率增加。30~39歲,有其他疾病的患者,要注重補充體內(nèi)骨密度的含量,以免使骨密度減少。50~89歲,對于有病史的患者,注意預防骨量偏低、骨質(zhì)疏松和骨質(zhì)硬化。
無病史患者共281人。其中20~29歲有14人;30~39歲有52人;40~49歲有78人;50~59歲有88人;60~69歲有33人;70~79歲有13人;80~89歲有3人。可以求出無病史患者T值或Z值在偏低,正常和偏高的人數(shù),從而可求出無病史患者T值或Z值在偏低,正常,偏高的比率表,如表3所示。
對于無病史患者,除了50~59歲以外,其他年齡段的患者,隨著年齡的增加,Z值或T值的正常比率下降;Z值或T值偏低的比率上升,50~59歲時候,T值或Z值比40~49歲、60~69歲偏低或偏高的現(xiàn)象。說明,無病史的男子50~59歲時候,需要注意身體保健,出現(xiàn)骨密度不正常的比率升高,應該注重營養(yǎng),增加骨密度,主要防治骨質(zhì)疏松和骨質(zhì)硬化。
把有病史和無病史的患者對比發(fā)現(xiàn),對于60歲以上的患者,無病史比有病史的患者,骨密度正常值的比率偏高。說明年齡大時,如果有其他病史,對骨密度含量有一定影響。
1.3.2 按脂肪率分類
采樣20~89歲男性共560人。按照30歲以下,偏瘦是脂肪率14%以下;標準是脂肪率14%~20%;微胖是脂肪率21%~25%;肥胖是脂肪率25%以上。30歲以上,偏瘦是脂肪率17%以下;標準是脂肪率17%~23%;微胖是脂肪率24%~25%;肥胖是脂肪率25%以上。偏瘦脂肪率共76人;標準脂肪率共104人;微胖脂肪率為28人;肥胖脂肪率為352人。由各段體重的人數(shù)可以求出脂肪率的比率,如表4所示。
表4 脂肪率Z(T)值比率統(tǒng)計表
通過脂肪率比率表發(fā)現(xiàn),脂肪率肥胖的患者,Z值或T值偏低的比率最高,說明肥胖的患者,骨密度減少的可能性最大,肥胖患者Z值或T值正常的比率最低;微胖的患者Z值或T值偏高的比率最大。說明為了健康應該控制體內(nèi)脂肪的含量,以免患骨質(zhì)疏松或骨質(zhì)硬化病。
1.3.3 按BMI分類
采樣20~89歲男性共560人。按照30歲以下,偏瘦是BMI<20;正常是20≤BMI≤25;超重是25<BMI≤30;肥胖是30<BMI≤35。重度肥胖是BMI>35???cè)藬?shù)共560人。其中偏瘦的有26人;正常的有262人;超重的有236人;肥胖的有34人;重度肥胖的有2人。由各段人數(shù),可以求出各段BMI的比率表,如表5所示。
表5 BMI比率統(tǒng)計表
通過BMI比率表發(fā)現(xiàn),偏瘦或者重度肥胖的患者,Z值或T值偏低的比率最高,說明偏瘦或重度肥胖的患者,骨密度減少的可能性最大,偏瘦或重度肥胖的患者Z值或T值正常的比率最低;體重正?;颊遉值或T值正常比率最高。說明為了健康應該控制體重,爭取保持標準體重,以免患骨質(zhì)疏松。
1.3.4 按血壓分類
統(tǒng)計了20~89歲的男性高血壓患者127人。其中T值或Z值偏低的有53人;正常的有66人;偏高的有8人。T值或Z值偏低的比率為41.7%,T值或Z值正常的比率為52.0%;T值或Z值偏高的比率為6.3%。說明高血壓患者,患骨質(zhì)疏松或骨量減少的可能性很大。
1.3.5 骨密度相關(guān)因素之間相互作用
通過數(shù)據(jù)分析發(fā)現(xiàn),骨質(zhì)疏松和年齡、有無病史、脂肪率、BMI以及血壓都有關(guān)系。并且這些影響因素之間兩兩相互作用,如果幾個因素疊加,會加大骨質(zhì)疏松的風險。
改進的決策樹算法的基本思想是:首先遞歸地對某一分類數(shù)據(jù)集進行劃分,可以多路分割,樹的每個非葉子節(jié)點可以包含一個分割點或者包含一個組合判斷分割點,由這個分割點決定數(shù)據(jù)如何劃分。直至每個子集的記錄全屬于一類或者某一類占壓倒的多數(shù)。根據(jù)這個算法思想,再結(jié)合表2~5,建立下面4個決策樹。
根據(jù)改進的決策樹算法分析,對于有病史患者,如圖1所示,如果Z值(T)值正常,年齡在20~29歲、40~49歲時候,骨量正??赡苄宰畲?;如果Z值(T)值偏低,年齡在30~39歲時候,骨量減少的可能性很大。當年齡在60~69歲、80~89歲時候,患骨質(zhì)疏松的可能性很大;如果Z值(T)值偏高,年齡是70~79歲的時候,患者患骨硬化病的可能性比較大。
圖1 有病史患者決策樹
根據(jù)改進的決策樹算法分析,對于無病史患者,如圖2所示,如果Z值(T)值正常,年齡在20~29歲、30~39歲時候,骨量正??赡苄宰畲?;如果Z值(T)值偏低,年齡在40~49歲時候,骨量減少的可能性很大。當年齡在50~59歲、80~89歲時候,患骨質(zhì)疏松的可能性很大;如果Z值(T)值偏高,年齡是70~79歲的時候,患者患骨硬化病的可能性比較大。
圖2 無病史患者決策樹
根據(jù)改進的決策樹算法分析,根據(jù)脂肪率可以推測,當脂肪率屬于偏瘦時候,骨量正??赡苄院艽?;當脂肪率屬于肥胖時候,骨質(zhì)疏松的可能性很大;當脂肪率屬于微胖時候,患者患骨硬化病的可能性比較大,如圖3所示。
圖3 脂肪率決策樹
根據(jù)改進的決策樹算法分析,當BMI屬于偏瘦或重度肥胖時候,患骨質(zhì)疏松的可能性很大;當BMI正常時,骨量正??赡苄院艽?,如圖4所示。
圖4 BMI決策樹
通過4個決策樹,可以輔助醫(yī)生判斷患者是否易患骨量減少、骨質(zhì)疏松或骨硬化病。如果有此風險,應該早預防、早治療。
本文主要研究了齊齊哈爾地區(qū)男性骨密度與相關(guān)因素的關(guān)系。采用的方法是分類和改進的決策樹算法。首先對20~89歲男性骨密度和相關(guān)因素進行采樣,得到患者骨密度及相關(guān)信息的原始數(shù)據(jù)。然后對原始數(shù)據(jù)按照不同分類方法進行統(tǒng)計。得到各種統(tǒng)計表。通過對各種表格對比分析發(fā)現(xiàn),對于有病史的患者,20~29歲時,正常范圍的比率最高,其次是40~49歲。50~89歲,T值的正常比率與年齡呈負相關(guān)。T值偏低的比率所有年齡段整體趨勢隨年齡增加而增加。T值偏高的比率,50歲以后隨年齡增加,偏高的比率增加。T值偏高的比率與年齡增長正相關(guān)。對于無病史患者,除了50~59歲以外,其他年齡段的患者,隨著年齡的增加,Z值或T值的正常比率下降,Z值或T值偏低的比率上升。50~59歲時候出現(xiàn)T值或Z值比40~49歲、60~69歲偏低或偏高的現(xiàn)象。無病史比有病史的患者,骨密度正常值的比率偏高。說明年齡大時,如果有其他病史,對骨密度含量有一定影響。按照脂肪率的含量進行分類發(fā)現(xiàn),脂肪率肥胖的患者,Z值或T值偏低的比率最高,說明肥胖的患者,骨密度減少的可能性最大,肥胖患者Z值或T值正常的比率最低;微胖的患者Z值或T值偏高的比率最大。根據(jù)BMI含量可以推測,當BMI屬于偏瘦或重度肥胖時候,可能骨質(zhì)疏松;當BMI正常時,骨量正??赡苄宰畲蟆Uf明為了健康應該控制體內(nèi)脂肪的含量或控制體重,以免患骨質(zhì)疏松或骨質(zhì)硬化病。高血壓患者易患骨質(zhì)疏松。然后根據(jù)改進的決策樹算法建立了4個決策樹,通過4個決策樹,可以輔助醫(yī)生判斷患者患病情況。