馮 宇
(長(zhǎng)安大學(xué) 電子與控制工程學(xué)院,陜西 西安 710064)
近年來(lái),國(guó)內(nèi)人口高血糖的患病率呈現(xiàn)逐年上升的趨勢(shì)[1-2]。急性高血糖可直接造成腦損傷[3],并影響心臟傳導(dǎo)系統(tǒng)的功能[4],嚴(yán)重威脅著人類(lèi)健康,目前亟需研究可以判斷急性高血糖的方法。從算法分析角度來(lái)看,醫(yī)學(xué)診斷過(guò)程的實(shí)質(zhì)是分類(lèi)與預(yù)測(cè),因此預(yù)測(cè)模型在醫(yī)學(xué)診斷領(lǐng)域中有廣泛的應(yīng)用前景。預(yù)測(cè)模型是數(shù)據(jù)挖掘研究領(lǐng)域中的重要組成部分,其功能是建立連續(xù)值函數(shù)模型,預(yù)測(cè)給定自變量對(duì)應(yīng)的因變量的值[5]。預(yù)測(cè)的目標(biāo)是建立一個(gè)預(yù)測(cè)函數(shù),使得對(duì)于每一個(gè)提前期,實(shí)際值與預(yù)測(cè)值之間的偏差的均方盡可能小[6]。在多種建立預(yù)測(cè)模型的方法中,模糊分析方法因其分析對(duì)象的系統(tǒng)性、數(shù)學(xué)表達(dá)的簡(jiǎn)潔性和較少的數(shù)據(jù)信息需求,廣泛應(yīng)用于醫(yī)學(xué)診斷研究領(lǐng)域[7-9]。文中建立了一種基于模糊語(yǔ)言規(guī)則(fuzzy language rules,F(xiàn)LR)的預(yù)測(cè)模型,通過(guò)該預(yù)測(cè)模型分析心臟傳導(dǎo)系統(tǒng)的電生理信息,進(jìn)而實(shí)現(xiàn)對(duì)不同濃度急性高血糖作用時(shí)間的判斷。
當(dāng)系統(tǒng)中有不確定的信息時(shí),可以認(rèn)為系統(tǒng)是模糊的。模糊模型介于單純的經(jīng)驗(yàn)?zāi)P秃蛧?yán)格的結(jié)構(gòu)模型之間,實(shí)際中的大部分模型都具備這樣的特點(diǎn),且模糊的推理方式更接近于人類(lèi)的思維和語(yǔ)言特點(diǎn)。經(jīng)驗(yàn)表明,使用模糊算法生成的預(yù)測(cè)模型往往具有更高的預(yù)測(cè)精度。
若X是對(duì)象x的集合,則X的模糊集合A定義為:
A={(x,μA(x))|x∈X}
(1)
其中,μA(x)為模糊集合A的隸屬函數(shù)。
隸屬函數(shù)可以將集合X中的每一個(gè)元素在0到1的區(qū)間上重新映射,稱(chēng)為隸屬度。隸屬函數(shù)的值在區(qū)間0到1之間是連續(xù)變化的。
一般可以將模糊推理過(guò)程分為三步:
第一步,根據(jù)分類(lèi)方式確定輸入變量的隸屬度,即數(shù)據(jù)模糊化。
第二步,將模糊化的輸入變量輸入模糊運(yùn)算規(guī)則庫(kù),使用規(guī)則庫(kù)中的多種運(yùn)算規(guī)則得到系統(tǒng)的輸出變量,該輸出也是模糊化的。
第三步,對(duì)輸出變量解模糊處理,最終得到確定的結(jié)果。
設(shè)計(jì)合理的算法,精確、高效地建立模糊規(guī)則庫(kù)是實(shí)現(xiàn)上述三個(gè)步驟的前提,也是建立模糊預(yù)測(cè)模型的核心內(nèi)容。
Takagi-Sugeno模型(T-S模型)最早由Takagi和Sugeno提出[10],是把輸入變量空間劃分成若干個(gè)模糊的子空間,每個(gè)子空間的特征均可以使用線(xiàn)性或非線(xiàn)性模型描述,混合這些模型即可得到系統(tǒng)的總體模型。
T-S模型通過(guò)IF-THEN語(yǔ)句描述規(guī)則,每條規(guī)則對(duì)應(yīng)一個(gè)子系統(tǒng),規(guī)則前件表示模糊子空間,規(guī)則后件則是輸入的線(xiàn)性或非線(xiàn)性組合。對(duì)于一個(gè)模糊系統(tǒng),令Ri為第i條規(guī)則,則T-S模型可以表述為:
THENy(t)=Aix(t)+Biu(t),i=1,2,…,r
若在模糊推理過(guò)程中分別使用單點(diǎn)模糊化、乘積推理和加權(quán)平均去模糊化,則上述模型可以表示為:
(2)
令:
(3)
則:
(4)
文中使用的基于模糊語(yǔ)言規(guī)則的預(yù)測(cè)模型采用IF-THEN的表述方式來(lái)描述規(guī)則[11]。算法的輸入矩陣用[x1,x2,…,xn]表示,模糊集用{L1,L2,…,Lm}表示,則一條規(guī)則可以表示為:
規(guī)則i:
IF
xp1∈Lq1andxp2∈Lq2… andxpn∈Lqn
THEN
j∈{1,2,…,n}
(5)
其中,σij為標(biāo)準(zhǔn)差;cij為期望值。
這樣,系數(shù)可通過(guò)式6計(jì)算:
(6)
(7)
實(shí)驗(yàn)使用雄性C57/BL6J小鼠,年齡為8~12周,體重20~25 g,小鼠使用標(biāo)準(zhǔn)的實(shí)驗(yàn)室飲食和水飼養(yǎng),飼養(yǎng)環(huán)境溫度為21±2℃,光照為有光條件和無(wú)光條件各12小時(shí)循環(huán)。實(shí)驗(yàn)操作過(guò)程符合長(zhǎng)安大學(xué)生物實(shí)驗(yàn)操作規(guī)程和倫理學(xué)要求。
實(shí)驗(yàn)使用MED64微電極陣列測(cè)量系統(tǒng)(AlphaMedScience,日本)來(lái)進(jìn)行數(shù)據(jù)采集和分析。每個(gè)傳感器包括64個(gè)電位記錄點(diǎn),在平面空間呈8×8方式排列,電極間距300 μm,每個(gè)電極為正方形,邊長(zhǎng)為50 μm。該傳感器可以直接測(cè)量小鼠心臟表面的場(chǎng)電位分布。實(shí)驗(yàn)系統(tǒng)還包括信號(hào)放大器、連接器、控制器、處理數(shù)據(jù)的計(jì)算機(jī)、倒置顯微鏡、灌流槽和蠕動(dòng)泵等。
取出小鼠心臟,使用有鈣臺(tái)式液和Langendorff離體心臟灌流方法[12]進(jìn)行離體灌流。心臟傳導(dǎo)系統(tǒng)的電信號(hào)由心臟竇房結(jié)發(fā)出,竇房結(jié)位于右心房,實(shí)驗(yàn)中將右心房置于下方,直接與傳感器測(cè)量平面接觸,之后進(jìn)行信號(hào)測(cè)量。在整個(gè)測(cè)量過(guò)程中,給樣本持續(xù)提供加入了5%二氧化碳和95%氧氣的有鈣臺(tái)式液,流速為5 ml/min,每次實(shí)驗(yàn)中給樣本加入不同濃度的高糖溶液,濃度間隔為10 mM。在每次實(shí)驗(yàn)中,首先記錄對(duì)照樣的測(cè)量信號(hào),隨后,從第0 min開(kāi)始加入高糖溶液,持續(xù)加入30 min。每種濃度加入后,從第0 min開(kāi)始,每間隔5 min測(cè)量一次,采樣頻率為20 kHz,每次測(cè)量持續(xù)30 s,每次可同時(shí)測(cè)量64個(gè)信號(hào)。隨后,對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行預(yù)處理,提取出每次測(cè)量到電位信號(hào)的最大正振幅、最大負(fù)振幅、頻率、單次信號(hào)持續(xù)時(shí)間等特征值。再將提取出的特征值作為預(yù)測(cè)模型的輸入矩陣,高糖作用時(shí)間作為預(yù)測(cè)模型的輸出,把實(shí)驗(yàn)數(shù)據(jù)分為訓(xùn)練集和驗(yàn)證集[13],訓(xùn)練集用于確定預(yù)測(cè)模型的系數(shù),驗(yàn)證集用于檢驗(yàn)預(yù)測(cè)結(jié)果。
圖1給出了測(cè)量信號(hào)的相關(guān)特征值在不同濃度的高糖溶液作用下,持續(xù)30分鐘后的變化率。其中,MPA為最大正振幅;MNA為最大負(fù)振幅;FRE為頻率;SVD為單次信號(hào)持續(xù)時(shí)間。
圖1 不同濃度高糖溶液作用30 min后測(cè)量信號(hào)特征值的變化率(*P<0.05 vs. 0mM)
從圖中可以明顯看出,當(dāng)高糖濃度高于30 mM時(shí),測(cè)量信號(hào)變化明顯,因此,后續(xù)實(shí)驗(yàn)中選用高糖溶液濃度分別為30 mM,40 mM和50 mM的環(huán)境進(jìn)行預(yù)測(cè)建模與分析。經(jīng)過(guò)數(shù)據(jù)預(yù)處理后測(cè)得有效的實(shí)驗(yàn)數(shù)據(jù)分別為1 264組、1 208組和1 221組,通過(guò)訓(xùn)練集生成基于模糊語(yǔ)言規(guī)則(FLR)的預(yù)測(cè)模型規(guī)則庫(kù),并使用驗(yàn)證集預(yù)測(cè)不同濃度下高糖溶液對(duì)心臟的作用時(shí)間,進(jìn)而檢驗(yàn)預(yù)測(cè)結(jié)果。同時(shí),對(duì)于相同的驗(yàn)證集,使用三種經(jīng)典的預(yù)測(cè)模型進(jìn)行預(yù)測(cè),并與文中使用的方法進(jìn)行比較,三種經(jīng)典的預(yù)測(cè)模型分別為偏最小二乘法(PLS)、最小二乘支持向量機(jī)(LSSVM)和反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)[14-16]。表1~3分別給出了三種高糖濃度下的實(shí)驗(yàn)結(jié)果。
表1 高糖溶液濃度為30 mM環(huán)境下的預(yù)測(cè)結(jié)果
表2 高糖溶液濃度為40 mM環(huán)境下的預(yù)測(cè)結(jié)果
表3 高糖溶液濃度為50 mM環(huán)境下的預(yù)測(cè)結(jié)果
在表1~3中,均方根誤差可以直觀反映出模型的預(yù)測(cè)精度[17],該參數(shù)越小,說(shuō)明預(yù)測(cè)精度越高。相關(guān)系數(shù)平方可以反映出實(shí)驗(yàn)數(shù)據(jù)輸入與輸出的相關(guān)性,該參數(shù)越大,說(shuō)明模型的輸入與輸出相關(guān)程度越高。四種方法各自的預(yù)測(cè)精度在30 mM高糖環(huán)境中均相對(duì)較高,說(shuō)明在此環(huán)境下,實(shí)驗(yàn)測(cè)量信號(hào)特征值變化最明顯。在每種濃度下,文中使用的基于模糊規(guī)則的預(yù)測(cè)模型預(yù)測(cè)精度均為最高,說(shuō)明該預(yù)測(cè)模型最適合用于對(duì)不同濃度急性高血糖作用時(shí)間的判斷。
使用同樣的思路,當(dāng)已知急性高血糖作用時(shí)間時(shí),可以預(yù)測(cè)血糖濃度,預(yù)測(cè)結(jié)果見(jiàn)表4。
表4 已知急性高糖作用時(shí)間時(shí)對(duì)高糖濃度的預(yù)測(cè)結(jié)果
文中使用基于模糊規(guī)則的預(yù)測(cè)模型,通過(guò)分析心臟傳導(dǎo)系統(tǒng)的電生理信息,實(shí)現(xiàn)了對(duì)不同濃度急性高血糖作用時(shí)間的預(yù)測(cè)。與三種經(jīng)典的預(yù)測(cè)模型相比較,基于模糊規(guī)則的預(yù)測(cè)模型最適合用于急性高血糖作用時(shí)間的預(yù)測(cè)。未來(lái)應(yīng)研究如何減少模型的時(shí)間和空間復(fù)雜度,對(duì)模型建立過(guò)程進(jìn)行優(yōu)化,并研究如何提取與急性高血糖有密切關(guān)系的體表生物的電信號(hào),使該方法可以為急性高血糖的臨床醫(yī)學(xué)診斷提供指導(dǎo)與建議。