龔 政,朱小淵,張崇岐
(廣州大學(xué) 經(jīng)濟(jì)與統(tǒng)計(jì)學(xué)院,廣東廣州 510006)
隨著傳統(tǒng)醫(yī)學(xué)系統(tǒng)化與現(xiàn)代化進(jìn)程的推進(jìn),混料試驗(yàn)設(shè)計(jì)在臨床治療中的應(yīng)用越發(fā)普及.中醫(yī)理論來自于經(jīng)驗(yàn)醫(yī)學(xué),在進(jìn)行中藥試驗(yàn)研究時(shí),為減少受試人數(shù)是試驗(yàn)設(shè)計(jì)的主要研究目標(biāo),混料最優(yōu)設(shè)計(jì)能保證試驗(yàn)結(jié)果的同時(shí)顯著達(dá)到減小樣本量.近年來利用混料最優(yōu)設(shè)計(jì)的中醫(yī)研究越發(fā)普遍,部分研究者利用混料最優(yōu)設(shè)計(jì)優(yōu)化處方,例如多糖速溶片的處方[1]的優(yōu)化.傳統(tǒng)醫(yī)學(xué)需要進(jìn)步,應(yīng)當(dāng)接受循證醫(yī)學(xué)的檢驗(yàn),合理利用混料最優(yōu)設(shè)計(jì)在內(nèi)的現(xiàn)代統(tǒng)計(jì)手段來檢驗(yàn)其有效性.除此之外,混料試驗(yàn)設(shè)計(jì)在工業(yè)生產(chǎn)以及現(xiàn)代生物技術(shù)中,也有著大規(guī)模的應(yīng)用.
混料試驗(yàn)設(shè)計(jì)主要研究各種混料成份與試驗(yàn)指標(biāo)之間的關(guān)系,試驗(yàn)指標(biāo)只與每種成份的比例有關(guān),而與總量無關(guān).在常用的最優(yōu)準(zhǔn)則中,D-最優(yōu)設(shè)計(jì)準(zhǔn)則以最大化信息矩陣行列式為目標(biāo),A-最優(yōu)準(zhǔn)則是需要滿足最小化試驗(yàn)域上設(shè)計(jì)的最大預(yù)測方差,而I-最優(yōu)準(zhǔn)則需要滿足試驗(yàn)域上設(shè)計(jì)的最小化平均預(yù)測方差,各類最優(yōu)準(zhǔn)則均有不同的優(yōu)點(diǎn),人們基于實(shí)際的需求,選擇最適合的模型與最優(yōu)準(zhǔn)則[2].本文主要研究滿足D-最優(yōu)準(zhǔn)則時(shí)的最優(yōu)設(shè)計(jì).
在實(shí)際試驗(yàn)中,先有具體問題,再有模型,從規(guī)范多項(xiàng)式到中心多項(xiàng)式再到特殊模型,由于試驗(yàn)點(diǎn)隨著混料成分的增加而變多,因此需要適當(dāng)簡化模型,使得模型參數(shù)個(gè)數(shù)正好等于試驗(yàn)點(diǎn)數(shù),以達(dá)到飽和設(shè)計(jì).現(xiàn)今關(guān)于一般混料模型的最優(yōu)設(shè)計(jì)的研究已經(jīng)日趨完善,人們開始研究更多復(fù)雜模型的最優(yōu)設(shè)計(jì)[3].
記混料模型中的q個(gè)分量為xi,i=1,2,...,q,其試驗(yàn)域?yàn)?/p>
它定義了q分量混料試驗(yàn)所在的q-1維單純形試驗(yàn)區(qū)域,并對(duì)擬合的模型產(chǎn)生重大的影響.
在混料模型中,變量是指各成份占混料總量的比例,一般混料模型可表示為
其中y(x)是點(diǎn)x響應(yīng)的觀察值,f(x)=(f1(x),f2(x),...,fp(x))T是給定的關(guān)于x=(x1,x2,……,xq)的點(diǎn)函數(shù)向量,ε是隨機(jī)誤差項(xiàng),服從正態(tài)分布N(0,σ2),而β=(β1,β2,……,βp)T是待估參數(shù)向量,模型(2)常用η(x)=fT(x)β,其中η(x)表示響應(yīng)的均值.
在混料試驗(yàn)中,影響試驗(yàn)指標(biāo)的變量除了混合物的比例外,還存在與成份的組成無關(guān)的變量,該變量統(tǒng)稱為過程變量,例如中藥藥材研磨的精細(xì)程度,藥品煎熬時(shí)的火候溫度,以及病人服用藥物的間隔時(shí)間等.一般的含過程變量混料模型可表示為η(x)=fT(x)β+αZ,這里的Z是過程變量,α為過程變量的待估參數(shù).
關(guān)于混料模型的區(qū)組研究現(xiàn)如今的成果已有許多,為了保證各區(qū)組內(nèi)混合物不受區(qū)組效應(yīng)的影響,Nigam[4]首先提出需以混合物成份為自變量,從研究重心點(diǎn)測度轉(zhuǎn)向研究等測度的試驗(yàn)點(diǎn)的位置,Saxena[5]以此提出了對(duì)稱單純形區(qū)組設(shè)計(jì),John[6]對(duì)Nigam提出的混料正交條件進(jìn)行了簡化并給出了含過程變量的二階規(guī)范多項(xiàng)式模型的擬合,但是這樣設(shè)計(jì)雖然規(guī)避了區(qū)組效應(yīng)對(duì)試驗(yàn)的影響,卻使得試驗(yàn)點(diǎn)變多.
因此Czitrom考慮以正交表來構(gòu)建混料正交設(shè)計(jì),對(duì)于含過程變量的3分量二階規(guī)范多項(xiàng)式模型,Czitrom[7]給出了正交區(qū)組設(shè)計(jì)并求出了滿足D-最優(yōu)準(zhǔn)則時(shí)的設(shè)計(jì)點(diǎn),隨后一些學(xué)者完善并拓展了正交區(qū)組設(shè)計(jì)的理論基礎(chǔ),成果突出的有Murthy[8]考慮了在混料限制下的區(qū)組設(shè)計(jì),Lewis[9]將規(guī)范多項(xiàng)式模型的正交區(qū)組設(shè)計(jì)推廣到了q分量的情形,Prescott[10]則是提出了各區(qū)組中設(shè)計(jì)點(diǎn)的利益區(qū)域應(yīng)是正規(guī)單純形在其內(nèi)部的投影,解決了方差函數(shù)驗(yàn)證的難題,現(xiàn)今已有研究者為提高模型參數(shù)估計(jì)精度,將研究擴(kuò)展到了缺失項(xiàng)模型的I-最優(yōu)設(shè)計(jì)[11].
對(duì)于混料中單成份效應(yīng)強(qiáng)于交互效應(yīng)的情況,Draper等[12]基于向量與矩陣的Kronecker代數(shù),提出了K模型,它是一類齊次模型,它是用混料分量的基本約束條件,將一次項(xiàng)轉(zhuǎn)化為二次項(xiàng),統(tǒng)一去研究,無需分為線性和二次項(xiàng)分別考慮.
關(guān)于K模型的研究十分廣泛,Manisha和Pal[13-14]將K模型轉(zhuǎn)化為矩陣形式研究,李俊鵬等[15]研究了混料K模型的R-最優(yōu)設(shè)計(jì).
其中γi與γij是待估參數(shù),xi(i=1,2,……,q)為混料成份的比例.
含過程變量Z的q分量K混料模型,表述如下
本文對(duì)含過程變量的K模型展開研究,并求出其q分量下滿足D-最優(yōu)準(zhǔn)則的正交區(qū)組設(shè)計(jì).
混料模型的試驗(yàn)設(shè)計(jì)ξ是試驗(yàn)域(1)上的一個(gè)概率分布
q分量混料模型的試驗(yàn)區(qū)域是一個(gè)q維空間上的q-1維正規(guī)單純形,xi(i=1,2,……,n) 為q-1維正規(guī)單純形上的任一試驗(yàn)點(diǎn),ωi表示各試驗(yàn)點(diǎn)的測度,且ωi滿足.
得到設(shè)計(jì)后,可以得到設(shè)計(jì)矩陣
由此可得到包含一個(gè)設(shè)計(jì)的所有信息的信息矩陣
其中Λ為測度矩陣.
同時(shí)可以得到設(shè)計(jì)矩陣對(duì)應(yīng)的方差函數(shù)
在試驗(yàn)設(shè)計(jì)中,經(jīng)常會(huì)遇見一個(gè)可能對(duì)響應(yīng)產(chǎn)生影響的因子,對(duì)這個(gè)因子的效應(yīng)并不感興趣,將之稱為討厭因子,它的特性為未知的和不可控,具有隨機(jī)性.可以通過區(qū)組化設(shè)計(jì)來系統(tǒng)地消除它在處理統(tǒng)計(jì)比較中的效應(yīng),如果有a個(gè)待比較的處理和b個(gè)區(qū)組,它的區(qū)組設(shè)計(jì)如下.
表1 a個(gè)處理和b 個(gè)區(qū)組的設(shè)計(jì)
它的效應(yīng)模型為
其中yij是在第j個(gè)區(qū)組中第i個(gè)處理的觀測數(shù)據(jù),μ是總均值,λi是第i個(gè)處理的效應(yīng),αj是第j個(gè)區(qū)組的效應(yīng),εij是通常的隨機(jī)誤差項(xiàng).
為了系統(tǒng)性控制過程變量,可以使用正交拉丁方設(shè)計(jì)讓區(qū)組保持正交.由此,在處理含過程變量的混料模型時(shí),可將過程變量的效應(yīng)看作區(qū)組效應(yīng),將每個(gè)實(shí)驗(yàn)單元分為若干正交區(qū)組.
當(dāng)q為素?cái)?shù)或者是素?cái)?shù)的方冪時(shí),必然存在q-1個(gè)正交的拉丁方[16].從常用的3分量混料模型開始討論,K模型的3分量形式為
此時(shí)存在2個(gè)正交區(qū)組.若在混料試驗(yàn)過程中以zi(i=1,2,……,n)來表示n個(gè)過程變量,每個(gè)過程變量均為兩水平,其中的高水平取值為+1,低水平取值為-1,將之分為兩個(gè)區(qū)組,區(qū)組1滿足條件z1=z2=……·=zn=-1,區(qū)組2滿足z1=z2=……·=zn=+1[17].為使區(qū)組間具有正交性,將混合物的組成成分作為自變量進(jìn)行處理.
由此可知K模型(4)在3分量情況下,作出如下二正交區(qū)組設(shè)計(jì).
其設(shè)計(jì)矩陣為
其信息矩陣表示為
其中I3是3階單位陣,J3是各元素皆為1的3階方陣,并且
當(dāng)滿足D-最優(yōu)準(zhǔn)則時(shí),在滿足正交性的各區(qū)組內(nèi),依舊保留了設(shè)計(jì)點(diǎn)在邊界處與中心處的特性,q分量K模型滿足D-最優(yōu)準(zhǔn)則的設(shè)計(jì)點(diǎn)必然在中心點(diǎn)與邊界處,此時(shí)信息矩陣行列式為
其最大值取在邊界處,令c=0,b=1-a.經(jīng)計(jì)算,滿足D-最優(yōu)準(zhǔn)則時(shí)a=0.1685或0.8315,如圖1所示,可發(fā)現(xiàn)為雙峰圖形,每條邊界處各有兩個(gè)頂點(diǎn),共計(jì)6個(gè)邊界頂點(diǎn),再加上2個(gè)中心點(diǎn),共同構(gòu)成了試驗(yàn)的設(shè)計(jì)點(diǎn).
圖1 信息矩陣行列式最大值
含過程變量的3分量K模型的D-最優(yōu)正交區(qū)組設(shè)計(jì)如下所示
為了驗(yàn)證其D-最優(yōu)設(shè)計(jì),需求解設(shè)計(jì)點(diǎn)以及各類重心點(diǎn)的方差函數(shù)值,三分量K模型方差函數(shù)公式為
引理2.1[18]設(shè)f(x)為列向量,G為正定陣,則二次型fT(x)Gf(x)在正規(guī)單純形利益區(qū)域上的最大值必在其各類重心處到達(dá).
各區(qū)組的利益區(qū)域?yàn)檎?guī)單純形在其內(nèi)部的投影,因此計(jì)算各重心點(diǎn),即
各重心處方差函數(shù)為d(x1,ξ)=1,d(x2,ξ)=0.8864,d(x3,ξ)=0.5.
由上所述,可以看到所求區(qū)域內(nèi)方差函數(shù)值小于等于1,滿足D-最優(yōu)準(zhǔn)則.同時(shí)可以觀察到方差最大值在頂點(diǎn)取得,得出定理2.1.
定理2.1含過程變量的3分量K混料模型,其滿足D-最優(yōu)準(zhǔn)則的正交區(qū)組設(shè)計(jì)為
其中P3表示單純形上滿足D-最優(yōu)準(zhǔn)則的單純形邊界上的6個(gè)點(diǎn).
當(dāng)q=3時(shí),混料模型在2維單純形上,因此只會(huì)取到邊界線上的點(diǎn),當(dāng)q ≥4 時(shí),其所在的單純形區(qū)域是一個(gè)高維的凸多面體,而正交區(qū)組的利益區(qū)域?yàn)閱渭冃蝺?nèi)部的一個(gè)投影,其頂點(diǎn)依舊取在邊界線上.
推廣到分量q為素?cái)?shù)或素?cái)?shù)冪方時(shí),共有q(q-1)個(gè)排列,可將試驗(yàn)分為q-1個(gè)正交區(qū)組,含過程變量的q分量K模型的信息矩陣為
其中Iq是q階單位陣,Jq是各元素皆為1的q階方陣,并且
根據(jù)D-最優(yōu)準(zhǔn)則,要求滿足max|XTX|,在此令x1=a,x2=1-a,xi≥3=0,此時(shí)(11)為
其信息矩陣行列式經(jīng)計(jì)算為
由于正交區(qū)組設(shè)計(jì)依賴于正交表的建立,需確定q分量,求(13)極大值來解a.對(duì)于q分量情況下的一個(gè)D-最優(yōu)設(shè)計(jì)點(diǎn)為(0,0,……,a,0,……,1-a,……,0,0).由此可以得出任意q為確定值時(shí)的設(shè)計(jì)點(diǎn)與正交區(qū)組.根據(jù)上述分析證明,可得出定理2.2.
定理2.2含過程變量的q分量二階K模型,其滿足D-最優(yōu)正交區(qū)組設(shè)計(jì)共有q2-q個(gè)邊界頂點(diǎn),每個(gè)區(qū)組中的設(shè)計(jì)點(diǎn)由q個(gè)邊界點(diǎn)與一個(gè)中心點(diǎn)構(gòu)成,q分量時(shí)滿足D-最優(yōu)準(zhǔn)則的正交區(qū)組設(shè)計(jì)為
其中Pq為滿足D-最優(yōu)準(zhǔn)則的單純形邊界上的點(diǎn).
本文對(duì)K模型構(gòu)建正交區(qū)組,并論證q種混合物時(shí)滿足D-最優(yōu)準(zhǔn)則的正交區(qū)組設(shè)計(jì).D-最優(yōu)準(zhǔn)則是應(yīng)用最廣泛的最優(yōu)準(zhǔn)則,且可以通過KWT等價(jià)定理來驗(yàn)證本設(shè)計(jì)同樣是G-最優(yōu)的,相較于規(guī)范多項(xiàng)式模型的擬合,精度有了進(jìn)一步提升.除此之外,還可以用此方法研究多項(xiàng)式模型,倒數(shù)模型以及齊次模型等滿足混料約束條件的模型.
混料最優(yōu)設(shè)計(jì)在中醫(yī)領(lǐng)域的合理應(yīng)用,解決了以往試驗(yàn)設(shè)計(jì)中樣本量需求過大的不足,研究者可以根據(jù)需求來選擇各類最優(yōu)準(zhǔn)則,以提高模型參數(shù)估計(jì)的精度,但在中藥制造中,由于工藝精度,病人個(gè)體差異以及輔藥的存在,一般混料模型在擬合時(shí)存在一定的誤差,每一次建模時(shí)都需謹(jǐn)慎對(duì)待.
隨著混料試驗(yàn)設(shè)計(jì)的推廣,更多的混料模型也會(huì)在中醫(yī)領(lǐng)域有著更多的應(yīng)用,并且針對(duì)更復(fù)雜的臨床試驗(yàn),研究領(lǐng)域?qū)?huì)逐步轉(zhuǎn)移到含特殊項(xiàng)的混料模型中,研究人員在進(jìn)行混料試驗(yàn)最優(yōu)設(shè)計(jì)時(shí)也會(huì)為提高參數(shù)估計(jì)效率,而從D-最優(yōu)準(zhǔn)則的理論推導(dǎo)發(fā)展推廣到E-最優(yōu)準(zhǔn)則與I-最優(yōu)準(zhǔn)則等滿足研究者需求的方向,可以預(yù)見混料模型的正交區(qū)組設(shè)計(jì)會(huì)在將來不斷推陳出新,有著長足的發(fā)展空間.