張意松等
摘要:利用SAS軟件中的Factex過程進(jìn)行析因試驗(yàn)方案的設(shè)計(jì),通過Optex過程對(duì)方案進(jìn)行了優(yōu)化,并通過實(shí)例說明其具體應(yīng)用方法。結(jié)果表明,通過Optex過程可減少70%的試驗(yàn)量,平均預(yù)期標(biāo)準(zhǔn)誤也相對(duì)較小。
關(guān)鍵詞:最優(yōu)化方法;SAS軟件;試驗(yàn)設(shè)計(jì);析因試驗(yàn)
中圖分類號(hào):S-3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2015)17-4309-03
DOI:10.14088/j.cnki.issn0439-8114.2015.17.053
析因試驗(yàn)是一種常用的重要試驗(yàn)設(shè)計(jì)方法,其理論基礎(chǔ)是方差分析理論[1],將兩個(gè)因素或多個(gè)因素進(jìn)行交叉分組,若分別以每個(gè)水平組合進(jìn)行試驗(yàn),稱為析因設(shè)計(jì),也叫因子設(shè)計(jì)。通過析因設(shè)計(jì)試驗(yàn)得到的結(jié)果可以用來檢驗(yàn)各因素內(nèi)部不同水平間有無差異,還可檢驗(yàn)兩個(gè)因素或多個(gè)因素間是否存在交互作用。由于農(nóng)業(yè)研究試驗(yàn)中涉及的影響因素往往較多,從而造成試驗(yàn)量較大[2,3],因此需要對(duì)試驗(yàn)方案做進(jìn)一步優(yōu)化,優(yōu)選出部分試驗(yàn)設(shè)計(jì)點(diǎn)。本研究介紹了SAS軟件QC模塊中的Factex和Optex過程,并通過示例程序說明了如何使用該過程設(shè)計(jì)析因試驗(yàn)和對(duì)試驗(yàn)處理組做優(yōu)化,以減少試驗(yàn)處理組的方法。
1 Factex過程的基本語法
SAS軟件中的QC模塊為全面質(zhì)量管理提供了一系列工具,引導(dǎo)用戶進(jìn)行標(biāo)準(zhǔn)的統(tǒng)計(jì)過程以及試驗(yàn)設(shè)計(jì),其中Plan和Factex過程用來完成各種試驗(yàn)方案的設(shè)計(jì),Optex過程則用來優(yōu)選試驗(yàn)設(shè)計(jì)點(diǎn)[4]。Factex過程的語法結(jié)構(gòu)如下:
PROC Factex < options> ;
Factors factor-names < / option> ;
Size size-specification ;
Model model-specification
Blocks block-specification ;
Examine
Output Out=SAS-data-set
1)PROC Factex語句,有可選項(xiàng),選項(xiàng)包括了變量名長度、搜索時(shí)間設(shè)定以及自動(dòng)選擇,一般使用nocheck選項(xiàng),防止某些特殊情況搜索時(shí)間過長;
2)Factors語句,用于指定試驗(yàn)的因素名,多個(gè)用空格隔開,默認(rèn)的水平是2,選項(xiàng)可指定水平數(shù),通過nlev=n來指定;
3)Size語句,用于指定試驗(yàn)單元數(shù),指定方式為design=ab×cd×L×n,其中b、d為因素個(gè)數(shù),a、c為水平個(gè)數(shù),n為重復(fù)次數(shù)。也可使用DESIGN=Mininum,自動(dòng)確定最少處理數(shù);
4)Model語句,用于指定搜尋設(shè)計(jì)方案的模式,可選項(xiàng)有:ESTIMATE=(effects)
5)Blocks語句,用于指定區(qū)組數(shù)及區(qū)組大小,當(dāng)Factex過程用于析因設(shè)計(jì)時(shí),一般不包括區(qū)組,則程序中無該語句;
6)Examine語句,用于指定輸出特征,有ALIASING、CONFOUNDING、DESIG選項(xiàng),分別輸出設(shè)計(jì)的混淆結(jié)構(gòu)、混淆規(guī)則以及標(biāo)準(zhǔn)編碼設(shè)計(jì)試驗(yàn)點(diǎn);
7)Output語句,用data=數(shù)據(jù)集.文件名,指定輸出文件名和數(shù)據(jù)集,此語句也可用factor-name NVALS=(level1 level2...levelq)或factor-name CVALS=(′level1′′level2′...′levelq′)格式指定在輸出設(shè)計(jì)方案中使用因素的實(shí)際水平值,使試驗(yàn)方案更加直觀。
2 Optex過程的基本語法
Optex過程的語法結(jié)構(gòu)如下所示:
PROC Optex < options > ;
Class class-variables ;
Model effects < / options> ;
Blocks block-specification
Examine
Generate
ID variables ;
Output Out= SAS-data-set
1)PROC Optex語句,有可選項(xiàng),其中data=數(shù)據(jù)集.文件名,指定輸出文件名和數(shù)據(jù)集,seed=s指定產(chǎn)生隨機(jī)數(shù)的種子數(shù)s,可以是小于230的任意正整數(shù),其他選項(xiàng)用于指定設(shè)計(jì)矩陣為奇異矩陣時(shí),一般使用缺省設(shè)置;
2)Class語句,用于指定分類變量,即試驗(yàn)設(shè)計(jì)的因素;
3)Model語句,用于指定優(yōu)化的模型,通過命令@sign指定可忽略的交互作用,通過條算符號(hào)“|”指定展開效應(yīng)使用的因素;
4)Blocks語句,用于存在協(xié)變量或者協(xié)方差時(shí)尋找符合D最優(yōu)準(zhǔn)則的設(shè)計(jì)方案;
5)Examine語句,用于指定輸出特征,同F(xiàn)actex過程的EXAMINE;
6)Generate語句,用于指定查找最優(yōu)設(shè)計(jì)的方式,可選項(xiàng)主要有優(yōu)化準(zhǔn)則、搜索次數(shù)、搜索方法等。準(zhǔn)則包括D、A、U、S等幾種最優(yōu)化準(zhǔn)則。系統(tǒng)默認(rèn)的是method=exchange,如果想找到更可靠的設(shè)計(jì)可以用method=m_fedorov;
7)ID語句,用于指定不參與建模的變量;
8)Output語句,用data=數(shù)據(jù)集.文件名,指定輸出文件名和數(shù)據(jù)集。
3 實(shí)例應(yīng)用
某縣農(nóng)委農(nóng)業(yè)生態(tài)環(huán)保檢驗(yàn)監(jiān)測(cè)站建立榨菜測(cè)土配方施肥示范,在肥料田間試驗(yàn)中,需要建立3因素4水平試驗(yàn)方案,3因素是指氮(x1)、磷(x2)、鉀(x3)3個(gè)研究因素;4水平是指氮、磷、鉀肥料用量的4個(gè)水平,分別用1、2、3、4水平代替,1水平為不施用任何肥料,3水平為當(dāng)?shù)毓┰囎魑锓柿献罴延昧浚?水平為3水平的1/2用量,4水平為3水平用量的1.5倍,析因設(shè)計(jì)方案見表1。全析因設(shè)計(jì)方案程序如下:
PROC Factex;
Factors x1 x2 x3/ nlev=4;
Size design=64;
Output out=aa x1 nvals=(1 2 3 4)
x2 nvals=(1 2 3 4)
x3 nvals=(1 2 3 4);
Run;
Factors x4 / nlev=3;
Size design=3;
Output out=bb pointrep=aa x4 nvals=(1 2 3);
Run;
PROC Print; Run; Quit;
由表1可以看到,按照析因設(shè)計(jì)的原則,有192個(gè)處理組,設(shè)計(jì)方案雖然能夠?qū)崿F(xiàn),但是由于試驗(yàn)具體實(shí)施需要一定的人力、物力和財(cái)力,因此需要在保證數(shù)據(jù)有效分析的基礎(chǔ)上對(duì)試驗(yàn)方案做優(yōu)化,選取設(shè)計(jì)空間中更少的點(diǎn)滿足分析。下面是Optex過程的應(yīng)用舉例,將Optex過程置于Factex過程之后,對(duì)Factex過程的設(shè)計(jì)結(jié)果做優(yōu)化:
PROC Factex;
PROC Optex data=bb seed=1234567;
Class x1 x2 x3 x4;
Model x1|x2|x3|x4 @2;
Generate n=57 keep=10 iter=50 method=m_fedorov ;
Output Out=optdesign;
Run;
PROC Print; Run; Quit;
由表2最優(yōu)設(shè)計(jì)評(píng)價(jià)表可知,按照D準(zhǔn)則評(píng)價(jià)1號(hào)方案是最佳方案,且平均預(yù)期標(biāo)準(zhǔn)誤也相對(duì)較小。析因設(shè)計(jì)方案經(jīng)過優(yōu)化以后處理數(shù)為57個(gè),較之原來的192個(gè)處理組減少了70%的處理組(表3)。
4 小結(jié)與討論
對(duì)SAS軟件的Factex過程和Optex過程進(jìn)行了詳細(xì)地介紹,可以根據(jù)試驗(yàn)需求設(shè)置不同的參數(shù),實(shí)現(xiàn)所需的析因設(shè)計(jì)方案。特別是使用Optex過程對(duì)析因設(shè)計(jì)點(diǎn)進(jìn)行優(yōu)化,在保證分析效果的情況下可得到試驗(yàn)量相對(duì)較小的設(shè)計(jì)方案,解決了農(nóng)業(yè)試驗(yàn)中試驗(yàn)處理組過多不容易實(shí)施所致的數(shù)據(jù)缺失、經(jīng)費(fèi)不足等問題。
參考文獻(xiàn):
[1] 周振泉,劉順玉.田間試驗(yàn)原理及其特點(diǎn)[J].黑龍江水利科技,2011,39(3):121-122.
[2] 張建方.關(guān)于試驗(yàn)設(shè)計(jì)的效率及有關(guān)問題[J].數(shù)理統(tǒng)計(jì)與管理,2007,26(5):792-801.
[3] 王懷勝.田間試驗(yàn)操作不當(dāng)?shù)脑蚺c技術(shù)要點(diǎn)[J].現(xiàn)代農(nóng)業(yè)科技,2007(23):161-165.
[4] 汪海波,羅 莉,吳 為,等.SAS統(tǒng)計(jì)分析從入門到精通[M].北京:人民郵電出版社,2013.endprint