• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      變量變換回歸分析(Ⅳ)偏好評(píng)分資料的結(jié)合分析法
      ——

      2019-08-13 01:44:52胡良平
      四川精神衛(wèi)生 2019年3期
      關(guān)鍵詞:效用分值顧客

      胡良平

      (1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會(huì),北京 100029

      1 基本概念

      1.1 偏好評(píng)分

      在心理、生理和精神衛(wèi)生等學(xué)科領(lǐng)域中,研究者常使用各種量表對(duì)患者進(jìn)行評(píng)定[1-4],此類評(píng)分一般被視為“計(jì)量資料”。然而,在很多其他領(lǐng)域,研究者?;谧约旱闹R(shí)、經(jīng)驗(yàn)、感受和偏好,來給被評(píng)價(jià)對(duì)象(以下簡(jiǎn)稱為“被評(píng)者”)評(píng)分,此即“偏好評(píng)分”。這里的“被評(píng)者”可以是人(如某病患者、參加比賽的歌手、前來應(yīng)聘的求職者、課題或項(xiàng)目的申請(qǐng)者等)、物品或商品(如電腦、汽車、住宅或服裝等)等。評(píng)價(jià)者進(jìn)行評(píng)分時(shí),通常依據(jù)被評(píng)者在若干方面或?qū)傩曰蛞蛩氐谋憩F(xiàn)或真實(shí)情況,并結(jié)合自己的“偏好”,給出一個(gè)自己認(rèn)為最合理的分值。由此可知,“偏好評(píng)分”不像試驗(yàn)結(jié)果那樣客觀、精準(zhǔn),而在一定程度上帶有主觀性。這就不難理解,為什么同一位患者的影像學(xué)光片由多位放射科醫(yī)生來閱讀,通常會(huì)給出不同的評(píng)分結(jié)果。

      1.2 因素及水平

      如何區(qū)分“被評(píng)者A”與“被評(píng)者B”?通常需要根據(jù)具體情況,從幾個(gè)主要方面或角度來度量或認(rèn)定被評(píng)者,用統(tǒng)計(jì)學(xué)的術(shù)語來描述,就是擬考慮的“因素”。以一位患者的CT光片為例,假定要考慮的主要因素有A、B、C、D,每個(gè)因素又可分為好、中、差3個(gè)檔次。于是,這4個(gè)因素都具有3個(gè)水平。請(qǐng)一位臨床醫(yī)生基于前述4個(gè)因素來給100例某病患者的CT光片進(jìn)行病情評(píng)分,病情由輕到重依次評(píng)為1、2、……、10分。這樣就可以獲得對(duì)這100例患者的“偏好評(píng)分”。這里的“偏好”主要反映了該臨床醫(yī)生在閱片方面的經(jīng)驗(yàn)和技能,顯然不可能像定量檢測(cè)樣品中某種物質(zhì)含量那樣精準(zhǔn)。

      1.3 偏好評(píng)分的性質(zhì)

      通常,偏好評(píng)分有兩種具體形式,其一,僅用很少的幾個(gè)分值來描述所有的“被評(píng)者”,如用“1、2、3、4、5”5個(gè)分值來描述100例某病患者;其二,使用1~ 81共81個(gè)不相同的分值來描述81例某病患者。前一種“偏好評(píng)分”只能被視為“有序資料”;而后一種“偏好評(píng)分”可以被視為“有序資料”,也可被近似視為“計(jì)量資料”。

      1.4 偏好評(píng)分資料的數(shù)據(jù)結(jié)構(gòu)

      在一項(xiàng)關(guān)于輪胎的消費(fèi)情況的調(diào)查中,假定輪胎主要屬性(或因素)有4個(gè):品牌、價(jià)格、使用壽命、有無公路意外保險(xiǎn)計(jì)劃,各屬性包含不同水平[5]。見表1。

      表1 輪胎的屬性及其水平

      若將各屬性的所有水平進(jìn)行組合,一共有3×3×3×2=54種可能的組合形式(相當(dāng)于有54種不同的輪胎或54種不同的試驗(yàn)條件;在多因素試驗(yàn)設(shè)計(jì)中,每種“組合”被稱為一個(gè)“試驗(yàn)點(diǎn)”)。最好的做法是采用析因設(shè)計(jì),即在54個(gè)試驗(yàn)點(diǎn)的每個(gè)試驗(yàn)點(diǎn)上至少做2次獨(dú)立重復(fù)試驗(yàn)。那么總試驗(yàn)次數(shù)至少需要108次。為了節(jié)約成本,研究者擬采用正交設(shè)計(jì)。利用SAS軟件產(chǎn)生一個(gè)組合數(shù)為18的正交設(shè)計(jì)表。見表2。其中最后兩列為兩名顧客(即在各試驗(yàn)點(diǎn)上均做了2次獨(dú)立重復(fù)試驗(yàn))給出的偏好評(píng)分,用1~18來表示其偏好(1表示最愿意購(gòu)買,18表示最不愿意購(gòu)買)。

      表2 具有18種水平組合的混合水平正交表

      由表2可知,偏好評(píng)分資料的數(shù)據(jù)結(jié)構(gòu)由兩種性質(zhì)的變量及其取值構(gòu)成:定性的影響因素(表2中第2~5列)和偏好評(píng)分(表2中最后2列)。就整體而言,它是一個(gè)多因素析因設(shè)計(jì)或正交設(shè)計(jì)(或均勻設(shè)計(jì))下所收集的一元或多元有序資料。

      由于未找到合適的臨床實(shí)例,故借用上面關(guān)于“商品”的例子。若臨床工作者能在臨床工作中發(fā)現(xiàn)與此實(shí)例類似的“臨床問題”,可以采用本文介紹的“結(jié)合分析法”進(jìn)行數(shù)據(jù)處理。

      1.5 偏好評(píng)分資料的分析任務(wù)及分析方法

      針對(duì)每一位顧客(即評(píng)價(jià)者)給出的“評(píng)分”,需要回答以下三個(gè)問題:其一,4個(gè)因素的“重要性(或貢獻(xiàn)率)”分別是多少(重要性之和為100.00%)?其二,每個(gè)因素各水平的“分值效用”(即每個(gè)水平的“重要性”,確切的含義為“水平效用”)是多少?其三,該顧客最偏愛或喜歡的輪胎是哪一款(即理想試驗(yàn)點(diǎn))?為實(shí)現(xiàn)前述的統(tǒng)計(jì)分析任務(wù),需要選擇“結(jié)合分析法”。

      2 結(jié)合分析簡(jiǎn)介[6-8]

      2.1 何為結(jié)合分析

      結(jié)合分析也叫聯(lián)合分析,它用于確定哪些產(chǎn)品(或服務(wù))的屬性(或因素)對(duì)于消費(fèi)者(或評(píng)價(jià)者)來說是最重要的、哪些是中等重要的、哪些是次要的;還可用于估計(jì)每種屬性(或因素)的每個(gè)水平的“效用(即對(duì)偏好評(píng)分的作用)”大小。

      2.2 結(jié)合分析的基本思想

      結(jié)合分析的基本思想是:將偏好評(píng)分近似視為計(jì)量因變量,將每個(gè)屬性的每個(gè)水平視為一個(gè)“二值自變量”。假定每個(gè)屬性的所有水平對(duì)因變量的影響是可以疊加的,進(jìn)一步假設(shè)每個(gè)屬性所有水平效應(yīng)之和為0(這在統(tǒng)計(jì)學(xué)上被稱為“約束條件”,以保證計(jì)算出的“效用值”有正有負(fù),代表不同的作用方向)。在前述假設(shè)成立的條件下,構(gòu)建多重線性回歸模型,并基于最小平方法原理求解回歸模型中的參數(shù)估計(jì)值。

      2.3 結(jié)合分析的基本模型

      結(jié)合分析中通常采用普通最小平方法估計(jì)回歸模型中的參數(shù),因素的每個(gè)水平被視為一個(gè)自變量,并且,每個(gè)自變量只有0或1兩個(gè)可能的取值。模型可用式(1)表示。

      Y=a+∑vx

      (1)

      在式(1)中,Y表示所有屬性(或因素)的一種水平組合條件下被評(píng)價(jià)對(duì)象的總效用,也被稱為“輪廓(即一個(gè)試驗(yàn)點(diǎn))”的總效用。a為截距,v為各水平的分值效用(相當(dāng)于回歸系數(shù)),x為取值為0或1的啞變量,當(dāng)它代表的某屬性的一個(gè)水平出現(xiàn)時(shí),x=1;否則x=0。

      若模型中屬性水平的分值效用的差值(最大效用與最小效用之差)越大,則該屬性的相對(duì)重要性越高。一般用百分比來描述各屬性的重要性。見式(2)。

      (2)

      在式(2)中,m表示屬性個(gè)數(shù),Wj表示第j個(gè)屬性的相對(duì)重要性,max(vj)和min(vj)分別表示第j個(gè)屬性各水平中最大和最小的分值效用。

      3 實(shí)例的SAS實(shí)現(xiàn)

      3.1 對(duì)實(shí)例的進(jìn)一步解說

      在前面的“實(shí)例”中,表1列出了擬考察的“屬性(或因素)及其水平”,表2是將這個(gè)實(shí)際問題付諸研究所給出的一種“試驗(yàn)設(shè)計(jì)”(第2~5列)及其兩位顧客給出的“偏好評(píng)分”(最后兩列)。表2中的每一行代表4個(gè)因素各取一個(gè)水平所對(duì)應(yīng)的一種組合(也叫試驗(yàn)點(diǎn)),也就是一款特定的產(chǎn)品(在本例中為一種輪胎)。統(tǒng)計(jì)分析的目的是希望依據(jù)某位顧客的“偏好評(píng)分”,回答前述“偏好評(píng)分資料的分析任務(wù)”中提及的問題。

      3.2 分析實(shí)例所需要的SAS程序

      options validvarname=any;

      proc format;

      value brandf 1=' goodstone' 2=' pirogi' 3=' machismo' ;

      value pricef 1=' $69.99' 2=' $74.99' 3=' $79.99' ;

      value lifef 1=' 50,000' 2=' 60,000' 3=' 70,000' ;

      value hazardf 1=' yes' 2=' no' ;

      run;

      data tires;

      input brand price life hazard rank1 rank2 @@;

      format brand brandf9. price pricef9.

      life lifef6. hazard hazardf3.;cards;

      ;

      run;

      proc transreg utilities cprefix=0 lprefix=0;

      ods select convergencestatus fitstatistics utilities;

      model identity(rank1 rank2/reflect)=

      class(brand price life hazard/zero=sum);

      output out=out replace predicted;

      run;

      proc print label data=out;

      var rank1 rank2 prank1prank2 brand price life hazard;

      run;

      【說明】“model語句”中的選項(xiàng)“reflect”的含義:代表各水平取正的“分值效用”時(shí),對(duì)應(yīng)著最好的“偏好評(píng)分”。這樣可以免去使用者在下專業(yè)結(jié)論時(shí),需要顧及結(jié)果變量究竟屬于高優(yōu)指標(biāo)還是低優(yōu)指標(biāo)。

      若忽略了選項(xiàng)“reflect”,當(dāng)結(jié)果變量為高優(yōu)指標(biāo)時(shí),需要選取絕對(duì)值最大的正效用值對(duì)應(yīng)的水平組成“理想試驗(yàn)點(diǎn)”;而當(dāng)結(jié)果變量為低優(yōu)指標(biāo)時(shí),需要選取絕對(duì)值最大的負(fù)效用值對(duì)應(yīng)的水平組成“理想試驗(yàn)點(diǎn)”。

      3.3 主要輸出結(jié)果及解釋

      因篇幅所限,下面僅給出第一位顧客偏好評(píng)分對(duì)應(yīng)的結(jié)合分析結(jié)果:

      RootMSE1.72562R-Square0.9385DependentMean9.50000AdjR-Sq0.8955CoeffVar18.16446

      以上結(jié)果表明:模型對(duì)資料的擬合優(yōu)度較高,均方根誤差=1.72562、R2=0.9385。與“分值效用(Utility)”和“重要性(Importance)”有關(guān)的計(jì)算結(jié)果見圖1。

      圖1 與表2中顧客A的偏好評(píng)分對(duì)應(yīng)的計(jì)算結(jié)果

      由圖1中第4列計(jì)算結(jié)果可知:輪胎的4個(gè)屬性的相對(duì)重要性為:價(jià)格>使用壽命>品牌>是否有公路意外保險(xiǎn)計(jì)劃。價(jià)格方面,越便宜越受顧客偏好;使用壽命方面,越長(zhǎng)越受顧客偏好;品牌方面,顧客最偏好的是pirogi;是否有公路意外保險(xiǎn)計(jì)劃方面,顧客更偏好有保險(xiǎn)計(jì)劃的輪胎。最受顧客歡迎的輪胎屬性組合為“品牌pirogi +使用壽命70 000km+價(jià)格$69.99+有公路意外保險(xiǎn)計(jì)劃”,它們都是各屬性中“分值效用”取最大正值的“水平”。

      4 討論與小結(jié)

      4.1 討論

      4.1.1 式(1)的解讀

      結(jié)合分析的“回歸模型”式(1)的真實(shí)含義,就是把“偏好評(píng)分值”視為“計(jì)量因變量”,而把所有的“屬性(或因素)”視為“定性自變量”,但需要對(duì)每個(gè)屬性變量產(chǎn)生啞變量。值得注意的是:在對(duì)每個(gè)屬性變量產(chǎn)生啞變量時(shí),不采取通常的方法(以其中一個(gè)水平為基準(zhǔn)),而是將其每個(gè)水平產(chǎn)生一個(gè)“0與1”的二值變量,但必須限制該屬性的所有水平對(duì)應(yīng)的啞變量之和等于0。例如:對(duì)于“品牌”這個(gè)屬性變量而言,由表2的第2列可知,第1~6行都是第1種品牌“GOODSTONE”,若用TB1代表它,則TB1=1,其后的12行都不是該品牌,故TB1=0;同理,可用TB2代表第2種品牌,則在第7~12行令TB2=1,其他行上令TB2=0;可用TB3代表第3種品牌,則在第13~18行令TB3=1,其他行上令TB3=0。于是,就將一個(gè)具有3水平的“品牌”轉(zhuǎn)換成TB1、TB2、TB3三個(gè)“二值變量”了。

      類似的,利用以上方法可將“價(jià)格”轉(zhuǎn)換成TP1、TP2、TP3三個(gè)“二值變量”,將“使用壽命”轉(zhuǎn)換成TL1、TL2、TL3三個(gè)“二值變量”,將“有無公路意外保險(xiǎn)計(jì)劃”轉(zhuǎn)換成TH1、TH2兩個(gè)“二值變量”。于是,可用擬合多重線性回歸模型的REG過程來實(shí)現(xiàn)模型(1)的擬合。

      4.1.2 用REG過程擬合式(1)

      /*結(jié)合模型的構(gòu)建與參數(shù)估計(jì)*/

      data abc;

      input a b tb1 tb2 tb3 tp1 tp2 tp3

      tl1 tl2 tl3 th1 th2;

      cards;

      161510010001010171810010000101541000101000199100010010012210000110010751000010011012110101001000118170101000010111120100101001014160100100011067010001010103301000101001131400110010010151300110001010480010100100110600101000110110010011000181000100100101

      ;

      run;

      proc reg data=abc;

      model a=tb1-tb3 tp1-tp3 tl1-tl3 th1 th2;

      restrict tb1+tb2+tb3=0,tp1+tp2+tp3=0,

      tl1+tl2+tl3=0,th1+th2=0;

      run;

      4.1.3 上述SAS程序的主要輸出結(jié)果

      方差分析源自由度平方和均方FPr>F模型7454.7222264.9603221.82<0.0001誤差1029.777782.97778校正合計(jì)17484.50000

      均方根誤差1.72562R20.9385因變量均值9.50000調(diào)整R20.8955變異系數(shù)18.16446

      以上結(jié)果與前面使用“TRANSREG過程”輸出的“擬合優(yōu)度”結(jié)果是相同的。

      參數(shù)估計(jì)值變量自由度參數(shù)估計(jì)值標(biāo)準(zhǔn)誤差tPr>|t|Intercept19.500000.4067323.36<0.0001tb11-0.166670.57521-0.290.7779tb211.166670.575212.030.0700tb31-1.000000.57521-1.740.1128tp115.666670.575219.85<0.0001tp21-0.666670.57521-1.160.2734tp31-5.000000.57521-8.69<0.0001tl11-2.166670.57521-3.770.0037tl21-0.666670.57521-1.160.2734tl312.833330.575214.930.0006th110.944440.406732.320.0426th21-0.944440.40673-2.320.0426RESTRICT-11.66533E-161.28569E-80.001.0000?RESTRICT-1-9.4369E-161.28569E-8-0.001.0000?RESTRICT-17.12104E-161.28569E-80.001.0000?RESTRICT-100 - -

      以上的輸出結(jié)果中,除了最后“RESTRICT”所在的4行外,第3列和第4列與前面圖1中第2列和第3列是完全一致的。此處,還多出了“t值”和“P值”,但少了關(guān)于各屬性“重要性”的計(jì)算結(jié)果。但若利用上面的計(jì)算結(jié)果代入式(2),就不難計(jì)算出“重要性”的數(shù)值。例如:

      屬性最大值-最小值重要性(%)品牌1.1667-(-1.0000)=2.16672.1667/18.8889=0.114708=11.471%價(jià)格5.6667-(-5.0000)=10.666710.6667/18.8889=0.564707=56.471%壽命2.8333-(-2.1667)=5.00005.0000/18.8889=0.264705=26.471%保險(xiǎn)0.9444-(-0.9444)=1.88881.8888/18.8889=0.099995=10.000%合計(jì)18.8889

      上面的“重要性”計(jì)算結(jié)果與前面圖1中第4列對(duì)應(yīng)的結(jié)果略有出入,可能是每一項(xiàng)“分值效用”輸出時(shí)僅保留了4位小數(shù),屬于“舍入誤差”所致。

      4.1.4在第3.2節(jié)SAS程序的“model語句”中不使用“reflect”的輸出結(jié)果

      若將前面第3.2節(jié)SAS程序“model語句”中的選項(xiàng)“reflect”刪除,其他內(nèi)容不變,與圖1對(duì)應(yīng)的輸出結(jié)果見圖2。

      將圖2與圖1對(duì)照,僅第2列中各因素的各水平的“分值效用”的正、負(fù)號(hào)發(fā)生了反轉(zhuǎn),絕對(duì)值沒有任何改變。此時(shí),若希望找出“理想試驗(yàn)點(diǎn)”,必須弄清楚“偏好評(píng)分”屬于“高優(yōu)指標(biāo)”還是“低優(yōu)指標(biāo)”。本例開始就交代了“偏好評(píng)分”為“低優(yōu)指標(biāo)”,故“理想試驗(yàn)點(diǎn)”應(yīng)由各屬性中“分值效用”取最大絕對(duì)值且為負(fù)號(hào)對(duì)應(yīng)的“水平”組合起來,即品牌pirogi+使用壽命70 000km+價(jià)格$69.99+有公路意外保險(xiǎn)計(jì)劃。

      圖2 與表2中顧客A的偏好評(píng)分對(duì)應(yīng)的計(jì)算結(jié)果(未用reflect選項(xiàng))

      4.2 小結(jié)

      結(jié)合分析模型是基于各屬性(或因素)的分值效用可以簡(jiǎn)單疊加的假定成立的條件下構(gòu)造出來的,當(dāng)實(shí)際問題符合此假定時(shí),其分析結(jié)果是正確的;否則,要慎重使用。必要時(shí),需要選擇其他統(tǒng)計(jì)模型。

      猜你喜歡
      效用分值顧客
      一起來看看交通違法記分分值有什么變化
      “一站式”服務(wù)滿足顧客
      小學(xué)美術(shù)課堂板書的四種效用
      納米硫酸鋇及其對(duì)聚合物的改性效用
      讓顧客自己做菜
      山東青年(2016年1期)2016-02-28 14:25:27
      以顧客為關(guān)注焦點(diǎn)
      幾種常見葉面肥在大蒜田效用試驗(yàn)
      玉米田不同控釋肥料效用研討
      宿遷城鎮(zhèn)居民醫(yī)保按病種分值結(jié)算初探
      病種分值結(jié)算模式下的醫(yī)療監(jiān)管之實(shí)踐與啟示
      营口市| 广南县| 修武县| 浪卡子县| 松阳县| 遂昌县| 朝阳市| 从化市| 奇台县| 淮南市| 宜城市| 镇康县| 阿拉善右旗| 英超| 探索| 荥阳市| 孙吴县| 仁布县| 平泉县| 辽宁省| 沙坪坝区| 安丘市| 青铜峡市| 东平县| 晋宁县| 新和县| 龙陵县| 股票| 竹北市| 隆子县| 辽宁省| 江山市| 肃南| 保靖县| 汕头市| 巴塘县| 吉隆县| 丰台区| 东至县| 茶陵县| 赣州市|