• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      隨機(jī)回歸模型在畜禽育種中的應(yīng)用

      2021-12-03 08:20:09邢杰
      中國畜禽種業(yè) 2021年8期
      關(guān)鍵詞:協(xié)方差方差遺傳

      邢杰

      (山西省右玉縣畜牧獸醫(yī)中心 037200)

      畜牧業(yè)生產(chǎn)中,遺傳改良是畜禽育種工作的重要環(huán)節(jié),利用統(tǒng)計模型進(jìn)行遺傳性狀評估是通過估計方差組分和遺傳參數(shù),采用合適的分析模型,在眾多動物群體中借助混合線性技術(shù),在較短時間內(nèi)篩選出優(yōu)良的目標(biāo)性狀,并加以固定。作為一種數(shù)據(jù)分析模型,隨機(jī)回歸模型(RRM) 有著廣泛的用途,應(yīng)用于社會經(jīng)濟(jì)諸多領(lǐng)域。早期RRM 主要應(yīng)用于奶牛泌乳、生長等性狀的預(yù)測評估,Meyer 等證明,協(xié)方差函數(shù)和RRM是等價的,并將其用于分析縱向數(shù)據(jù)或重復(fù)記錄,用來解釋由動態(tài)性狀在不同個體間動態(tài)變化而導(dǎo)致的遺傳差異[1]。隨著此模型的普及與優(yōu)化,人們逐漸將其用于肉牛、羊、豬及禽類(以雞為主)等其他畜禽相關(guān)性狀的遺傳評估,從對單一或少數(shù)性狀轉(zhuǎn)變到多個不同性狀的評估分析,這也是RRM 的不斷完善與推廣的漫長過程。

      1 隨機(jī)回歸模型的理論基礎(chǔ)

      1.1 回歸分析思想的建立與應(yīng)用

      回歸分析是一種預(yù)測性的建模技術(shù),它研究的是因變量和自變量之間的關(guān)系,通常用于預(yù)測分析時間序列模型及發(fā)現(xiàn)變量之間的因果關(guān)系。如通過對奶牛泌乳期各個階段產(chǎn)奶量與泌乳時間、環(huán)境等相關(guān)性的分析來確定產(chǎn)奶性狀的優(yōu)劣就是回歸分析方法的一種運(yùn)用?;貧w分析是建模與分析數(shù)據(jù)的重要手段,利用它能找出自變量與因變量之間的顯著關(guān)系,并顯示多個自變量對一個因變量的影響強(qiáng)度。在7 種回歸分析技術(shù)中,線性回歸和多項(xiàng)式回歸是常用于畜禽遺傳評估的兩種回歸分析技術(shù)。線性回歸的因變量是連續(xù)的,自變量可以是連續(xù)的,也可以是離散的,線性回歸使用最佳擬合直線建立因變量與自變量之間的關(guān)系,一元與多元線性回歸的區(qū)別在于,前者只有一個自變量,而后者有多個。多項(xiàng)式回歸則是一種運(yùn)用自變量指數(shù)大于1 的回歸方程,其最佳擬合線不是直線,而是用于擬合數(shù)據(jù)點(diǎn)的曲線。

      1.2 隨機(jī)回歸模型的提出

      隨機(jī)回歸模型(RRM)分析法最早由Henderson 等(1982年)提出[2],隨后Schaeffer 和Dekkers(1994 年)提議將此方法用于動物育種研究領(lǐng)域[3],Meyer 和Hill (1997 年) 證明,RRM 和協(xié)方差函數(shù)是等價的,并將其應(yīng)用于分析縱向數(shù)據(jù)或重復(fù)記錄,即用于分析動物生命過程中的一定時期收集的有關(guān)性狀記錄[1]。因此,Meyer 和Hill 的研究是對RRM 應(yīng)用的早期完善。

      1.3 隨機(jī)回歸模型的引入

      沿軌跡進(jìn)行的測定通??山槎x該軌跡參數(shù)的函數(shù)。重復(fù)測定經(jīng)常被人們用于描述性狀隨時間的變化,而處理重復(fù)測定的模型常常被用于動物生產(chǎn),如對奶牛多個泌乳記錄的分析就是經(jīng)常使用“重復(fù)模型”,從遺傳學(xué)的角度看,這種模型的典型特征是重復(fù)記錄被認(rèn)為是對同一性狀的表達(dá),即重復(fù)泌乳記錄之間的相關(guān)性被認(rèn)為是統(tǒng)一的。這類模型能專門描述按時間回歸的變化(如泌乳曲線和生長曲線),對這種變化的分析可能揭示其影響變量產(chǎn)生的原因,而相應(yīng)參數(shù)在品種內(nèi)也可能存在加性遺傳變異。分析途徑是估計每個動物的曲線參數(shù)和確定此類參數(shù)的變量組成,也可以使用模型來分析回歸系數(shù)在動物間改變,這樣的回歸系數(shù)不固定,但允許按指定分布而改變,從而表現(xiàn)為隨機(jī)回歸系數(shù)[4]。

      1.4 隨機(jī)回歸模型的分類

      1.4.1 基于重復(fù)率模型的隨機(jī)回歸模型

      這種模型有多種形式,Schaeffer 提出的RRM 是較為典型的一種,其表達(dá)式如下:

      其中y 為測定日產(chǎn)奶性狀觀察值,x 為對應(yīng)的協(xié)變量,HTD 為牛群的測定日固定環(huán)境效應(yīng);a,p 分別是加性遺傳效應(yīng)和隨機(jī)永久環(huán)境效應(yīng)的隨機(jī)回歸系數(shù),∑ajxj和∑pkxk分別為隨機(jī)回歸部分;b 為回歸系數(shù),∑bixi為固定回歸部分,用來擬合群的泌乳曲線;e 為隨機(jī)殘差。

      基于重復(fù)率模型的常用于分析奶牛的產(chǎn)奶記錄(泌乳曲線),另外Schaeffer 等還提出使用此模型對動物生存性狀進(jìn)行分析[5,6]。

      1.4.2 基于母體效應(yīng)

      此模型將基于重復(fù)率模型的RRM 的加性遺傳效應(yīng)分為直接遺傳效應(yīng)和母體遺傳效應(yīng),基于母體效應(yīng)的是基于重復(fù)率模型的一種,對應(yīng)母畜,還有一種基于公畜模型的RRM,其性質(zhì)與此模型類似[6]。

      1.4.3 二維隨機(jī)回歸模型

      將兩個隨時間改變的性狀對應(yīng)的時間尺度同時作為分析性狀測定的時間尺度,此模型即可稱為二維RRM。如使用此模型分析泌乳期記錄時,就需要將泌乳天數(shù)和胎次同時作為時間尺度。二維RRM 在早期應(yīng)用過程中,有時人們并不考慮不同性狀的時間尺度之間的相互作用,但實(shí)際上它們之間的確存在相關(guān)性,從而導(dǎo)致該模型的估計值不夠準(zhǔn)確[6]。

      1.5 隨機(jī)回歸模型經(jīng)常使用的統(tǒng)計理論

      1.5.1 協(xié)方差函數(shù)的應(yīng)用

      協(xié)方差函數(shù)可定義為給出軌跡不同點(diǎn)測定性狀的方差和協(xié)方差的連續(xù)函數(shù),此函數(shù)可用于描述表型協(xié)方差結(jié)構(gòu)。在RRM 中,使用協(xié)方差函數(shù)的優(yōu)點(diǎn)類似于使用回歸,因?yàn)閰f(xié)方差函數(shù)允許:(1)協(xié)方差隨時間逐漸變化;(2)協(xié)方差和時間差異之間存在關(guān)聯(lián)性;(3)預(yù)測軌跡點(diǎn)的方差和協(xié)方差函數(shù),或即使觀測點(diǎn)很少,但能使用來自所有其他測定的信息。協(xié)方差函數(shù)給出我們?nèi)绾斡米兓膮?shù)恰當(dāng)描述隨時間不斷改變的性狀,這一點(diǎn)對含有遺傳參數(shù)的評估模型尤為重要,協(xié)方差函數(shù)給出了我們處理此類變化的信息,即我們到底如何處理和分析生長曲線和泌乳曲線,協(xié)方差函數(shù)為分析相應(yīng)模型中的獨(dú)立方差分量提供了方法,這種方差分量揭示了性狀隨時間改變的特有模式[4]。

      1.5.2 方差分量(或遺傳參數(shù))的估計

      1.5.2.1 基于似然函數(shù)的估計

      當(dāng)似然函數(shù)取得最大值時,說明采樣數(shù)據(jù)發(fā)生的概率最大,我們稱其為最優(yōu)(或最大)似然函數(shù)。最大似然法(ML)、約束最大似然法(REML),ML 法和REML 法都是以使觀察值或觀察值的線性組合的似然函數(shù)達(dá)到極值的原則來估計方差組合。根據(jù)迭代法的不同,REML 又可分為最大期望約束最大似然法(EMREML)、非求導(dǎo)約束最大似然法(DFREML)和平均信息約束最大似然法(AIREML)[7]。

      1.5.2.2 基于線性模型的估計

      按照最佳線性無偏估計的原則去估計線性模型的固定效應(yīng)和隨機(jī)效應(yīng)的方差分量估計法稱為最佳線性無偏估計法(BLUP),該法使用的數(shù)學(xué)模型是混合線性效應(yīng)模型,因此,它將選擇指數(shù)法和最小二乘法有機(jī)結(jié)合起來。除了BLUP 法外,最小范數(shù)二次無偏估計法(MINQUE)和最小方差二次無偏估計法(MIVQUE)也是兩種方差分量的無偏估計法,但不如BLUP 法常用,這兩種方法均適用于所有混合模型。另外,最小二乘法也是一種模型曲線的擬合方法,最早由法國勒讓德提出,常用于估計方差分量[8]。

      1.5.2.3 貝葉斯法(Bayesian approach)估計

      貝葉斯法是一種重要的方差分量估計方法,此法將當(dāng)前信息和先驗(yàn)信息結(jié)合起來,先驗(yàn)密度與似然函數(shù)的乘積等于后驗(yàn)密度,此法能對數(shù)量性狀和閾性性狀進(jìn)行方差組分估計[8]。

      1.5.3 兩種常用的回歸方法

      1.5.3.1 勒讓德多項(xiàng)式(Legendre polynomials)回歸

      Legendre 多項(xiàng)式回歸是描述兩個變量在[-1,1]上正交的序列函數(shù)(或多項(xiàng)式集合),因變量通常是隨機(jī)的且服從某種分布,自變量通常由觀測者決定的一些時間點(diǎn)來校正,模型可以選擇與時間點(diǎn)個數(shù)相同的多項(xiàng)式階數(shù),這樣可以準(zhǔn)確描述數(shù)據(jù),雖然缺少一般性,但此類函數(shù)的優(yōu)點(diǎn)在于具有正交性,由于存在正交條件高階項(xiàng)系數(shù)趨于零,并且增加和刪除一個項(xiàng)對其他項(xiàng)沒有影響。在生物學(xué)中,絕大部分曲線都可使用三階、四階或五階多項(xiàng)式來表示。

      1.5.3.2 樣條回歸

      樣條回歸是一種特殊的函數(shù),由多項(xiàng)式分段定義,一般的樣條是自然的三次樣條。樣條回歸可以看作一個逐段回歸或分段回歸,即把數(shù)據(jù)分為幾段,在一段內(nèi)分別擬合模型,每一段內(nèi)可以擬合直線、二次項(xiàng)、三次項(xiàng)等,根據(jù)實(shí)際情況而定,與多項(xiàng)式回歸相比,樣條回歸擬合效果更優(yōu),而擬合模型的最終目的都是尋找相對較優(yōu)的模型。在特定回歸模型(如給定的RRM)中,經(jīng)常將樣條回歸用于擬合協(xié)方差結(jié)構(gòu)的分析中。

      2 隨機(jī)回歸模型的優(yōu)點(diǎn)與缺陷

      2.1 優(yōu)點(diǎn)方面

      當(dāng)RRM 側(cè)重于分析測定日記錄或縱向數(shù)據(jù)時,其優(yōu)點(diǎn)在于能以較少參數(shù)準(zhǔn)確擬合性狀的協(xié)方差,能靈活地與生產(chǎn)測定計劃相結(jié)合,能較準(zhǔn)確地消除測定日記錄中的環(huán)境效應(yīng),能用于擬合個體泌乳曲線與群體一般性狀產(chǎn)生的偏差,提高奶牛305d 產(chǎn)奶量的遺傳評估準(zhǔn)確度[6],RRM 的優(yōu)點(diǎn)還在于可利用特征值系數(shù)有效改變性狀曲線,能對不完整記錄進(jìn)行處理[9]。

      2.2 缺陷方面

      2.2.1 表現(xiàn)在等價協(xié)方差函數(shù)的使用上

      給定時間內(nèi)的多次測定值可視為多重性狀,但在時間推移中,測定值可能時間分布,理論上,多性狀方法包含無數(shù)個性狀,而實(shí)際上很多性狀的數(shù)據(jù)都可能會丟失(除非我們進(jìn)行連續(xù)測定),采取簡化的方式就是將特定時間的表達(dá)定義為獨(dú)立性狀,從而達(dá)到限制性狀數(shù)量的目的,但卻存在這些缺陷:(1)我們將協(xié)方差結(jié)構(gòu)擬合為不連續(xù)的結(jié)構(gòu),但實(shí)際上它是連續(xù)的;(2)在正確解釋同一時間段的更多測定值時,這種做法更顯單調(diào)煩瑣;(3)針對許多不同年齡性狀的多性狀模型,其缺陷在于相關(guān)性矩陣不具有結(jié)構(gòu)性[4]。

      2.2.2 表現(xiàn)在數(shù)據(jù)分析的便利程度上

      RRM 本質(zhì)上是一種帶有隨機(jī)效應(yīng)的回歸模型,一般來說,隨機(jī)效應(yīng)模型得出的結(jié)論偏向保守,置信區(qū)間較大,更難發(fā)現(xiàn)差異,帶給我們的信息是,如果各個試驗(yàn)的結(jié)果差異很大時,是否需要把各個試驗(yàn)合并往往需要我們慎重考慮,因而難以很快獲得較為客觀的結(jié)論。

      2.2.3 表現(xiàn)在使用隨機(jī)回歸模型需要的計算量上

      在進(jìn)行多元隨機(jī)回歸分析時,常出現(xiàn)計算量大幅上升現(xiàn)象,而擬合種群或亞種群平均增長曲線的參數(shù)也可以用于RRM,這同樣適合于擬合回歸模型所需的參數(shù)數(shù)量,但這種情況下,對于待分析(大型)動物育種數(shù)據(jù),更多的隨機(jī)回歸系數(shù)會使計算量迅速增加[4],這都是我們不愿面對的。另外,在使用基于RRM 的單步最佳線性無偏估計法(ssBLUP)時,其主要限制因素仍然是分析大數(shù)據(jù)集所需要的計算時間[10]。

      3 隨機(jī)回歸模型的優(yōu)化

      3.1 優(yōu)化手段

      從Legendre 多項(xiàng)式階此組合的優(yōu)選分析入手,尋找該模型的隨機(jī)效應(yīng)對性狀曲線(如生長曲線和泌乳曲線)的最佳擬合點(diǎn)。

      3.2 優(yōu)化目標(biāo)

      將更多的隨機(jī)回歸效應(yīng)納入至隨機(jī)回歸模型中,以期達(dá)到更加準(zhǔn)確的評估分析結(jié)果。

      4 隨機(jī)回歸模型在畜禽育種中應(yīng)用舉例

      4.1 隨機(jī)回歸模型在奶牛育種中的應(yīng)用

      4.1.1 隨機(jī)回歸—測定日模型的應(yīng)用

      奶牛育種的主要目的在于選擇不斷提高群體產(chǎn)奶性狀的遺傳水平[5],不過這也是奶牛遺傳育種的難點(diǎn)之一,產(chǎn)奶性狀極易受其他數(shù)量性狀和環(huán)境的共同影響,且環(huán)境效應(yīng)影響很大。性狀選擇遺傳評估主要是通過估計育種值(EBV)實(shí)現(xiàn)的,可以使用多性狀回歸測定日模型(MMRRM-TDM)進(jìn)行EBV 評估,MMRRM-TDM 利用來自測定日記錄的信息對個體進(jìn)行EBV 估計,進(jìn)而利用不同定義階段的EBV 值對種公畜進(jìn)行遺傳評定和性狀分析,通過持續(xù)力EBV 對泌乳曲線進(jìn)行遺傳改進(jìn)[10]。

      4.1.2 基于線性樣條的多性狀隨機(jī)回歸模型的應(yīng)用

      在不同遺傳組成的種群中使用不同的選擇強(qiáng)度和特定的選擇過程,純種和雜交奶牛之間的差異和協(xié)方差可能發(fā)生在多個品種群體中,制定和實(shí)施考慮基因型手段、親屬間遺傳力協(xié)方差的遺傳評估及每個不同品種群體存在的特定遺傳方差,有助于多品種群體的基因改良。線性樣條RRM(RRMLS)適用于獲得多品種群體的遺傳參數(shù),不同品種組成的后代群與種公牛的BV 會發(fā)生交互作用[11]。

      4.2 隨機(jī)回歸模型在肉牛育種中的應(yīng)用

      國外專家曾嘗試對該國的Hays Converter(HC)牛進(jìn)行遺傳參數(shù)和遺傳趨勢的評估,他們聯(lián)合應(yīng)用了MMT 和RRM 這兩種評估模型。研究顯示,外觀檢查和使用作為候選肉牛的個體表型可能不會對肉牛的性狀選擇產(chǎn)生最大限度的影響,使用估計育種值(EBV)作為選擇基礎(chǔ),預(yù)計將會更快地產(chǎn)生改良基因。該遺傳評估引入了當(dāng)代群體(CG)這個效應(yīng)值,該效應(yīng)在RRM 中被認(rèn)為是隨機(jī)的,則預(yù)測估計方差會減小,因?yàn)槟切└嘁咽占降男畔⒈挥糜陬A(yù)測EBV[12]。

      4.3 隨機(jī)回歸模型在蛋雞育種中的應(yīng)用

      體重也是雞體健康的標(biāo)志之一,與肉雞及其他家禽相比,從目前已取得的研究成果看,國內(nèi)專家曾以白來航雞與東鄉(xiāng)綠殼蛋雞F2資源群為研究對象,根據(jù)已收集的數(shù)據(jù),對這兩種蛋雞的遺傳參數(shù)作出評估。研究顯示,RRM 可用于蛋雞早期體重選育,但RRM 的應(yīng)用和優(yōu)化應(yīng)緊扣研究目的,且高階多項(xiàng)式適用于估計遺傳參數(shù),而低階多項(xiàng)式則更適用于EBV[9]。

      4.4 隨機(jī)回歸模型在綿羊育種中的應(yīng)用

      在家畜生長性狀中,體重是一個重要且容易測量的經(jīng)濟(jì)性狀,家畜生長發(fā)育過程中各階段的體重(包括初生重、斷奶重和周歲重等)是生長性狀遺傳力評估模型中的常用方差分量。國內(nèi)專家曾以考力代綿羊作為試驗(yàn)對象,對其體重生長的遺傳參數(shù)和協(xié)方差函數(shù)進(jìn)行分析和評估,他們根據(jù)似然比檢驗(yàn)(LRT)篩選出用于考力代綿羊多性狀遺傳分析和協(xié)方差函數(shù)估計的最佳模型[13]。

      5 隨機(jī)回歸模型應(yīng)用前景展望

      RRM 是處理包含隨機(jī)效應(yīng)的回歸分析方法,與具有等價作用的測定日模型(TDM)、協(xié)方差模型一樣,都是分析縱向數(shù)據(jù)的常用模型,但對特定時間點(diǎn)的縱向數(shù)據(jù)(針對多性狀模型)分析而言,很明顯只需要考慮性狀間隨機(jī)效應(yīng)(即加性遺傳效應(yīng)、永久環(huán)境效應(yīng)等)的相關(guān)性,因而,隨機(jī)參數(shù)數(shù)量有限,但在實(shí)際應(yīng)用中,這種情況幾乎不存在,因?yàn)椴豢疾煨誀钛貢r間改變的趨勢和走向,對性狀的預(yù)測和估計便無從談起,因而,重復(fù)測定是人們獲得可靠評估分析的必需,但卻是最簡單直接的手段,但一定限度內(nèi)的測定次數(shù),無論從計算量還是分析難度方面講,RRM 都能發(fā)揮其處理大樣本且結(jié)果準(zhǔn)確的優(yōu)點(diǎn),同時從建模計算的發(fā)展前景來看,借助計算機(jī)軟件處理復(fù)雜計算似乎早已成為趨勢,至少計算量大的問題一定限度內(nèi)是可以克服的,但隨著重復(fù)測定次數(shù)的增加,帶來的不僅是計算量的增加,而是性狀測定頻率難以把握和數(shù)據(jù)結(jié)果分析的復(fù)雜程度,因?yàn)橹貜?fù)測定的目的之一就是考察同一性狀在不同時間點(diǎn)的相關(guān)性高低,這是影響遺傳性狀評估準(zhǔn)確性的重要因素,如果時間間隔過大,相關(guān)性可能為零,過小一則測定工作量太大,再則最終產(chǎn)生的隨機(jī)效應(yīng)參數(shù)太多,從計算量上和數(shù)據(jù)分析上(每一協(xié)方差參數(shù)都要作出估計,都要與目標(biāo)曲線進(jìn)行擬合)都是巨大的挑戰(zhàn)。另外,重復(fù)測定的均勻程度也間接關(guān)系到最終結(jié)果的準(zhǔn)確性。另有研究顯示,RRM 對稀疏數(shù)據(jù)很敏感[12],這又間接說明,隨著重復(fù)測定次數(shù)的增多和時間間隔的縮小,RRM 對數(shù)量激增的隨機(jī)效應(yīng)參數(shù)的敏感度變小,這種情況同樣會影響最終分析結(jié)果,因而使用此模型可能難以獲得十分可靠的評估結(jié)果。對于RRM 的應(yīng)用前景展望,很多人都把此模型能處理更多的隨機(jī)效應(yīng)作為其準(zhǔn)確分析試驗(yàn)效應(yīng)的重要條件,但很少有人探討其具體的實(shí)現(xiàn)途徑,從上述分析可以看出,不斷優(yōu)化模型結(jié)構(gòu),尋求更為便捷、快速的計算處理手段,努力探索增加隨機(jī)效應(yīng),是提高評估準(zhǔn)確性與參數(shù)增多帶來分析不便之間的最佳解決方案(如使用樣條函數(shù)擬合協(xié)方差結(jié)構(gòu)就是一種有益嘗試),這幾點(diǎn)應(yīng)該是RRM 在未來發(fā)揮其應(yīng)有作用的關(guān)鍵所在。

      6 結(jié)語

      將數(shù)理統(tǒng)計學(xué)模型應(yīng)用于畜禽育種研究工作中,對現(xiàn)代畜牧業(yè)發(fā)展具有里程碑意義。無論哪個畜種,在具體育種工作中使用何種模型,應(yīng)視其研究目的和方向的不同靈活應(yīng)用,揚(yáng)長避短,只有這樣才能發(fā)揮其應(yīng)有作用,人們對隨機(jī)回歸模型的不斷優(yōu)化及其應(yīng)用畜種的不斷增多充分體現(xiàn)了這一點(diǎn),而隨著計算處理?xiàng)l件和分析手段的進(jìn)一步提高,相信該模型會受到業(yè)內(nèi)人士更多的關(guān)注。

      猜你喜歡
      協(xié)方差方差遺傳
      方差怎么算
      非遺傳承
      概率與統(tǒng)計(2)——離散型隨機(jī)變量的期望與方差
      還有什么會遺傳?
      還有什么會遺傳
      還有什么會遺傳?
      計算方差用哪個公式
      方差生活秀
      不確定系統(tǒng)改進(jìn)的魯棒協(xié)方差交叉融合穩(wěn)態(tài)Kalman預(yù)報器
      一種基于廣義協(xié)方差矩陣的欠定盲辨識方法
      泽普县| 龙井市| 聂拉木县| 平度市| 汤原县| 夏河县| 河南省| 维西| 禹州市| 安化县| 合肥市| 新干县| 瑞昌市| 武强县| 高台县| 合江县| 奉贤区| 同德县| 织金县| 绥江县| 和硕县| 普宁市| 会宁县| 理塘县| 石河子市| 闻喜县| 江永县| 阳新县| 花垣县| 平原县| 防城港市| 台北县| 石阡县| 鲁甸县| 垦利县| 滦平县| 游戏| 泗水县| 公主岭市| 临邑县| 小金县|