孫繼偉 王 丹 李熙顏 陳 詩 蔡年輝 許玉蘭 楊利華
(1. 西南林業(yè)大學(xué) 西南山地森林資源保育與利用教育部重點實驗室,云南 昆明 650233;2. 西南林業(yè)大學(xué)云南省高校林木遺傳改良與繁育重點實驗室,云南 昆明 650233;3. 普洱市林業(yè)和草原科學(xué)研究所,云南 普洱 665099)
云南松(Pinus yunnanensis)是云南省主要用材樹種及重要的生態(tài)樹種,其遺傳改良與良種培育工作的開展對分布區(qū)內(nèi)的經(jīng)濟(jì)發(fā)展和生態(tài)環(huán)境建設(shè)具有重大意義。然而,受天然更新、人為干擾、病蟲害等因素的影響,云南松天然林出現(xiàn)退化[1-3],云南松人工林多數(shù)為純林,由于其生態(tài)系統(tǒng)功能的弱化,人工林也出現(xiàn)不同程度退化[4]。以往開展云南松子代測定時通常測量所有試驗苗木,尤其是研究生長性狀,逐株地多指標(biāo)測量苗木需要耗費大量人力物力[5]。與此同時,由于國家禁止采伐天然林用于商業(yè),我國的木材使用持續(xù)依靠進(jìn)口,數(shù)量不斷增大,然而社會需求持續(xù)增長與供應(yīng)不足之間的矛盾一直是突出問題[5]。加強對于用材樹種的遺傳育種研究,可以有效促進(jìn)林業(yè)產(chǎn)業(yè)發(fā)展,進(jìn)而緩解木材供應(yīng)與需要的矛盾。
苗高和地徑通常作為用材樹種遺傳改良的目標(biāo),云南松的子代測定在20世紀(jì)90年代有較多的研究[6-8],最初學(xué)者們通過子代測定進(jìn)行選優(yōu)、建立無性系種子園,使人工林的經(jīng)濟(jì)效益提高[9],與此同時,通過子代測定選擇具有優(yōu)良性狀的雙親建立母樹林[10]。子代測定研究工作在其他樹種中較多,目前云南松這方面的研究多集中于苗期選擇[11-13],且研究多采用隨機抽樣或全樣本測量的方法,全樣本測定的方法得到的結(jié)果精確度高但需要耗費大量人力物力,使測量成本高昂。遺傳參數(shù)估算是群體遺傳學(xué)研究的主要內(nèi)容之一,測定材料、試驗設(shè)計和生境等因素影響遺傳參數(shù)估算值,除這些因素,基因型與環(huán)境的互作效應(yīng)、小樣本抽樣等也會影響,其中樣本容量或是在某一特定群體中育種群體的大小對遺傳力估算值影響較大[14-15]。對子代進(jìn)行遺傳測定可估算親本性狀的配合力和遺傳力等重要參數(shù),其結(jié)果可指導(dǎo)種子園的營建,選擇優(yōu)良性狀的云南松家系,為下一步培育提供繁殖材料,是遺傳改良的重要內(nèi)容[16-17]。
云南松的子代測定研究成果來看,測定子代遺傳參數(shù)需要的樣本量如何確定,還是一個值得探討的問題。影響家系樣本量對于子代遺傳力估算可以從估算精度及子代測定所需的臨界樣本量2方面進(jìn)行探討[18]。提高精度主要可以通過選擇不同的交配設(shè)計,鑒于此,本研究主要從如何確定家系樣本量進(jìn)行討論。在遺傳力估算值有較高精度的條件下,按家系樣本量間隔為10的梯度隨機抽取云南松半同胞家系,研究不同家系樣本量梯度對遺傳力估算的影響,進(jìn)而確定地徑及苗高的遺傳力估算需要的最低樣本量,為今后云南松苗期遺傳測定所需的最佳樣本量和選擇方式提供參考。
試驗地位于云南省昆明市盤龍區(qū)西南林業(yè)大學(xué)苗圃內(nèi),東經(jīng)102°45′41″,北緯25°04′00″,播種所用種子來源于3個不同的采種點,分別為云南宜良、新平和祿豐,共140個半同胞家系。
采用完全隨機區(qū)組試驗,以株行距5 cm×10 cm進(jìn)行點播,每個家系播種2行,每行播種20粒,共40粒種子,設(shè)置3個重復(fù),每個家系播種120粒。將存活9 196個單株作為測定植株,苗齡為2 a,分別使用直尺和電子游標(biāo)卡尺測量苗高和地徑,其中苗高精確到0.1 cm,地徑精確到0.01 mm,分家系記錄,各家系植株數(shù)見下表1。
表1 2年生云南松苗木各家系保存數(shù)Table 1 Preservation number of different families of 2-year-old P. yunnanensis seedlings
利用Excel 2010整理錄入數(shù)據(jù),為所有家系進(jìn)行編號。利用課題組前期編寫好的隨機抽樣程序(從140個家系中不放回的抽取n個家系作為樣本量)對數(shù)據(jù)進(jìn)行預(yù)抽取,經(jīng)過預(yù)抽取,設(shè)置家系樣本量梯度為10、20、30、40、50、···、140,共14個家系樣本量梯度,標(biāo)記為F1、F2、F3、F4、F5、···、F14。按此梯度對整理好的數(shù)據(jù)進(jìn)行正式抽取,每次抽取并導(dǎo)出表格文件,用家系樣本量加上抽取次數(shù)對文件進(jìn)行命名,如第1次抽取家系樣本量為10的數(shù)據(jù),命名為:family10 1st。第1輪每個家系抽取30次,并數(shù)據(jù)進(jìn)行方差分析及樣本量確定。數(shù)據(jù)分析包括以下幾個方面。
1)遺傳參數(shù)估算。使用HalfsibSS 1.0軟件對導(dǎo)出的數(shù)據(jù)進(jìn)行分析[19],將導(dǎo)出表格的第1行修改為指定格式,如有3個重復(fù),對2個指標(biāo)分析10個家系樣本量下的遺傳參數(shù),應(yīng)將第1行修改為‘block3 family10 trait2’。更改格式后需要將文件另存為文本文件的格式,導(dǎo)入進(jìn)行分析,可以得到該家系樣本量的家系遺傳力和標(biāo)準(zhǔn)差。
2)家系遺傳力的均值與變異系數(shù)。對不同家系樣本量計算輸出的結(jié)果進(jìn)行整理,使用SPSS進(jìn)行均值比較,計算苗高和地徑家系遺傳力的極值、均值、標(biāo)準(zhǔn)差[20],計算各樣本量下家系遺傳力的變異系數(shù)(平均值/標(biāo)準(zhǔn)差×100%),用來估算各性狀表現(xiàn)的離散程度,即變異系數(shù)越小,離散程度越低,反之離散程度越高。
3)不同家系樣本量間遺傳力差異性檢驗。使用SPSS 24.0進(jìn)行方差分析,Duncan法進(jìn)行多重比較。以確定不同家系樣本量間的差異顯著性,進(jìn)而確定家系樣本量對云南松子代測定遺傳力估算的影響。
本研究設(shè)置的14個梯度中每個被抽取的家系都包含該家系所有單株,取苗高和地徑2個生長性狀的遺傳力不再隨樣本量增加發(fā)生顯著變化時的家系樣本量,即遺傳力估算值趨于平穩(wěn)時的家系樣本量作為臨界樣本量,利用的3種方法,結(jié)合圖表確定臨界樣本量[21]。
1)計算每個梯度與相鄰梯度遺傳參數(shù)差的絕對值,對所有結(jié)果取平均,得到所有梯度遺傳參數(shù)估算值的平均絕對差值(MAD):
2)計算所有14個梯度的性狀遺傳力估算值,求取平均值(AV),再確定1個正整數(shù)m,條件(其中,k為隨機比例因子,如0.05或0.1,AVm為最后n-m+1個梯度的遺傳力的平均值)。正整數(shù)m的確定方法同方法1。
3)計算所有14個梯度性狀遺傳力估算值的標(biāo)準(zhǔn)差(SD),再確定1個正整數(shù)m,使得相鄰梯度間遺傳力滿足條件SD。正整數(shù)m的確定方法同方法1。
各家系樣本量梯度地徑和苗高的均值分別為11.28 mm和13.3 cm,隨機抽取不同梯度家系樣本量使得苗高、地徑生長的情況均值較相近。苗高指標(biāo)各家系梯度生長量變化范圍是12.6~14.8cm,變異系數(shù)20.53%;地徑指標(biāo)的各家系梯度生長量變化范圍是10.57~11.82 mm,變異系數(shù)3.36%(表2),即各家系樣本量的隨機抽取結(jié)果相對比較穩(wěn)定。對各家系梯度間進(jìn)行方差分析,結(jié)果表明苗高、地徑均值及變異系數(shù)在各梯度間均無顯著差異。
表2 云南松苗木各家系樣本梯度苗高和地徑指標(biāo)生長量的基本情況Table 2 Basic information of P. yunnanensis seedling height and ground diameter for each family sample size
被測群體的14個梯度地徑指標(biāo)的家系遺傳力變化范圍是0.393 7~0.770 1,試驗家系樣本量梯度間的地徑遺傳力具有顯著的差異(P<0.05),其中除家系樣本量梯度F2外,其余家系樣本量梯度的地徑家系遺傳力均顯著大于家系樣本量梯度F3,最大的為家系樣本量梯度F7,達(dá)0.677 0。家系遺傳力的最大值為0.770 1,出現(xiàn)在家系樣本量梯度F1,即含有10個家系樣本量的梯度,其變異系數(shù)為18.35%;最小值出現(xiàn)在家系樣本量梯度F2,即含有20個家系樣本量的梯度,為0.393 7,其變異系數(shù)為17.64%。14個梯度的變異系數(shù)波動范圍是0.29%~18.35%,通過變異系數(shù)隨家系樣本量的變化分析,家系樣本量較少的梯度,遺傳力估算值波動較大。隨家系樣本量的增加,遺傳力估算值逐漸趨于穩(wěn)定,家系樣本量增加至70個后,遺傳力估算的穩(wěn)定性更加明顯。家系樣本量梯度F1~F4遺傳力估算值及其標(biāo)準(zhǔn)差與含有140個家系的梯度存在較大差異,中間梯度即F5~F14遺傳力估算值及其標(biāo)準(zhǔn)差沒有較大的差異,總體來看,遺傳力參數(shù)估算的平均值為0.6~0.7(除家系樣本量梯度F3),波動程度在家系樣本量梯度大于F7時變得穩(wěn)定;標(biāo)準(zhǔn)差隨參試家系樣本量的增加,逐漸減?。ū?)。這種趨勢體現(xiàn)出參試家系樣本量越接近總參試家系(F14=140),其家系遺傳力的估算值準(zhǔn)確度就越高。鑒于此,在遺傳分析研究時,研究者們趨向于在實際操作可行的情況下盡可能多的提取家系樣本進(jìn)行分析計算,從而得到更加準(zhǔn)確的結(jié)果。
表3 云南松苗木地徑和苗高的家系遺傳力Table 3 Family heritability estimation of P. yunnanensis seedling height and ground diameter in different family sample size
被測14個梯度苗高的家系遺傳力為0.565 7~0.918 0,與地徑遺傳力不相一致,家系樣本梯度間的苗高遺傳力具有極顯著的差異影響(P<0.01),家系樣本梯度F7~F14的苗高遺傳力極顯著地高于家系樣本梯度F1~F5。家系遺傳力最大為0.918 0,出現(xiàn)在家系樣本量梯度F10,即含有100個家系樣本量的梯度,其變異系數(shù)為6.00%;最小值出現(xiàn)在家系樣本量梯度F1,即含有10個家系的梯度,為0.565 7,其變異系數(shù)為13.91%,家系樣本梯度F1~F6苗高的遺傳力與最大梯度即含有140個家系樣本梯度的遺傳力估算值相差很大,在家系樣本量增加到100個以后,遺傳力估算值變化逐漸趨于穩(wěn)定,中間梯度即F7~F9遺傳力的估算值相差不大,但與遺傳力估算值最大的梯度仍有一定差距。14個梯度的變異系數(shù)波動范圍是0.51%~13.91%,通過變異系數(shù)隨家系樣本量梯度的變化分析,家系樣本量過少的梯度,遺傳力估算值波動較大,家系樣本量越大,其變異系數(shù)越小。苗高的標(biāo)準(zhǔn)差大小隨家系樣本量的增加逐漸降低,然而在家系樣本量小于70個時,標(biāo)準(zhǔn)差波動范圍較大,但整體趨勢下標(biāo)準(zhǔn)差仍然隨著家系樣本量的增加而降低,在家系樣本量大于70個后仍持續(xù)緩慢降低(表3)。綜合分析變異系數(shù)和標(biāo)準(zhǔn)差估算值,說明在家系樣本量小于70個時遺傳力估算的準(zhǔn)確度較低,估算值存在較大的偶然性。
計算分析遺傳力估算值隨家系樣本量的變化趨勢,分析兩變量之間的回歸關(guān)系,確定其參數(shù)方程,得到更加清晰、明確的數(shù)量關(guān)系,使研究成果對其他主要用材樹種的測定選擇樣本量更有參考價值。經(jīng)過SPSS軟件對苗高和地徑與家系樣本量回歸分析,苗高、地徑F值統(tǒng)計量分別103.609(P<0.001)和13.021(P<0.001),表明測量時家系樣本量(X)的增加對云南松家系遺傳力估算(Y)的回歸效果顯著,由回歸系數(shù)表可知回歸方程分別為:Y=0.702+0.001X、Y=0.61+0.001X。
通過3種方法判斷的各性狀遺傳力及其標(biāo)準(zhǔn)差估算所需的臨界家系樣本量結(jié)果(表4)表明:臨界樣本量的最小值是方法2確定的,最大值是使用方法3確定的。方法2和方法3的k取值越小,表示所要求遺傳力估算值波動越小,在該臨界樣本量下遺傳力的估算值和標(biāo)準(zhǔn)差也越高。其中方法3的k取值為0.1時,符合對應(yīng)判定條件的梯度,說明在該取值下遺傳力估算值變化趨勢的平穩(wěn)程度不能滿足判定臨界樣本量的要求。
表4 3種方法下兩性狀遺傳力估算所需的臨界家系樣本量Table 4 The critical sample size of familiy heritability estimation of P. yunnanensis seedling by using 3 methods
綜合3種方法,方法1確定的臨界家系樣本量為70~80個,此時數(shù)據(jù)波動幅度較小,標(biāo)準(zhǔn)差較小,可以作為本測定群體的家系樣本量。方法2將波動幅度與相應(yīng)家系樣本梯度的平均值進(jìn)行比較,當(dāng)比例因子k=0.05時,采用40~70個家系進(jìn)行參數(shù)估算即可達(dá)到測定目的。方法3當(dāng)比例因子為0.05時苗高和地徑遺傳力估算所要求的臨界家系樣本量最高,此時需采用130個家系進(jìn)行估算。綜合前文性狀遺傳力及其標(biāo)準(zhǔn)差結(jié)果,對于本研究的測定群體,測定的2年生云南松苗木家系數(shù)大于70個時,可以獲得有一定準(zhǔn)確度的遺傳力估算值。3種方法確定的臨界樣本量有差異,地徑指標(biāo)在2年生時其遺傳力估算并沒有在各家系區(qū)分出更明顯的子集,所以在討論對于該群體臨界樣本量的確定,更傾向于多考慮苗高指標(biāo)。方法2及方法3定的臨界樣本量分別為40個和130個,家系樣本量為40個時,遺傳力估算值仍有較大波動,根據(jù)多重比較結(jié)果,F(xiàn)4處于第3、4子集,說明該家系樣本梯度并不是表現(xiàn)最符合親本的家系樣本量,且不具備較高準(zhǔn)確性;家系樣本量為130時,雖然得到結(jié)果的誤差與變異系數(shù)較小,但接近全樣本測量為對研究及生產(chǎn)無意義。綜上所述,在家系樣本量為70個時,家系遺傳力均值較高,而標(biāo)準(zhǔn)差和變異系數(shù)較低;測定的云南松家系數(shù)大于70個,既保證其遺傳力估算值的準(zhǔn)確性,又達(dá)到實際生產(chǎn)實驗需要。
應(yīng)用簡單隨機抽樣的方法來調(diào)查云南松苗木質(zhì)量,在簡單隨機抽樣的調(diào)查方法中,調(diào)查對象的樣本量的確定一直是一個難題,樣本量的確定過程本質(zhì)上是費用與精度的權(quán)衡過程[22]。苗高和地徑是衡量苗木品質(zhì)及估算遺傳參數(shù)的重要指標(biāo)[23-24]。本試驗以140個云南松2年生半同胞家系共9 196株苗木的為研究材料,通過比較分析在不同家系樣本量下苗高和地徑遺傳力及其標(biāo)準(zhǔn)差估算值的穩(wěn)定性,探討家系樣本量對性狀遺傳力估算的影響,進(jìn)而確定各性狀遺傳力評估所需的臨界樣本量。結(jié)果表明,遺傳力估算值穩(wěn)定性隨著家系樣本量的增加而提高,云南松子代苗高和地徑遺傳力估算的家系樣本量較小時,估算值有較大的波動,可通過增加抽樣次數(shù)在一定范圍內(nèi)提高數(shù)據(jù)的準(zhǔn)確性和代表性。
確定抽樣方法時,應(yīng)該考慮到樣本量的多少,因為樣本量的大小會影響抽樣結(jié)果的精度,不同的樣本量應(yīng)該選取不同的抽樣方法來進(jìn)行試驗[25]。本研究中家系樣本量達(dá)到了140個,且抽樣時每次抽中仍放回總體,采取了簡單隨機抽樣重復(fù)抽樣的方法,按不同家系樣本量梯度來進(jìn)行抽樣,隨著每個家系樣本量的增加,相對應(yīng)的苗高與地徑的家系遺傳力估算值趨于穩(wěn)定,標(biāo)準(zhǔn)差不斷降低趨近于0。這在張帥楠等[18]對濕地松(Pinus elliottii)的研究中也有報道,樣本量大小對性狀遺傳力估算有影響,小樣本量下的遺傳力及其標(biāo)準(zhǔn)差估算值不穩(wěn)定,隨樣本量或家系量的增加其精度與準(zhǔn)確性逐漸增加,在遺傳力估計時應(yīng)采用較大的樣本量與盡可能多的家系數(shù),以保證其估算的精度及準(zhǔn)確性的結(jié)果相似,較大的樣本量有利于提高遺傳參數(shù)估算的精度。畢志宏等[26]也發(fā)現(xiàn)了不同的樣本量會對白樺(Betula platyphylla)各性狀遺傳參數(shù)產(chǎn)生影響,需要較大的樣本容量確保精度。這也與本研究中隨著每個家系樣本量的增加,相應(yīng)的苗高與地徑的家系遺傳力估算值趨于穩(wěn)定,標(biāo)準(zhǔn)差不斷降低趨近于0的結(jié)果類似,在相關(guān)研究中應(yīng)考慮到樣本量的大小對遺傳參數(shù)估算的影響。
樣本量過小,則估計量方差過大,統(tǒng)計推斷的可信度降低,而樣本量過大,會浪費人財物力,且調(diào)查周期延長,從而喪失抽樣調(diào)查相對于全面調(diào)查的優(yōu)點[27-28]。所以,如何尋找一個合適的樣本量,既能使樣本充分地代表總體,又能保證抽樣調(diào)查耗時少、費用低的優(yōu)點,這成為抽樣理論和實踐都必須要面對和回答的課題。樣本量臨界值的確定均衡了工作量的消耗與調(diào)查精度之間的關(guān)系,在臨界值以下,估算精度隨家系樣本量增加而提高,到達(dá)臨界點后,樣本量的增加對遺傳力估算精度的提高增效微弱[18,26]。本研究中,家系樣本量為70個時,家系遺傳力均值較穩(wěn)定,而標(biāo)準(zhǔn)差和變異系數(shù)較低,雖然家系樣本量在更接近總樣本量時獲得了更高的精度,但是為了保證其遺傳力估算值的準(zhǔn)確性,又達(dá)到實際生產(chǎn)需要,因此測定的云南松家系數(shù)大于或等于70個為宜。
同時,研究也存在一定的局限性,研究結(jié)果顯示,對于不同性狀最終確定的臨界樣本量也不同[18,26,29],對于遺傳力較低的性狀需要增加臨界樣本量[15]。但本研究由于只分析2個性狀并不能證明這一結(jié)論,沒有囊括苗木的其他生長性狀(針葉長、植株根莖葉的鮮質(zhì)量及干質(zhì)量等),只用苗高和地徑性狀進(jìn)行分析,性狀間的互作并沒有被考慮進(jìn)來,會影響其群體遺傳參數(shù)的研究,故對于試驗林其他性狀的遺傳力估算還需要更深入地研究。
綜上所述,在各樣本為隨機抽取的情況下,各家系梯度的樣本相對比較穩(wěn)定。對各家系樣本量梯度間苗高、地徑均值及其變異系數(shù)均無顯著差異,每一梯度的遺傳力及其標(biāo)準(zhǔn)差估算結(jié)果均無偏移。對于苗高和地徑2個性狀的家系遺傳力估算值在不同家系樣本容量梯度間都存在顯著的差異,其中苗高存在極顯著差異(P<0.01)、地徑存在顯著差異(P<0.05),即家系樣本量對云南松子代測定的苗高和地徑的家系遺傳力有顯著影響。樣本量的較小時家系遺傳力估算值的變異系數(shù)較大,估算精度隨著樣本量的增加而有規(guī)律的增加,另外為了保證估算精度,應(yīng)不斷計算并增加抽樣次數(shù)。對本研究的云南松半同胞子代來說,3種方法確定的臨界樣本量有差異,地徑指標(biāo)在2年生時其遺傳力估算并沒有在各家系區(qū)分出更明顯的子集,所以在討論對于該群體臨界樣本量的確定,更傾向于多考慮苗高指標(biāo)。方法2及方法3確定的臨界樣本量分別為40個和130個,家系樣本量為40個時,遺傳力估算值仍有較大波動,根據(jù)多重比較結(jié)果,F(xiàn)4處于第3、4子集,說明該家系樣本量梯度并不是表現(xiàn)最符合親本的家系容量,且不具備較高準(zhǔn)確性;家系樣本量為130個時,雖然得到結(jié)果的誤差與變異系數(shù)較小,但接近全樣本測量為對研究及生產(chǎn)無意義。綜上所述,在家系樣本量為70個時,家系遺傳力均值較穩(wěn)定,而標(biāo)準(zhǔn)差和變異系數(shù)較低。樣本量大于70個時,既保證其遺傳力估算值的準(zhǔn)確性,又達(dá)到實際生產(chǎn)實驗需要。確定臨界樣本量,對快速、簡便的測定苗木提供了可行的參考。