陳彥清,曹永生,陳麗娜,方溈
?
基于地統(tǒng)計(jì)分析方法的谷子種質(zhì)資源品質(zhì)與農(nóng)藝相關(guān)性狀 的空間分區(qū)研究
陳彥清,曹永生,陳麗娜,方溈
(中國(guó)農(nóng)業(yè)科學(xué)院作物科學(xué)研究所,北京 100081)
【目的】分析中國(guó)谷子資源相關(guān)農(nóng)藝及品質(zhì)性狀的空間分布特點(diǎn),掌握相關(guān)性狀在空間上的總體質(zhì)量分布,提高對(duì)谷子資源的宏觀認(rèn)知和有效保護(hù)及高效利用?!痉椒ā勘狙芯繌牡乩砜臻g的角度出發(fā),利用空間插值、空間聚類(lèi)等方法研究了谷子資源的相關(guān)性狀的空間分布規(guī)律。首先對(duì)谷子資源的目標(biāo)性狀值進(jìn)行插值,然后將全國(guó)網(wǎng)格化數(shù)據(jù)與插值數(shù)據(jù)進(jìn)行分區(qū)統(tǒng)計(jì),利用統(tǒng)計(jì)后的網(wǎng)格數(shù)據(jù)進(jìn)行優(yōu)化熱點(diǎn)分析形成目標(biāo)性狀的空間分區(qū)數(shù)據(jù),進(jìn)而尋找目標(biāo)性狀對(duì)應(yīng)的高值、隨機(jī)值和低值區(qū)域。【結(jié)果】谷子資源在全國(guó)的分布上來(lái)說(shuō),粗蛋白含量平均值為(13.98±1.23)%,變幅在10.47%—17.33%,變異系數(shù)為8.80%;粗脂肪含量平均值為(4.01±0.38)%,變幅在3.08%—5.47%,變異系數(shù)為9.48%,單株粒重平均值為(10.39±4.13)g,變幅在1.65—29.30g,變異系數(shù)為39.75%;生育期平均值為(111.46±10.94)d,變幅在79.15—150.43 d,變異系數(shù)為9.81%。從區(qū)域聚集分布上來(lái)說(shuō),粗蛋白含量低值區(qū)、隨機(jī)值區(qū)和高值區(qū)的平均值分別為(12.80±0.70)%、(13.98±0.39)%和(15.24±0.42)%,變幅分別在10.47%—14.90%、12.72%—15.30%和13.61%—17.33%,變異系數(shù)分別為5.47%、2.79%和2.76%;粗脂肪含量低值區(qū)、隨機(jī)值區(qū)和高值區(qū)的平均值分別為(3.69±0.13)%、(3.99±0.16)%和(4.41±0.26)%,變幅分別為3.11%—4.39%、3.08%—4.48%和3.57%—5.47%,變異系數(shù)分別為3.52%、4.01%和5.89%;單株粒重低值區(qū)、隨機(jī)值區(qū)和高值區(qū)的平均值分別為(6.49±1.84)g、(10.51±1.49)g和(14.44±2.88)g,變幅分別為(1.65—13.38)、(5.42—16.54)和(7.63—29.30)g,變異系數(shù)分別為23.73%、14.18%和19.94%;生育期低值區(qū)、隨機(jī)值區(qū)和高值區(qū)的平均值分別為(99.58±6.64)d、(111.89±2.99)d和(121.17±6.04)d,變幅分別為(79.15—116.81)d、(99.53—124.44)d和(108.34—150.43)d,變異系數(shù)分別為6.67%、2.67%和4.98%?!窘Y(jié)論】谷子資源粗蛋白含量高值區(qū)內(nèi)部差異最小,主要集中在新疆和黑龍江省東北部,低值區(qū)內(nèi)部差異最大,主要在中部和東部,高低值區(qū)間存在隨機(jī)值過(guò)度地帶,呈現(xiàn)兩側(cè)向中間越來(lái)越小的分布趨勢(shì);粗脂肪含量高值區(qū)內(nèi)部差異最大,主要集中在中部地區(qū),低值區(qū)內(nèi)部差異最小,主要分布在新疆和東北部分地區(qū),呈現(xiàn)中間向兩側(cè)越來(lái)越小的趨勢(shì)分布,且分區(qū)相對(duì)不規(guī)整;單株粒重的隨機(jī)值區(qū)內(nèi)部差異最小,高值區(qū)內(nèi)部差異最大,寧夏、山西、陜西等地屬于單株粒重高值區(qū),黑龍江、浙江、內(nèi)蒙北部、安徽南部以及西南大部分地區(qū),均屬單株粒重低值區(qū);生育期的隨機(jī)值區(qū)內(nèi)部差異最小,低值區(qū)內(nèi)部差異最大,東北大部分地區(qū)、西北和西南部分地區(qū)生育期較長(zhǎng),河南、山東、河北等谷子夏播期的地區(qū)生育期較短。
谷子;種質(zhì)資源;目標(biāo)性狀;空間插值;空間分布
【研究意義】谷子起源于中國(guó),是傳統(tǒng)的優(yōu)勢(shì)作物、主食作物和抗旱耐瘠作物[1],距今已有8 700多年的栽培歷史[2]。谷子具有抗旱耐瘠、水分利用效率高、適應(yīng)性廣、營(yíng)養(yǎng)豐富、各種成分平衡、飼草蛋白含量高等突出特點(diǎn),被認(rèn)為是應(yīng)對(duì)未來(lái)水資源短缺的戰(zhàn)略貯備作物,建設(shè)可持續(xù)農(nóng)業(yè)的生態(tài)作物以及人們膳食結(jié)構(gòu)調(diào)整、平衡營(yíng)養(yǎng)的特色作物[3-5]。中國(guó)既是栽培谷子的起源地,也是擁有谷子種質(zhì)資源最多、研究利用最充分的國(guó)家。全世界谷子總產(chǎn)中,中國(guó)占80%[6],主要種植區(qū)分布在北方干旱、半干旱地區(qū)。在“全國(guó)種植業(yè)結(jié)構(gòu)調(diào)整規(guī)劃(2016—2020)”[7]中指出:適當(dāng)調(diào)減“鐮刀彎”地區(qū)玉米面積,改種耐旱耐瘠薄的薯類(lèi)、雜糧雜豆,滿足市場(chǎng)需求,保護(hù)生態(tài)環(huán)境??梢?jiàn)谷子等耐旱耐貧瘠雜糧類(lèi)資源越來(lái)越受到重視,而掌握谷子資源在空間上的總體質(zhì)量分布概況,對(duì)于有效利用和開(kāi)發(fā)谷子資源、尋找優(yōu)異谷子種質(zhì)具有重要意義?!厩叭搜芯窟M(jìn)展】近年對(duì)谷子資源的品質(zhì)及農(nóng)藝性狀的研究也越來(lái)越多。李慶春等[8]從各生態(tài)區(qū)的角度對(duì)于谷子的蛋白含量進(jìn)行和普查與評(píng)價(jià),從統(tǒng)計(jì)學(xué)的角度分析了各生態(tài)區(qū)內(nèi)谷子資源粗蛋白含量的極值、平均值和標(biāo)準(zhǔn)差等;那海智等[9]通過(guò)研究谷子粗蛋白、粗脂肪含量與物候期的關(guān)系得出,生育期越短,粗蛋白含量越高,反之越低,而生育期對(duì)粗脂肪的影響并不顯著;王海崗等[10]利用聚類(lèi)分析、相關(guān)分析和主成分分析等方法對(duì)谷子核心種質(zhì)的莖粗、穗重、粒色等15個(gè)表型性狀進(jìn)行了分析和綜合評(píng)價(jià)。劉三才等[11]測(cè)量和評(píng)價(jià)了谷子品種資源內(nèi)微量元素硒和蛋白質(zhì)的含量;劉敏軒等[12]利用統(tǒng)計(jì)分析和相關(guān)性分析等方法研究了谷子育成品種維生素E含量分布規(guī)律及其與主要農(nóng)藝性狀和類(lèi)胡蘿卜素的相關(guān)性分析。以上研究的共同點(diǎn)在于,在研究某一性狀的分布特點(diǎn)或地區(qū)差異時(shí),均采用數(shù)理統(tǒng)計(jì)、相關(guān)性分析等數(shù)學(xué)方法得到一個(gè)或幾個(gè)數(shù)值,根據(jù)數(shù)值差異定量的評(píng)價(jià)該性狀,均利用省份或生態(tài)區(qū)作為分區(qū)研究區(qū)域差異?!颈狙芯壳腥朦c(diǎn)】這種方法雖然能夠從定量角度充分說(shuō)明資源性狀的特性,但不能直觀的反映出某一性狀在地理空間上的分布特性,可視化效果差;并且以行政區(qū)劃為單元對(duì)谷子資源性狀的地區(qū)差異進(jìn)行分析打破了原有的自然區(qū)劃關(guān)聯(lián)?!緮M解決的關(guān)鍵問(wèn)題】本研究從地理空間的角度出發(fā),利用空間插值、空間聚類(lèi)等方法研究谷子資源的農(nóng)藝及品質(zhì)性狀的空間分布規(guī)律,為解決傳統(tǒng)分析方法中可視化差及行政界線的限制等問(wèn)題提出依據(jù)。
1.1 材料
20世紀(jì)50年代以來(lái),中國(guó)先后組織了兩次全國(guó)規(guī)模的農(nóng)作物種質(zhì)資源調(diào)查,在資源調(diào)查和信息共享方面取得了重大進(jìn)展和顯著成效,積累了大量的種質(zhì)資源數(shù)據(jù)[13-15]。同時(shí),近十年來(lái),中國(guó)先后在云南、貴州、西南干旱地區(qū)、東部沿海等地區(qū)開(kāi)展了多次種質(zhì)資源調(diào)查工作,豐富了國(guó)家農(nóng)作物種質(zhì)資源數(shù)據(jù)庫(kù)。對(duì)于國(guó)家農(nóng)作物種質(zhì)資源數(shù)據(jù)庫(kù)中的谷子資源數(shù)據(jù),共整理出27 000余條谷子資源數(shù)據(jù)記錄,這些數(shù)據(jù)中,初步完成了形態(tài)學(xué)特征和農(nóng)藝性狀鑒定半數(shù)種質(zhì)進(jìn)行了抗病蟲(chóng)、抗逆、營(yíng)養(yǎng)品質(zhì)的特性鑒定[16]。根據(jù)其經(jīng)緯度屬性信息轉(zhuǎn)換為地理空間數(shù)據(jù)(圖1)。
1.2 方法
由于谷子種質(zhì)資源數(shù)據(jù)在空間上為點(diǎn)數(shù)據(jù),不利于進(jìn)行空間分析等操作。而針對(duì)點(diǎn)數(shù)據(jù),在空間上可利用地統(tǒng)計(jì)分析方法通過(guò)插值得到面上的數(shù)據(jù),從而進(jìn)一步進(jìn)行空間分析。基于該點(diǎn)考慮,首先對(duì)谷子種質(zhì)資源待分析的屬性值進(jìn)行插值,估測(cè)全國(guó)各地對(duì)應(yīng)的屬性值情況,然后將全國(guó)網(wǎng)格化數(shù)據(jù)與插值數(shù)據(jù)進(jìn)行分區(qū)統(tǒng)計(jì),將屬性值賦給每個(gè)網(wǎng)格,并利用賦值的網(wǎng)格數(shù)據(jù)進(jìn)行優(yōu)化熱點(diǎn)分析,實(shí)現(xiàn)網(wǎng)格的聚類(lèi),最后將聚類(lèi)結(jié)果進(jìn)一步處理,對(duì)全國(guó)進(jìn)行分區(qū),找到目標(biāo)屬性對(duì)應(yīng)的高值、隨機(jī)值和低值區(qū)域。
圖1 谷子資源分布圖
1.2.1 農(nóng)藝及品質(zhì)性狀數(shù)據(jù)空間插值 地統(tǒng)計(jì)分析方法可用于估計(jì)尚未進(jìn)行任何采樣的位置的值以及評(píng)估這些估計(jì)的不確定性。地統(tǒng)計(jì)分析方法主要用來(lái)研究那些在空間上既有隨機(jī)性又有結(jié)構(gòu)性的自然現(xiàn)象[17]。由南非礦山工程師Krige等[18]在金礦儲(chǔ)量估計(jì)上提出了該方法的雛形,其應(yīng)用領(lǐng)域從地質(zhì)、礦業(yè)逐漸拓展到土壤[19]、水資源[20]、農(nóng)業(yè)[21-23]、氣象[24]、海洋[25]等領(lǐng)域。地統(tǒng)計(jì)中最常用的空間插值方法為克里金插值法,該方法是建立在變異函數(shù)理論及結(jié)構(gòu)分析基礎(chǔ)之上的,在插值時(shí)需要選擇一種適宜的半變異函數(shù)模型,并且待插值的數(shù)據(jù)需要服從或近似服從正態(tài)分布。所以在選擇使用克里金插值方法時(shí),首選需進(jìn)行數(shù)據(jù)分布檢驗(yàn),確定該數(shù)據(jù)是否適合插值,然后利用交叉檢驗(yàn)法對(duì)插值結(jié)果的精度進(jìn)行評(píng)價(jià),從而選擇最適宜的半變異函數(shù)模型進(jìn)行插值。
1.2.2 農(nóng)藝及品質(zhì)性狀數(shù)據(jù)網(wǎng)格化處理 網(wǎng)格是對(duì)
地理空間的劃分[26]。網(wǎng)格化數(shù)據(jù)不僅能夠?qū)崿F(xiàn)不同尺度、不同類(lèi)型數(shù)據(jù)的統(tǒng)一和融合,而且能夠打破行政單元約束,提高信息檢索與更新效率[27-28]。與柵格數(shù)據(jù)相比,便于空間統(tǒng)計(jì)和分析,選擇將插值得到的柵格數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一大小的網(wǎng)格數(shù)據(jù)。首先根據(jù)全國(guó)的范圍,選擇適宜的網(wǎng)格大小,創(chuàng)建全國(guó)范圍內(nèi)的網(wǎng)格數(shù)據(jù),并利用空間分析中的分區(qū)統(tǒng)計(jì)方法,將對(duì)應(yīng)的插值后的農(nóng)藝或品質(zhì)性狀數(shù)據(jù)統(tǒng)計(jì)到每個(gè)網(wǎng)格上,得到帶有目標(biāo)屬性值的網(wǎng)格數(shù)據(jù)。
1.2.3 農(nóng)藝及品質(zhì)性狀數(shù)據(jù)空間聚類(lèi)及區(qū)域劃分 通過(guò)空間聚類(lèi),將空間上相鄰、數(shù)值上相近的網(wǎng)格數(shù)據(jù)聚集成一類(lèi),根據(jù)聚類(lèi)結(jié)果進(jìn)行區(qū)域劃分??臻g聚類(lèi)的方法很多,熱點(diǎn)分析方法就是其中一種,它的特點(diǎn)是能夠識(shí)別具有統(tǒng)計(jì)顯著性的高值(熱點(diǎn))和低值(冷點(diǎn))的空間聚類(lèi)。利用該方法,不僅能夠?qū)崿F(xiàn)聚類(lèi),而且能夠根據(jù)聚類(lèi)結(jié)果區(qū)分出哪些地區(qū)對(duì)應(yīng)的值比較高,哪些地區(qū)對(duì)應(yīng)的值比較低,比較符合本研究的需求。故在空間聚類(lèi)方面,選擇利用ARCGIS的優(yōu)化熱點(diǎn)分析工具,對(duì)網(wǎng)格數(shù)據(jù)進(jìn)行高低值聚類(lèi)。根據(jù)聚類(lèi)結(jié)果,將網(wǎng)格數(shù)據(jù)分為高值、隨機(jī)值和低值三類(lèi),融合空間相鄰、類(lèi)別相同的網(wǎng)格,并進(jìn)行平滑處理,劃分農(nóng)藝或品質(zhì)性狀的空間分布區(qū)域。
具體流程如下:
圖2 方法流程圖
根據(jù)谷子種質(zhì)資源的數(shù)據(jù)和地統(tǒng)計(jì)中的探索性分析,最終選擇粗蛋白含量和粗脂肪含量2個(gè)品質(zhì)性狀與生育期和單株粒重2個(gè)農(nóng)藝性狀為空間分區(qū)要素,對(duì)以上方法進(jìn)行實(shí)例化分析。在27 000余份資源數(shù)據(jù)中,分別具有粗脂肪值、粗蛋白值、單株粒重值、生育期值的資源有20 451份、20 477份、25 807份和26 420份,這4項(xiàng)屬性數(shù)據(jù)的缺失較少,并且經(jīng)過(guò)數(shù)據(jù)分布檢驗(yàn)后表明,這4項(xiàng)數(shù)據(jù)的分布均接近于正態(tài)分布(圖3),適合利用克里金法進(jìn)行空間插值。
圖3 4種目標(biāo)屬性的直方圖分布情況
對(duì)以上4項(xiàng)屬性數(shù)據(jù)進(jìn)行空間插值,選擇球面函數(shù)、高斯函數(shù)和四球3種半變異函數(shù)模型進(jìn)行插值,利用平均值預(yù)測(cè)誤差、平均標(biāo)準(zhǔn)誤差、均方根預(yù)測(cè)誤差、均方根標(biāo)準(zhǔn)化誤差進(jìn)行交叉檢驗(yàn),檢驗(yàn)結(jié)果如表1所示。在交叉檢驗(yàn)中,如果預(yù)測(cè)誤差具有無(wú)偏性,平均值預(yù)測(cè)誤差應(yīng)接近于0;如果正確估計(jì)了預(yù)測(cè)中的變異性,平均標(biāo)準(zhǔn)誤差與均方根預(yù)測(cè)誤差應(yīng)接近,并且均方根標(biāo)準(zhǔn)化誤差應(yīng)接近于1。經(jīng)過(guò)綜合分析發(fā)現(xiàn),這4類(lèi)性狀均在利用高斯函數(shù)模型時(shí)預(yù)測(cè)效果最優(yōu)。
對(duì)經(jīng)過(guò)插值后的數(shù)據(jù)進(jìn)行網(wǎng)格化處理、空間聚類(lèi)分析、網(wǎng)格融合和平滑處理,最終得到4項(xiàng)要素的空間分區(qū)分布圖(圖3—圖6)。
蛋白質(zhì)含量是谷子營(yíng)養(yǎng)品質(zhì)的主要構(gòu)成成分之一[29-30],在谷子品質(zhì)育種中應(yīng)重點(diǎn)提高蛋白質(zhì)含量[31]。谷子資源粗蛋白含量高的地區(qū)主要集中在中國(guó)的西部地區(qū)和黑龍江省東北部,低值地區(qū)主要在中國(guó)的中部和東部,在高低值之間存在隨機(jī)值過(guò)度地帶,呈現(xiàn)兩側(cè)向中間越來(lái)越小的分布趨勢(shì),不是隨意穿插分布的,并且各分區(qū)的多邊形相對(duì)面積較大,不存在零星分布的小多邊形,說(shuō)明中國(guó)谷子的粗蛋白含量地域連續(xù)性較強(qiáng)(圖3)。從均值上看,根據(jù)表2數(shù)據(jù),粗蛋白含量的全國(guó)平均值為(13.98±1.23)%,低值區(qū)平均值為(12.80±0.70)%,占41.89%;隨機(jī)區(qū)平均值為(13.98±0.39)%,占18.69%;高值區(qū)平均值為(15.24±0.42)%,占全國(guó)總面積39.42%。由于高值地區(qū)主要分布在西部高原地區(qū),大部分地區(qū)不適宜種植,而谷子主要種植區(qū)均屬于粗蛋白含量低值區(qū),表明中國(guó)谷子資源的粗蛋白含量高且聚集分布的區(qū)域較小,大部分谷子的粗蛋白含量水平處于低值聚集區(qū)的水平上。從變幅上看,全國(guó)粗蛋白含量變幅在10.47%—17.33%,低值區(qū)、隨機(jī)值區(qū)、高值區(qū)的變幅分別在10.47%—14.90%、12.72%—15.30%和13.61%—17.33%,低值區(qū)的跨度最大,并且三者的變幅值有重復(fù)部分,這是因?yàn)榭臻g聚類(lèi)時(shí)不僅需要考慮數(shù)值的近似性,還要考慮空間上的相鄰性,所以不會(huì)嚴(yán)格按照數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行聚類(lèi)。從聚類(lèi)效果看,粗蛋白含量的全國(guó)變異系數(shù)為8.80%,低值區(qū)、隨機(jī)值區(qū)和高值區(qū)的變異系數(shù)分別為5.47%、2.79%和2.76%。變異系數(shù)越小,證明聚類(lèi)的效果最好,經(jīng)過(guò)聚類(lèi)后的3個(gè)分區(qū)的變異系數(shù)都小于國(guó)家級(jí)變異系數(shù),高值區(qū)聚類(lèi)效果最佳,低值區(qū)聚類(lèi)效果最弱。
表1 不同變異函數(shù)模型的插值誤差值對(duì)比
圖4 谷子資源粗蛋白含量的區(qū)域劃分結(jié)果
谷子資源粗脂肪含量高的地區(qū)主要集中在中部地區(qū),低值地區(qū)為西部和部分東北地區(qū),與粗蛋白情況相反,呈現(xiàn)中間向兩側(cè)越來(lái)越小的趨勢(shì)分布,并且相對(duì)于粗蛋白含量的分區(qū)結(jié)果來(lái)說(shuō),出現(xiàn)多個(gè)面積較小的分區(qū)多邊形,分區(qū)相對(duì)不規(guī)整(圖4)。從均值上看,根據(jù)表2數(shù)據(jù),粗脂肪含量的全國(guó)平均值為(4.01±0.38)%,低值區(qū)平均值為(3.69±0.13)%,占44.36%;隨機(jī)值區(qū)平均值為(3.99±0.16)%,占18.67%;高值區(qū)平均值為(4.41±0.26)%,占全國(guó)總面積36.97%。雖然低值區(qū)域占地面積最大,但由于西部地區(qū)存在大面積不適宜種植的區(qū)域,所以,從整體上來(lái)看,中國(guó)谷子資源的粗脂肪含量高且呈現(xiàn)聚集的區(qū)域面積廣闊。從變幅上看,全國(guó)谷子資源粗脂肪含量變幅在3.08%—5.47%,低值區(qū)、隨機(jī)值區(qū)、高值區(qū)的變幅分別在3.11%—4.39%、3.08%—4.48%和3.57%—5.47%,3個(gè)區(qū)間均有重疊部分,其中,隨機(jī)值區(qū)域跨度最大。從聚類(lèi)效果看,粗脂肪含量的全國(guó)變異系數(shù)為9.48%,高于粗蛋白含量的變異系數(shù),說(shuō)明粗脂肪含量的聚類(lèi)效果不如粗蛋白含量的顯著。低值區(qū)、隨機(jī)值區(qū)和高值區(qū)的變異系數(shù)分別為3.52%、4.01%和5.89%。低值區(qū)聚類(lèi)效果最佳,高值區(qū)聚類(lèi)效果最弱。
單株粒重直接影響谷子的產(chǎn)量,當(dāng)種植密度相同時(shí),單株粒重越大,產(chǎn)量越高。從地理分布上分析(圖6),寧夏、山西、陜西,以及甘肅、內(nèi)蒙、湖北和新疆大部分地區(qū)、河北北部和山東中部均屬于高值區(qū),而黑龍江、浙江、內(nèi)蒙北部、安徽南部以及中國(guó)的大部分西南地區(qū),均屬于單株粒重低值區(qū);其他地區(qū)屬于高值區(qū)與低值區(qū)的過(guò)度地帶的隨機(jī)值區(qū)。從均值(表2)上看,單株粒重的全國(guó)平均值為(10.39±4.13)g,低值區(qū)平均值為(6.49±1.84)g,占39.45%;隨機(jī)值區(qū)平均值為(10.51±1.49)g,占22.80%;高值區(qū)平均值為(14.44±2.88)g,占全國(guó)總面積37.75%。正如上文所說(shuō),雖然低值區(qū)域占地面積大,但由于這些地區(qū)不屬于谷子的主要種植區(qū),所以,從整體上來(lái)看,中國(guó)谷子主要集中在單株粒重高的高值區(qū)域內(nèi)。從變幅上看,全國(guó)谷子單株粒重變幅在(1.65—29.30)g,低值區(qū)、隨機(jī)值區(qū)、高值區(qū)的變幅分別在(1.65—13.38)、(5.42—16.54)和(7.63—29.30)g,3個(gè)區(qū)間均有重疊部分,其中高值區(qū)域跨度最大。從聚類(lèi)效果看,單株粒重的全國(guó)變異系數(shù)為39.75%,屬于這4項(xiàng)性狀中變異系數(shù)最高的1項(xiàng),說(shuō)明單株粒重在這4項(xiàng)性狀中聚類(lèi)效果最弱,全國(guó)范圍內(nèi)差異最明顯;低值區(qū)、隨機(jī)值區(qū)和高值區(qū)的變異系數(shù)分別為23.73%、14.18%和19.94%。隨機(jī)值區(qū)聚類(lèi)效果最佳,低值區(qū)聚類(lèi)效果最弱。
從生育期的地理分布分析來(lái)看(圖7),東北大部分地區(qū)、西北和西南部分地區(qū)屬于生育期較長(zhǎng)的地區(qū),生育期較短區(qū)域主要包括了河南、山東、河北等谷子夏播期的地區(qū)。從數(shù)值上分析(表2),生育期的全國(guó)平均值為(111.46±10.94)d,低值區(qū)平均值為(99.58±6.64)d,占34.28%;隨機(jī)值區(qū)平均值為(111.89±2.99)d,占24.30%;高值區(qū)平均值為(121.17±6.04)d,占全國(guó)總面積41.42%。從變幅上看,全國(guó)生育期變幅在(79.15—150.43) d,高值區(qū)、隨機(jī)值區(qū)、低值區(qū)的變幅分別在(108.34—150.43)、(99.53—124.44)、(79.15—116.81) d,3個(gè)區(qū)間均有重疊部分,其中高值區(qū)域跨度最大。從聚類(lèi)效果看,全國(guó)變異系數(shù)為9.81%,高值區(qū)、隨機(jī)值區(qū)和低值區(qū)的變異系數(shù)分別為4.98%、2.67%和6.67%。隨機(jī)值區(qū)聚類(lèi)效果最佳,低值區(qū)聚類(lèi)效果最弱。
本方法主要根據(jù)插值后的結(jié)果進(jìn)行聚類(lèi)分區(qū),尚未考慮其他因素對(duì)谷子種植的影響,所以未區(qū)分哪些地區(qū)是谷子的適宜和非適宜種植區(qū),而因?yàn)楹0?、氣候等原因,使得一些地區(qū)無(wú)法進(jìn)行農(nóng)作物的種植。根據(jù)圖1谷子資源樣點(diǎn)的分布,絕大部分分布在海拔3 000 m以下的地區(qū),若將海拔3 000 m以上的區(qū)域作為谷子不適宜種植區(qū)域并進(jìn)行扣除,各性狀的高低值區(qū)域比例則會(huì)發(fā)生較大的變動(dòng),如圖8所示。粗蛋白含量被扣除的主要是高值區(qū)域,其余3個(gè)性狀被扣除的主要是低值區(qū)域。所以,在考慮海拔限制的前提下,粗蛋白含量的高值區(qū)主要集中在新疆和黑龍江省東北部,低值區(qū)主要在中部和東部;粗脂肪含量的高值區(qū)主要集中在中部地區(qū),低值地區(qū)為新疆和東北的部分地區(qū);單株粒重的高值區(qū)主要集中在寧夏、山西、陜西,以及甘肅、內(nèi)蒙、湖北和新疆大部分地區(qū)、河北北部和山東中部等谷子主要種植區(qū),低值區(qū)主要集中在東北和西南地區(qū);生育期的高值區(qū)為東北大部分地區(qū)、西北和西南部分地區(qū),低值區(qū)為東南沿海地區(qū)。再加入其它限制因素時(shí),可進(jìn)一步縮小資源的分布區(qū)域,進(jìn)一步細(xì)化資源各性狀的高低值分區(qū)布局。
圖5 谷子資源粗脂肪含量區(qū)域劃分結(jié)果
圖6 谷子資源單株粒重區(qū)域劃分結(jié)果
圖7 谷子資源生育期區(qū)域劃分結(jié)果
表2 4項(xiàng)性狀聚類(lèi)后的相關(guān)統(tǒng)計(jì)數(shù)值表
對(duì)于每項(xiàng)性狀的聚類(lèi),其高低值類(lèi)型區(qū)的劃分是一個(gè)相對(duì)概念,與聚類(lèi)時(shí)對(duì)應(yīng)的空間尺度關(guān)系密切,在另外一個(gè)尺度下,如生態(tài)類(lèi)型區(qū)尺度下再進(jìn)行聚類(lèi),會(huì)出現(xiàn)不同的聚類(lèi)結(jié)果,所以本研究的聚類(lèi)僅針對(duì)國(guó)家尺度上的分析。另外,克里金插值是一種光滑的內(nèi)插方法,在數(shù)據(jù)點(diǎn)多時(shí),其內(nèi)插的結(jié)果可信度較高,而數(shù)據(jù)點(diǎn)少的地區(qū)其插值結(jié)果的偏差則會(huì)較大。中國(guó)西部和東南部地區(qū)的樣點(diǎn)數(shù)量較少,并且存在大面積地區(qū)無(wú)樣點(diǎn)的情況,這些地區(qū)的插值結(jié)果的可信度會(huì)明顯低于中部和東北地區(qū)(圖1)。
圖8 海拔限制下的四性狀空間分布
4.1 谷子資源的粗蛋白含量、粗脂肪含量、單株粒重、生育期4種性狀數(shù)據(jù)的分布均接近于正態(tài)分布,適合利用克里金法進(jìn)行空間插值;對(duì)比球面函數(shù)、高斯函數(shù)和四球3種半變異函數(shù)模型插值效果,這4種性狀數(shù)據(jù)均選擇高斯函數(shù)模型時(shí)預(yù)測(cè)效果最優(yōu)。
4.2 谷子資源粗蛋白含量的高值區(qū)、隨機(jī)值區(qū)和低值區(qū)的變異系數(shù)分別為2.76%、2.79%和5.47%,高值區(qū)聚類(lèi)效果最佳(類(lèi)內(nèi)相似性最大,下同),低值區(qū)聚類(lèi)效果最弱(類(lèi)內(nèi)相似性最小,下同)。粗脂肪含量的高值區(qū)、隨機(jī)值區(qū)和低值區(qū)的變異系數(shù)分別為3.52%、4.01%和5.89%,低值區(qū)聚類(lèi)效果最佳,高值區(qū)聚類(lèi)效果最弱。單株粒重的高值區(qū)、隨機(jī)值區(qū)和低值區(qū)的變異系數(shù)分別為23.73%、14.18%和19.94%,隨機(jī)值區(qū)聚類(lèi)效果最佳,低值區(qū)聚類(lèi)效果最弱。生育期的高值區(qū)、隨機(jī)值區(qū)和低值區(qū)的變異系數(shù)分別為6.67%、2.67%和4.98%,隨機(jī)值區(qū)聚類(lèi)效果最佳,低值區(qū)聚類(lèi)效果最弱。
4.3 谷子資源粗蛋白含量的高值區(qū)集中在新疆和黑龍江省東北部,低值區(qū)主要在中部和東部,呈現(xiàn)兩側(cè)向中間越來(lái)越小的分布趨勢(shì),地域連續(xù)性較強(qiáng);粗脂肪含量的高值區(qū)主要集中在中部地區(qū),低值地區(qū)為新疆和東北的部分地區(qū),呈現(xiàn)中間向兩側(cè)越來(lái)越小的趨勢(shì)分布,并且相對(duì)于粗蛋白含量的分區(qū)結(jié)果來(lái)說(shuō),出現(xiàn)多個(gè)面積較小的分區(qū)多邊形,分區(qū)相對(duì)不規(guī)整;單株粒重的高值區(qū)主要集中在寧夏、山西、陜西,以及甘肅、內(nèi)蒙、湖北和新疆大部分地區(qū)、河北北部和山東中部,低值區(qū)主要集中在東北和西南地區(qū);生育期的高值區(qū)為東北大部分地區(qū)、西北和西南部分地區(qū),低值區(qū)主要集中在河南、山東、河北等谷子夏播期的地區(qū)。
[1] 刁現(xiàn)民. 中國(guó)谷子生產(chǎn)與產(chǎn)業(yè)發(fā)展方向//柴巖, 萬(wàn)世富. 中國(guó)小雜糧產(chǎn)業(yè)發(fā)展報(bào)告. 北京: 中國(guó)農(nóng)業(yè)科學(xué)技術(shù)出版社, 2007: 32-43.
Diao X M. Developing direction of the Chinese foxtail millet production and industry//Chai Y, Wan S F.Beijing: Chinese Agricultural Science and Technology Press, 2007: 32-43. (in Chinese)
[2] Lu H Y, Zhang J P, Liu K B, Wu N Q, Li Y M, Zhou K S. Earliest domestication of common millet()in East Asia Extended to 10000 Years Ago., 2009, 106(18): 7367-7372.
[3] 李順國(guó), 劉猛, 趙宇, 劉斐, 王慧軍. 河北省谷子產(chǎn)業(yè)現(xiàn)狀和技術(shù)需求及發(fā)展對(duì)策. 農(nóng)業(yè)現(xiàn)代化研究, 2012, 33(3): 286-289.
Li S G, Liu M, Zhao Y, Liu F, Wang H J. Industry situation, technology need and development suggestion of foxtail millet in Hebei province., 2012, 33(3): 286-289. (in Chinese)
[4] 張海金. 谷子在旱作農(nóng)業(yè)中的地位和作用. 安徽農(nóng)學(xué)通報(bào), 2007, 13(10): 169-170.
Zhang H J. Status and effect of foxtail millet in dry-land agriculture., 2007, 13(10): 169-170. (in Chinese)
[5] 柴巖, 萬(wàn)福世. 中國(guó)小雜糧產(chǎn)業(yè)發(fā)展報(bào)告. 北京: 中國(guó)農(nóng)業(yè)出版社, 2007: 32-43.
Chai Y, Wan F S.. Beijing: China Agriculture Press, 2007: 32-43. (in Chinese)
[6] 刁現(xiàn)民. 中國(guó)谷子產(chǎn)業(yè)與產(chǎn)業(yè)技術(shù)體系. 北京: 中國(guó)農(nóng)業(yè)科學(xué)與技術(shù)出版社, 2011: 20-30.
Diao X M.. Beijing: China Agricultural Sciences and Technology Press, 2011: 20-30. (in Chinese)
[7] 中華人民共和國(guó)農(nóng)業(yè)部.《全國(guó)種植業(yè)結(jié)構(gòu)調(diào)整規(guī)劃(2016-2020年)》農(nóng)農(nóng)發(fā)〔2016〕3號(hào).
Ministry of Agriculture of the People's Republic of China, < National crop structure adjustment plan (2016-2020)>, 〔2016〕NO. 3 (in Chinese)
[8] 李慶春, 吳舒致. 不同品種小米中粗蛋白含量的普查與評(píng)價(jià). 中國(guó)糧油學(xué)報(bào), 1993, 8(增刊): 8-13.
Li Q C, Wu S Z. Survey and evaluation of crude protein content in different varieties of foxtail millet., 1993, 8(Suppl.): 8-13. (in Chinese)
[9] 那海智, 吳秀蘭, 趙鐵男. 試論谷子粗蛋白質(zhì)、粗脂肪含量與物候期的相關(guān)關(guān)系. 黑龍江農(nóng)業(yè)科學(xué), 1982(4). 14-16.
Na H Z, Wu X L, Zhao T N. Study on the relationship between the contents of crude protein and crude fat and the phenological phase., 1982(4): 14-16. (in Chinese)
[10] 王海崗, 賈冠清, 智慧, 溫琪汾, 董俊麗, 陳凌, 王君杰, 曹曉寧, 劉思辰, 王綸, 喬治軍, 刁現(xiàn)民. 谷子核心種質(zhì)表型遺傳多樣性分析及綜合評(píng)價(jià). 作物學(xué)報(bào), 2016, 42(1): 19-30.
Wang H G, Jia G Q, Zhi H, Wen Q F, Dong J L, Chen L, Wang J J, Cao X N, Liu S C, Wang L, Qiao Z J, Diao X M. Phenotypic diversity evaluations of foxtail millet core collections., 2016, 42(1): 19-30. (in Chinese)
[11] 劉三才, 朱志華, 李為喜, 劉方, 李燕, 黃蓉. 谷子品種資源微量元素硒和蛋白質(zhì)含量的測(cè)定與評(píng)價(jià). 中國(guó)農(nóng)業(yè)科學(xué), 2009,42(11): 3812-3818.
Liu S C, Zhu Z H, Li W X, Liu F, Li Y, Huang R. Evaluation of selenium and protein content of foxtail millet landraces originated from different ecological regions of China., 2009, 42(11): 3812-3818. (in Chinese)
[12] 劉敏軒, 陸平. 中國(guó)谷子育成品種維生素E含量分布規(guī)律及其與主要農(nóng)藝性狀和類(lèi)胡蘿卜素的相關(guān)性分析. 作物學(xué)報(bào), 2013, 39(3): 398-408.
Liu M X, Lu P. Distribution of vitamin E content and its correlation with agronomic trait sand carotenoids content in foxtail millet varieties in china. China., 2013, 39(3): 398-408. (in Chinese)
[13] 曹永生, 方溈. 國(guó)家農(nóng)作物種質(zhì)資源平臺(tái)的建立和應(yīng)用. 生物多樣性, 2010, 18(5): 454-460.
Cao Y S, Fang W. Establishment and application of national crop germplasm resources infrastructure in China.2010, 18(5): 454-460. (in Chinese)
[14] 王述民, 張宗文. 世界糧食和農(nóng)業(yè)植物遺傳資源保護(hù)與利用現(xiàn)狀. 植物遺傳資源學(xué)報(bào), 2011, 12(3): 325-338.
Wang S M, Zhang Z W. The state of the world's plant genetic resources for food and agriculture., 2011, 12(3): 325-338. (in Chinese)
[15] 司海平, 方溈, 唐鵬, 曹永生. 基于SOA的農(nóng)作物種質(zhì)資源調(diào)查信息系統(tǒng)研究. 植物遺傳資源學(xué)報(bào), 2010, 11(5): 517-521.
Si H P, Fang W, Tang P, Cao Y S. Research of crop germplasm resources investigation information system based on SOA., 2010, 11(5): 517-521. (in Chinese)
[16] 陸平. 谷子種質(zhì)資源描述規(guī)范和數(shù)據(jù)標(biāo)準(zhǔn). 北京: 中國(guó)農(nóng)業(yè)出版社, 2006: 3.
Lu P.. Beijing: China Agriculture Press, 2006: 3. (in Chinese)
[17] 侯景儒, 黃競(jìng)先.地質(zhì)統(tǒng)計(jì)學(xué)及其在礦產(chǎn)儲(chǔ)量計(jì)算中的應(yīng)用. 北京: 地質(zhì)出版社, 1982.
Hou J R, Huang J X.. Beijing: Geological Press, 1982. (in Chinese)
[18] Krige D G. A statistical analysis of some of the borehole values in the Orange Free St ate gold field., 1952, 53: 47-64.
[19] Bor?vka L, Mládková L, Pení?ek V, Drábek O, Va?át R. Forest soil acidification assessment using principal component analysis and geostatistics., 2007, 140(4): 374-382.
[20] Goovaerts P. Geostatistical approaches for incorporating elevation into the spatial interpolation of rainfall., 2000, 228(1/2): 113-129.
[21] Oliver M A. Precision agriculture and geostatistics: how to manage agriculture more exactly., 2013, 10(2): 17-22.
[22] Castrignanò A, Landrum C, Benedetto D D, Poljak M. Delineation of management zones in precision agriculture by integration of proximal sensing with multivariate geostatistics., 2015, 80(1): 39-45.
[23] 王虎, 許哲, 郭靜, 劉哲, 李紹明, 張曉東, 朱德海. 玉米品種多環(huán)境測(cè)試數(shù)據(jù)的空間插值分析. 玉米科學(xué), 2012, 20(6): 43-148.
Wang H, Xu Z, Guo J, Liu Z, Li S M, Zhang X D, Zhu D H. Spatial interpolation research of multi-environment trials data for maize., 2012, 20(6): 143-148. (in Chinese)
[24] Künzli N, Jerrett M, Mack W J, Beckerman B, Labree L, Gilliland F. Ambient air pollution and atherosclerosis in los angeles., 2005, 113(2): 201-206.
[25] Jonathan P, Ewans K. Statistical modelling of extreme ocean environments for marine design: A review., 2013, 62(2): 91-109.
[26] 沈立宏, 張超, 桑玲玲, 陳亞婷, 張曉東, 楊建宇, 朱德海, 鄖文聚. 利用網(wǎng)格法確定縣域農(nóng)田整治優(yōu)先度. 農(nóng)業(yè)工程學(xué)報(bào), 2012, 28(18): 241-247.
Shen L H, Zhang C, Sang L L, Chen Y T, Zhang X D, Yang J Y, Zhu D H, Yun W J. Determination of consolidation priority for farmland at county level using grid method., 2012, 28(18): 241-247. (in Chinese)
[27] 李德仁, 賓洪超, 邵振峰. 國(guó)土資源網(wǎng)格化管理與服務(wù)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn). 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版), 2008, 33(1): 1-6.
Li D R, Bin H C, Shao Z F. Design and Implementation of Land and Resources Grid Management and Service System., 2008, 33(1): 1-6. (in Chinese)
[28] 陳述彭, 陳星. 地球信息科學(xué)的理解與實(shí)踐. 地球信息科學(xué), 2004, 6(1): 4-10.
Chen S P, Chen X. The cognition and practice of geo-information science., 2004, 6(1): 4-10. (in Chinese)
[29] 李東輝, 王堯琴. 粟的品質(zhì)改良. 作物雜志, 1986, 1(3): 4-6.
Li D H, Wang Y Q. Quality improvement of foxtail millet., 1986, 1(3): 4-6. (in Chinese)
[30] 王玉文, 李會(huì)霞, 田崗, 王高鴻. 我國(guó)小米品質(zhì)研究進(jìn)展及其改良設(shè)想. 中國(guó)農(nóng)學(xué)通報(bào), 2001, 17(5): 49-51.
Wang Y W, Li H X, Tian G, Wang G H. Research progress and improvement assumption of quality of foxtail millet in China., 2001, 17(5): 49-51. (in Chinese)
[31] 楊春, 田志芳, 盧健鳴, 楊秀麗, 丁衛(wèi)英. 小米蛋白質(zhì)研究進(jìn)展. 中國(guó)糧油學(xué)報(bào), 2010, 25(8): 123-128.
Yang C, Tian Z F, Lu J M, Yang X L, Ding W Y. Research progress on millet protein., 2010, 25(8): 123-128. (in Chinese)
(責(zé)任編輯 李莉)
A Spatial partition Statistical Analysis for quality and agronomic traits of foxtail millet germplasm resources
CHEN Yanqing, CAO Yongsheng, CHEN Lina, FANG Wei
(Institute of Crop Science, Chinese Academy of Agricultural Sciences, Beijing 100081)
【Objective】 The objective of this paper is to analyze the spatial distribution characteristics of related agronomic traits and quality of millet germplasm resources in China, grasp the overall quality in spatial distribution, improve the macro cognition of millet resources and effective protection and utilization. 【Method】 From the point of view of geographical space, the methods of spatial interpolation and spatial clustering were used to study the spatial distribution rules of the related traits of foxtail millet resources. Firstly, spatial interpolation was made for target traits of foxtail millet resources, partition statistics method was used to analyze national grid and interpolation data and the optimized hot spot analysis method was used to get the spatial partition data. Finally, the high value, random value and low value spatial distribution of foxtail millet related traits were found. 【Result】 The results of the distribution of the foxtail millet resources in the country show that the average of crude protein content of foxtail millet resources is (13.98±1.23)%, the range is 10.47%-17.33%, the coefficient of variation is 8.80%. The average of crude fat content is (4.01±0.38)%, the range is 3.08%-5.47%, the coefficient of variation is 9.48%. The average of grain weight per plant is (10.39±4.13) g, the range is 1.65-29.30 g, the coefficient of variation is 39.75%. The average of growth period is (111.46±10.94) d, the range is 79.15-150.43 d, the coefficient of variation is 9.81%. From the aspect of the cluster distribution areas, the average values of crude protein content in low value area, random value area and high value area are (12.80±0.70) %, (13.98±0.39)% and (15.24±0.42)%, respectively, the amplitude of variations of the three areas, respectively, are 10.47%-14.90%, 12.72%-15.30% and 13.61%-17.33%, the variation coefficients of the three areas, respectively, are 5.47%, 2.79% and 2.76%. The average values of crude fat content in low value area, random value area and high value area are (3.69±0.13) %, (3.99±0.16) % and (4.41±0.26)%, respectively, the amplitude of variations of the three areas, respectively, are 3.11%-4.39%, 3.08%-4.48% and 3.57%-5.47%, the variation coefficients of the three areas, respectively, are 3.52%, 4.01% and 5.89%. The average values of grain weight per plant in low value area, random value area and high value area are (6.49±1.84) g, (10.51±1.49)g and (14.44±2.88)g, respectively, the amplitude of variations of the three areas, respectively, are 1.65-13.38 g, 5.42-16.54 g and 7.63-29.30 g, the variation coefficients of the three areas respectively are 23.73%, 14.18% and 19.94%. The average values of growth period in low value area, random value area and high value area are (99.58±6.64)d, (111.89±2.99)d and (121.17±6.04)d, respectively, the amplitude of variations of the three areas, respectively, are 79.15-116.81d, 99.53-124.44 d and 108.34-150.43 d, the variation coefficients of the three areas respectively are6.67%, 2.67% and 4.98%. 【Conclusion】The internal differences in the high value regions of crude protein content are the minimum and these regions are mainly concentrated in Xinjiang and the northeast of Heilongjiang province. The internal differences of the low value regions are the maximum and they are mainly distributed in the central and Eastern zones. Random value regions are mainly distributed in the areas which located between high value and low value regions. The distribution of crude protein content shows an increasing trend in the two sides. On the contrary, the high value regions of crude fat content own the maximum internal differences, which are mainly concentrated in central zones of China, the low value regions’ internal differences are the minimum, which are mainly distributed in Xinjiang and the northeast of China. The distribution of crude fat content shows a decreasing trend in the two sides and the regions are relatively not regular. The internal differences in random value areas of grain weight per plant are the minimum, and the high value areas are the maximum. Ningxia, Shanxi, Shaanxi and other places belong to the high value areas of grain weight per plant, Heilongjiang, Zhejiang, northern Inner Mongolia, southern Anhui and southwestern parts belong to the low value areas. The internal differences in random value areas of growth period are the minimum, and the low value areas are the maximum. The growth period of foxtail millet in Northeast China, northwest and southwest Henan is relatively long, and Shandong, Hebei and other areas where summer foxtail millet is planted, belong to the short growth period regions.
foxtail millet; germplasm resources; target traits; spatial interpolation; spatial distribution
2016-12-23;接受日期:2017-04-21
國(guó)家農(nóng)作物種質(zhì)資源平臺(tái)(NICGR2016)、農(nóng)作物種質(zhì)資源保護(hù)與利用專項(xiàng)(2016NWB036-10)
陳彥清,Tel:010-62186693;E-mail:chenyanqing@caas.cn。通信作者方溈,Tel:010-62186693;E-mail:fangwei@caas.cn