陸國泉,彭 琳
(云南農(nóng)業(yè)大學(xué)/云南省高校農(nóng)業(yè)信息技術(shù)重點(diǎn)實(shí)驗(yàn)室,云南昆明 650201)
自然界植物資源極其豐富,其中在《中國植物志》中記載的植物就達(dá)31 142種[1]。即使是一個(gè)資深的植物學(xué)專家也不可能鑒別出所有的植物,植物知識(shí)也往往存在著存放分散、不易檢索等特點(diǎn),且經(jīng)典分類學(xué)后繼乏人,相關(guān)的計(jì)算機(jī)應(yīng)用也處于較低的水平[2]。因此,植物鑒別對(duì)植物知識(shí)的快速檢索具有重要意義。當(dāng)下研究人員主要采用以下方法進(jìn)行植物鑒別:人工鑒別法、人工輔助法(光譜法、色譜法、質(zhì)譜法)及基于計(jì)算機(jī)圖像識(shí)別的方法。人工鑒別法往往需要植物領(lǐng)域知識(shí)的支持,對(duì)研究人員的素質(zhì)要求非常高,因此適用面較狹窄;人工輔助法則須要進(jìn)行大量的樣品采集、標(biāo)本制作和較長(zhǎng)時(shí)間的觀測(cè),因此工作效率較低;基于計(jì)算機(jī)圖像識(shí)別的植物鑒別法大多選擇葉片作為鑒別依據(jù),且不適用于葉部特征不明顯的植物,目前的應(yīng)用水平較低[3]。基于傳統(tǒng)的形態(tài)學(xué)和統(tǒng)計(jì)數(shù)學(xué)形成了數(shù)量分類學(xué)[4],并利用該方法先后實(shí)現(xiàn)了繁縷屬的分類[5]、金銀花的選育[6]、山羊豆族植物的分類[7]以及中國傳統(tǒng)大菊品種的分級(jí)[8]。雖然基于數(shù)量的植物分類在多個(gè)方面實(shí)現(xiàn)了應(yīng)用,但大多適用于少數(shù)品種的精確分類,不具普適性,且在計(jì)算機(jī)應(yīng)用中的研究較少,尤其是將其作為信息檢索的依據(jù)。本研究首先使用正態(tài)云模型計(jì)算出植物各個(gè)形態(tài)的隸屬度,接著使用灰色關(guān)聯(lián)分析對(duì)植物進(jìn)行綜合評(píng)價(jià),最后根據(jù)綜合評(píng)分鑒別出植物的屬種信息。
本研究的植物知識(shí)來源于由中國科學(xué)院中國植物志編輯委員會(huì)歷時(shí)45年編撰而成的《中國植物志》,它是目前世界上最大型、種類最豐富的一部植物志,共收錄309科3 299屬維管植物[9]。由于該書采用數(shù)字的方式對(duì)植物進(jìn)行描述,且大多附有植物照片,因此極其適合用作文本的知識(shí)來源,同時(shí),該書中附帶的圖片也可以對(duì)結(jié)果進(jìn)行檢驗(yàn)。
根據(jù)科學(xué)性、可操作性、完備性、數(shù)據(jù)可獲性等原則[10]選取葉長(zhǎng)、葉寬、株高、葉柄長(zhǎng)及生境海拔作為評(píng)價(jià)指標(biāo)。由于植物具有一定的生長(zhǎng)周期,為了擴(kuò)大應(yīng)用范圍,本研究暫不選取花、果等形態(tài)特征作為評(píng)價(jià)指標(biāo);同時(shí),植物在生長(zhǎng)發(fā)育過程中,葉形也會(huì)不斷發(fā)生變化[11],因此也不考慮葉形作為評(píng)價(jià)指標(biāo)。
由于時(shí)間限制,暫時(shí)不考慮將《中國植物志》中3 229屬植物作為本研究的研究范圍,本研究結(jié)合客觀的需求選取云南省種子植物特有屬125屬共246種植物[12]作為本研究的研究范圍,旨在為云南地區(qū)植物保護(hù)研究提供便捷的方法。本研究采用區(qū)間的方式來描述植物的外形特征,以Ex1、Ex2分別表示植物外形特征數(shù)據(jù)的下限、上限,然而《中國植物志》對(duì)一些植物的外形描述并沒有采用區(qū)間的方式而是采用單個(gè)數(shù)值L來描述。因此,經(jīng)過對(duì)《中國植物志》的數(shù)值研究及植物領(lǐng)域?qū)<业慕ㄗh,對(duì)采用單個(gè)數(shù)值描述植物外形的區(qū)間統(tǒng)一設(shè)置為[L×(1-0.2),L×(1+0.2)]。對(duì)于無葉柄的植物,結(jié)合正態(tài)云模型的特點(diǎn)和實(shí)際應(yīng)用將無葉柄植物的葉柄長(zhǎng)的范圍統(tǒng)一設(shè)置為[0.000 1,0.000 7],實(shí)際測(cè)量的數(shù)字統(tǒng)一設(shè)置為0.000 4。對(duì)于爬藤類植物,默認(rèn)其株高的范圍為[0.000 1,0.000 7],同樣將實(shí)際測(cè)量的數(shù)字設(shè)置為0.000 4。此外,對(duì)于未注明生境海拔的植物,根據(jù)該植物的分布地區(qū)將其生境海拔設(shè)置為[Hmin,Hmax],其中,Hmin為該植物最低分布地區(qū)的海拔,Hmax為該植物最高分布地區(qū)的海拔。
本研究隨機(jī)選取10種植物作為研究實(shí)例,其中包含了同屬不同種及不同屬的情況,具體數(shù)據(jù)如表1所示。
表1 植物外形特征數(shù)據(jù)
注:Ex1、Ex2分別表示植物外形特征數(shù)據(jù)的下限、上限。
本研究測(cè)試的地膽旋蒴苣苔位于紅河州元陽縣境內(nèi)的小新街鄉(xiāng),其海拔為753 m。經(jīng)過外部測(cè)量,其葉長(zhǎng)為5.7 cm,葉寬為1.9 cm,由于不具葉柄,因此其葉柄長(zhǎng)為 0.000 4 cm,由于是藤類植物,因此其株高為0.000 4 cm。
1.4.2 植物隸屬度的計(jì)算 根據(jù)建立好的植物形態(tài)數(shù)據(jù)庫以及正態(tài)云模型,植物隸屬度計(jì)算步驟如下:
表2 植物外形特征的期望值及熵
表3 植物各個(gè)指標(biāo)的隸屬度
表4 1~9比率標(biāo)度的意義
表5 判斷矩陣
表6 各指標(biāo)的權(quán)值
步驟二:利用灰色關(guān)聯(lián)分析法進(jìn)行綜合評(píng)價(jià)?;疑到y(tǒng)理論是由鄧聚龍創(chuàng)立的一門學(xué)科,通過分析系統(tǒng)中各個(gè)因素的關(guān)聯(lián)程度來對(duì)事物進(jìn)行綜合評(píng)價(jià)[26]。本研究定義Xi(i≥1)為每種植物的各個(gè)指標(biāo)的隸屬度向量,通過比較排序?qū)0={0.782 7,0.637 6,1.000 0,1.000 0,0.850 4}定義為參考向量,然后計(jì)算出每種植物的各指標(biāo)差值|Xi-X0|,如表7所示。
表7 植物各指標(biāo)差值
表8 植物各個(gè)指標(biāo)的關(guān)聯(lián)系數(shù)
根據(jù)公式Ge(i)=Xi·We計(jì)算植物的等權(quán)關(guān)聯(lián)度,其中,We=(0.2,0.2,0.2,0.2,0.2)T;利用公式Gw=Xi·Ww計(jì)算植物的加權(quán)關(guān)聯(lián)度。由表9可知,關(guān)聯(lián)度排名第1的植物名稱為地膽旋蒴苣苔,與實(shí)際結(jié)果相符。在加權(quán)關(guān)聯(lián)度中排名第2的植物為大花旋蒴苣苔,而在等權(quán)關(guān)聯(lián)度中排名第2的植物為鷺鷥草。根據(jù)《中國植物志》記載,大花旋蒴苣苔和地膽旋蒴苣苔為同屬不同種植物,表明使用層次分析法給各個(gè)指標(biāo)分配權(quán)值明顯提高了植物鑒別的準(zhǔn)確率。
由于不具備實(shí)地測(cè)量246種植物的條件,本研究設(shè)計(jì)了以下5組試驗(yàn):第1組測(cè)量值為Ex×(1-0.1);第2組測(cè)量值為Ex×(1+0.1);第3組測(cè)量值為Ex×(1-0.2);第4組測(cè)量值為Ex×(1+0.2);第5組測(cè)量值為Ex。定義準(zhǔn)確率為P=F/A,其中,F(xiàn)表示準(zhǔn)確鑒別出來的植物數(shù)量;A表示數(shù)據(jù)庫中所有植物的數(shù)量,即246種云南省種子植物特有屬。由表10可知,使用本研究的方法基本可以滿足植物鑒別的需求,只要鑒別人員掌握基本的植物知識(shí)便可以對(duì)植物進(jìn)行無損鑒別。
表9 植物各個(gè)指標(biāo)的關(guān)聯(lián)度及排序
表10 5組對(duì)照試驗(yàn)鑒別準(zhǔn)確率的測(cè)試結(jié)果
針對(duì)研究人員因不具備海量、完備的植物知識(shí)而不能識(shí)別每種植物的問題,本研究提出基于正態(tài)云模型的植物鑒別算法。該算法融合了植物數(shù)量分類思想,結(jié)合層次分析法和植物專家的意見對(duì)各指標(biāo)進(jìn)行權(quán)重分配,從而考慮了各個(gè)因素對(duì)植物鑒別不同的影響程度,最后使用灰色關(guān)聯(lián)分析法對(duì)植物的隸屬度進(jìn)行綜合評(píng)價(jià)。結(jié)果表明,在鑒別云南省種子植物特有屬試驗(yàn)中本研究的方法有效、可行。由于《中國植物志》是由80多個(gè)科研單位共計(jì)312位植物專家編撰而成,加之植物本身形態(tài)各異,導(dǎo)致一小部分植物的信息不完整,因此數(shù)據(jù)無法被錄入植物外部形態(tài)特征數(shù)據(jù)庫。同時(shí),為了使本研究方法的通用性更強(qiáng),本研究采用5個(gè)最基本的形態(tài)特征作為植物鑒別的指標(biāo)。在以后的研究中,將聯(lián)合植物專家進(jìn)一步完善植物外部的形態(tài)數(shù)據(jù),采用更多的指標(biāo),從而提高植物鑒別的準(zhǔn)確率,同時(shí)也會(huì)將本研究的方法引入到植物領(lǐng)域的信息檢索研究中。
[1]中國科學(xué)院中國植物志編輯委員會(huì).中國植物志[M].北京:科學(xué)出版社,2004.
[2]馬金雙.中國植物分類學(xué)的現(xiàn)狀與挑戰(zhàn)[J].科學(xué)通報(bào),2014,59(6):510-521.
[3]陳永富,劉 華,陳 巧.植物鑒別方法研究現(xiàn)狀與展望[J].世界林業(yè)研究,2014,27(4):18-23.
[4]張明理.植物數(shù)量分類學(xué)的流行方法[J].西北植物學(xué)報(bào),1986,6(1):67-80.
[5]陳旭波,孟世勇,張小飛,等.石竹科繁縷屬與孩兒參屬的數(shù)量分類[J].植物學(xué)報(bào),2014,49(4):432-439.
[6]張山山,黃璐琦,袁 媛,等.栽培金銀花農(nóng)藝性狀的數(shù)量分類學(xué)研究[J].中國中藥雜志,2014,39(8):1379-1385.
[7]史傳奇,劉 玫,王 臣.東北豆科山羊豆族4屬植物葉形態(tài)特征及數(shù)量分類學(xué)研究[J].草業(yè)學(xué)報(bào),2015,24(5):182-189.
[8]雒新艷,宋雪彬,戴思蘭.中國傳統(tǒng)大菊品種數(shù)量性狀變異及其概率分級(jí)[J].北京林業(yè)大學(xué)學(xué)報(bào),2016,38(1):101-111.
[9]駱 洋,何延彪,李德銖,等.中國植物志、Flora of China和維管植物新系統(tǒng)中科的比較[J].植物分類與資源學(xué)報(bào),2012,34(3):231-238.
[10]高明美,孫 濤,趙天燕,等.正態(tài)云模型在皖江地區(qū)土地生態(tài)安全評(píng)價(jià)中的應(yīng)用[J].湖南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,41(2):196-201.
[11]黃文娟,李志軍,楊趙平,等.胡楊異形葉結(jié)構(gòu)型性狀及其相互關(guān)系[J].生態(tài)學(xué)報(bào),2010,30(17):4636-4642.
[12]馮建孟,朱有勇.云南地區(qū)中國種子植物特有屬的研究[J].生態(tài)環(huán)境學(xué)報(bào),2010,19(3):621-625.
[13]李德毅,劉常昱.論正態(tài)云模型的普適性[J].中國工程科學(xué),2004,6(8):28-34.
[14]劉常昱,李德毅,潘莉莉.基于云模型的不確定性知識(shí)表示[J].計(jì)算機(jī)工程與應(yīng)用,2004,40(2):32-35.
[15]王迎超,靖洪文,張 強(qiáng),等.基于正態(tài)云模型的深埋地下工程巖爆烈度分級(jí)預(yù)測(cè)研究[J].巖土力學(xué),2015,36(4):1189-1194.
[16]楊朝暉,李德毅.二維云模型及其在預(yù)測(cè)中的應(yīng)用[J].計(jì)算機(jī)學(xué)報(bào),1998,21(11):961-969.
[17]張 楊,嚴(yán)金明,江 平,等.基于正態(tài)云模型的湖北省土地資源生態(tài)安全評(píng)價(jià)[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29(22):252-258.
[18]李 陶,李付偉,李向新,等.地震災(zāi)害風(fēng)險(xiǎn)的正態(tài)云模型綜合評(píng)價(jià)——以畢節(jié)市為例[J].中國安全科學(xué)學(xué)報(bào),2015,25(10):166-171.
[19]Saaty T L.How to make a decision:the analytic hierarchy process[J].European Journal of Operational Research,1990,48(1):9-26.
[20]莊 倩.基于AHP的江蘇省高標(biāo)準(zhǔn)農(nóng)田綜合生產(chǎn)能力評(píng)價(jià)[J].江蘇農(nóng)業(yè)科學(xué),2016,44(6):511-515.
[21]焦 藝,劉 璇,畢金峰,等.基于灰色關(guān)聯(lián)度和層次分析法的油桃果汁品質(zhì)評(píng)價(jià)[J].中國食品學(xué)報(bào),2014,14(12):154-163.
[22]王 青,戴思蘭,何 晶,等.灰色關(guān)聯(lián)法和層次分析法在盆栽多頭小菊株系選擇中的應(yīng)用[J].中國農(nóng)業(yè)科學(xué),2012,45(17):3653-3660.
[23]楊天天,潘曉星,穆立薔.基于葉片圖像特征數(shù)字化信息識(shí)別7種柳屬植物[J].東北林業(yè)大學(xué)學(xué)報(bào),2014,42(12):75-79.
[24]王麗君,淮永建,彭月橙.基于葉片圖像多特征融合的觀葉植物種類識(shí)別[J].北京林業(yè)大學(xué)學(xué)報(bào),2015,37(1):55-61.
[25]Satty T L.A scaling method for priorities in structure[J].Journal of Mathematical Psychology,1978,1(1):57-68.
[26]鄧聚龍.灰色系統(tǒng)基本方法[M].武漢:華中科技大學(xué)出版社,2001:17-30.