• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      雉雞亞種種群的圖像識別研究

      2021-05-06 03:10:04屈軍樂
      野生動物學(xué)報 2021年2期
      關(guān)鍵詞:雉雞羽色亞種

      王 彪 王 筠 屈軍樂

      (1.深圳大學(xué)生命與海洋科學(xué)學(xué)院,深圳,518060;2.深圳大學(xué)光電工程學(xué)院,光電子器件與系統(tǒng)重點實驗室,深圳,518060)

      雉雞(Phasianuscolchicus),頸部下方有一圈顯著白色環(huán)紋,為我國雉科(Phasianidae)中分布最廣的鳥類。目前已確定多達(dá)31個亞種,一些亞種從表型與遺傳上已適應(yīng)于不同的地理區(qū)域(例如:寒帶、熱帶、干旱區(qū)、高原等),從而形成了各具特色的獨特群體[1]。群體間的差異可能是自然選擇、配偶選擇、群體歷史遷移等共同的影響[2-4]。近年來,動物學(xué)家通過形態(tài)分類和分子生物學(xué)手段對雉雞亞種的種群類型進(jìn)行了較為深入的研究[5-6]。例如:Qu等[7]以線粒體DNA(mtDNA)控制區(qū)基因1 079 bp堿基序列為遺傳標(biāo)記,研究了中國雉雞28個群體的分子生態(tài)(將我國雉雞群體分成3個進(jìn)化支(clade),與依形態(tài)上劃分的“白翅組、準(zhǔn)噶爾組、灰腰組”對應(yīng)[8])。Liu等擴大了取樣的范圍,對全國13個亞種58個采樣點的483個雉雞樣本進(jìn)行了線粒體DNA控制區(qū)和細(xì)胞色素b共1 625 bp的序列進(jìn)行了分析,將全國的雉雞分為7個主要進(jìn)化支,發(fā)現(xiàn)隨著適宜的棲息地的擴大,雉雞群體適應(yīng)性產(chǎn)生的差異也在各亞種之間的形態(tài)上有所體現(xiàn)[9-11]。Kayvanfar等的研究確認(rèn)了elegans亞種的分布范圍在中國云南西北部,在所研究的17個亞種中處于基礎(chǔ)地位,并且驗證了雉雞可能起源于中國東南部森林的假設(shè)[12-13]。

      雉雞的亞種種群具有分布范圍廣、群體數(shù)量大、擴散能力弱等特點,在漫長的進(jìn)化歷史中,形成了形色各異的亞種羽色圖案形態(tài)。通過對雉雞亞種羽色形態(tài)進(jìn)行研究,能夠更精準(zhǔn)地對其進(jìn)行亞種分類,基于宏觀形態(tài)的類別又可以與微觀分子的進(jìn)化進(jìn)行比較分析,即可揭示種群遺傳格局和歷史動態(tài),并能從另一角度理解自然選擇、種群歷史等對于雉雞遺傳格局及演化的不同影響[14-16]。同時,基于形態(tài)學(xué)的詳細(xì)分析可為基因與形態(tài)的關(guān)聯(lián)研究(genome-wide association study)提供更多的有用信息[3,17-19]。

      雉雞亞種羽色形態(tài)觀察大多通過動物學(xué)家人眼進(jìn)行,但有經(jīng)驗的動物識別專家往往需要多年的經(jīng)驗積累。對于雉雞這樣分布廣、數(shù)量大、亞種形態(tài)復(fù)雜易混的物種來說,識別準(zhǔn)確難以實現(xiàn)。隨著數(shù)碼相機等觀察設(shè)備的更新?lián)Q代,可以運用圖像數(shù)字化的技術(shù)對光線、角度、環(huán)境干擾等多種復(fù)雜因素的進(jìn)行修正,明顯提高了野外采集雉雞羽色形態(tài)的圖像質(zhì)量。通過實驗室計算機圖形的后期數(shù)字化分析,可以幫助更好地識別雉雞亞種,對物種鑒定進(jìn)行輔佐糾偏。

      實現(xiàn)數(shù)字圖形識別的前提是通過特征提取,將雉雞圖像區(qū)域與背景區(qū)分出來。因此,需要建立雉雞羽色數(shù)據(jù)庫,應(yīng)用已有的信息進(jìn)行輔助提取。另一方面,羽毛的樣式和顏色受遺傳與環(huán)境交互影響,是一些具有獨特紋理的圖案和一些不可描述的特征組合。圖像數(shù)字化處理:(1)基于像素的分割:利用像素外觀作為像素分配標(biāo)簽;(2)基于區(qū)域的分割:主要通過尋找圖像之間的邊界來將圖像分割成區(qū)域;(3)基于圖像標(biāo)記的分割:被定義于全局能量函數(shù),但精準(zhǔn)度取決于外觀和圖像梯度的識別[20-21]。特征提取后,需要用數(shù)字分類方法對圖像進(jìn)行解析,這是一種基于模板匹配的動物圖像監(jiān)測模型,并可通過基于顏色特征的支持向量機(support vector machine,SVM)對雉雞的分類特征進(jìn)行聚類與描述。其中,K近鄰分類算法(K-nearest neighbor)、概率神經(jīng)網(wǎng)路(probabilistic neural network)和符號分類器(symbolic classifier)是最有效的3種算法[22-26]。本研究通過以上3種算法,對大英博物館提供的25個雉雞亞種的標(biāo)準(zhǔn)圖片進(jìn)行識別,探索數(shù)字識別在雉雞亞種鑒定中的可能性。

      1 材料與方法

      本研究的雉雞亞種外觀性狀圖像取自大英博物館館藏標(biāo)本,共25個亞種,每個亞種2張不同角度的全身數(shù)碼圖片(圖1)。對圖片的處理包含圖像切割、特征提取、特征分析與聚類3個步驟。

      1.1 圖像分割

      首先通過TernausNet對圖形微切分割出色彩微格,并將其灰白化[27](圖2)。對于原始分割進(jìn)行賦值、合并、再切割。在分割中,圖像的中心區(qū)域被稱為目標(biāo)標(biāo)記區(qū)域,圖像的邊界稱為背景標(biāo)記區(qū)域。對數(shù)值矩陣進(jìn)行標(biāo)記:標(biāo)記對象區(qū)域、標(biāo)記背景區(qū)域和非標(biāo)記區(qū)域[28]。提取對象輪廓及非標(biāo)記區(qū)域被分配給對象區(qū)域或背景區(qū)域。

      1.2 特征提取

      利用Gabor函數(shù)的濾波器微格對數(shù)字圖像模式進(jìn)行分析,將有效表征的重復(fù)結(jié)構(gòu)進(jìn)行歸納,在空間域和頻率域的聯(lián)合不確定性之間進(jìn)行折中[29]?;陬l率分析的數(shù)學(xué)特性通過Gabor函數(shù)來進(jìn)行描述,將空間和頻率聯(lián)合的不確定性最小化。微格分析通過應(yīng)用同一組尺度和方向選擇性的Gabor來完成的[30]。對圖像的過濾所應(yīng)用的二維Gabor函數(shù)G(x;y)及其傅立葉變換G(u;v)可以寫成:

      式中:波長(λ):以像素為單位指定,大于等于2,不大于輸入圖像尺寸的五分之一;方向(θ):Gabor函數(shù)并行條紋的方向,取值為0到360°;相位偏移(φ):取值范圍-180°到180°,分別對應(yīng)中心對稱的center-on函數(shù)和center-off函數(shù);長寬比(γ):空間縱橫比,Gabor函數(shù)形狀的橢圓率。操作程序可在github.com/mhaghighat/gabor獲取。

      1.3 特征分析與聚類

      通過檢測重要特征來減少數(shù)據(jù)的維度,每個雉雞圖像所使用的特征選擇算法分為兩類:(1)過濾法:通過矩陣評估和選擇特征子集的數(shù)據(jù)特征,需要濾波器用作圖像預(yù)處理步驟;(2)包含法:使用機器學(xué)習(xí)算法的性能來評估每個算法候選特征子集,尋找最優(yōu)化學(xué)習(xí)的特征算法。

      聚類方式包括:

      K近鄰分類算法是基于“最近距離(nearest neighbor)”的算法,通過R語言中的yalmpute程序包實現(xiàn)[31-33]。K近鄰分類算法采用向量形式測試樣本特征,找到每個訓(xùn)練示例的向量的歐氏距離,作為最近距離。隨后,將標(biāo)簽分配在測試樣本上,利用“平滑”假設(shè),歸類聚合相同的微格模塊。

      概率神經(jīng)網(wǎng)路是3層結(jié)構(gòu)的前饋網(wǎng)絡(luò),來自貝葉斯決策網(wǎng)絡(luò)(Bayesian network),通過R語言中的PNN程序?qū)崿F(xiàn)(https://github.com/chasset/pnn)。它基于訓(xùn)練樣本的概率密度函數(shù),使用相似的概率密度函數(shù),針對每個測試向量單獨進(jìn)行計算[34])。在輸入到網(wǎng)絡(luò)之前對向量進(jìn)行同一化。隱含層每個分類含一個節(jié)點,輸出層具有用于每個模式分類的節(jié)點。

      符號分類器使用提取的Gabor特征作為雉雞樣本的符號表示[35-36],通過R語言中的symbolicDA程序?qū)崿F(xiàn)(http://keii.ue.wroc.pl/symbolicDA)。由于雉雞羽毛的特征在每個亞組中具有的類內(nèi)差異較小,區(qū)分這些變化較困難。因此使用非常規(guī)數(shù)據(jù)處理,能夠更有效地區(qū)分并保存數(shù)據(jù)之間的差異?;谙笳魈卣鞯乃惴ㄟm應(yīng)于捕捉變化區(qū)間值的特征向量。

      2 結(jié)果

      雉雞亞種圖像識別結(jié)果顯示了分割與特征提取的性能和效率,此步驟結(jié)果可直接影響到后面的聚類分析。在提取時,不同的種群呈現(xiàn)出不平衡的數(shù)據(jù)集。檢測的雉雞5大亞種類群,包括:黑頸雉雞(Phasianuscolchicuscolchicus)、橄欖腰雉雞(Phasianuscolchicustarimensis)、灰腰雉雞(Phasianuscolchicushagenbecki)、準(zhǔn)格爾雉雞(Phasianuscolchicusmongolicus)和白翅雉雞(Phasianuscolchicuschrysomelas)(圖3)。總的來說,所有模型取得的識別效果并不好,主要在于雉雞的羽色過于接近。其中灰腰雉雞的利用概率神經(jīng)網(wǎng)路(PNN)的識別精度最高,為62.3%。而橄欖腰雉雞和白翅雉雞則分別利用K近鄰分類算法(KNN)和概率神經(jīng)網(wǎng)路(PNN)所獲得的識別度最低,僅有20.5%。

      對完整雉雞圖像數(shù)據(jù)集的識別包含5大亞種集群一共25個亞種,但來自各大集群的亞種數(shù)目并不平衡,本研究依然采納所有亞種圖像進(jìn)行分析驗證。結(jié)果表明雉雞在大的亞種類群中識別度較高。依然是概率神經(jīng)網(wǎng)路取得了最好的效果,識別性能從19.2%到60.4%。最簡單的模型K近鄰分類算法性能較低。模型符號分類器也顯示了較好的結(jié)果。

      本研究對圖像切割后的灰度微格的識別效率,繼而運用序列前向選擇法、序列后向選擇法、序列浮動前向選擇法和序列浮動后向選擇法等算法,對差異紋理特征進(jìn)行提取和聚類,并進(jìn)行了多重組合驗證[37]。這種驗證技術(shù)僅適用于K近鄰分類算法、概率神經(jīng)網(wǎng)路和符號分類器的基礎(chǔ)構(gòu)架設(shè)計。其模型具有預(yù)先訓(xùn)練的權(quán)值,本研究的實驗結(jié)果顯示了完整的驗證結(jié)果。在數(shù)據(jù)模擬進(jìn)行到40%時,數(shù)值就已趨于穩(wěn)定,平均值穩(wěn)定為(70.8±4.5),驗證了識別結(jié)果的可靠性。

      在對雉雞亞種圖像識別的進(jìn)一步驗證中,本研究將所有亞種圖片共50張對應(yīng)的主要亞種類群進(jìn)行比對,5個亞種類別為:黑頸雉雞、橄欖腰雉雞、灰腰雉雞、準(zhǔn)格爾雉雞和白翅雉雞。在只考慮不平衡數(shù)據(jù)集的驗證中,每一類的所有圖像樣本被拆分為2組:預(yù)測亞種類群與目標(biāo)亞種類群(表2)。同時,類群的判別應(yīng)用了3種聚類模型。如果有2個以上判定為同一種,可認(rèn)定為這一種。結(jié)果證明,本研究并沒有3個模型判定為3個不同類群的情況,因此50個實驗圖像都被歸集到相應(yīng)的群組之中。其中,3個模型判定完全一致的占52.5%。通過這個3模型聯(lián)合驗證法,雉雞亞群的平均識別率已經(jīng)達(dá)到了70%,最低的(即對于橄欖腰雉雞的識別)也在60%。

      表1 圖像識別聚類的交叉驗證率

      表2 3種模型綜合使用的圖片識別驗證

      3 分析與討論

      本研究測試了通過羽毛圖案對雉雞亞種類群進(jìn)行識別的計算方法,主要依托K近鄰分類(KNN)、概率神經(jīng)網(wǎng)路(PNN)和符號分類器3大函數(shù)。利用最大區(qū)域合并分割雉雞圖像,從分割圖像中提取Gabor特征,判別Gabor特征,然后使用3大算法進(jìn)行特征選擇。對于所提出的方法的有效性,我們也進(jìn)行了不同維度的驗證,包括對能采集到圖像資料的所有亞種(共25種)進(jìn)行了分析,并在交叉驗證中混入來自圖冊或野外工作采集的圖片。同時,考慮了不同大小的亞種數(shù)據(jù)庫的差異,研究了非平衡狀況下效果分類的精度。實驗結(jié)果表明,概率神經(jīng)網(wǎng)路(PNN)優(yōu)于其他個體特征。

      通過數(shù)字模型對雉雞亞種種群進(jìn)行圖像識別證實了目前數(shù)字分類的難度。同時,通過比較可以清楚地發(fā)現(xiàn)概率神經(jīng)網(wǎng)路(PNN)模型可以被較好地應(yīng)用到圖片識別數(shù)據(jù)集之中。此外,K近鄰分類算法(KNN)的算法架構(gòu)最為簡單,分類結(jié)果對于某些類群也顯示了良好的效果。而用符號分類器實現(xiàn)高性能,對圖像數(shù)字矩陣模型的平衡性有較高要求。對于雉雞羽色的識別,圖3顯示平衡數(shù)據(jù)集的性能結(jié)果并沒有其他2種算法表現(xiàn)好。本研究結(jié)果還顯示,對于25種亞群群體的圖像識別與人臉識別相比都有不同程度的性能退化,這可能是雉雞初始樣品集圖像大數(shù)據(jù)欠缺的原因。而分析過程中,初始樣本的分類結(jié)果也確認(rèn)了本研究分析流程的可靠性,因而表明為未來研究需求還應(yīng)采集更大量和高精度的樣本圖像。

      在特定雉雞類群的識別方面,對于準(zhǔn)格爾雉雞,3種算法K近鄰分類、概率神經(jīng)網(wǎng)路和符號分類器顯示出非常接近的性能,這可能是由于準(zhǔn)格爾雉雞在羽毛外觀形態(tài)上和其他幾類亞種類型的重疊度最高。在其他幾個亞種類群中,灰腰雉雞擁有反差最大的羽色特征,這也是造成在概率神經(jīng)網(wǎng)路算法下,獲得最高識別度的原因。白翅雉雞在3種算法下的效率都不好,主要因為白色區(qū)域的識別度較差。而在實際野外采樣中,采集到的自然界的樣本可能更難形成被模型高效識別的數(shù)據(jù)集。

      通過圖像識別聚類的交叉驗證,可以推斷出序列浮動后向選擇法的模型精度較低,而與訓(xùn)練相比新數(shù)據(jù)集的序列前向選擇法可取得更好的驗證結(jié)果。因為K近鄰分類算法呈現(xiàn)了從61.7%到79.2%的變化范圍,表明結(jié)果可能出現(xiàn)了過度擬合。最重要的微格數(shù)值矩陣帶來了計算成本的極大不確定性,也是在實際應(yīng)用中需要考慮到的。

      4 結(jié)論

      本研究通過計算機圖像識別對羽色圖案各異的雉雞亞種類群實現(xiàn)自動化分類。雖然現(xiàn)在的識別效率還不夠精準(zhǔn),優(yōu)化后的模型也只能對5個亞種大類進(jìn)行識別,且成功率只有大約70%,但這對于野外物種的標(biāo)準(zhǔn)化采集與識別是一次重要的嘗試。系統(tǒng)性的數(shù)字識別會降低野外觀測的偏差,同時數(shù)字化提取出的信息也可以作為系統(tǒng)進(jìn)化分析的重要原始數(shù)據(jù)。目前識別效率較低主要原因有:第一,目前用于優(yōu)化模型的雉雞羽色形態(tài)的初始數(shù)據(jù)量仍不足。隨著對于雉雞的深入研究,以及有意識的采集高質(zhì)量的圖片,一定會有更多的原始圖像數(shù)據(jù)積累。第二,數(shù)碼攝影的硬件局限,雖然現(xiàn)代的照相設(shè)備已經(jīng)能達(dá)到很高的像素質(zhì)量,但光線處理問題仍還存在瓶頸,有待于攝影硬件的技術(shù)突破。第三,本研究采用灰度微格進(jìn)行分析,制約了顏色數(shù)字矩陣的轉(zhuǎn)換,一定程度上丟失了一些重要的形態(tài)信息,需要進(jìn)一步的技術(shù)改良。第四,本研究采用的數(shù)據(jù)模型并非嚴(yán)格意義上的人工智能算法。相信現(xiàn)代計算科學(xué)的快速發(fā)展,會帶來更加高效率的數(shù)值算法,使得更好的圖像識別成為可能。再伴有越來越多的大數(shù)據(jù)收集與儲存,計算機視覺的深度學(xué)習(xí)技術(shù)能力肯定能在不久的將來,使得此探索性研究的功能與成果得到顯著性提高。

      猜你喜歡
      雉雞羽色亞種
      A comprehensive review on the chemical constituents,sesquiterpenoid biosynthesis and biological activities of Sarcandra glabra
      亞沉茶漬亞洲亞種Lecanora subimmersa subsp. asiatica Zahlbr.的訂正研究
      雉雞肌纖維和肉質(zhì)性狀及其與ATIC、AMPD1和CAPN1 基因表達(dá)相關(guān)性分析
      盤羊新亞種
      ——和田盤羊
      不同羽色雞種ASIP基因SNP位點篩選及其生物信息學(xué)分析
      雉雞
      意林(2019年24期)2019-12-24 09:00:09
      番鴨羽色與產(chǎn)肉性狀的觀測研究
      戀歌
      大西洋鮭殺鮭氣單胞菌無色亞種的分離鑒定和致病性研究
      矮小型雞三種羽色類型體型性狀和產(chǎn)蛋性能的研究
      武定县| 嘉鱼县| 读书| 舟山市| 大港区| 兴山县| 河北省| 茌平县| 镇坪县| 克拉玛依市| 碌曲县| 仁怀市| 彭州市| 沁阳市| 福清市| 宣武区| 南川市| 华池县| 荔波县| 宁南县| 大渡口区| 璧山县| 沂水县| 闵行区| 尉犁县| 淮北市| 铜山县| 时尚| 兰坪| 永川市| 江安县| 汪清县| 中方县| 古交市| 习水县| 清流县| 烟台市| 太谷县| 宁阳县| 乌什县| 芜湖市|