劉 穎(吉林市北華大學(xué)信息技術(shù)與傳媒學(xué)院,吉林 吉林 132013)
基于模糊規(guī)則的土壤分類系統(tǒng)
劉 穎
(吉林市北華大學(xué)信息技術(shù)與傳媒學(xué)院,吉林 吉林 132013)
模糊分類系統(tǒng)一直被用于表示一個集合的分類知識,系統(tǒng)中包含分類知識的可讀規(guī)則和對規(guī)則的相關(guān)解釋。本文討論了如何構(gòu)建模糊分類規(guī)則,以及如何使用模糊分類規(guī)則來生成目標(biāo)土壤數(shù)據(jù)。在模糊分類系統(tǒng)設(shè)計中最重要的任務(wù)是從訓(xùn)練數(shù)據(jù)中找到一套模糊規(guī)則來處理一個特定的分類問題。在本文中,首先定義模糊系統(tǒng)隸屬度函數(shù),根據(jù)隸屬度函數(shù)確定土壤數(shù)據(jù)的輸入屬性類別,然后在生成初始模糊規(guī)則集的基礎(chǔ)上用函數(shù)計算土壤數(shù)據(jù)的屬性,最后合并這些模糊規(guī)則,產(chǎn)生最終的模糊規(guī)則集。
模糊分類系統(tǒng); 土壤分類; 隸屬函數(shù); 模糊規(guī)則
DOI:10.16640/j.cnki.37-1222/t.2016.16.173
模糊分類系統(tǒng)被廣泛認(rèn)為是一個較好用來表示分類知識的分類系統(tǒng),它具備可讀性和可解釋性的模糊規(guī)則庫[1]。模糊分類系統(tǒng)可以將傳統(tǒng)數(shù)據(jù)抽象為語言變量,利用模糊分類器,人們可以得到系統(tǒng)建議與結(jié)論。我們賴以生存的世界是模糊的,同時,絕對清晰的閾值是不存在的。因此,使用模糊規(guī)則顯得尤為直觀,指定模糊集有時比指定清晰的時間間隔更為容易[2]。模糊推理系統(tǒng)將“不知何故”處理的不確定性,在處理實際問題時要更為真實。模糊分類系統(tǒng)的模糊規(guī)則獲取方法主要包括兩種。一種是直接由專家直接給出;另一種是通過自主學(xué)習(xí)模糊分類系統(tǒng)自動產(chǎn)生的。近年來,越來越多學(xué)者將目光投向后一種方法,通過自主學(xué)習(xí)來產(chǎn)生模糊規(guī)則集解決問題實例。
近些年,土壤問題得到廣泛學(xué)者的關(guān)注。在對土壤進(jìn)行分類時,土壤特征具有重要的作用,土壤特征對土地利用和土地管理有著重要的意義。雖然在土壤分類過程中不可避免會丟失一些信息,但是土壤分類能有效地降低上述過程中數(shù)據(jù)信息的復(fù)雜度,這有助于我們了解土壤的主要特征。本文討論了土壤分類方法,提出一種基于模糊規(guī)則的土壤分類方法,新方法在對土壤分類時可以減少信息丟失并能根據(jù)已有數(shù)據(jù)準(zhǔn)確定位測試土壤的質(zhì)地。在本文中,我們使用三角隸屬函數(shù)的方法來定義隸屬函數(shù)的輸入屬性,提出了一種新方法來產(chǎn)生模糊規(guī)則,利用一組測試數(shù)據(jù)對分類系統(tǒng)進(jìn)行測試,測試結(jié)果驗證了系統(tǒng)的有效性。
土壤數(shù)據(jù)包含111個實例,每個實例由7個輸入屬性和一個輸出的屬性組成。為了能夠清楚地說明提出的模糊規(guī)則生成算法,我們選擇了指定情況下,每種類型的土壤數(shù)據(jù)輸出屬性。
傳統(tǒng)模糊分類系統(tǒng)中有許多類型的隸屬度函數(shù),最常用的隸屬函數(shù)三角形隸屬函數(shù)、梯形隸屬函數(shù)、高斯鐘形曲線隸屬函數(shù)和S形隸屬函數(shù)。在本文中,我們采用了三角形隸屬函數(shù)來描述數(shù)據(jù)特征。我們假定每個輸入屬性標(biāo)簽的數(shù)量是4個,它們分別是:ZE, PL, PM,PH。輸入的隸屬度函數(shù)屬性分別為:depth, Sand, Silt, Clay, Sandbysilt,Sandbyclay, Sandbysiltclay。
本文利用一組訓(xùn)練數(shù)據(jù),提出一種基于模糊規(guī)則的土壤分類系統(tǒng)算法。該算法分成四個步驟,詳細(xì)步驟如下:
步驟1:將訓(xùn)練數(shù)據(jù)中的每個訓(xùn)練樣本轉(zhuǎn)換為一條模糊規(guī)則,然后將新生成模糊規(guī)則放入初始規(guī)則集。
步驟2:對初始規(guī)則集進(jìn)行判斷,如果初始規(guī)則集為空,或者所有的模糊規(guī)則集的初始規(guī)則都已被采取,則算法停止;否則從初始規(guī)則集中采取一條模糊規(guī)則。
步驟3:如果一組已被采取的模糊規(guī)則是空的或者存在部分模糊規(guī)則有相同的輸出與特征,則合并模糊規(guī)則,即模糊規(guī)則的成員均不相同。否則進(jìn)入步驟4。
步驟4:將模糊規(guī)則與具備模糊規(guī)則相同輸出但是并沒有被采取的模糊規(guī)則合并;如果被合并模糊規(guī)則與原模糊規(guī)則具備相同特征,則合并后的模糊規(guī)則將取代原規(guī)則,跳轉(zhuǎn)至步驟2,否則轉(zhuǎn)到步驟3。
根據(jù)上述四個步驟產(chǎn)生最終模糊規(guī)則集。接下來,用測試數(shù)據(jù)驗證系統(tǒng)有效性。首先,我們導(dǎo)入測試數(shù)據(jù),然后將測試數(shù)據(jù)生成系統(tǒng)標(biāo)簽,最后測試分類系統(tǒng)是否包含明確規(guī)則集的模糊規(guī)則。
在本節(jié)中,我們使用C++語言程序設(shè)計進(jìn)行編程。首先定義隸屬函數(shù)的輸入屬性,再將每個訓(xùn)練數(shù)據(jù)都轉(zhuǎn)換成一個模糊規(guī)則,從初始訓(xùn)練數(shù)據(jù)中選擇訓(xùn)練數(shù)據(jù)(91.4,6.85,1.75,13.34,3.91,10.62)。其中,屬性深度值為0.17,我們映射值“0.17”為輸入屬性深度的隸屬函數(shù),并檢查與標(biāo)簽的隸屬關(guān)系,我們可以得到,它的隸屬度值為1。用同樣的方式,我們可以轉(zhuǎn)換((91.4,6.85,1.75,13.34,3.91,0.17,10.62),1)為(({ZE}, {PH}, {ZE}, {ZE},{ZE}, {PH},{PL}), 1)。重復(fù)上述步驟,我們可以將初始訓(xùn)練數(shù)據(jù)轉(zhuǎn)換為初始規(guī)則集:
接下來,我們用這些模糊規(guī)則來處理分類。我們使用的實例(37.15,0.73,18.25,44,2.07,0.41和0.6)的土壤數(shù)據(jù)作為測試數(shù)據(jù)來說明整個分類過程。首先,我們將這個測試數(shù)據(jù)進(jìn)行轉(zhuǎn)換,然后把這個轉(zhuǎn)換的數(shù)據(jù)再轉(zhuǎn)換成其相對的模糊規(guī)則,通過對比計算得出分類系統(tǒng)運(yùn)算時間與分類準(zhǔn)確率。
本文提出了一種基于模糊規(guī)則的土壤分類系統(tǒng),新算法首先將訓(xùn)練數(shù)據(jù)轉(zhuǎn)換成初始的模糊規(guī)則集,然后根據(jù)順序一個接一個合并那些最初產(chǎn)生的模糊規(guī)則,以減少模糊規(guī)則的數(shù)目。最后導(dǎo)入測試數(shù)據(jù),驗證系統(tǒng)有效性。新算法對以往算法進(jìn)行了修改,與原算法不同的是,新算法接受輸入屬性,并生成最后的規(guī)則,消除了需要生成初始規(guī)則和合并的初始規(guī)則,也消除了特征相似度較大的初始規(guī)則,仿真實驗表明該程序可以運(yùn)行接受輸入屬性任意數(shù)量的數(shù)據(jù),并能立即產(chǎn)生模糊規(guī)則的紋理類類型。雖然算法結(jié)果令人滿意,但是如何能夠簡化算法的復(fù)雜程度,這將是本文下一步的工作。
[1]安紅艷,龍懷玉,張認(rèn)連,雷秋良,穆真.冀北山地5個土壤發(fā)生學(xué)分類代表性剖面在系統(tǒng)分類中的歸屬研究[J]. 河北農(nóng)業(yè)大學(xué)學(xué)報, 2012(04).
[2]閆湘,常慶瑞,王曉強(qiáng),潘靖平.陜西關(guān)中土墊旱耕人為土樣區(qū)的基層分類研究[J].土壤學(xué)報,2005(04).