李 丹, 董春游
(黑龍江科技學院 計算機與信息工程學院,哈爾濱 150027)
計算機模擬技術在逆向云發(fā)生器中的應用
李 丹, 董春游
(黑龍江科技學院 計算機與信息工程學院,哈爾濱 150027)
針對采集大量的定量信息存在一定的困難,引入了計算機模擬技術。利用計算機模擬技術,可以由采集到的少量的云滴信息模擬出大量的云滴信息。逆向云發(fā)生器可以實現(xiàn)定量數(shù)值到定性語言值的轉換,其精度依賴于定量數(shù)值的數(shù)目,誤差隨著定量信息的增加而減少。通過實例驗證,結果表明:模擬數(shù)據(jù)可信,該研究為提高逆向云發(fā)生器算法的精度提供了一種新的方法。
逆向云發(fā)生器;計算機模擬;云模型
云模型是李德毅在傳統(tǒng)模糊集理論和概率統(tǒng)計的基礎上,建立的一種定性定量不確定性轉換模型。它把不確定性概念的模糊性和隨機性有機地結合在一起,實現(xiàn)了不確定語言值與定量數(shù)值之間的自然轉換[1]。正向云發(fā)生器和逆向云發(fā)生器是云模型中兩個最基本、最關鍵的算法,前者實現(xiàn)了語言值表達的定性信息中獲得定量數(shù)據(jù)的范圍和分布規(guī)律,這是一個前向的、直接的過程;后者是將一定數(shù)量的精確數(shù)值有效轉換為恰當?shù)亩ㄐ哉Z言值[2],是個逆向的、間接的過程。在這個過程中,不可避免的會有誤差存在。實驗證明,云滴數(shù)越多,所得到的特征值的誤差就越小,云滴數(shù)n>10時,可以比較準確地得到Ex(誤差小于0.01),當云滴數(shù)n>100,En的相對誤差小于1%,而對He,當n>200時,相對誤差小于10%[3]。為了減少逆向云發(fā)生器的誤差,需要采集大量的定量信息,而對于許多評價問題,如多屬性評價或綜合評判,收集大量的評價數(shù)據(jù)又存在困難。如某一待評價對象,如果它不是大眾所了解熟識的,而是某一領域需要有專業(yè)知識的人才能對其進行正確的評價,這就需要聽取該領域專家的意見,為了保證算法的精確度,需要請大量的專家分別對其進行評價。如上所述,為了保證He的誤差小于10%,一方面,需要請至少200個專家,另一方面,即使請到了這么多專家又如何能保證他們同時到場。為了解決上述問題,引入了計算機模擬技術。其基本思想是根據(jù)多個專家給出的評價信息進行統(tǒng)計分析,模擬出所需數(shù)目的專家評定模擬值,為科學評價奠定基礎。
計算機模擬主要包括數(shù)據(jù)的采集與整理、模擬模型的構造、模擬程序的編制和驗證、模擬運行、結果分析等步驟,其流程如圖1所示。
圖1 計算機模擬流程Fig.1 Flowchart of computer simulation
收集若干個原始的評價數(shù)據(jù)。數(shù)據(jù)整理指根據(jù)收集到的數(shù)據(jù)推斷數(shù)據(jù)總體的分布。一般地,從收集到的數(shù)據(jù)來推斷總體X的分布分為兩步:一是根據(jù)數(shù)據(jù)值大致地了解總體的可能分布;二是進行分布函數(shù)的擬合檢驗。
1.1.1 概率密度的近似求法——直方圖法
頻度分布和直方圖在辨識一個分布的形狀時是很有用的。直方圖可以按照下列步驟構造:
(1)找出數(shù)據(jù)中的最小值和最大值,分別記為a和b,數(shù)據(jù)個數(shù)記為n。
(2)將區(qū)間[a,b]分為m個子區(qū)間(m的值與n有關,一般近似等于樣本大小的平方根,且應使每個子區(qū)間至少包含一個樣本觀測值),每組組距(子區(qū)間長度)為(b-a)/m。
(3)記ni(i=1,2,…,m)為樣本觀測值落在第i個子區(qū)間(ai-1,ai]的個數(shù),稱為頻數(shù),fi=ni/n是樣本觀測值落在區(qū)間(ai-1,ai]中的頻率。在xOy平面上,對每個i(1≤i≤m),以區(qū)間(ai-1,ai]為底,yi= fi/(ai-ai-1)為高,作一排直的長方形,即為直方圖。
由文獻[4]可知,當n充分大時,直方圖的外廓曲線近似于總體X的概率密度曲線。因此,利用直方圖法,可以大致地描述總體X的概率密度的概貌。
1.1.2 分布函數(shù)的擬合優(yōu)良度檢驗
設總體的分布函數(shù)F(x)為未知,(X1,…,Xn)為總體X的樣本,欲根據(jù)樣本檢驗假設
其中F0(x)是某個已知的分布函數(shù)。對上述假設H0作顯著性檢驗,稱之為分布函數(shù)的擬合檢驗。分布函數(shù)的擬合檢驗方法很多,最主要的是χ2檢驗法,其步驟是:
(1)將總體X的全體可能值分成m個互不相交的區(qū)間(ai-1,ai],i=1,2,…,m,計算樣本(X1,…,Xn)的觀測值出現(xiàn)在第i個小區(qū)間(ai-1,ai]的頻數(shù)ni和頻率ni/n,ni和ni/n分別稱為經(jīng)驗頻數(shù)和經(jīng)驗頻率。
(2)求出當H0成立時,總體X取值于第i個小區(qū)間(ai-1,ai]的概率:
稱npi為理論頻數(shù),pi為理論頻率。
選皮爾遜統(tǒng)計量:
費希爾推廣了皮爾遜定理,證明了式(1)漸近服從χ2(m-r-1)分布,其中m為小區(qū)間數(shù),r為待估參數(shù)的個數(shù)。因而,對給定的顯著性水平α,由χ2分布表可得臨界值(m-r-1),使得P(χ2>(mr-1))=α,于是得拒絕域((m-r-1),∞)。
(3)作出判斷。由樣本觀測值計算統(tǒng)計量χ2的觀測值。若χ2>(m-r-1),則拒絕H0;反之,接受H0。
運用計算機程序語言將系統(tǒng)的數(shù)學邏輯模型轉變?yōu)橹饕捎嬎銠C程序組成的模型,以便在計算機上進行模擬運行。進行調(diào)試性模擬以驗證數(shù)學邏輯模型是否正確反映現(xiàn)實系統(tǒng)的本質(zhì),以及模擬模型是否正確實現(xiàn)數(shù)學邏輯模型,從而修改模型和調(diào)整計算機程序。
當產(chǎn)生計算機模擬數(shù)據(jù)以后,要對計算機模擬輸出數(shù)據(jù)值與實際值進行假設檢驗,樣本均值和樣本方差常被用來估計假設分布的參數(shù)。所以通常采用t檢驗法和F檢驗法[5]來驗證真實值與模擬值之間是否有顯著性差異。
1.4.1 t檢驗法
檢驗兩正態(tài)總體樣本均值差的假設用t檢驗法。
這里δ是已知常數(shù),當δ=0時,就是檢驗兩個正態(tài)總體的均值是否相等。
取檢驗統(tǒng)計量為
1.4.2 F檢驗法
檢驗兩正態(tài)總體樣本方差比的假設用F檢驗法。
以問卷調(diào)查的形式收集20位專家對某一待評價對象的定量評價信息,通過對調(diào)查表的回收、整理和統(tǒng)計,得到定量評價信息如表1所示。
表1 定量評價信息Table 1 Quantitative data
運用上述計算機模擬的步驟,采用Java語言進行編程實現(xiàn),最終得到200個模擬評價數(shù)據(jù)。模擬得出的評價信息與專家給出的評價信息非常接近。利用t檢驗法和F檢驗法對兩組數(shù)據(jù)進行假設檢驗后,得出兩組數(shù)據(jù)的平均值和方差無顯著性差異,所以模擬出的數(shù)據(jù)是可信的。
根據(jù)采集到的評價信息和模擬出的評價信息,利用無須確定度信息的逆向云發(fā)生器算法即可得到云模型的數(shù)字特征。
其中,mean(),stdev()分別為求均值和標準差的函數(shù)。
逆向云算法可以用于從定量知識得出定性評價。但為了保證算法的精確度要求有較大數(shù)量的云滴數(shù),而很多時候采集大量的原始數(shù)據(jù)又存在一定的困難,為了解決上述問題,將計算機模擬技術引入到逆向云發(fā)生器中,它是眾多專家集體智慧的結晶,與傳統(tǒng)的一個或幾個專家的評價信息相比較,其結果具有更高的準確性,更具科學性、合理性,為得出對象的正確評價結果奠定了基礎。計算機模擬技術與逆向云的結合,不僅可以用于多屬性評價或綜合評判中求參數(shù)Ex、En、He,還可用于不確定性推理中求云滴的確定度μ(x)以及云發(fā)生器的確定點μ、a等。
[1]鄧 羽,劉盛和,張文婷,等.廣義多維云模型及在空間聚類中的應用[J].地理學報,2009,64(12):1439-1447.
[2]羅自強,張光衛(wèi).一種新的逆向云算法[J].計算機科學與探索,2007,1(2):234-240.
[3]呂輝軍,王 曄,李德毅,等.逆向云在定性評價中的應用[J].計算機學報,2003,26(8):1009-1014.
[4]劉次華,萬建平.概率論與數(shù)理統(tǒng)計[M].2版.北京:高等教育出版社,2003.
[5]劉衛(wèi)江.概率論與數(shù)理統(tǒng)計[M].北京:清華大學出版社,2008.
Application of computer simulation technology in backward cloud generator
LI Dan, DONG Chunyou
(College of Computer&Information Engineering,Heilongjiang Institute of Science&Technology,Harbin 150027,China)
Aimed at addressing a more difficult collection of an increasing number of cloud droplets,this paper introduces computer simulation technology which makes possible the simulation of a large number of cloud droplets by the collected value.Backward cloud generator(BCG)capable of transforming quantitative values into qualitative concepts exhibits an accuracy determined by the number of quantitative information and the decreasing deviation of BCG due to the increasing number of quantitative information.The experiment shows that the simulation data are reliable.The study provides a new method designed for improving the accuracy of BCG.
backward cloud generator;computer simulation;cloud model
TP18
A
1671-0118(2011)04-0329-04
2011-07-11
李 丹(1982-),女,黑龍江省雞西人,講師,碩士,研究方向:人工智能、決策支持系統(tǒng),E-mail:fdpld@126.com。
(編輯徐 巖)