馬宏艷
摘要:模糊數(shù)學自誕生以來取得了快速的發(fā)展,隨著計算機應用技術(shù)的發(fā)展,特別是網(wǎng)絡的普及,人們越來越離不開計算機,計算機獲取各種信息的主要工具,大量的信息處理工作也離不開計算機。在日常生活和工作中,存在著大量的文字信息處理工作,必須交由計算機處理。漢字識別是模式識別領域的一個重要方向,涉及到很多方面的知識,同時它的實踐意義也很深遠。
關鍵詞:模糊數(shù)學;漢字識別;模糊匹配
中圖分類號:TP391文獻標識碼:A文章編號:1009-3044(2012)21-5176-02
Fuzzy Theory Application to Chinese Characters Recognition
MA Hong-yan
(Information Engineering Institute, Longdong University ,Qinyang 745000,China)
Abstract: The fuzzy mathematics since its birth has achieved rapid development, with the popularization and application of computer tech? nology, especially the popularization of Internet, people depend more and more on computers to get all kinds of information, a lot of infor? mation processing are transferred to a computer for. In daily life and work, there are a large number of text information processing prob? lems, the text information to the computer processing requirements becomes very urgent. Character recognition is the field of pattern rec? ognition is an important direction, involving many aspects of knowledge, and its practical significance is far-reaching.
Key words: fuzzy mathematics;Chinese characters recognition;fuzzy matching
1965年,美國加州大學的L.A.Zadeh教授發(fā)表的題為:“Fuzzy Sets”和“Fuzzy Sets and Systems”兩篇開創(chuàng)性的論文是模糊數(shù)學誕生的標志。
模糊性概念現(xiàn)在用模糊集來進行描述,運用模糊數(shù)學的概念可以進行判斷、推理、評價、決策以及控制的過程等。例如模糊聚類分析、模糊模式識別等。這些方法構(gòu)成了一種模糊性系統(tǒng)理論,構(gòu)成了一種思辨數(shù)學的雛形,在氣象、醫(yī)學、心理、地質(zhì)、石油、環(huán)境、生物、林業(yè)、農(nóng)業(yè)、經(jīng)濟管理、化工、語言、遙感、控制、體育、教育等方面已經(jīng)取得了明顯的成果。模糊數(shù)學的應用領域主要是計算機智能方面,這也是計算機發(fā)展的一個主要方向。模糊數(shù)學主要研究的內(nèi)容是三個方面:第一是模糊數(shù)學理論的研究,以及它和傳統(tǒng)的精確數(shù)學、隨機數(shù)學之間的關系。第二是模糊語言學以及模糊邏輯的研究。這兩方面的研究目前還不是很成熟,需要進一步的深入研究。第三是模糊數(shù)學的應用的研究,這是模糊數(shù)學的主要研究方向。模糊數(shù)學的研究對象是不確定性的事物,因此它對于傳統(tǒng)的精確數(shù)學、隨機數(shù)學的不足能起到彌補的作用。現(xiàn)已有模糊群論、模糊拓撲學、模糊概率、模糊圖論、模糊邏輯學、模糊語言學等分支。
1模式識別
模式識別的主要任務是讓機器模擬人的思維方法,對客觀世界中帶有模糊特征的事物進行識別和分類。計算機分析各種模式,并對未知模式給出分類和結(jié)構(gòu)描述。模式識別問題是已知事物的各種類別,然后來判斷給定的對象是屬于哪一個類別的問題,"模式"是指標準的模板。實際生活中,有些事物的類別(即模式)是明確、清晰和肯定的,但也有很多事物的模式帶有不同程度的模糊性,對這些具有模糊性的模式借助于模糊理論來刻畫。具有"模糊模式"的模式識別問題,可以用"模糊模式識別"方法來處理[1]。
解決模式識別的問題時使用模糊邏輯的方法或思想的方法就是模糊模式識別。模糊技術(shù)在統(tǒng)計模式識別及句法模式識別方面均有較好的應用。其主要特點是它能更直接更自然地表達人們習慣使用的一些邏輯含義,模糊數(shù)學對于直接的或者高層的知識表示很是適用,這就使得模糊概念的模式識別能成為智能科學前沿領域的研究的有效工具之一。
模糊模式識別通常由傳感器部分、預處理部分、特征提取部分、識別分類部分四部分組成的,在模式識別中特征的提取是非常重要的。模式識別的方式有兩種:第一種是最大隸屬原則(直接方法),這種方法應用相當廣泛,象三角形的識別、染色體的識別等都屬于這一類,這類問題的難點在于隸屬函數(shù)的建立。第二種是擇近原則(間接方法),擇近原則是模式識別中的一種間接方法,目前它已用于計算機識別手寫數(shù)碼及文字。對于文字識別,無論是印刷體還是手寫體,讓計算機識別時,輸入的模型都是選取特征后面的平面格點,它是一個模糊集,而計算機原來存貯的模型也是幾個模糊集,這時需要考慮的就是貼近問題。
漢字識別技術(shù)是一種高速、自動的信息錄入手段,是未來計算機的重要職能接口,同時也是辦公自動化、新聞出版、機器翻譯等
在自然語言的處理過程中,模糊字辨認還是一個比較困難的事情,因此迫切需要一種高效率的自動的辨認方法。該文提出了一種基于語義的模糊匹配算法,能夠很好地解決這個問題,而且具有實際應用的可能。
模糊數(shù)學是一門嶄新的數(shù)學學科,它的產(chǎn)生不僅拓廣了經(jīng)典數(shù)學的基礎,而且是使計算機科學向人們的自然機理方面發(fā)展的重大突破。它在科學技術(shù)、經(jīng)濟發(fā)展和社會學等問題的廣泛應用領域中顯示了巨大的力量。它雖然只有二十多年的歷史,但已被國內(nèi)外數(shù)學界以及信息、系統(tǒng)、計算機和自動控制科學、人員的普遍關注,它是正在迅速發(fā)展中的有著廣闊應用前景的一門嶄新學科。
[1]周擁,張彪,夏寬理.基于語義的模糊匹配在模糊漢字辨認中的應用[J].計算機工程,2002(5).
[2]張忻中.漢字識別技術(shù)[M].北京:清華大學出版社,1992.
[3]謝季堅,劉承平.模糊數(shù)學方法及其應用[M].3版.武漢:華中科技大學出版社,2006.
[4]梁保松,曹殿立.模糊數(shù)學及其應用[M].北京:科學出版社,2007.
[5]姚瑤,王偉,王愛菊.一種新的快速圖像細化算法研究與實現(xiàn)[J].電腦知識與技術(shù),2010(6).