唐 華
(天津市工業(yè)和信息化研究院 天津 300000)
隨著計算機技術、信息技術和網(wǎng)絡技術的快速發(fā)展,人工智能識別技術應運而生,成為一種新興計算機技術,在各行各業(yè)、各個領域的應用范圍不斷擴大,為經(jīng)濟增長、社會發(fā)展提供重要基礎保障。
計算機人工智能識別技術是在計算機應用技術的基礎上衍生和發(fā)展起來的科學技術,它是一種自動化、智能化、科學化計算機技術,通過將人類思維模式從抽象化到具體化,進行準確識別、科學判斷和準確模擬,最終通過計算機程序完整體現(xiàn)出來。計算機人工智能識別技術被廣泛運用于各個領域,與其他計算機技術相比,人工智能識別技術的應用前景更為廣闊,能夠為人類提供更為高效、便捷和優(yōu)質(zhì)服務。近年來,計算機人工智能識別技術在我國相關領域中取得一系列顯著應用成效,由于人工智能識別技術的發(fā)展時間較短,很多關鍵環(huán)節(jié)尚未攻克,尚未形成一套完整的運行體系,整個應用過程依然面臨諸多瓶頸問題。
計算機人工智能識別技術是指借助人力所制造的智能化設備來代替人力進行工作的機器被稱為人工智能化機器。目前,人工智能化設備主要借助計算機來作為基礎,結(jié)合人工的方法和科學技術,將人類的思維和智慧融入設備中,使得制造出來的機器更加的智能化和自動化。人工智能化技術的發(fā)展離不開科學技術的發(fā)揮。隨著社會的不斷進步,科學技術也在不斷的發(fā)展,從傳統(tǒng)的自動化機器向人工智能化的方式進行轉(zhuǎn)變,其中運用到的知識不僅僅是單純的計算機知識,還包含其他學科的知識。自計算機技術發(fā)展以來,全新的技術和方法都進入了工程化的階段,有效促進了工業(yè)技術的進一步發(fā)展?;诖耍斯ぶ悄茏R別技術也得到了飛躍的進步,主要應用領域包括智能語音識別、智能視覺識別、人工神經(jīng)網(wǎng)絡等。
智能語音識別技術,也被稱為自動語音識別Automatic Speech Recognition,(ASR),其目標是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機可讀的輸入,例如進制編碼或者字符序列。與說話人識別及說話人確認不同,后者嘗試識別或確認發(fā)出語音的說話人而非其中所包含的詞匯內(nèi)容。
語音識別技術的應用包括語音撥號、語音導航、設備控制、語音文檔檢索、簡單的聽寫數(shù)據(jù)錄入等。語音識別技術與其他自然語言處理技術如機器翻譯及語音合成技術相結(jié)合,可以構(gòu)建出更加復雜的應用,例如語音到語音的翻譯。
語音識別技術所涉及的領域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。
語音人工智能識別技術作為計算機人工智能識別技術的一項核心技術,長期以來,深受國內(nèi)外學術界的高度重視。與此同時,語音人工智能識別技術被廣泛應用于各行各業(yè)、各個領域,其技術和產(chǎn)品優(yōu)勢十分鮮明,在語音電話、語音通信、語音交互等方面取得顯著應用成效。但語音識別還是有一些缺點的。語音隨時間而變化,所以必須使用生物識別模板。語音也會由于傷風、嗓音沙啞、情緒壓力或是青春期而變化。語音識別系統(tǒng)比指紋識別系統(tǒng)有著較高的誤識率,因為人們的聲音不像指紋那樣獨特和唯一。對快速傅立葉變換計算來說,系統(tǒng)需要協(xié)同處理器和比指紋系統(tǒng)更多的效能。
智能視覺識別技術成功的關鍵在于是否擁有尖端的核心算法,并使識別結(jié)果具有實用化的識別率和識別速度。智能視覺識別集成了人工智能、機器識別、機器學習、模型理論、視頻圖像處理等多種專業(yè)技術,同時需結(jié)合中間值處理的理論與實現(xiàn),是生物特征識別的最新應用,其核心技術的實現(xiàn),展現(xiàn)了弱人工智能向強人工智能的轉(zhuǎn)化接口能力。人工智能識別技術的應用前景更為廣闊,能夠為人類提供更為高效、便捷和優(yōu)質(zhì)服務。
一般來說,智能視覺識別包括圖像攝取、人臉定位、圖像預處理、以及人臉識別(身份確認或者身份查找)。系統(tǒng)輸入一般是一張或者一系列含有未確定身份的人臉圖像,以及人臉數(shù)據(jù)庫中的若干已知身份的人臉圖象或者相應的編碼,而其輸出則是一系列相似度得分,表明待識別的人臉的身份。對人臉進行掃描,進而進行身份信息的識別和判斷,通常所掃描的部位是人的眼睛或臉部結(jié)構(gòu)。人臉識別技術通過局部放大,自動進行人臉部關鍵特征信息的收集、識別,通過調(diào)節(jié)亮度,提高識別結(jié)果的精準性。
人臉識別產(chǎn)品已廣泛應用于金融、司法、軍隊、公安、邊檢、政府、航天、電力、工廠、教育、醫(yī)療及眾多企事業(yè)單位等領域。隨著技術的進一步成熟和社會認同度的提高,人臉識別技術將應用在更多的領域,如金融遠程開戶、服務人員身份監(jiān)管、企業(yè)刷臉考勤、門禁系統(tǒng)、酒店自助入住、民事政務自助辦理、人臉識別支付等。
盡管視覺識別技術非常方便,便于人們進行身份的認證,但是在實際應用過程中,依然面臨以下幾個方面的瓶頸問題: 一是由于人們臉部表情各不相同,即使同一人,其面部表情也隨情緒、外部環(huán)境的變化而改變,數(shù)據(jù)庫中的人臉表情數(shù)據(jù)十分有限,從而之間影響到人臉識別效果; 二是人臉結(jié)構(gòu)、輪廓均會跟隨外部環(huán)境、個人情緒、年齡等發(fā)生改變,從而造成識別效果并不明顯; 三是受到外部環(huán)境,諸如光線之類的因素影響,人工智能視覺識別同樣面臨不確定性因素?,F(xiàn)階段,人工智能視覺識別技術在我國相關領域已經(jīng)取得一系列顯著成效,但是在實際應用過程中,依然面臨較大的瓶頸問題,比如: 臉部表情、臉部輪廓、臉部結(jié)構(gòu)、發(fā)型、化妝、外部光線等的不同,都將給人工智能視覺識別帶來巨大的挑戰(zhàn)和識別壓力。
人工神經(jīng)網(wǎng)絡指的是經(jīng)過大量簡單處理單元創(chuàng)建形成的并行互聯(lián)網(wǎng)絡系統(tǒng),能夠模擬人腦系統(tǒng),并且具有人腦的多種基本功能。人工神經(jīng)網(wǎng)絡的工作原理是通過模擬人腦神經(jīng)組織構(gòu)造過程中得到的啟發(fā),試圖通過人工神經(jīng)網(wǎng)絡處理大量單元,包括電子元件、人工神經(jīng)元和處理元件。盡管人工神經(jīng)網(wǎng)絡并不能等同于人腦,也不能完全發(fā)揮出人腦所有作用,但是卻能夠通過人工智能識別技術幫助人類進行自動化、智能化事件的處理。
總而言之,計算機人工智能識別技術現(xiàn)如今已在人們生活、工作中得到廣泛推廣,不僅可對商品信息進行準確掃描,獲取商品價格;還可實現(xiàn)對指紋、聲音、人臉進行有效鑒定,識別用戶身份,為人們生活、工作創(chuàng)造了極大便利。某種意義上而言,人工智能識別技術是計算機技術的一次革命性發(fā)展,推動了計算機不斷趨向于自動化、智能化。因而,計算機人工智能識別技術相關研發(fā)人員必須要革新思想觀念,不斷鉆研研究、總結(jié)經(jīng)驗,提高對人工智能識別技術及人工智能識別系統(tǒng)內(nèi)涵特征的有效認識,推進對計算機人工智能識別技術的科學合理應用,積極促進計算機人工智能識別技術的健康穩(wěn)定發(fā)展,不斷推進對計算機人工智能識別技術的科學合理應用。