王雪淳
摘 要 圖像識別與生成技術(shù)是計(jì)算機(jī)通過分析圖片而提取圖像特征,根據(jù)特征來模仿,生成圖片的技術(shù)。這項(xiàng)技術(shù)目前已較廣泛應(yīng)用于手機(jī)解鎖,司法鑒定,醫(yī)學(xué)診斷,游戲娛樂等領(lǐng)域。圖像識別與生成技術(shù)在人工智能領(lǐng)域已有多方面的應(yīng)用,且有極大的上升空間與發(fā)展?jié)摿Α?/p>
關(guān)鍵詞 人工智能;圖像識別;圖像生成
中圖分類號 TP3 文獻(xiàn)標(biāo)識碼 A 文章編號 1674-6708(2019)232-0153-02
2017年11月3日,蘋果公司推出一款可以通過人臉識別技術(shù)來解鎖的手機(jī)iPhoneX,一時大受追捧。這一技術(shù)不僅為廣大用戶提供便利,同時也使大部分人愿意為這樣一份新鮮感而買單。一些網(wǎng)頁程序,如近期比較熱門的網(wǎng)頁小游戲image-toimage,可以將用戶輸入的簡單幾何形轉(zhuǎn)化為貓,建筑物等實(shí)物圖像。本文將簡要分析這些應(yīng)用背后的圖像識別與生成技術(shù)。
1 人工智能概述
人工智能,是一門研究、開發(fā)用于擴(kuò)展人類智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的科學(xué)技術(shù)[ 1 ]。它起源于20世紀(jì)50年代,至今已經(jīng)過了多個瓶頸期和突破期,其中最新的一個突破源于近五年計(jì)算機(jī)數(shù)據(jù)科學(xué)的蓬勃發(fā)展所帶來的大數(shù)據(jù)技術(shù)。人工智能是計(jì)算機(jī)科學(xué)的一個分支,主要以能做出與人類相似的反應(yīng),并勝任一些需要人工智能才能完成的復(fù)雜工作為目標(biāo),具體研究領(lǐng)域包括機(jī)器人,語言識別,圖像識別,自然語言處理和專家系統(tǒng)等領(lǐng)域。其中主要分為具備自我思考、自我推理及解決問題能力的強(qiáng)人工智能,及不具備此類能力的弱人工智能[ 2 ]。
2 圖像識別技術(shù)及其在人工智能中的應(yīng)用
2.1 圖像識別技術(shù)原理
圖像識別技術(shù),是一種計(jì)算機(jī)通過提取圖像關(guān)鍵性重要特征以識別各種不同模式的目標(biāo)和對象的技術(shù)。這一技術(shù)已經(jīng)得到了深入的研究和廣泛的發(fā)展,是計(jì)算機(jī)學(xué)科領(lǐng)域非常重要的研究方向之一[ 3 ]。
2.2 人工智能圖像識別應(yīng)用
人工智能圖像識別廣泛應(yīng)用與多個領(lǐng)域,如司法、娛樂等,同時還與醫(yī)學(xué)等學(xué)科有交叉。
1)識別筆跡。其在司法筆跡鑒定中的應(yīng)用也較為成熟,能分析且提取筆跡形態(tài)上的特征,如長寬比,字間距,筆畫粗細(xì),折筆角度等關(guān)系,實(shí)現(xiàn)筆跡鑒定。但同時也存在一些如對于摹仿簽名筆跡的有效識別率較低等問題[ 4 ]。對筆跡的識別研究是法務(wù)判斷的重要參考。在經(jīng)濟(jì)領(lǐng)域,涉及合同簽名等問題中,筆記鑒定顯得尤為重要。除此,筆記識別還可鑒定收藏品中的名家筆墨,是真品還是贗品,抵制販賣假貨的行為,保護(hù)公民個人財(cái)產(chǎn)。
2)識別繪畫圖像。一些小程序游戲可成為開發(fā)者前期訓(xùn)練人工智能的絕佳場所?!安庐嬓「琛本褪沁@樣是一款谷歌推出的微信游戲小程序,其主要內(nèi)容是人工智能識別玩家的簡筆畫。游戲的玩法類似“你畫我猜”,但游戲的參與者不全是真人玩家。在玩家畫畫的同時,人工智能可以不斷地提供猜測的答案并顯示在手機(jī)屏幕上,直到猜對正確答案或游戲時間(每輪20秒)結(jié)束為止?!安庐嬓「琛笨梢酝ㄟ^預(yù)先分析上萬張手繪簡筆畫,提取其中不同物體的關(guān)鍵特征,掌握群眾繪圖時的基本思路。然后當(dāng)用戶們只畫下簡單的線條,甚至是人類也看不出所畫何物時,“猜畫小歌”可以迅速將線條與數(shù)據(jù)庫匹配,繼而給出答案[ 5 ]。由于小程序游戲的廣泛傳播與極易上手,越來越多的用戶為“猜畫小歌”的數(shù)據(jù)庫提供素材,從而促進(jìn)人工智能領(lǐng)悟人類繪畫時的思維習(xí)慣,不僅降低前期訓(xùn)練人工智能成本,也大大提高訓(xùn)練效率。
3)識別實(shí)物圖像。人工智能的圖像識別技術(shù)還可識別人臉和植物等實(shí)物。
人臉識別是基于人的臉部特征信息進(jìn)行身份識別的一種生物識別技術(shù)。人臉可受發(fā)型,胡子,妝容,光源等影響,故此人臉識別需要先分割人臉,才能提取人臉特征,如五官大小,分布間的參數(shù)比例等,建立三維人臉模型,再匹配和識別人臉。此項(xiàng)技術(shù)極廣泛的應(yīng)用于日常生活,如人臉識別解鎖手機(jī),超市中識別人臉后即可用相應(yīng)賬戶付錢[ 6 ]。隨其安全性仍飽受爭議,但不可否認(rèn)人臉識別技術(shù)的發(fā)展也為社會帶來極大的便捷。
“花伴侶”App是一款植物智能識別App,由于花卉種類繁多,分布廣泛,特性相異,光建立數(shù)據(jù)庫就已是一項(xiàng)龐大的工程。制作團(tuán)隊(duì)選取眾多花的照片,進(jìn)行分析鑒定,現(xiàn)已實(shí)現(xiàn)五千多種中常見植物的智能識別[7]。這一大眾化App使用戶們每拍一張照片,就可了解所見一些常見植物的相關(guān)知識,更易滿足人們求知欲,同時也為科學(xué)研究作出一定貢獻(xiàn)。
4)識別醫(yī)學(xué)診斷。病理圖像是疾病診斷的金標(biāo)準(zhǔn),醫(yī)師通過分析圖像中細(xì)胞屬性來進(jìn)行診斷決策。數(shù)字病理切片是將整張載玻片進(jìn)行全信息、全方位快速掃描,使物質(zhì)化的玻璃載玻片變成數(shù)字化的病理切片[8]。計(jì)算機(jī)可識別組織中的腫瘤,并將結(jié)果快速輸出成病理報告,從而為醫(yī)師減負(fù),也大大提高就診效率與準(zhǔn)確率。在中醫(yī)領(lǐng)域,計(jì)算機(jī)也可以識別不同植物的紋理,判斷中藥真假,甚至能推測其作用部位。這些應(yīng)用都降低醫(yī)生工作難度,也降低誤診率,為人類社會提供更好的就醫(yī)體驗(yàn)。
3 圖像生成技術(shù)及其在人工智能中的應(yīng)用
圖像生成技術(shù)有助于人工智能的機(jī)器學(xué)習(xí)等系統(tǒng),促進(jìn)其將接收到的信息轉(zhuǎn)化為系統(tǒng)可以理解與處理的信息,使自我知識體系不斷完善,逐漸降低對人類專家依賴程度,從而使性能提高。
3.1 圖像生成技術(shù)原理
圖像生成技術(shù)指系統(tǒng)通過計(jì)算機(jī)視覺嘗試分析一副或多副二維圖像,感知幾何信息,提取其中特點(diǎn),而用能力模仿特征生成相關(guān)圖像。
3.2 人工智能圖像生成應(yīng)用
基于圖像生成技術(shù),人工智能可模仿人類書寫效果或名畫家繪畫風(fēng)格,可將實(shí)物與繪圖相互轉(zhuǎn)換。同時,圖像生成技術(shù)對于虛擬現(xiàn)實(shí)、人機(jī)交互、網(wǎng)絡(luò)輔助教學(xué)等都有廣泛應(yīng)用。
1)生成筆跡。筆記生成技術(shù)主要是計(jì)算機(jī)對人類的真實(shí)書寫進(jìn)行分析,從而能模仿出其書寫風(fēng)格。但由于在電子產(chǎn)品上書寫時,沒有壓感,機(jī)器必須先分析真實(shí)毛筆的筆刷形態(tài),筆鋒等進(jìn)行分析,建立相關(guān)筆刷模型,在分析人類書寫時的速度,從而調(diào)整筆畫粗細(xì)與筆鋒,生成能具體體現(xiàn)書寫者書法效果的字體[ 9 ]。然后人類在電子產(chǎn)品中寫下的字體就更美觀也更真實(shí),促進(jìn)無紙化辦公發(fā)展。