劉明明
基于條件深度卷積生成對抗網絡的圖像識別方法
劉明明
武警工程大學密碼工程學院,陜西 西安 710086
在信息技術爆炸的時代,對在大量數(shù)據(jù)下互聯(lián)網的發(fā)展情況進行分析是非常關鍵的。對基于條件深度卷積生成對抗網絡進行分析,通過對圖像數(shù)據(jù)的基本特征進行分析和研究,提出了基于條件深度卷積生成對抗網絡的應用方案,為其進一步發(fā)展打下了堅實的基礎。
條件深度卷積網絡;圖像識別;生成對抗網絡
生成對抗網絡是Goodfellow等在2014年提出的一種生成模型。不同于傳統(tǒng)生成模型, 生成對抗網絡在網絡結構上除了生成網絡外,還包含一個判別網絡。生成網絡與判別網絡之間是一種對抗關系。對抗的思想源自博弈論。博弈雙方在平等的對局中各自利用對方的策略變換自己的對抗策略,以此達到獲勝的目的。引申到生成對抗網絡中,即生成器和判別器為博弈雙方,生成器擬合數(shù)據(jù)的產生過程,生成模型樣本,優(yōu)化目標,達到納什均衡,使生成器估測到數(shù)據(jù)樣本的分布。目前,生成對抗網絡在圖像和視覺領域得到了廣泛的研究和應用,已經可以生成數(shù)字和人臉等物體對象,構成各種逼真的室內外場景,從分割圖像恢復原圖像,給黑白圖像上色,從物體輪廓恢復物體圖像,從低分辨率圖像生成高分辨率圖像等[1]。
圖像數(shù)據(jù)包括大量的數(shù)據(jù)與數(shù)據(jù)的存儲分析結構等。海量數(shù)據(jù)主要是交互式的數(shù)據(jù),是結構化或者非結構化的數(shù)據(jù)。我們可以通過這樣的數(shù)據(jù)對過去發(fā)生的事情進行判斷,也能夠對將來的事情進行預測。大部分數(shù)據(jù)是非結構化的數(shù)據(jù),融合了文本、圖像、音頻等信息,因此只有設計更可靠的算法來讀取數(shù)據(jù),才能夠將其中蘊含的信息提取出來。在傳統(tǒng)數(shù)據(jù)中,廣泛存在的還是結構化的數(shù)據(jù)。結構化的數(shù)據(jù)不僅讀取比較方便,而且可以很容易地觀測信息。但是在大數(shù)據(jù)時代,數(shù)據(jù)的讀取極其依靠強大的算法,這就是它們主要存在的差異[2]。
條件生成對抗網絡(Conditional Generative Adversarial Networks,CGAN)是在GAN(Generative Adversarial Networks,GAN)的基礎上加上了條件擴展為條件模型。如果生成器和判別器都適用于某些額外的條件,例如類標簽,那么可以通過將其附加到輸入層中輸入到生成器和判別器中進行調節(jié),可以指導數(shù)據(jù)生成過程。條件生成對抗網絡的構造是極為復雜的。對該模型而言,待修正的參數(shù)包括條件與噪聲等,各參量在工作中可能存在一些耦合現(xiàn)象,因此只依靠研究人員的相關經驗來進行調整,成本較高,效果也較差。目前,借助現(xiàn)代計算機的全局搜索工具來進行模型的修正是極為關鍵的。利用數(shù)學建模的方案可以使問題變得抽象,同時對其進行優(yōu)化調整。優(yōu)化算法的種類是非常多樣的,但是從根本原理上來概括,優(yōu)化算法主要包括精確算法和啟發(fā)式算法兩大類別。精確算法可以對解空間得到最優(yōu)化的解,比如線性規(guī)劃和動態(tài)規(guī)劃等;但是精確算法由于存在一定的局限導致使用范圍受限,比如局部最優(yōu)解較多或者是決策參數(shù)過多時,工作效率就會降低,無法解決大型問題。在工作量增加之后輸出精度也較差,因此目前使用廣泛的是啟發(fā)式的算法。
利用啟發(fā)式算法,可以很快地深度卷積生成對抗網絡中的參數(shù)因子。每更新一次參數(shù)因子就是在縮放部件特性曲線,利用計算機的快速計算能力,可以在很短的時間內完成優(yōu)化計算[3]。從本質上是可將其歸入參數(shù)優(yōu)化問題的,可將其概述為給定測試圖像特定的目標路徑,要求從數(shù)據(jù)集中找到與之最接近的圖像。為了能夠得到符合要求的測試數(shù)據(jù),需要經歷的時間較長。該問題的自動求解,能夠大大降低測試人員承擔的工作量,而且生成效率也能得到提高,進而推動網絡整體質量的提高。
將條件加入深度卷積生成對抗網絡中的生成器,利用卷積網絡提取特征的能力加上條件輔以訓練,之后將訓練好的C-DCGAN中的判別器部分抽取出來,添加Softmax后形成用于圖像識別的新網絡結構。在實際應用中,該網絡可以提升圖像識別的準確率。目前,圖像數(shù)據(jù)分析的要求是評估圖像數(shù)據(jù),以為將來的決策提供幫助。這些評估指標主要包括圖像數(shù)據(jù)的播放量、曝光量、分享量等,只有這樣才能夠對其將來的傳播情況進行預測[4]。
眼球系數(shù)指的是圖像數(shù)據(jù)中每個點吸引瀏覽者眼球的能力。眼球系數(shù)已成為很多圖像數(shù)據(jù)網站分析用戶行為的關鍵因素。這些圖像數(shù)據(jù)包含了大量的信息,因此需要進行更加科學的收集,利用更符合實際情況的機器學習等算法進行深層次的探究。只有這樣才能夠更好地評估這些數(shù)據(jù),從而根據(jù)用戶的實際情況進行圖像數(shù)據(jù)推薦與廣告推送等,為企業(yè)帶來收益。
采用更先進的方法也能過濾網絡圖像數(shù)據(jù)網站中的一些不良圖像數(shù)據(jù),將具有正能量的圖像數(shù)據(jù)更多地推薦給用戶,利于弘揚社會風氣,將機器學習應用于社會建設中有著極好的效果,因此在圖像數(shù)據(jù)網站的建設中,應大量采用這樣的技術,以較低的成本和較高的效率做好圖像數(shù)據(jù)的篩選工作。通過手機定位技術等可以分析網絡圖像數(shù)據(jù)的用戶分布情況。通過用戶在網絡圖像數(shù)據(jù)網站的行為還可以分析用戶對該圖像數(shù)據(jù)網站以及上面所包含圖像數(shù)據(jù)的滿意程度。按照用戶對網絡圖像數(shù)據(jù)的忠誠程度,可以將用戶劃分為初級用戶、高級用戶和深度用戶等。初級用戶登錄網絡圖像數(shù)據(jù)網站的頻率較低;而高級用戶則經常使用該類網站;深度用戶不觀看,而且經常上傳圖像數(shù)據(jù),這樣就可以更好地分析用戶的人群特征。用這個方法和原圖像進行比較,從而達到匹配的效果。選用一些樣本作為原始的數(shù)據(jù),在判斷時計算待測的數(shù)據(jù)和原模板之間的距離,找到和這個模板最相近的輸出值,從而確定最適配的圖像。
為了提高分析結果的科學性與嚴謹性,提升準確度,我們需要利用Softmax等方法來分析各項指標,還需要對時間和評價次數(shù)采取歸一化處理,以確保全部的程序所得到的結果處于相同的數(shù)量級上。本文提出的方法能夠在確保算法性能的基礎上控制算法時間,降低時間消耗,尤其是在大規(guī)模程序中,這種時間優(yōu)勢更加突出。條件深度卷積的方式有利于實現(xiàn)圖像的高速處理,便于進一步掌握其特征,從而利用這樣的圖像特征做好系統(tǒng)辨識、模式識別、圖像生成等工作,在軍用和民用領域都有著較為廣闊的發(fā)展前景。
在對抗網絡圖像處理過程之中,因為某些非人為政策、地理、天氣等客觀的不確定的因素而形成的變化,致使其準確率產生意想不到的變化,所以必須在識別時總結提出各種可能遇到的問題和因素,然后對所產生的問題進行分析探究,最終找到合理的方法解決問題。
[1]張龍,趙杰煜,葉緒倫,等. 協(xié)作式生成對抗網絡[J]. 自動化學報,2018,44(5):804-810.
[2]趙樹陽,李建武. 基于生成對抗網絡的低秩圖像生成方法[J]. 自動化學報,2018,44(5):829-839.
[3]張營營. 生成對抗網絡模型綜述[J]. 電子設計工程,2018,26(5):34-37,43.
[4]曹志義,牛少彰,張繼威. 基于半監(jiān)督學習生成對抗網絡的人臉還原算法研究[J]. 電子與信息學報,2018,40(2):323-330.
Image Recognition Method for Generative Adversarial Networks Based on Conditional Depth Convolution
Liu Mingming
School of Cryptography Engineering, Engineering University of PAP, Shaanxi Xi’an 710086
In the era of information technology explosion, it is very important to analyze the development of the internet under a large amount of data. The paper analyzes generative adversarial networks based on the conditional depth convolution. By analyzing and studying the basic features of image data, the paper puts forward the application scheme of generative adversarial networks, so as to effectively study it and lay a solid foundation for its further development.
conditional depth convolution network; image recognition; generative adversarial networks
TP183;TP391.4
A
劉明明(1992—)男,漢族,山東五蓮人,研究生學歷,研究方向為信息隱藏、生成對抗網絡。