• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于稀疏表示的半監(jiān)督線性子空間學(xué)習(xí)

      2021-11-19 03:25:14唐曉晴
      電腦與電信 2021年8期
      關(guān)鍵詞:字典線性標(biāo)簽

      唐曉晴

      (南京理工大學(xué)紫金學(xué)院計(jì)算機(jī)學(xué)院,江蘇 南京 210023)

      關(guān)鍵字:半監(jiān)督;稀疏表示;線性子空間;投影矩陣;人臉數(shù)據(jù)庫(kù)

      1 引言

      線性子空間學(xué)習(xí)作為降維以及特征提取的技術(shù)現(xiàn)已廣泛應(yīng)用于計(jì)算機(jī)視覺以及模式識(shí)別等重要領(lǐng)域,其最為著名的是人臉識(shí)別應(yīng)用。其代表方法已有很多,比如基于主成分分析(Principal Component Analysis,PCA)進(jìn)行的人臉識(shí)別,基于線性判別分析(Linear Discriminant Analysis,LDA)進(jìn)行的人臉識(shí)別[1-3]等??偟膩?lái)說(shuō),子空間學(xué)習(xí)方法就是根據(jù)一定的準(zhǔn)則函數(shù)來(lái)學(xué)習(xí)得到一個(gè)子空間或者投影矩陣[4,5]。根據(jù)是否使用訓(xùn)練樣本的標(biāo)簽又可將上述方法分為監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)兩大類[6]。

      雖然監(jiān)督學(xué)習(xí)方法可以有效提高分類的結(jié)果,但是現(xiàn)有的監(jiān)督學(xué)習(xí)方法仍存在著局限性,尤其是標(biāo)簽樣本的獲得往往需要大量的人力和財(cái)力。隨著圖像數(shù)據(jù)數(shù)量的快速增長(zhǎng),獲取無(wú)標(biāo)簽數(shù)據(jù)更加有利,使得僅能處理有標(biāo)簽數(shù)據(jù)的監(jiān)督學(xué)習(xí)方法的局限性顯得更加明顯。考慮到有標(biāo)簽數(shù)據(jù)較難獲得而廉價(jià)的無(wú)標(biāo)簽樣本卻很容易獲得,半監(jiān)督學(xué)習(xí)方法吸引了越來(lái)越多的研究者們的注意[7-11]。半監(jiān)督學(xué)習(xí)方法是位于監(jiān)督學(xué)習(xí)與非監(jiān)督學(xué)習(xí)之間的一種學(xué)習(xí)方法。當(dāng)訓(xùn)練樣本為大量無(wú)標(biāo)簽和少量有標(biāo)簽的數(shù)據(jù)集時(shí),使用該方法可以較好地提高學(xué)習(xí)能力。與監(jiān)督學(xué)習(xí)方法相比,半監(jiān)督學(xué)習(xí)的優(yōu)點(diǎn)在于利用未標(biāo)記的數(shù)據(jù)來(lái)估計(jì)數(shù)據(jù)間的結(jié)構(gòu)信息從而幫助有標(biāo)簽的數(shù)據(jù)進(jìn)行預(yù)測(cè)。因此,在研究基于大量的無(wú)標(biāo)簽的樣本和少量的有標(biāo)簽樣本的半監(jiān)督學(xué)習(xí)方法是有意義的。利用無(wú)標(biāo)簽進(jìn)行半監(jiān)督學(xué)習(xí)的做法一般有以下兩種:(1)利用無(wú)標(biāo)簽樣本來(lái)微調(diào)生成模型中的參數(shù);(2)明確有標(biāo)簽和無(wú)標(biāo)簽的樣本,將它們合成一個(gè)訓(xùn)練集來(lái)訓(xùn)練半監(jiān)督模型。本文就是基于第2種思想提出了基于稀疏表示的半監(jiān)督線性子空間學(xué)習(xí)。其基本思想是利用無(wú)標(biāo)簽樣本和有標(biāo)簽樣本間的相關(guān)性來(lái)形成一個(gè)基于半監(jiān)督學(xué)習(xí)的投影矩陣P。

      本文提出了如圖1所示的基于稀疏表示的半監(jiān)督線性子空間學(xué)習(xí)方法。該方法能較好地解決標(biāo)簽樣本的少量性,因此具有更好的實(shí)用性。

      圖1 基于稀疏表示的半監(jiān)督線性子空間學(xué)習(xí)

      2 基于稀疏表示的半監(jiān)督線性子空間學(xué)習(xí)

      線性子空間聚類的一個(gè)重要優(yōu)勢(shì)是分類效果較好且方法簡(jiǎn)單。通過(guò)學(xué)習(xí)投影矩陣P,可以達(dá)到對(duì)高維數(shù)據(jù)的降維;與此同時(shí),在降維后的子空間中,原始圖像的有用信息得到了加強(qiáng),從而提高了分類的準(zhǔn)確率。由圖1可知,本文主要分為三大部分,即字典學(xué)習(xí)、特征分組以及線性子空間學(xué)習(xí)。

      2.1 字典學(xué)習(xí)和稀疏表示

      假設(shè)X=[x1,x2,...xm]∈Rn*m為訓(xùn)練集,本文的主要思想是將其每一個(gè)樣本xi(i∈{1,2,...m})分成兩部分,一部分為具有較高識(shí)別能力的另一部分為具有較低識(shí)別能力的由此X=Xa+Xb,其中對(duì)于一個(gè)線性投影矩陣P,可以得到PX=PXa+PXb,通過(guò)投影矩陣P,使得在Xa中的特征得到保留,在Xb中的特征得到抑制。最后將投影到P上的測(cè)試樣本使用KNN進(jìn)行分類。

      要解決上述問(wèn)題,一個(gè)重要步驟是如何進(jìn)行樣本特征的分解。由于人臉數(shù)據(jù)較高的維度以及特殊的空間關(guān)系,本文中使用學(xué)習(xí)得到的字典D來(lái)表示樣本的特征。其形式描述如下:對(duì)于每一個(gè)樣本人臉xi,將其分成q個(gè)有部分重疊的樣本塊,從而得到h=m*q個(gè)樣本塊。假設(shè)每個(gè)樣本塊tj(j=1,2,...,h)的維數(shù)為l,則訓(xùn)練集可以表示為:T=[t1,t2,..,th]。根據(jù)訓(xùn)練集T,可以把字典學(xué)習(xí)的問(wèn)題轉(zhuǎn)化為求解如下形式的優(yōu)化問(wèn)題:

      其中λ是常數(shù)系數(shù),T∈Rh*l表示輸入的訓(xùn)練集,D=[d1,d2,...,dk]∈Rl*k表示字典,Λ=[α1,α2,...,αh]∈Rk*h表示訓(xùn)練數(shù)據(jù)集的稀疏系數(shù)矩陣。

      在字典學(xué)習(xí)階段,一般采用迭代的方法可以求解式(1)。首先固定字典D,則式子(1)轉(zhuǎn)化為一個(gè)求稀疏矩陣Λ的問(wèn)題;然后固定系數(shù)矩陣Λ,則(1)轉(zhuǎn)化為一個(gè)求字典D的二次約束的最小平方問(wèn)題。根據(jù)K-奇異分解算法(KSVD),首先運(yùn)用正交匹配追蹤(OMP)算法求解稀疏矩陣Λ,接著更新字典D。通過(guò)多次迭代求解可以得到字典D[12-15]。

      通過(guò)學(xué)習(xí)得到字典D以及稀疏表示理論后,可以將每一個(gè)樣本tj表示為如下的形式:

      tj=Dαj=αj(1)d1+αj(2)d2+...+αj(k)dk,也就是說(shuō)每個(gè)樣本塊可以寫成k個(gè)部分的和,即tj=tj,1+tj,2+...+tj,k。通過(guò)將屬于圖像xi的樣本塊進(jìn)行組合,則得到xi=xi,1+xi,2+...+xi,k。其中xi,z是屬于圖像xi的樣本塊tj,z相連得到的,其中重疊部分的像素用均值來(lái)表示xi,z。

      2.2 半監(jiān)督的子空間學(xué)習(xí)

      在稀疏表示之后,每一個(gè)樣本圖像xi被分解為k個(gè)特征圖像xi,z,本文的目的是根據(jù)這k個(gè)特征的識(shí)別能力分為具有較高識(shí)別能力的特征和具有較低識(shí)別能力的特征,從而進(jìn)行更有效的子空間學(xué)習(xí)。

      2.2.1特征分組

      由于半監(jiān)督學(xué)習(xí)的樣本為大量無(wú)標(biāo)簽和少量有標(biāo)簽樣本,因此對(duì)這兩類數(shù)據(jù)集進(jìn)行分組時(shí),將使用不同準(zhǔn)則。

      對(duì)于無(wú)標(biāo)簽樣本,由于不知道樣本圖像xi的類別標(biāo)簽,從而認(rèn)為每一個(gè)樣本都是一個(gè)類別,假設(shè)特征xi,z的標(biāo)準(zhǔn)差越大,我們就認(rèn)為該特征在區(qū)分樣本時(shí)含有更多的信息;根據(jù)這一準(zhǔn)則,特征圖像被分為較高識(shí)別能力和較低識(shí)別能力兩部分。用表示特征圖像xi,z的均值,則xi,z的標(biāo)準(zhǔn)差可以表示為:

      通過(guò)對(duì)標(biāo)準(zhǔn)差進(jìn)行降序排序,選取前τ*k(其中τ為常數(shù))為較高識(shí)別能力的,剩下的為較低識(shí)別能力。為了便于表達(dá),本文假設(shè)特征記為較高識(shí)別能力部分(MDP);記為較低識(shí)別能力部分(LDP)。如圖2即為無(wú)標(biāo)簽樣本的MDP與LDP的結(jié)果圖。

      圖2 無(wú)標(biāo)簽樣本的MDP與LDP

      對(duì)于有標(biāo)簽樣本,由于樣本的標(biāo)簽是已知的,可以根據(jù)Fisher比率進(jìn)行分類[16]。若特征樣本的Fisher比率越大,我們就認(rèn)為該特征樣本在區(qū)分樣本時(shí)含有更多的信息。特征圖像xi,z的Fisher比率計(jì)算方式如式(3):

      其中Xc是標(biāo)簽為c的樣本集,表示特征樣本xi,z的均值,表示屬于類別c(其中c=1,2,...,C)的xi,z均值。mc為類別c的數(shù)目。與無(wú)標(biāo)簽的樣本相似,選取前τ*k為較高識(shí)別能力的,剩下的為較低識(shí)別能力,從而得到MDP部分的以及LDP部分的如圖3即為標(biāo)簽樣本的MDP與LDP的結(jié)果圖。

      圖3 標(biāo)簽樣本的MDP與LDP

      2.2.2子空間學(xué)習(xí)

      通過(guò)特征分組之后,無(wú)標(biāo)簽數(shù)據(jù)集可以表示為X=Xa+Xb,其中每一個(gè)樣本可以表示為同樣的有標(biāo)簽數(shù)據(jù)集也可以表示為其中每一個(gè)樣本可以表示為本文的目標(biāo)是訓(xùn)練得到一個(gè)投影矩陣P,使得對(duì)于任意一個(gè)測(cè)試樣本y,可以使用Py作為該測(cè)試樣本的特征,從而進(jìn)行分類。

      由上面的信息可以得到,Xa以及X'a對(duì)于識(shí)別樣本具有較高的識(shí)別能力,但是如果只使用Xa以及X'a來(lái)學(xué)習(xí)投影矩陣P,那么結(jié)果肯定不是很適合,因?yàn)閄b和X'b的部分同樣也含有有用的信息。為了有效利用兩部分的信息,需要最大化較高識(shí)別能力部分能量的同時(shí)最小化較低識(shí)別能力部分的能量。因此,提出如下(4)的最優(yōu)化問(wèn)題:

      3 實(shí)驗(yàn)

      本實(shí)驗(yàn)使用的是matlab語(yǔ)言進(jìn)行編寫,稀疏字典的學(xué)習(xí)使用SPAMS開源庫(kù)進(jìn)行訓(xùn)練和學(xué)習(xí)。SPAMS開源庫(kù)的學(xué)習(xí)可以參考鏈接http://spams-devel.gforge.inria.fr/index.html。下文所涉及的不同方法均是在相同的服務(wù)器上進(jìn)行測(cè)試,均采用聯(lián)想筆記本小新,處理器為R7-4800U,內(nèi)存為16G,操作系統(tǒng)為Windows10。

      為了驗(yàn)證半監(jiān)督學(xué)習(xí)方法的識(shí)別能力,本文在兩個(gè)不同的公共數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn):AR數(shù)據(jù)集、extended Yale B數(shù)據(jù)集。本文重點(diǎn)在于驗(yàn)證半監(jiān)督學(xué)習(xí)的有效性,因此在實(shí)驗(yàn)過(guò)程中將本文的半監(jiān)督學(xué)習(xí)方法與無(wú)監(jiān)督學(xué)習(xí)以及監(jiān)督學(xué)習(xí)進(jìn)行對(duì)比。在參數(shù)選擇方面,字典塊的大小為8*8,字典的元素個(gè)數(shù)為64。

      3.1 Extended Yale B

      extended Yale B[17]數(shù)據(jù)集是在9個(gè)動(dòng)作以及64種光照條件下形成的38個(gè)人臉。每個(gè)人臉的64張圖片僅在頭部和臉部表情有一點(diǎn)不同。本文隨機(jī)選擇每個(gè)人的前32張中的5張作為訓(xùn)練集,剩余的32張中的5張作為測(cè)試集。該數(shù)據(jù)集上得到的實(shí)驗(yàn)結(jié)果比較如圖4所示。圖中的縱坐標(biāo)為識(shí)別率,其值的計(jì)算為OA(Overall Accuracy),即在測(cè)試集上分類正確的數(shù)量與測(cè)試集的總體數(shù)量之間的比值。

      圖4 extended Yale B實(shí)驗(yàn)結(jié)果

      從圖4可以得到,本文提出的半監(jiān)督線性子空間學(xué)習(xí)方法在該數(shù)據(jù)庫(kù)上取得了較好的效果,比非監(jiān)督學(xué)習(xí)(unsupervised sparse coding based projection,USCP)[6]方法高出2%左右;與此同時(shí)與具有相同樣本標(biāo)簽數(shù)目的監(jiān)督學(xué)習(xí)(supervised sparsecoding based projection,SSCP)[6]相比也有著明顯的提高。由此可見有效利用標(biāo)簽樣本和無(wú)標(biāo)簽樣本而形成的半監(jiān)督學(xué)習(xí)方法十分有利于人臉的識(shí)別。

      3.2 AR數(shù)據(jù)集

      AR數(shù)據(jù)集[18]包含126個(gè)人(其中70個(gè)為男性,56個(gè)為女性)的4000張彩色人臉照片,其大小為576*768。一共有兩個(gè)場(chǎng)景,每一個(gè)場(chǎng)景包含120個(gè)人以及14張彩色圖片,每一個(gè)場(chǎng)景有:中性表情,微笑,憤怒,尖叫,戴著太陽(yáng)眼鏡,戴著圍巾等情況。本文選擇120張人臉進(jìn)行實(shí)驗(yàn),將其人臉大小裁剪為32*32。該數(shù)據(jù)集上得到的實(shí)驗(yàn)結(jié)果比較如圖5所示。圖中的縱坐標(biāo)為識(shí)別率,其值的計(jì)算為OA(Overall Accuracy),即在測(cè)試集上分類正確的數(shù)量與測(cè)試集的總體數(shù)量之間的比值。

      圖5 AR數(shù)據(jù)庫(kù)實(shí)驗(yàn)結(jié)果

      從圖5可以得到,本文的方法在AR數(shù)據(jù)庫(kù)上取得了較好的效果,相較于與非監(jiān)督學(xué)習(xí)(unsupervised sparse coding based projection,USCP)[6]相比,半監(jiān)督學(xué)習(xí)因包含有標(biāo)簽樣本的信息而使得分類結(jié)果提高了將近2%左右;與相同標(biāo)簽樣本數(shù)目的監(jiān)督學(xué)習(xí)(supervised sparse coding based projection,SSCP)[6]相比,使用半監(jiān)督學(xué)習(xí)方法因包含大量的無(wú)標(biāo)簽的信息而使得實(shí)驗(yàn)結(jié)果有了顯著的提高。

      4 結(jié)語(yǔ)

      本文針對(duì)標(biāo)簽樣本價(jià)格昂貴且不易獲得、無(wú)標(biāo)簽樣本廉價(jià)且豐富的特點(diǎn)提出了一種基于稀疏表示的半監(jiān)督子空間學(xué)習(xí)方法。該方法將有標(biāo)簽樣本與無(wú)標(biāo)簽合成一個(gè)訓(xùn)練集進(jìn)行半監(jiān)督模型訓(xùn)練。首先有標(biāo)簽樣本和無(wú)標(biāo)簽樣本各自訓(xùn)練得到一個(gè)字典,然后將每一個(gè)樣本根據(jù)其特性分成MDP和LDP兩個(gè)部分,最后通過(guò)保留MDP部分和抑制LDP部分求解得到投影矩陣P。實(shí)驗(yàn)證明,該方法高于非監(jiān)督樣本以及具有相同標(biāo)簽樣本數(shù)目監(jiān)督學(xué)習(xí)方法。

      猜你喜歡
      字典線性標(biāo)簽
      開心字典
      家教世界(2023年28期)2023-11-14 10:13:50
      開心字典
      家教世界(2023年25期)2023-10-09 02:11:56
      漸近線性Klein-Gordon-Maxwell系統(tǒng)正解的存在性
      線性回歸方程的求解與應(yīng)用
      二階線性微分方程的解法
      無(wú)懼標(biāo)簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      我是小字典
      正版字典
      讀者(2016年14期)2016-06-29 17:25:50
      標(biāo)簽化傷害了誰(shuí)
      平塘县| 沅陵县| 洛阳市| 蓬莱市| 塘沽区| 鲁山县| 闻喜县| 临高县| 株洲县| 澜沧| 洛隆县| 朝阳市| 英德市| 改则县| 大安市| 新竹市| 南木林县| 岢岚县| 阳江市| 永平县| 静乐县| 昆山市| 南澳县| 修水县| 平顶山市| 宝丰县| 舞钢市| 桑日县| 桃源县| 平度市| 河池市| 定襄县| 资溪县| 凤城市| 巴林左旗| 出国| 新野县| 内乡县| 嘉义市| 兴仁县| 望江县|