• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      加入皮爾遜相關系數(shù)的局部保持投影方法

      2016-10-20 08:28:08于顏儒
      中國科技縱橫 2016年17期
      關鍵詞:皮爾遜約簡維數(shù)

      于顏儒

      (天津理工大學中環(huán)信息學院 電工電子教學訓練中心,天津 300380)

      加入皮爾遜相關系數(shù)的局部保持投影方法

      于顏儒

      (天津理工大學中環(huán)信息學院 電工電子教學訓練中心,天津 300380)

      隨著多媒體技術的不斷發(fā)展,基于內容的圖像檢索技術發(fā)展迅猛。本篇文章提供一種面向多媒體信息檢索領域的特征維數(shù)約簡技術,它針對多媒體圖像、視頻數(shù)據(jù)特征維數(shù)很高、容易引起“維數(shù)災難”的特點,利用檢索結果與查詢之間的相關程度信息,加入皮爾遜相關系數(shù),對傳統(tǒng)的局部保持投影(Local Preserving Projection, LPP)[1]進行了改進,達到了提高維數(shù)約簡效果的目的。

      維數(shù)約簡 LPP 皮爾遜相關系數(shù)

      1 研究背景

      隨著信息技術的快速發(fā)展,圖像和視頻等多媒體數(shù)據(jù)大量涌現(xiàn),成為人們獲取信息的重要途徑之一。然而,這些數(shù)據(jù)通常具有高維特性,直接其進行分析和處理會出現(xiàn)如下重要問題:(1)計算復雜度高;(2)存儲代價高昂;(3)維數(shù)災難。這些問題嚴重制約多媒體內容分析和檢索。維數(shù)約簡是有效解決這些問題的重要方法,其目標是通過對原始數(shù)據(jù)進行變換而得到的有效的低維表示。維數(shù)約簡的定義為給定一批觀察樣本,記作,即包含n個樣本,每個樣本均是D維,根據(jù)某個準則,找到數(shù)據(jù)的低維表示同時保持數(shù)據(jù)的幾何結構。

      局部保持投影方法能較好解決數(shù)據(jù)處理中的“維數(shù)災難”問題,保持原始數(shù)據(jù)的拓撲結構不變[2],作為拉普拉斯特征映射的一種線性逼近可以較好的反映樣本的流形結構,已經(jīng)被廣泛的應用到圖像檢索和圖像修復中。局部保持投影方法有著非常重要的一步是構建所有點的鄰接圖,距離定義為歐氏距離,即相似度的計算。有時在做相似度計算的時候經(jīng)常會用到皮爾遜相關系數(shù)[3],它描述了兩個定距變量間聯(lián)系的緊密程度(線性關系)。在歐式距離的基礎之上加入皮爾遜相關系數(shù),能夠得到更加準確的鄰接圖。

      2 加入皮爾遜相關系數(shù)的局部保持算法

      LPP是一種最近提出的能夠較好保持非線性局部數(shù)據(jù)特征的線性流形學習算法,它是Laplace-Beltrami算子[4]特征函數(shù)的一個線性估計,其目的是保持數(shù)據(jù)之間原有的相似關系,即原始數(shù)據(jù)空間上相鄰的數(shù)據(jù)點在投影后的空間上也保持相應的相鄰關系。LPP算法中的無向圖構造和相似矩陣的建立都需要計算任意兩點之間的距離,最經(jīng)典的距離計算方式是歐式距離,但是歐式距離只是從數(shù)據(jù)的角度,并沒有考慮到數(shù)據(jù)本身的結構,不能準確的體現(xiàn)數(shù)據(jù)間的關系。所以引入了皮爾遜相關系數(shù),提出了加入皮爾遜相關系數(shù)的局部保持算法(PCC-LPP)。PCC-LPP能夠更加準確保持每個數(shù)據(jù)點的近鄰關系,使維數(shù)約簡之后的數(shù)據(jù)更加接近原始數(shù)據(jù)特征。

      皮爾遜相關系數(shù)是一種度量兩個變量間相關程度的方法。樣本之間的相關系數(shù)一般用表示,計算公式為:

      r的取值在-1與+1之間,若 0r>,表明兩個變量是正相關,即一個變量的值越大,另一個變量的值也會越大, r為1時,為完全正相關;若 0r<,表明兩個變量是負相關,即一個變量的值越大另一個變量的值反而會越小, r為-1時,為完全負相關。在這里我們認為 r值越大表示兩個樣本的相似程度越高[6][7]。

      在計算兩點距離時將皮爾遜相關系數(shù)加入到原始的歐式距離中,新的距離計算公式為:

      其ijS中表示新的相似矩陣,。則目標函數(shù)可以轉化為:是Laplacian矩陣。同經(jīng)典的LPP算法一樣需要增加約束條件。目標函數(shù)表示為

      其中, D*仍為對角矩陣,,并且將最小值求解問題轉化為特征值求解問題:

      PCC-LPP能夠更加準確的體現(xiàn)數(shù)據(jù)之間的關系,使得維數(shù)約簡算法更加準確。PCC-LPP是對LPP算法的改進,沒有加入其他標注信息,所以依然是一個無監(jiān)督的線性降維算法。

      3 實驗結果

      從Google搜索引擎上搜索10個查詢主題,包括 “Bike”、“Greet Wall”、“White House”、“Ice cream”、“Football”、“Fish”、“Baby”、“Tree”、“Summer”、“Stars”。分別涉及動物,人物,運動,景物。下載每個主題查詢結果的前500幅圖像,并且為每幅圖像人工標注相關實驗首先提取圖像的特征向量,然后用不同的維數(shù)約簡方法處理圖像特征向量,再用降維之后得到的數(shù)據(jù)和部分標注的相關性等級進行排序訓練得到排序模型,利用排序模型對所有樣本進行排序,最后評價各個維數(shù)約簡算法在重排序中的效果。(如圖1所示)為查詢的初始結果和重排序之后的結果。

      性等級。相關性等級分為三個級:非常相關、一般相關、不相關。實驗前為每個查詢主題選擇一少部分圖像作為訓練圖像,非常相關、一般相關、不相關每組選出若干圖像組成標注樣本集合,其余樣本作為未標注樣本集合。

      [1]Niyogi X. Locality preserving projections[C]//Neural information processing systems. 2004,16:153.

      [2]林晟.人臉圖像特征提取和識別算法研究[D].哈爾濱理工大學,2009.

      [3]Derrick T R,Bates B T, Dufek J S. Evaluation of time-series data sets using the Pearson product-moment correlation coefficient[J].Medicine and science in sports and exercise,1994,26(7):919.

      [4]Andreotti A,Vesentini E.Carleman estimates for the Laplace-Beltrami equation on complex manifolds[J].Publications Mathé matiques de l'IH?S,1965,25(1):81-130.

      [5]張忠林,曹志字,李元韜.基于加權歐式距離的k_means算法研究[J].鄭州大學學報:工學版, 2010,31(1):89-92.

      [6]王翠茹,田振清.兩隨機變量簡單相關系數(shù)圖式的算法設計[J].中國教育技術裝備,2011(006):69-70.

      [7]郭洪燕.工業(yè)企業(yè)安全投入與產出模型研究[D].蘭州理工大學,2011.

      猜你喜歡
      皮爾遜約簡維數(shù)
      β-變換中一致丟番圖逼近問題的維數(shù)理論
      現(xiàn)代統(tǒng)計學之父:卡爾·皮爾遜
      現(xiàn)代統(tǒng)計學之父:卡爾·皮爾遜
      一類齊次Moran集的上盒維數(shù)
      基于二進制鏈表的粗糙集屬性約簡
      Excel在水文學教學中的應用
      卡方分布的探源
      實值多變量維數(shù)約簡:綜述
      自動化學報(2018年2期)2018-04-12 05:46:01
      基于模糊貼近度的屬性約簡
      關于齊次Moran集的packing維數(shù)結果
      洛南县| 措美县| 乡宁县| 和顺县| 萝北县| 南涧| 乌拉特前旗| 通城县| 巨野县| 柞水县| 南昌市| 黄龙县| 普兰店市| 阿尔山市| 霍邱县| 桦甸市| 乌恰县| 开封县| 固阳县| 宣恩县| 金坛市| 景德镇市| 达拉特旗| 西畴县| 陵水| 长白| 盐城市| 临泉县| 始兴县| 平昌县| 浪卡子县| 固安县| 潍坊市| 公安县| 长沙市| 康平县| 辽源市| 栖霞市| 阳原县| 太白县| 响水县|