薛艷
(西安美術(shù)學(xué)院, 藝術(shù)教育學(xué)院, 陜西, 西安 710000)
互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展以及多媒體技術(shù)的廣泛應(yīng)用,使人類獲取多媒體資源的方式發(fā)生了很大的變化[1-2]。在這種情況下,各種類型的多媒體資源定向檢索已經(jīng)逐漸成為不同類型用戶獲取多媒體的重要工具[3]。但是傳統(tǒng)的資源檢索主要是通過關(guān)鍵詞進(jìn)行搜索,檢索效果往往無法令人滿意。為此,相關(guān)專家給出了一些較好的研究成果,例如鄭偉等[4]通過貝葉斯網(wǎng)絡(luò)組建信息檢索模型,實(shí)現(xiàn)信息檢索。李愛勤[5]重點(diǎn)分析不同平臺中地名的表達(dá)特征,設(shè)計了面向地名信息的多級索引組織方式以及檢索框架,以有效實(shí)現(xiàn)信息檢索。以上2種方法雖然取得了較為滿意的研究成果,但是由于未能對多媒體課件資源進(jìn)行降維處理,導(dǎo)致定向檢索錯誤率增加,檢索效率和課件資源的總相似度降低。為此,提出一種大學(xué)英語多媒體課件資源定向檢索方法,最后通過仿真實(shí)驗證明本文所提方法的優(yōu)越性。
在大學(xué)英語多媒體課件資源定向檢索中,對圖像和視頻的內(nèi)容進(jìn)行描述,通常情況下使用特征向量的形式表示,特征向量是指在變換下方向不變,或者簡單地乘以一個縮放因子的非零向量。為了更加精準(zhǔn)地描述多媒體信息[6],大部分特征向量往往是高維的。為此需要選擇特征組合進(jìn)行降維處理。以下采用LLE算法對大學(xué)英語多媒體課件資源進(jìn)行降維處理,具體步驟如下。
給定N個輸入特征向量集合{x1,x2,…,xn},采用LLE算法,獲取降維后的輸出向量,整個算法主要劃分為以下幾個步驟。
(1) 獲取各個特征向量的k個最近鄰點(diǎn),即距離每個特征向量最近的點(diǎn)。
(2) 采用各個特征向量的近鄰點(diǎn)對特征向量進(jìn)行重建[7],獲取重建過程中誤差最小的近鄰局部重建權(quán)值矩陣。
(3) 通過步驟(2)中組建的矩陣和對應(yīng)鄰近點(diǎn)計算特征向量的輸出向量。
計算各個特征向量的k個近鄰點(diǎn),其中k為一個固定值。設(shè)定一個誤差函數(shù),主要用于求解局部重建權(quán)值矩陣,具體計算如下:
(1)
(2)
當(dāng)求解局部重建權(quán)值矩陣W時,需要使誤差函數(shù)的取值達(dá)到最低[8-9],即通過樣本點(diǎn)的近鄰點(diǎn)組建最優(yōu)W矩陣使誤差函數(shù)取值達(dá)到最低。
針對特征向量xi,通過k個近鄰進(jìn)行局部重建,則誤差能夠表示為
(3)
其中,Q(i)為k×k的矩陣,具體的表達(dá)形式如下:
(4)
如果設(shè)定r是一個規(guī)范化參數(shù),I為單位矩陣,則:
(5)
將全部的特征向量映射為低維空間中的向量,同時需要使輸出數(shù)據(jù)在低維空間中保持初始拓?fù)浣Y(jié)構(gòu)。以此為依據(jù)[10],建立一個代價函數(shù),在映射的過程中需要使代價函數(shù)的取值為最低,具體為
(6)
式中,yi為xj的輸出向量,y(i)j為y(i)的k個近鄰點(diǎn),同時需要滿足以下約束條件:
(7)
其中,誤差代價函數(shù)式(6)可改寫為以下形式:
(8)
式中,M為一個N×N的對稱矩陣,利用式(9)給出具體的表達(dá)形式為
(9)
通過拉格朗日乘子法將其進(jìn)行轉(zhuǎn)換,則特征值和特征向量為
(10)
為了使代價函數(shù)最小化,需要選取M的最小m個特征值對應(yīng)的向量為列向量組建矩陣YT,則Y的列向量為m維空間的降維向量。
當(dāng)確定特征向量的局部最近鄰個數(shù)k值后,組建如下的稀疏矩陣,即:
(11)
給定限定條件,將上述問題轉(zhuǎn)換為最小化問題,即轉(zhuǎn)換為最小代價函數(shù)的特征值和特征向量:
(12)
在上述分析的基礎(chǔ)上,通過LLE算法對大學(xué)英語多媒體課件資源進(jìn)行降維處理,即:
(13)
采用多模態(tài)檢索機(jī)制進(jìn)行大學(xué)英語多媒體課件資源定向檢索,利用圖1給出多模態(tài)檢索體系結(jié)構(gòu)。
圖1 多模態(tài)檢索體系結(jié)構(gòu)
當(dāng)給出交叉參照索引時,需要優(yōu)先設(shè)定多媒體對象,以下將交叉參照多媒體對象簡稱為廣義關(guān)鍵字,即:
P(Oi)=(〈gki1,wi1〉,〈gki2,wi2〉,…,〈gkik,wik〉,…,
〈gkiN,wiN〉)
(14)
在組建檢索系統(tǒng)的初級階段,需要優(yōu)先對多媒體進(jìn)行預(yù)處理,多媒體對象的交叉參照索引可以根據(jù)分析已有的多媒體文檔組成結(jié)構(gòu)以及網(wǎng)絡(luò)上的超鏈接組建。
通過自動得到的交叉參照索引全面利用大學(xué)英語多媒體課件資源間的隱式語義關(guān)系,針對面向用戶的檢索而言,僅僅使用這些交叉進(jìn)行檢索能力是有限的。首先,在大學(xué)英語多媒體課件資源進(jìn)行預(yù)處理以及用戶提交查詢的過程中,會出現(xiàn)單一的多媒體對象,這些多媒體對象的交叉參照索引很難建立。同時,大學(xué)英語多媒體課件資源組成的結(jié)構(gòu)僅僅是課件設(shè)計者對多媒體對象語義關(guān)系的理解,由于檢索是面向用戶的,所以在進(jìn)行交叉參考索引時還需要全面分析大學(xué)英語多媒體課件資源語義間的關(guān)系。
為有效提升檢索精度,需要加入相關(guān)反饋這種人機(jī)交互手段,通過用戶對檢索的反饋信息及時調(diào)整多媒體對象的交叉參照索引。其中,交叉參照索引以及關(guān)鍵字索引兩者存在一定的相似性,兩者的主要差異是交叉參照索引使用的是一組多媒體對象進(jìn)行標(biāo)注,而關(guān)鍵字索引使用的是關(guān)鍵字標(biāo)注多媒體對象。
在交叉參照索引中,各個廣義關(guān)鍵字gkik所對應(yīng)的權(quán)重wik體現(xiàn)了上述的第一個因素,所以需要對其進(jìn)行調(diào)整,如式(15):
(15)
式中,M為關(guān)鍵字的總數(shù)量,Mik為交叉參照索引中含有g(shù)kik廣義關(guān)鍵字的多媒體對象總數(shù)。
兩個多媒體對象間交叉參照索引間的相似度計算主要通過余弦距離完成,同時能夠?qū)⒔徊鎱⒄账饕g的相似度轉(zhuǎn)換為對應(yīng)夾角的余弦值,具體表達(dá)形式如下:
(16)
(17)
通過加權(quán)平均算法計算多媒體對象P和查詢對象Q兩者間的距離,即:
(18)
其中,相關(guān)反饋信息的處理問題能夠被描述為通過用戶的反饋信息獲取理想的查詢對象,同時使反饋正例和查詢向量間的加權(quán)距離平方和最小化,即:
(19)
采用拉格朗日乘子法將具有約束條件的優(yōu)化問題轉(zhuǎn)換為無約束的最優(yōu)問題,即:
(20)
檢索主要是通過多個不同的階段完成的,首先通過索引進(jìn)行候選對象匹配;再更新查詢矢量和相似度度量,計算候選對象的綜合相似度;最后排列對象并且返回至用戶。其中,多媒體對象和例子對象兩者間的總相似度計算式為
(21)
式中,Ri為第一階段計算出Oi和例子對象兩者間的對等索引相似度。
為進(jìn)一步提升檢索結(jié)果準(zhǔn)確性,用戶可以將大學(xué)英語多媒體課件資源標(biāo)注為相關(guān)或者不相關(guān)。通過上述操作流程,對查詢向量以及歐拉相似函數(shù)進(jìn)行優(yōu)化處理,通過一個全面的相似度量方法來重新計算各個對象的總相似度,具體計算式如下:
(22)
由此,實(shí)現(xiàn)大學(xué)英語多媒體課件資源定向檢索。
為了驗證本文所提方法的綜合有效性,在Ubuntu16.04,電腦配置為GPU(NVIDIA GTX-10606G顯存),CPU(i7-6700),8G內(nèi)存,進(jìn)行仿真實(shí)驗測試。在仿真實(shí)驗測試過程中,為保證實(shí)驗結(jié)果的準(zhǔn)確性,使代價函數(shù)的取值為最低,大學(xué)英語多媒體課件資源總數(shù)為800條,共進(jìn)行50次實(shí)驗測試,將定向檢索錯誤率作為測試指標(biāo),具體的實(shí)驗對比結(jié)果如圖2所示。
圖2 不同方法的定向檢索錯誤率對比結(jié)果
分析圖2可知,隨著實(shí)驗次數(shù)的持續(xù)增加,文獻(xiàn)[4]、文獻(xiàn)[5]方法的定向檢索錯誤率均呈直線上升趨勢,而本文所提方法的定向檢索錯誤率則處于穩(wěn)定的狀態(tài),這是因為設(shè)計方法優(yōu)先對不同的課件資源進(jìn)行了降維處理,有效剔除了無價值信息,從而使錯誤率得到了明顯降低。
為預(yù)測各個檢索方法的性能,以下實(shí)驗測試將檢索效率設(shè)定為測試指標(biāo),具體實(shí)驗結(jié)果如表1所示。
表1 不同方法的檢索效率對比結(jié)果
分析表1可知,本文所提方法能夠獲取課件資源中有價值的信息,剔除無用的信息,有效降低資源重疊,大大提升整個方法的檢索效率,且明顯優(yōu)于另外2種方法。
為了更深入驗證本文所提方法的優(yōu)越性,將大學(xué)英語多媒體課件資源總相似度作為測試對象進(jìn)行實(shí)驗,對比如圖3所示。
圖3 不同方法的大學(xué)英語多媒體課件資源總相似度對比結(jié)果
分析圖3可知,相比另外2種方法,本文所提方法的大學(xué)英語多媒體課件資源總相似度明顯更高,最高可達(dá)到97.5%,這是因為其他2種方法未能對資源進(jìn)行降維處理,導(dǎo)致其受到外界因素和人為因素影響嚴(yán)重,無法獲取理想的檢索效果,而本文設(shè)計方法對相關(guān)資源進(jìn)行降維處理,能夠滿足大學(xué)英語多媒體教學(xué)的需要,具有一定的實(shí)際應(yīng)用價值。
本文設(shè)計并提出一種大學(xué)英語多媒體課件資源定向檢索方法。仿真結(jié)果表明,本文所提方法能夠有效降低定向檢索錯誤率,提升檢索效率和課件資源總相似度。由于受到時間以及環(huán)境等因素的限制,致使本文所提方法仍然存在一定不足,后續(xù)將對其進(jìn)行全面的完善和改進(jìn)。