• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于Hilbert-Schmidt獨立準(zhǔn)則的多標(biāo)簽學(xué)習(xí)算法

      2023-06-22 17:30:42李程文鄧家亮
      無線互聯(lián)科技 2023年4期
      關(guān)鍵詞:特征選擇相關(guān)性

      李程文 鄧家亮

      摘要:與傳統(tǒng)二分類或多分類的單標(biāo)簽問題不同,多標(biāo)簽問題研究中一個目標(biāo)可能與多個標(biāo)簽相關(guān)聯(lián),標(biāo)簽之間豐富關(guān)系的存在導(dǎo)致對多標(biāo)簽問題的分析研究更加復(fù)雜。針對如何利用特征與標(biāo)簽、標(biāo)簽與標(biāo)簽之間的關(guān)系的問題,文章提出了基于Hilbert-Schmidt獨立準(zhǔn)則的多標(biāo)簽學(xué)習(xí)算法。該方法利用Hilbert -Schmidt獨立準(zhǔn)則評估特征和它的標(biāo)簽之間關(guān)聯(lián)性并對其進行改進,采用多項式核函數(shù)代替線性核函數(shù)來衡量特征和標(biāo)簽的相關(guān)聯(lián)性,考慮到不同標(biāo)簽對分類的貢獻不同,加入標(biāo)簽權(quán)重矩陣。實驗證明,文章研究的算法可以提高多標(biāo)簽分類的性能。

      關(guān)鍵詞:多標(biāo)簽:特征選擇:相關(guān)性:Hilbert-Schmidt

      中圖分類號:TP181

      文獻標(biāo)志碼:A

      0 引言

      在實際生活中,數(shù)據(jù)多以多標(biāo)簽的形式存在的,使得多標(biāo)簽特征選擇、分類和識別成了機器學(xué)習(xí)中重要的研究方向之一。對比傳統(tǒng)的單標(biāo)簽數(shù)據(jù),多標(biāo)簽數(shù)據(jù)由于存在復(fù)雜多變的目標(biāo)對象以及龐大的標(biāo)簽組合空間,變得十分具有挑戰(zhàn)性[1]。多標(biāo)簽數(shù)據(jù)最主要的特點是數(shù)據(jù)的多個標(biāo)簽之間存在著相關(guān)性。探索標(biāo)簽的語義信息和相互聯(lián)系,是提高多標(biāo)簽學(xué)習(xí)方法的性能的重要手段之一[1]。如在經(jīng)典的行人檢測數(shù)據(jù)集INRIA Person Dataset中,圖片分為只有車、只有人、有車有人、無車無人4個類別,其中既有車又有人的圖片則屬于典型的多標(biāo)簽圖像,如何精準(zhǔn)地識別出有車又有人的圖片中的行人就是多標(biāo)簽研究中常見的問題[2]。

      本文提出了一種新的多標(biāo)簽分類算法框架,即基于Hilbert-Schmidc獨立準(zhǔn)則的多標(biāo)簽學(xué)習(xí)算法。這種算法利用Hilhert -Schmidt獨立準(zhǔn)則評估特征和它的標(biāo)簽之間關(guān)聯(lián)性,對其進行改進,采用多項式核函數(shù)代替線性核函數(shù)來衡量特征和標(biāo)簽的相關(guān)聯(lián)性,考慮到不同標(biāo)簽對分類的貢獻不同,加入標(biāo)簽權(quán)重矩陣。

      1 Hilbert-Schmidt獨立準(zhǔn)則

      Hilbert - Schmidt獨立評估準(zhǔn)則是一種基于核函數(shù)的變量相關(guān)性評價方法。該方法首先計算2個變量在再生核希爾伯特空間( RKHS)中的互協(xié)方差,然后從這些變量中選擇出適合用于多標(biāo)簽分類的特征[3]。

      雖然HSIC準(zhǔn)則可以很好地用來評估2個變量在核空間中的相關(guān)性,但是對于多標(biāo)簽數(shù)據(jù)而言,不同標(biāo)簽對于同一特征的重要性是不同的,而且多標(biāo)簽數(shù)據(jù)的多個標(biāo)簽之間存在某種相關(guān)聯(lián)性。本研究對HSIC準(zhǔn)則進行改進,采用多項式核來衡量標(biāo)簽之間的相關(guān)聯(lián)性,加入標(biāo)簽權(quán)重。

      2 多標(biāo)簽分類算法

      選擇出來的最優(yōu)特征應(yīng)使得特征和它的標(biāo)簽之間具有最大關(guān)聯(lián)性。對于每一個特征,不同標(biāo)簽與它的關(guān)聯(lián)性和重要程度是不一樣的。本研究引入權(quán)重矩陣β。根據(jù)HSIC準(zhǔn)則,式(7)可以改寫為如下:

      3 實驗

      3.1 數(shù)據(jù)集

      本次實驗使用的是化合物毒性預(yù)測( PTC),該數(shù)據(jù)集包含作用在4種不同老鼠身上的417種不同的化合物致癌信息。每一種老鼠體內(nèi)被注入任意一個化合物都會產(chǎn)生CE、SE、P、E、EE、IS、NE、N類醫(yī)學(xué)反應(yīng),其中P、SE和CE屬于正標(biāo)簽類別.N和NE屬于負標(biāo)簽類別,E、IS和EE屬于不明確標(biāo)簽。在實驗中,本研究將這類標(biāo)簽移除。最終得到253種化合物實驗的數(shù)據(jù),并分配4類標(biāo)簽,即小型的雄性老鼠MM、大型的雄性老鼠MR、小型的母性老鼠FM、大型的母性老鼠FR[4]。

      3.2 實驗方法

      為了體現(xiàn)本文方法的實用性和有效性,將設(shè)置以下對比實驗:

      (1)單標(biāo)簽+SVM:這種方法是將多標(biāo)簽分類任務(wù)轉(zhuǎn)換為多個二分類任務(wù),使用SVM作為二分類器將數(shù)據(jù)分類成多個二分類別。

      (2) MLFS+ BoosTexter:采用評估方法選擇適合的多標(biāo)簽特征數(shù)據(jù),然后采用多標(biāo)簽分類器BoosTexter對其進行分類。

      3.3 實驗結(jié)果

      在實驗中,整個數(shù)據(jù)集被劃分為10個相等大小的部分。其中.1份用作驗證集,其余9份用作訓(xùn)練集,然后重復(fù)10次,直到每份都曾用作驗證集,其余折疊用作訓(xùn)練集。為了驗證算法的有效性,本研究采用Average Precision和Hamming Loss評估多標(biāo)簽分類性能。實驗結(jié)果如圖1和圖2所示,可以看出無論是Hamming Loss還是Average Precision,本文提出的方法MLFS-BT分類效果比SL-SVM的分類效果好。

      4 結(jié)語

      本文采用Hilbert - SChmidt獨立準(zhǔn)則評估特征與標(biāo)簽之間關(guān)聯(lián)性,采用多項式核函數(shù)對其進行改進,同時考慮到不同標(biāo)簽對分類的貢獻不同,加入標(biāo)簽權(quán)重矩陣,從而選擇出對分類起作用比較大的特征,通過實驗證明方法的有效性。以后的研究可以考慮將算法擴展到多標(biāo)簽圖像識別領(lǐng)域。

      參考文獻

      [1]李為.基于圖神經(jīng)網(wǎng)絡(luò)的多標(biāo)簽圖像識別[D].哈爾濱:哈爾濱工業(yè)大學(xué).2021.

      [2] BEN-BARUCH E, RIDNIK T,ZAMIR N,et al.AsVmmetriC loss for multi -lahel classification[ EB/OL].( 2021 -07 - 29)[2023 - 01 - 20]. https://www. xueshufan.com/publication/3090578762.

      [3]張居杰.多標(biāo)簽學(xué)習(xí)中關(guān)鍵問題研究[D].西安:西安電子科技大學(xué).2016.

      [4]李遠航.基于圖數(shù)據(jù)的主動學(xué)習(xí)方法的多標(biāo)簽分類研究與應(yīng)用[D].廣州:廣東工業(yè)大學(xué),2015.

      (編輯王永超)

      猜你喜歡
      特征選擇相關(guān)性
      Kmeans 應(yīng)用與特征選擇
      電子制作(2017年23期)2017-02-02 07:17:06
      基于Kronecker信道的MIMO系統(tǒng)通信性能分析
      科技視界(2016年21期)2016-10-17 17:37:34
      小兒支氣管哮喘與小兒肺炎支原體感染相關(guān)性分析
      腦梗死與高同型半胱氨酸的相關(guān)性研究(2)
      腦梗死與高同型半胱氨酸的相關(guān)性研究
      會計信息質(zhì)量可靠性與相關(guān)性的矛盾與協(xié)調(diào)
      決策有用觀下財務(wù)會計信息質(zhì)量研究
      基于GA和ELM的電能質(zhì)量擾動識別特征選擇方法
      聯(lián)合互信息水下目標(biāo)特征選擇算法
      基于特征選擇聚類方法的稀疏TSK模糊系統(tǒng)
      镇宁| 霍山县| 新宾| 绵竹市| 南岸区| 会泽县| 杂多县| 东乌| 威信县| 阿图什市| 嘉黎县| 安西县| 香港| 边坝县| 广昌县| 南澳县| 历史| 凤山市| 蓝田县| 犍为县| 九江县| 凤阳县| 鄱阳县| 天柱县| 长乐市| 四平市| 张家口市| 库伦旗| 五台县| 天水市| 大埔县| 义马市| 奉新县| 德安县| 永济市| 铜川市| 阿合奇县| 宁河县| 五华县| 三亚市| 营口市|