• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      特征選擇

      • 基于哨兵二號的大豆、玉米遙感識別
        兵二號影像;特征選擇;遙感識別中圖分類號:TP79????? 文獻(xiàn)標(biāo)識碼:A????? 文章編號:1000-4440(2023)08-1698-09Recognition of corn and soybean based on Sentinel-2 imagery: a case study in Xuhuai area, Jiangsu provinceWANG Jing-jing1 LAN Shi-hao2 QIU Lin1 WANG Shu1 SH

        江蘇農(nóng)業(yè)學(xué)報 2023年8期2024-01-30

      • 基于數(shù)據(jù)挖掘的田徑運動員訓(xùn)練質(zhì)量評估研究
        ;數(shù)據(jù)挖掘;特征選擇;模型構(gòu)建隨著競技體育水平的不斷提高,田徑運動員的訓(xùn)練質(zhì)量成為關(guān)鍵的競爭要素。通過數(shù)據(jù)挖掘技術(shù)對訓(xùn)練過程中的數(shù)據(jù)進(jìn)行分析,可以找出提高訓(xùn)練質(zhì)量的關(guān)鍵因素,從而為教練員和運動員提供科學(xué)的訓(xùn)練建議。本研究基于數(shù)據(jù)挖掘的田徑運動員訓(xùn)練質(zhì)量評估方法,旨在提高運動員的整體競技水平。1 數(shù)據(jù)挖掘在田徑運動員訓(xùn)練質(zhì)量評估中的應(yīng)用探討1.1 提高田徑運動員訓(xùn)練質(zhì)量的重要性田徑運動是體育競技的基礎(chǔ)項目,涵蓋了跑、跳、投等多個子項目。訓(xùn)練質(zhì)量直接影響著田徑

        拳擊與格斗·上半月 2023年7期2023-09-18

      • 多策略增強(qiáng)型麻雀搜索算法
        叉優(yōu)化算法;特征選擇中圖分類號:TP18? 文獻(xiàn)標(biāo)識碼:A? ? ? 文章編號:2096-4706(2023)13-0039-08Multi-Strategy Enhanced Sparrow Search AlgorithmCHEN Jiandong, NIE Bin, LEI Yinxiang, ZHANG Yuchao, CHEN Xingxin, MIAO Zhen(College of Computer Science, Jiangxi Univ

        現(xiàn)代信息科技 2023年13期2023-09-14

      • 基于卷積神經(jīng)網(wǎng)絡(luò)的腦卒中中醫(yī)辨證分型舌象分類研究
        支持向量機(jī);特征選擇〔中圖分類號〕R288? ? ? ?〔文獻(xiàn)標(biāo)志碼〕A? ? ? ? 〔文章編號〕doi:10.3969/j.issn.1674-070X.2023.08.019Convolutional neural networks-based TCM pattern differentiation and classification of tongue manifestations in stroke patientsWANG Zhaoyu1,

        湖南中醫(yī)藥大學(xué)學(xué)報 2023年8期2023-09-07

      • 基于優(yōu)化CS-SVM算法的DGA域名檢測研究
        型。關(guān)鍵詞:特征選擇;DGA域名;布谷鳥搜索算法;支持向量機(jī)中圖分類號:TP393.0? 文獻(xiàn)標(biāo)識碼:A? 文章編號:2096-4706(2023)11-0077-03Research on DGA Domain Name Detection Based on Optimized CS-SVM AlgorithmLU Jiaqi, LYU Guangxu, WEI Xianyan, FENG Yanru, WANG Xiaoying(Institute o

        現(xiàn)代信息科技 2023年11期2023-08-01

      • 航班到港延誤時長預(yù)測及特征分析
        消除方法進(jìn)行特征選擇;其次,構(gòu)建航班延誤時長預(yù)測模型,利用遺傳算法進(jìn)行參數(shù)調(diào)優(yōu),并與目前常用的模型進(jìn)行對比;最后,在航班延誤時長預(yù)測的基礎(chǔ)上結(jié)合SHAP模型,從總體特征和特征間的相互關(guān)系2個角度分析特征的重要程度。實驗結(jié)果表明,經(jīng)過遺傳算法調(diào)優(yōu)的XGBoost模型預(yù)測精度更高,其中MAE降低了8.94%,RMSE降低了19.85%,MAPE降低了6.15%,且其模型精度更高。因此,SHAP模型破除了XGBoost模型的黑盒特性,增強(qiáng)了模型的可解釋性,可為降

        河北科技大學(xué)學(xué)報 2023年3期2023-07-18

      • 基于Hilbert-Schmidt獨立準(zhǔn)則的多標(biāo)簽學(xué)習(xí)算法
        詞:多標(biāo)簽:特征選擇:相關(guān)性:Hilbert-Schmidt中圖分類號:TP181文獻(xiàn)標(biāo)志碼:A0 引言在實際生活中,數(shù)據(jù)多以多標(biāo)簽的形式存在的,使得多標(biāo)簽特征選擇、分類和識別成了機(jī)器學(xué)習(xí)中重要的研究方向之一。對比傳統(tǒng)的單標(biāo)簽數(shù)據(jù),多標(biāo)簽數(shù)據(jù)由于存在復(fù)雜多變的目標(biāo)對象以及龐大的標(biāo)簽組合空間,變得十分具有挑戰(zhàn)性[1]。多標(biāo)簽數(shù)據(jù)最主要的特點是數(shù)據(jù)的多個標(biāo)簽之間存在著相關(guān)性。探索標(biāo)簽的語義信息和相互聯(lián)系,是提高多標(biāo)簽學(xué)習(xí)方法的性能的重要手段之一[1]。如在經(jīng)典

        無線互聯(lián)科技 2023年4期2023-06-22

      • 基于相對混亂度特征選擇的船舶風(fēng)機(jī)智能狀態(tài)監(jiān)測與故障診斷
        、特征提取、特征選擇和故障識別組成的智能狀態(tài)監(jiān)測和故障診斷框架,以及基于相對混亂度的特征選擇方法和基于特征選擇的支持向量機(jī)訓(xùn)練方法。該方法相比傳統(tǒng)方法在故障識別準(zhǔn)確率上有所提升,可達(dá)到94.46%,并且可有效縮短分類器計算耗時,最快可將其縮短77.8%。文中提出的算法框架、特征選擇方法、基于特征選擇的支持向量機(jī)訓(xùn)練方法和智能故障診斷方法相比現(xiàn)有方法有一定的優(yōu)勢,對機(jī)艙中回轉(zhuǎn)機(jī)械設(shè)備的狀態(tài)監(jiān)測和故障診斷有一定的參考價值。關(guān)鍵詞:智能故障診斷; 特征選擇; 支

        上海海事大學(xué)學(xué)報 2023年1期2023-06-22

      • 改進(jìn)的ReliefF-BPNN分類模型
        。關(guān)鍵詞: 特征選擇; ReliefF算法; 交互增益; BP神經(jīng)網(wǎng)絡(luò);分類中圖分類號:TP181? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A? ? ?文章編號:1006-8228(2023)06-20-05Improved ReliefF-BPNN classification modelLi Yupei, Wang Xinli(College of Science, University of Shanghai for Science and Technolog

        計算機(jī)時代 2023年6期2023-06-15

      • 云環(huán)境下基于模糊C均值的入侵檢測系統(tǒng)
        ;入侵檢測;特征選擇;模糊C均值1引言云計算是IT領(lǐng)域中一種按需取用及付費的全新商業(yè)模式。云計算因其節(jié)約成本、維護(hù)方便、配置靈活,能夠應(yīng)對大數(shù)據(jù)時代的產(chǎn)生的IT資源問題,已經(jīng)成為企業(yè)、個人等優(yōu)先選擇的一項服務(wù)。然而,云計算其巨大的市場對入侵者也有著巨大的誘惑力。由于規(guī)模巨大、結(jié)構(gòu)復(fù)雜、用戶繁多,其潛在攻擊面較大,網(wǎng)絡(luò)安全機(jī)制亟待完善,云環(huán)境相應(yīng)的安全問題也呈直線上升趨勢。本文將聚類分析應(yīng)用到云環(huán)境中檢測異常流量數(shù)據(jù),是對入侵檢測系統(tǒng)的一種完善。2云環(huán)境下入

        計算機(jī)應(yīng)用文摘 2023年5期2023-05-30

      • 云環(huán)境下基于模糊C均值的入侵檢測系統(tǒng)
        ;入侵檢測;特征選擇;模糊C均值1引言云計算是IT領(lǐng)域中一種按需取用及付費的全新商業(yè)模式。云計算因其節(jié)約成本、維護(hù)方便、配置靈活,能夠應(yīng)對大數(shù)據(jù)時代的產(chǎn)生的IT資源問題,已經(jīng)成為企業(yè)、個人等優(yōu)先選擇的一項服務(wù)。然而,云計算其巨大的市場對入侵者也有著巨大的誘惑力。由于規(guī)模巨大、結(jié)構(gòu)復(fù)雜、用戶繁多,其潛在攻擊面較大,網(wǎng)絡(luò)安全機(jī)制亟待完善,云環(huán)境相應(yīng)的安全問題也呈直線上升趨勢。本文將聚類分析應(yīng)用到云環(huán)境中檢測異常流量數(shù)據(jù),是對入侵檢測系統(tǒng)的一種完善。2云環(huán)境下入

        計算機(jī)應(yīng)用文摘·觸控 2023年5期2023-03-22

      • 基于l2,0范數(shù)稀疏性和模糊相似性的圖優(yōu)化無監(jiān)督組特征選擇方法
        兩種方式: 特征選擇[5-6]和特征提取[7-8].特征提取是對原始特征空間進(jìn)行映射或變換,得到原始特征線性組合或非線性組合生成的一組特征.與特征提取不同,特征選擇是在原始特征空間中進(jìn)行,通過某種評價策略,從原始特征集上選擇最具有代表性的特征子集.因此,相比特征提取,特征選擇保留數(shù)據(jù)的原始物理意義,具有更強(qiáng)的可解釋性.根據(jù)數(shù)據(jù)標(biāo)簽的使用情況,特征選擇可分為3類:監(jiān)督特征選擇[9-10]、半監(jiān)督特征選擇[11]和無監(jiān)督特征選擇[12].在實際生活中,數(shù)據(jù)標(biāo)簽

        模式識別與人工智能 2023年1期2023-02-25

      • 基于粗糙集的動態(tài)特征選擇算法研究
        糙集;動態(tài);特征選擇;信息量;可分辨矩陣;正域1 引言所謂特征選擇,顧名思義是從原始特征空間中篩選與任務(wù)相關(guān)的特征,剔除無關(guān)、冗余及噪聲特征等[1]。 在大數(shù)據(jù)時代下,由于信息量急速增加,數(shù)據(jù)集的構(gòu)成具有動態(tài)變化和不確定性的特征,傳統(tǒng)特征選擇方法普遍面臨不能適應(yīng)的問題[2]。 粗糙集理論作為一種數(shù)據(jù)分析理論,是一種處理不精確、不確定與不完全數(shù)據(jù)的數(shù)學(xué)方法,被廣泛應(yīng)用于知識發(fā)現(xiàn)、模式識別、生物學(xué)及數(shù)據(jù)挖掘等領(lǐng)域,使得應(yīng)用粗糙集理論解決數(shù)據(jù)特征選擇面臨的上述不

        計算機(jī)應(yīng)用文摘·觸控 2022年21期2022-12-12

      • 基于遺傳算法的封裝式特征選擇研究
        機(jī)器學(xué)習(xí)中,特征選擇在數(shù)據(jù)預(yù)處理階段被用來剔除數(shù)據(jù)集中的冗余特征。特征選擇分為嵌入式、過濾式、封裝式。其中,封裝式特征選擇在監(jiān)督學(xué)習(xí)中應(yīng)用廣泛。本文主要研究將遺傳算法用于封裝式特征選擇時,不同的個體選擇策略與種群更新策略的結(jié)合對監(jiān)督學(xué)習(xí)算法預(yù)測準(zhǔn)確率的影響。實驗結(jié)果表明,錦標(biāo)賽選擇法與精英個體參與遺傳操作的精英保留策略相結(jié)合的方式,能夠得到最好的效果。通過在所有數(shù)據(jù)集上的計算總平均準(zhǔn)確率發(fā)現(xiàn),這種結(jié)合方式比將所有特征用于學(xué)習(xí)的平均準(zhǔn)確率高出1.2%。關(guān)鍵詞

        電腦知識與技術(shù) 2022年19期2022-08-31

      • 文本分類中TF-IDF算法的改進(jìn)研究
        :文本分類;特征選擇;CHI平方統(tǒng)計;TFIDF;分類準(zhǔn)確性隨著在線信息的快速發(fā)展,如何有效地處理大量文本成為一個熱門的研究課題,文本分類是其中的關(guān)鍵任務(wù)之一。文本分類是將新文檔分配給預(yù)先存在的類別,并且已廣泛用于許多領(lǐng)域,如信息檢索、電子郵件分類、垃圾郵件過濾、主題定位。近年來,大多數(shù)研究集中在尋找新的分類算法上,對信息檢索的文獻(xiàn)表示模型的改進(jìn)研究很少。傳統(tǒng)模型有三種:向量空問模型、概率模型、推理網(wǎng)絡(luò)模型。向量空問模型把對文本內(nèi)容的處理簡化為向量空間中的

        計算技術(shù)與自動化 2022年2期2022-07-04

      • 基于特征選擇和CNN+Bi-RNN模型的小麥抗寒性識別方法
        究對象,利用特征選擇算法和深度學(xué)習(xí)方法實現(xiàn)小麥抗寒性識別研究。首先,使用集成學(xué)習(xí)中的自適應(yīng)增強(qiáng)(adaptive boosting,簡稱AdaBoost)算法和極端梯度提升(extreme gradient boosting,簡稱XGBoost)算法進(jìn)行特征選擇;然后,將卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,簡稱CNN)抽取的局部特征和雙向循環(huán)神經(jīng)網(wǎng)絡(luò)(Bi-direction recurrent neural netw

        江蘇農(nóng)業(yè)科學(xué) 2022年10期2022-06-12

      • 基于決策樹的代碼異味優(yōu)先級評估
        決策樹; 特征選擇; 軟件可維護(hù)性中圖分類號: TP 311??? 文獻(xiàn)標(biāo)志碼: A??? 文章編號: 1000-5137(2022)02-0210-07GUO Di, WU Haitao(College of Information, Mechanical and Electrical Engineering, Shanghai Normal University, Shanghai 201418, China) Based on the priori

        上海師范大學(xué)學(xué)報·自然科學(xué)版 2022年2期2022-06-01

      • 基于混合特征選擇的腦電解碼方法
        腦電解碼中,特征選擇非常重要。由于運動想象腦電存在個體差異,因此需要特征選擇方法選擇被試特異的頻帶特征、時間窗特征、通道特征等[1]。另外,融合特征也需要特征選擇方法選擇更具判別性的特征。單一特征或者少數(shù)特征不需要特征選擇,但是單一特征通常不能更好地表征完整的腦電信息。融合特征有利于實現(xiàn)信息互補(bǔ)[2],但是通常也包含噪聲和冗余信息。因此,融合特征需要特征選擇剔除無效信息。此外,特征選擇可以降低特征維數(shù),減少分類模型的復(fù)雜度,避免維數(shù)災(zāi)難和過擬合?,F(xiàn)有特征選

        計算機(jī)與現(xiàn)代化 2022年4期2022-05-05

      • 改進(jìn)的KNN分類異常點檢測方法
        亮河關(guān)鍵詞:特征選擇;孤立森林算法;NSL-KDD中圖分類號:TP3910引言隨著信息技術(shù)的發(fā)展,在大數(shù)據(jù)時代,準(zhǔn)確收集各方面的數(shù)據(jù)格外重要,然而數(shù)據(jù)容易被異常點污染,因此數(shù)據(jù)質(zhì)量的監(jiān)測被越來越多的學(xué)者重視。在異常檢測系統(tǒng)研究領(lǐng)域中,異常點檢測是其中一項非常重要的環(huán)節(jié)。在物聯(lián)網(wǎng)領(lǐng)域中,前人提出了許多方法處理研究數(shù)據(jù)異常值來保證檢測結(jié)果的準(zhǔn)確性,例如SVM、KDE、聚類、貝葉斯、決策樹等方法,但是很少有方法是通過研究數(shù)據(jù)的相關(guān)性去進(jìn)行異常點檢測研究。通常我們

        甘肅科技縱橫 2022年1期2022-05-01

      • 基于特征選擇集成學(xué)習(xí)的軍事體育訓(xùn)練成績分析
        基礎(chǔ)上,結(jié)合特征選擇集成學(xué)習(xí)模型一般步驟,建立基于特征選擇集成學(xué)習(xí)的軍事體育訓(xùn)練成績分析模型。模型按照軍事體育訓(xùn)練成績的數(shù)據(jù)規(guī)范化準(zhǔn)備,按照身體素質(zhì)建立特征子集和基學(xué)習(xí)器,按動態(tài)權(quán)值構(gòu)建集成學(xué)習(xí)模型三步完成模型構(gòu)建。通過試點應(yīng)用,在歷史訓(xùn)練數(shù)據(jù)發(fā)現(xiàn)集成學(xué)習(xí)模型具有更高的預(yù)測效能和更好的可解釋性。關(guān)鍵詞:軍事體育訓(xùn)練;特征選擇;集成學(xué)習(xí);數(shù)據(jù)預(yù)處理中圖分類號:TP 181? ? ? 文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2022)03-0081-03開

        電腦知識與技術(shù) 2022年3期2022-03-12

      • 基于LSTM的智能家庭用電預(yù)測模型研究
        基礎(chǔ)上設(shè)計了特征選擇方法,對多個特征進(jìn)行重要性計算,選取其中重要性高的部分進(jìn)行建模,然后利用LSTM網(wǎng)絡(luò)與全連接層對時間序列數(shù)據(jù)進(jìn)行訓(xùn)練,得到預(yù)測模型。實驗結(jié)果表明,所提方法的預(yù)測效果明顯優(yōu)于其他三種模型,能與真實數(shù)據(jù)較好地擬合。關(guān)鍵詞:智慧能源;用電預(yù)測;特征選擇;時間序列;LSTM網(wǎng)絡(luò)中圖分類號:TP399? ? ?文獻(xiàn)標(biāo)識碼:AResearch on Smart Power Consumption Prediction?Model of Smart

        軟件工程 2022年2期2022-03-09

      • 正交基低冗余無監(jiān)督特征選擇
        要的意義,而特征選擇是數(shù)據(jù)降維的一種常用手段,本研究分析數(shù)據(jù)集的特征選擇.特征選擇旨在從原始數(shù)據(jù)集中選出具有判別特性且相關(guān)的特征子集,同時減少冗余、不相關(guān)、高噪聲的特征.許多研究人員提出了各種特征選擇法,并廣泛應(yīng)用于機(jī)器學(xué)習(xí)的各個領(lǐng)域.根據(jù)樣本的標(biāo)簽信息,特征選擇可以分為有監(jiān)督特征選擇、半監(jiān)督特征選擇和無監(jiān)督特征選擇[1].由于獲得樣本的類別信息需要大量的工作,因此研究無監(jiān)督的特征選擇具有重要意義.不僅如此, 無監(jiān)督特征選擇在發(fā)現(xiàn)數(shù)據(jù)集內(nèi)部隱含的信息也有一

        福州大學(xué)學(xué)報(自然科學(xué)版) 2022年1期2022-01-21

      • 基于屬性相關(guān)性與特征選擇的K-近鄰缺失值順序填充算法
        補(bǔ)時難以進(jìn)行特征選擇,提出一種基于屬性相關(guān)性的對于多維數(shù)據(jù)缺失按順序并進(jìn)行特征選擇的填充方法,在解決相關(guān)性計算的問題同時提出了采用相關(guān)性進(jìn)行填充順序選擇。算法首先提取完整數(shù)據(jù)集或者投影計算距離相關(guān)性,并按照一定的方式按相關(guān)性從大到小進(jìn)行填充,保證在填充時不會因為特征選擇出現(xiàn)參照數(shù)據(jù)集為空的情況,在填充時選擇大于相關(guān)性臨界點的特征在投影的基礎(chǔ)上進(jìn)行近鄰填充。實驗分別在不同缺失率下計算該方法與其它算法的均方誤差結(jié)果,結(jié)果表明,該算法在填充效果上明顯優(yōu)于其它算法

        錦繡·下旬刊 2021年11期2021-10-12

      • 基于鄰域區(qū)間擾動融合的無監(jiān)督特征選擇算法框架
        這種境況下,特征選擇技術(shù)顯得尤為重要。特征選擇技術(shù)的主要目的是在一個特定的評估標(biāo)準(zhǔn)下,從原始的高維特征中選擇出最重要的特征子集,然后利用選擇出的特征子集結(jié)合一些有效的算法去完成數(shù)據(jù)聚類、分類等任務(wù)。根據(jù)數(shù)據(jù)樣本是否含有標(biāo)簽信息,特征選擇算法可分為有監(jiān)督特征選擇[1,2]、半監(jiān)督特征選擇[3-5]和無監(jiān)督特征選擇[6-8]3類。有監(jiān)督和半監(jiān)督特征選擇通常會用到樣本的標(biāo)簽信息,通過特征和標(biāo)簽信息之間的相關(guān)性來評定特征的重要性?,F(xiàn)實中采集到的數(shù)據(jù)很少有標(biāo)簽信息,

        南京理工大學(xué)學(xué)報 2021年4期2021-09-15

      • 基于K-means算法的企業(yè)信用無監(jiān)督分類研究
        算法;分類;特征選擇Abstract: The application of corporate credit classification can reduce the risk of credit business for commercial banks. With the continuous intensification of market competition, the application of machine learning and

        電腦知識與技術(shù) 2021年22期2021-09-14

      • 基于LSTM模型的國民經(jīng)濟(jì)GDP增長預(yù)測建模研究
        ;LSTM;特征選擇;隨機(jī)森林中圖分類號:F12 ? ? ? ?文獻(xiàn)標(biāo)志碼:A ? ? ?文章編號:1673-291X(2021)19-0005-05引言近幾年,全球經(jīng)濟(jì)和貿(mào)易增長逐漸放緩。國際環(huán)境復(fù)雜多變,貿(mào)易壁壘不斷增加,世界經(jīng)濟(jì)面臨增長乏力的局面。中國經(jīng)濟(jì)正在由高速增長階段轉(zhuǎn)向高質(zhì)量發(fā)展。受全球經(jīng)濟(jì)放緩和中美貿(mào)易摩擦不確定的影響,經(jīng)濟(jì)運行總體平穩(wěn),GDP增速放緩。GDP增速反映經(jīng)濟(jì)發(fā)展趨勢,與人民的生活水平息息相關(guān)。中國國家統(tǒng)計局?jǐn)?shù)據(jù)顯示,中國經(jīng)濟(jì)經(jīng)

        經(jīng)濟(jì)研究導(dǎo)刊 2021年19期2021-09-12

      • 一種新的最大相關(guān)最小冗余特征選擇算法
        30006)特征選擇是數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和模式識別中的一項重要技術(shù),是當(dāng)前信息領(lǐng)域的研究熱點之一[1-3]。它在數(shù)據(jù)分析和預(yù)處理過程中起著非常重要的作用。特征選擇在不改變特征原始表達(dá)的基礎(chǔ)上,僅從特征集中篩選最能代表數(shù)據(jù)特點的最優(yōu)特征子集。因此,不僅可以去除不相關(guān)和冗余信息,降低訓(xùn)練樣本的維度和分類樣本的復(fù)雜度,而且能很好地保持原始特征包含的信息,對于人們理解和判斷觀測來說更加容易。特征選擇根據(jù)其是否與后續(xù)學(xué)習(xí)算法獨立可以分為過濾式和封裝式兩種。過濾式特征

        智能系統(tǒng)學(xué)報 2021年4期2021-09-11

      • 基于鄰域粗糙集的莆田地區(qū)肺癌特征選擇
        臨床數(shù)據(jù)進(jìn)行特征選擇是必要的。本文提出一種基于變精度鄰域粗糙集的特征選擇算法,并對從醫(yī)院采集的病例進(jìn)行特征選擇,然后用多種機(jī)器學(xué)習(xí)的方法驗證特征選擇的有效性。1? ? ?鄰域粗糙集和變精度鄰域粗糙集粗糙集理論(Rough Sets,RS)是Z.Pawlak[1]在上世紀(jì)90年代初提出的理論,通過上、下近似集,將知識分為模糊的知識和精確的知識,這使得RS理論具備從不確定、不一致、不完備的知識中,找出潛藏知識的能力。隨后,為了解決經(jīng)典粗糙集抗干擾能力差的問題,

        廊坊師范學(xué)院學(xué)報(自然科學(xué)版) 2021年2期2021-09-10

      • 粗糙集屬性約簡在客戶流失預(yù)測中的應(yīng)用
        效地實現(xiàn)客戶特征選擇,從而降低客戶流失預(yù)測的運算難度,提高預(yù)測性能?!続bstract】Customer churn prediction, as the main problem of customer relationship management, has always been the focus of researchers. Based on internal and external data information, enterprises

        中小企業(yè)管理與科技·中旬刊 2021年7期2021-08-06

      • 基于圖像識別的水果分揀系統(tǒng)
        :圖像識別;特征選擇;實時統(tǒng)計;水果分揀中圖分類號: S126;TP391.41 ?文獻(xiàn)標(biāo)志碼: A ?文章編號:1002-1302(2021)10-0170-06傳統(tǒng)水果分揀主要采用人工分揀,而人工分揀效率低、易造成水果損壞、準(zhǔn)確率低、人力物力消耗較大,極大增加了分揀成本。為了降低水果分揀成本,亟需探索出一種分揀效率高、準(zhǔn)確率高、人力物力消耗小的自動化系統(tǒng)。關(guān)于農(nóng)產(chǎn)品的品質(zhì)鑒定和分級研究,主要涉及農(nóng)產(chǎn)品的大小、形狀、顏色、表面損傷與缺陷檢測等[1-5]。

        江蘇農(nóng)業(yè)科學(xué) 2021年10期2021-07-01

      • 精準(zhǔn)扶貧視角下高校家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定預(yù)測機(jī)制探究
        于差分進(jìn)化的特征選擇為數(shù)據(jù)進(jìn)行預(yù)處理,去除冗余特征,降低數(shù)據(jù)維度,以2個標(biāo)準(zhǔn)數(shù)據(jù)集與1個采集數(shù)據(jù)集對特征選擇結(jié)果在2個分類器上進(jìn)行有效性驗證。以近2000名學(xué)生的信息為數(shù)據(jù)樣本,通過K近鄰分類預(yù)測算法預(yù)測學(xué)生家庭經(jīng)濟(jì)困難程度,驗證了算法的可行性以及準(zhǔn)確性。為大數(shù)據(jù)在高校教育中的應(yīng)用提供了新的模式和方法。關(guān)鍵詞:精準(zhǔn)資助;大數(shù)據(jù);差分進(jìn)化;特征選擇;K近鄰預(yù)測中圖分類號:G640? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? ? ?文章編號:2096-000X(2

        高教學(xué)刊 2021年3期2021-06-20

      • 網(wǎng)絡(luò)入侵檢測場景下的特征選擇方法對比研究
        ,采用適當(dāng)?shù)?span id="j5i0abt0b" class="hl">特征選擇算法來縮減流量特征規(guī)模對于提高網(wǎng)絡(luò)入侵檢測系統(tǒng)性能來說具有重要意義[6-7].特征選擇作為一項數(shù)據(jù)預(yù)處理手段早已發(fā)展多年,它對提高機(jī)器學(xué)習(xí)模型的性能起到了重要作用. 然而,面對眾多的特征選擇算法,如mRMR[8]、馬爾科夫毯[9]、卡方檢驗、互信息、梯度下降樹[10]、隨機(jī)森林[11]、CART決策樹[12]、最小二乘法[13]等,如何選擇適合于應(yīng)用場景下的算法以及所選特征選擇算法是否能夠有效縮減特征規(guī)模以去除冗余特征,且不會影響入侵檢

        河南科學(xué) 2021年3期2021-05-06

      • 基于卷積神經(jīng)網(wǎng)絡(luò)與特征選擇的醫(yī)療圖像誤差預(yù)測算法
        積神經(jīng)網(wǎng)絡(luò)與特征選擇的醫(yī)療圖像誤差預(yù)測算法. 首先,選取5種集成規(guī)則構(gòu)建自適應(yīng)多分類器,對醫(yī)療圖像區(qū)域進(jìn)行分類;其次,訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),利用訓(xùn)練完成的神經(jīng)網(wǎng)絡(luò)提取不同類別醫(yī)療圖像區(qū)域特征,以此為基礎(chǔ)計算區(qū)域距離,尋找出相似度最小的區(qū)域,完成圖像可疑區(qū)域定位;再次,融合多評價標(biāo)準(zhǔn)生成特征子集,從中搜索得到最優(yōu)特征子集,完成可疑區(qū)域圖像特征選擇;最后,以選擇得到的特征區(qū)域像素點作為訓(xùn)練樣本,建立預(yù)測樣本與訓(xùn)練樣本之間的多元線性回歸矩陣,實現(xiàn)誤差預(yù)測. 實驗結(jié)果

        湖南大學(xué)學(xué)報·自然科學(xué)版 2021年4期2021-05-06

      • 基于LightGBM算法的中小上市公司財務(wù)困境預(yù)測研究
        五種方法構(gòu)建特征選擇集成評分模型并篩選出關(guān)鍵特征,利用SMOTE算法處理非平衡數(shù)據(jù),在此數(shù)據(jù)預(yù)處理基礎(chǔ)上基于LightGBM算法建立財務(wù)困境預(yù)測模型并將實驗結(jié)果與以邏輯回歸、支持向量機(jī)、決策樹、XGBoost等算法為基礎(chǔ)建立的預(yù)測模型對比。結(jié)果顯示,在測試集上LightGBM集成學(xué)習(xí)模型對中小企業(yè)財務(wù)困境預(yù)測準(zhǔn)確率高達(dá)0.950 877、AUC值為0.975 8遠(yuǎn)遠(yuǎn)高于基于其他算法的預(yù)測模型。這對金融企業(yè)精準(zhǔn)評價中小企業(yè)的財務(wù)風(fēng)險以及政府實施中小企業(yè)政策扶

        荊楚理工學(xué)院學(xué)報 2021年3期2021-03-29

      • 藏文文本分類技術(shù)研究綜述
        表示以及文本特征選擇方法進(jìn)行了分析和比較,接著回顧了藏文在機(jī)器學(xué)習(xí)方面的分類算法特點,深入討論了不同算法應(yīng)用在藏文文本分類技術(shù)上的研究情況,最后指出了當(dāng)前藏文文本分類所面臨的問題和挑戰(zhàn),并對未來的研究提出了建議。關(guān)鍵詞:藏文文本分類;文本表示;特征選擇;機(jī)器學(xué)習(xí)中圖分類號: TP391? ? ? ? 文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2021)04-0190-03Abstract :This article introduces the rese

        電腦知識與技術(shù) 2021年4期2021-03-22

      • 基于改進(jìn)人工蜂群算法的大數(shù)據(jù)特征選擇方法
        摘 要:數(shù)據(jù)特征選擇就是從初始的數(shù)據(jù)特征中選擇指定數(shù)據(jù)進(jìn)行子集篩選。目前,通常使用人工蜂群算法進(jìn)行特征選擇,但由于收斂慢、尋優(yōu)差,無法滿足人們的需求。因此,本文提出一種改進(jìn)人工蜂群算法,通過特征選擇繪制大數(shù)據(jù)特征選擇框架圖,建立多項搜索渠道;利用改進(jìn)的人工蜂群算法提取并行特征,使用MapReduce模型降低編程難度,獲取并行特征最優(yōu)解;設(shè)計特征選擇復(fù)雜粗糙集模型,并構(gòu)建特征學(xué)習(xí)模型來實現(xiàn)大數(shù)據(jù)特征選擇。試驗結(jié)果表明,設(shè)計的特征選擇方法性能優(yōu)于傳統(tǒng)方法。關(guān)鍵

        河南科技 2021年19期2021-03-10

      • 一種面向?qū)ο蟮娜斯げ莸剡b感監(jiān)測方法
        2)最優(yōu)分類特征選擇對于面向?qū)ο筮b感信息提取至關(guān)重要,驗證了J-M距離對特征選擇的有效性,該方法可以適用于不同影像,但所選的特征依賴于具體影像和待提取要素的特性;(3)試驗區(qū)人工草地呈現(xiàn)團(tuán)塊狀的集聚分布,主要分布在城鎮(zhèn)周邊,多沿道路分布。2013-2017年,人工草地草種植范圍呈擴(kuò)張趨勢,增加的區(qū)域大部分來自耕地。關(guān)鍵詞:人工草地;遙感監(jiān)測;面向?qū)ο蠓诸?多尺度分割;特征選擇中圖分類號:TP75文獻(xiàn)標(biāo)識碼:A文章編號:1000-4440(2021)06-1

        江蘇農(nóng)業(yè)學(xué)報 2021年6期2021-01-29

      • 雙重代價敏感隨機(jī)森林算法
        在隨機(jī)森林的特征選擇階段和集成投票階段引入代價敏感學(xué)習(xí)。在特征選擇階段提出了生成代價向量時間復(fù)雜度更低的方法,并將代價向量引入到了分裂屬性的計算中,使其在不破壞隨機(jī)森林隨機(jī)性的同時更有傾向性地選擇強(qiáng)特征;在集成階段引入誤分類代價,從而選出對少數(shù)類數(shù)據(jù)更敏感的決策樹集合。在UCI數(shù)據(jù)集上的實驗結(jié)果表明,提出的算法較對比方法具有更高的整體識別率,平均提高2.46%,對少數(shù)類識別率整體提升均在5%以上。關(guān)鍵詞:隨機(jī)森林;不平衡數(shù)據(jù);特征選擇;代價敏感DOI:10

        哈爾濱理工大學(xué)學(xué)報 2021年5期2021-01-16

      • 多標(biāo)記特征選擇算法的綜述
        一類為多標(biāo)記特征選擇方法。特征抽取是指對原始特征空間進(jìn)行特定組合(線性組合)將其映射到一個低維空間,該類方法通??梢杂行Ы稻S并取得不錯的分類效果,但是不能保留原始特征的物理意義,對應(yīng)分類過程不具有解釋性。而現(xiàn)實領(lǐng)域中的很多問題,往往需要更好的解釋性,例如醫(yī)療領(lǐng)域,好的解釋性有助于醫(yī)生更好地運用模型;金融領(lǐng)域,好的解釋性有助于金融公司了解為用戶推薦基金的原因。相較于特征抽取,特征選擇方法不僅可以有效去除特征空間中冗余、無關(guān)特征,而且可以保留原始特征的物理意義

        鄭州大學(xué)學(xué)報(理學(xué)版) 2020年4期2020-11-18

      • 面向高新企業(yè)審計數(shù)據(jù)的特征選擇算法研究
        ,采用二階段特征選擇算法進(jìn)行特征篩選與建模分析。隨著近年來模式識別和數(shù)據(jù)挖掘等領(lǐng)域中數(shù)據(jù)規(guī)模和特征維數(shù)的快速增加,特征選擇已成為去除數(shù)據(jù)中非相關(guān)和冗余特征的重要手段。在特征選擇中,最好的特征子集是維數(shù)最少且滿足對分類準(zhǔn)確性貢獻(xiàn)最大的子集[1]。本文從二階段特征選擇算法展開,基于過濾式(Filter)和包裹式(Wrapper)的特征選擇算法進(jìn)行設(shè)計建模,論證所提出的特征選擇方法的有效性。1 基于最大互信息系數(shù)的第一階段特征選擇算法在原特征子集中存在大量的噪聲

        科技創(chuàng)新發(fā)展戰(zhàn)略研究 2020年6期2020-09-08

      • 基于進(jìn)化計算的特征選擇方法研究概述
        的廣泛關(guān)注。特征選擇(feature selection, FS)是從一組初始特征中挑選出一些具有代表性的特征以降低特征空間維數(shù)的過程,是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的關(guān)鍵問題之一。對于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí),一個好的學(xué)習(xí)樣本是訓(xùn)練分類器的關(guān)鍵,樣本中是否包含有不相關(guān)或冗余特征直接影響著分類器的性能。特征選擇的目的是尋找解決問題所必須的、足夠的最小特征子集。通過從原始特征集中剔除不相關(guān)和冗余特征以減少數(shù)據(jù)的維數(shù),加速學(xué)習(xí)過程,簡化學(xué)習(xí)模型和提高學(xué)習(xí)算法的性能[1]。有效

        鄭州大學(xué)學(xué)報(工學(xué)版) 2020年1期2020-02-25

      • 特征選擇算法研究綜述
        2)一、引言特征選擇在文本分類、文本檢索、基因分析和藥物診斷等場合有廣泛應(yīng)用,是模式識別領(lǐng)域的研究熱點之一。例如,自動文本分類是指按照給定的分類體系,依據(jù)文本的內(nèi)容自動進(jìn)行文本所屬類別判別的過程,是一種有監(jiān)督的學(xué)習(xí)過程。自動文本分類在信息過濾、信息檢索、搜索引擎和數(shù)字圖書館等領(lǐng)域有廣泛應(yīng)用。分類系統(tǒng)主要包括數(shù)據(jù)預(yù)處理、文檔分詞、特征表示、特征選擇、文本表示、分類器選擇和訓(xùn)練以及分類結(jié)果評價等過程。1975年,文獻(xiàn)[1]提出向量空間模型(Vector Spa

        安徽開放大學(xué)學(xué)報 2019年4期2019-12-06

      • 基于詞向量的文本特征選擇方法研究
        .因此,進(jìn)行特征選擇,對提升分類的準(zhǔn)確率和速度具有重要意義.傳統(tǒng)的文本特征選擇大多基于統(tǒng)計的方法,通過計算特征詞在語料中的詞頻或特征詞與類別的關(guān)系,來評價每個詞對分類的貢獻(xiàn)度.常用的特征選擇方法有以下幾種:DF[3](Document Frequency,文檔頻率)特征選擇,利用訓(xùn)練集中特征詞出現(xiàn)的文檔數(shù)進(jìn)行特征選擇.通過設(shè)置閾值,過濾文檔頻率較低的特征詞.該方法會忽略掉一些文檔頻率過低但對分類影響較大的特征詞.CHI[4](Chi-square test

        小型微型計算機(jī)系統(tǒng) 2018年5期2018-07-04

      • 基于特征變權(quán)的動態(tài)模糊特征選擇算法
        du.cn)特征選擇是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)中的一個重要課題,它不僅有助于理解數(shù)據(jù)、節(jié)約計算成本、減少特征之間的相互影響,而且可以提高預(yù)測的準(zhǔn)確率[1-2].特征選擇也稱特征子集選擇,是指從原始特征中選擇出一些最有效特征以降低數(shù)據(jù)集維度的過程[3].目前,特征選擇已經(jīng)應(yīng)用于多個領(lǐng)域,例如工業(yè)傳感器數(shù)據(jù)分析[4]、空氣質(zhì)量分析[5]、健康數(shù)據(jù)分析[6]等等.在一些現(xiàn)實的系統(tǒng)中,人們往往利用一些模糊語義將原始特征集轉(zhuǎn)化為模糊特征集,提高系統(tǒng)的可解釋性.然而,模糊化

        計算機(jī)研究與發(fā)展 2018年5期2018-05-28

      • 網(wǎng)絡(luò)視頻流量分類的特征選擇方法研究
        頻流量分類的特征選擇方法研究吳爭,董育寧南京郵電大學(xué)通信與信息工程學(xué)院,南京2100031 引言近年來,隨著互聯(lián)網(wǎng)和流媒體技術(shù)的迅速發(fā)展,網(wǎng)絡(luò)視頻業(yè)務(wù)的增長非常迅速。在2016年互聯(lián)網(wǎng)流量中,視頻流量的比例已達(dá)到73%,根據(jù)思科[1]的預(yù)測,到2021年將達(dá)到82%,并且每秒鐘將有1 000 000 min的視頻內(nèi)容通過網(wǎng)絡(luò)。通過網(wǎng)絡(luò)視頻業(yè)務(wù)流的分類,可以為互聯(lián)網(wǎng)提供商(ISP)更好地依據(jù)不同視頻業(yè)務(wù)的服務(wù)質(zhì)量(QoS)要求提供不同等級的服務(wù)。由于動態(tài)端口

        計算機(jī)工程與應(yīng)用 2018年6期2018-03-19

      • 基于結(jié)構(gòu)化多視圖稀疏限定的監(jiān)督特征選擇算法研究
        疏限定的監(jiān)督特征選擇算法研究史彩娟,段昌鈺,谷志斌(華北理工大學(xué),河北 唐山 063210)為了有效利用多視圖數(shù)據(jù)信息提升監(jiān)督特征選擇的性能,構(gòu)建了一種結(jié)構(gòu)化多視圖稀疏限定,并基于該稀疏限定提出了一種監(jiān)督特征選擇方法,即結(jié)構(gòu)化多視圖監(jiān)督特征選擇方法(SMSFS)。該方法在特征選擇過程中能夠同時考慮不同視圖特征的重要性以及同一視圖中不同特征的重要性,從而有效的結(jié)合多視圖數(shù)據(jù)信息,提升監(jiān)督特征選擇的性能。SMSFS目標(biāo)函數(shù)是非凸的,設(shè)計了一個有效的迭代算法對目

        圖學(xué)學(xué)報 2018年6期2018-02-23

      • 基于特征聚類集成技術(shù)的在線特征選擇
        成技術(shù)的在線特征選擇杜政霖1*,李 云1,2(1.南京郵電大學(xué) 計算機(jī)學(xué)院,南京 210003; 2.桂林電子科技大學(xué) 廣西高校云計算與復(fù)雜系統(tǒng)重點實驗室,廣西 桂林 541004) (*通信作者電子郵箱simondzl@163.com)針對既有歷史數(shù)據(jù)又有流特征的全新應(yīng)用場景,提出了一種基于組特征選擇和流特征的在線特征選擇算法。在對歷史數(shù)據(jù)的組特征選擇階段,為了彌補(bǔ)單一聚類算法的不足,引入聚類集成的思想。先利用k-means方法通過多次聚類得到一個聚類集

        計算機(jī)應(yīng)用 2017年3期2017-05-24

      • 兩種基于K近鄰特征選擇算法的對比分析
        種基于K近鄰特征選擇算法的對比分析薛又岷,嚴(yán)玉萍,古嘉玲,包曉蓉(江蘇科技大學(xué) 計算機(jī)科學(xué)與工程學(xué)院,江蘇 鎮(zhèn)江212003)在特征選擇過程中,針對近鄰錯誤分類率較低的問題,分別采用正向貪心和逆向貪心思想設(shè)計了兩種啟發(fā)式特征選擇算法,其目的是在降低數(shù)據(jù)集中特征數(shù)量的同時,能夠進(jìn)一步降低近鄰錯誤分類率。通過8組UCI數(shù)據(jù)集上的交叉驗證結(jié)果表明,相比于正向貪心算法,逆向貪心算法能夠刪除較多的冗余特征,從而得出逆向貪心算法能夠更有效地提高近鄰算法的分類精度的結(jié)論

        電子設(shè)計工程 2016年1期2016-09-08

      • 不平衡情感分類中的特征選擇方法研究
        特征的問題,特征選擇方法在文本分類研究中占有非常重要的地位[5]。然而,對于情感分類,特別是不平衡情感分類,特征選擇方法的研究還非常缺乏。如果在不平衡分類任務(wù)中進(jìn)行特征選擇還是一個迫切需要解決的問題相關(guān)研究表明,在不平衡情感分類中,欠采樣(Under-sampling)方法是一種表現(xiàn)較好的方法[6]。為了能夠降低不平衡分類中高維度特征空間問題,本文以欠采樣方法為基礎(chǔ),結(jié)合四種經(jīng)典的特征選擇方法,提出三種特征選擇模式。本文結(jié)構(gòu)安排如下: 第2節(jié)介紹了不平衡情

        中文信息學(xué)報 2013年4期2013-04-23

      • 穩(wěn)定的特征選擇研究*
        有用的知識,特征選擇已成為高維數(shù)據(jù)分類或者回歸中的關(guān)鍵問題[1],目前已被廣泛應(yīng)用于文本分類、圖像檢索、基因分析和入侵檢測等。所謂特征選擇就是從一組特征中挑選出一些最有效的特征以達(dá)到降低特征空間維數(shù)或者發(fā)現(xiàn)自然模型真實變量的過程,其通常包括兩個關(guān)鍵問題:搜索策略和評價準(zhǔn)則。參考文獻(xiàn)[2-4]對已有特征選擇方法以及特征選擇統(tǒng)一框架進(jìn)行了全面的綜述。特征選擇算法根據(jù)訓(xùn)練的數(shù)據(jù)集中樣本有無標(biāo)記通常分為監(jiān)督、非監(jiān)督和半監(jiān)督特征選擇算法。在評價過程中,監(jiān)督的特征選擇

        網(wǎng)絡(luò)安全與數(shù)據(jù)管理 2012年15期2012-02-28

      • 基于模擬退火的多標(biāo)記數(shù)據(jù)特征選擇
        性,其降維和特征選擇方法的研究仍然很少。目前多標(biāo)記學(xué)習(xí)技術(shù)大體可以分為兩類[1-2]:轉(zhuǎn)化問題方法,改寫算法方法。轉(zhuǎn)化問題方法獨立于算法,把多標(biāo)記學(xué)習(xí)任務(wù)轉(zhuǎn)化為一個或多個但標(biāo)記分類任務(wù),如單標(biāo)記學(xué)習(xí)打分、組合類標(biāo)、繼承學(xué)習(xí)方法等;改寫算法方法通過擴(kuò)展特定的學(xué)習(xí)算法(如Boosting,支持向量機(jī),決策樹等)來直接處理多標(biāo)記數(shù)據(jù)。對于特征維數(shù)高影響學(xué)習(xí)器效果方面,近年發(fā)表的一個特征抽取方法是多標(biāo)記最大依賴維數(shù)約簡(MDDM)算法[9-10],這個方法采用希爾

        計算機(jī)工程與設(shè)計 2011年7期2011-09-07

      宁陕县| 汶川县| 屯昌县| 钦州市| 商洛市| 台山市| 都江堰市| 潞城市| 关岭| 西和县| 凤台县| 阿拉尔市| 齐齐哈尔市| 鄄城县| 大渡口区| 余庆县| 梧州市| 玉山县| 林口县| 汾西县| 舒兰市| 繁峙县| 石柱| 南涧| 恭城| 隆德县| 平安县| 酒泉市| 夏河县| 合阳县| 湖北省| 怀仁县| 江西省| 杂多县| 嵩明县| 吉林市| 云和县| 平凉市| 西林县| 苏尼特左旗| 临漳县|