means算法
- 一種基于GDK-means的高校貧困生信息隱私保護方法研究
DK-means算法,在保證數(shù)據(jù)可用性的前提下,可實現(xiàn)數(shù)據(jù)發(fā)布中較好的隱私保護性。關(guān)鍵詞:貧困生資助;分布式聚類;隱私保護;K-means算法中圖分類號:TP311.13;G647? 文獻標(biāo)識碼:A? 文章編號:2096-4706(2023)11-0030-04Research on a College Information Privacy-Protection Method for Poor StudentsBased on GDK-meansLIU
現(xiàn)代信息科技 2023年11期2023-08-01
- 基于YOLOv5算法的足球訓(xùn)練識別系統(tǒng)
過K-means算法進行二次算法模型分析,對圖像聚類分析改進算法對圖像特征。在算法訓(xùn)練結(jié)束后,文章對此目標(biāo)檢測算法模型進行測試,測試結(jié)果表明:聚類分析后的目標(biāo)算法模型對足球漏檢的情況顯著變少,而且對足球的實時檢測效果表現(xiàn)良好,提升了算法識別速度和識別準(zhǔn)確度;其mAP平均精度達到了98.6%,與原改進前提升了1%。關(guān)鍵詞:足球識別;YOLOv5算法;K-means算法;目標(biāo)識別算法中圖分類號:TP391.41? 文獻標(biāo)志碼:A0 引言隨著人們生活質(zhì)量的日漸提
無線互聯(lián)科技 2023年8期2023-06-26
- 對K-means聚類算法初始值的研究
的K-means算法中隨機選取初始值改進,對樣本值增加進行預(yù)處理,首先對樣本值多次取數(shù),對采樣數(shù)據(jù)集進行初次K-means運算后獲得聚類結(jié)果,從聚類結(jié)果中取距離最大的[k]個聚類中心作為初始值。通過Iris數(shù)據(jù)集對改進算法進行驗證,聚類效果有較好的提高。關(guān)鍵詞:聚類分析;K-means算法;初始值優(yōu)化中圖分類號:TP391? ? ? 文獻標(biāo)識碼:A文章編號:1009-3044(2022)11-0095-03隨著人工智能的發(fā)展,海量數(shù)據(jù)的涌現(xiàn),如何從大量樣本
電腦知識與技術(shù) 2022年11期2022-05-31
- 基于K-means聚類的居民用電行為分析
,K-means算法在對居民用電負(fù)荷曲線聚類時具有較高的準(zhǔn)確度,電網(wǎng)企業(yè)能夠據(jù)此分析居民用電行為,提供用電個性化服務(wù)。關(guān)鍵詞:K-means算法;用電行為分析;智能用電中圖分類號:TP18? ? ? 文獻標(biāo)識碼:A文章編號:1009-3044(2022)07-0026-031 概述隨著智能電表的普及,儀器中產(chǎn)生和傳輸?shù)臄?shù)據(jù)正以指數(shù)增長,在當(dāng)今智能互聯(lián)網(wǎng)背景下,使用人工智能技術(shù)挖掘這些海量數(shù)據(jù),分析其中隱藏的用戶用電行為,有利于電網(wǎng)企業(yè)根據(jù)分析結(jié)果精確地為不
電腦知識與技術(shù) 2022年7期2022-05-09
- 基于機器學(xué)習(xí)的白洋淀生態(tài)數(shù)據(jù)的異常檢測
;K-means算法;DBSCAN算法中圖分類號:TP181? ? ? ? 文獻標(biāo)識碼:A文章編號:1009-3044(2022)35-0007-031 概述白洋淀是華北地區(qū)最大的濕地生態(tài)系統(tǒng)被稱為“華北之腎”,多年來由于上游生活污水和工業(yè)污水的排放、機械船只增多等因素,白洋淀水質(zhì)不斷惡化。自2017年4月1日起,白洋淀生態(tài)環(huán)境治理和保護攻堅戰(zhàn)打響。修復(fù)白洋淀生態(tài)的關(guān)鍵在于水域環(huán)境,改善水域內(nèi)水體環(huán)境才能保障和恢復(fù)生物的多樣性。白洋淀的生態(tài)數(shù)據(jù)通過物聯(lián)網(wǎng)傳
電腦知識與技術(shù) 2022年35期2022-02-17
- 改進PSO-K-means算法在汽車行駛工況估計中的應(yīng)用
-K-means算法構(gòu)建車輛行駛工況,并從10個主要特征參數(shù)角度與實際工況進行對比,結(jié)果表明所構(gòu)建工況能夠準(zhǔn)確反映車輛在實際道路上的行駛特征,說明使用改進PSO-K-means算法構(gòu)建輕型車行駛工況的合理性和有效性。關(guān)鍵詞: PCA分析; 數(shù)據(jù)清洗; 改進PSO-K-means算法; 行駛工況文章編號: 2095-2163(2021)07-0080-07中圖分類號:TP391文獻標(biāo)志碼: AApplication of improved PSO-K-mea
智能計算機與應(yīng)用 2021年7期2021-12-07
- K-means算法及其應(yīng)用實踐
。K-means算法是被廣泛應(yīng)用的一種聚類算法,K-means算法的關(guān)鍵是選擇合適的k值,文章通過鳶尾花聚類展示K-means算法應(yīng)用。關(guān)鍵詞:K-means算法;聚類;無監(jiān)督學(xué)習(xí);機器學(xué)習(xí)一、何為聚類聚類(Clustering)是一種典型的“無監(jiān)督學(xué)習(xí)”。聚類算法是對大量未知標(biāo)記的數(shù)據(jù)集,根據(jù)數(shù)據(jù)之間的距離或者說是相似性(親疏性)將數(shù)據(jù)集劃分為多個簇(Cluster),使簇內(nèi)的數(shù)據(jù)相似度盡可能大,而簇間的數(shù)據(jù)相似度盡可能小。聚類的目的是把數(shù)據(jù)分類,但是事
科學(xué)與生活 2021年23期2021-12-06
- 多點種子預(yù)劃分的二階段社區(qū)發(fā)現(xiàn)算法
用K-means算法將高影響力節(jié)點加以聚合,得到高影響力社區(qū)簇。然后提出一種吸引力度量函數(shù),選擇性的將網(wǎng)絡(luò)中的剩余節(jié)點合并到社區(qū)簇以完成社區(qū)識別任務(wù)。實驗結(jié)果表明,二階段社區(qū)發(fā)現(xiàn)方法能夠發(fā)現(xiàn)尺寸較大,個數(shù)較少的社區(qū)結(jié)構(gòu),進而在中觀層面捕捉群組之間的關(guān)聯(lián)性。關(guān)鍵詞:復(fù)雜網(wǎng)絡(luò);局部社區(qū)發(fā)現(xiàn);種子擴張;節(jié)點影響力;K-means算法DOI:10.15938/j.jhust.2021.04.011中圖分類號:TP391.4文獻標(biāo)志碼:A文章編號:1007-2683
哈爾濱理工大學(xué)學(xué)報 2021年4期2021-10-07
- 基于眾包配送模式的超市訂單分配與路徑規(guī)劃研究
的K-means算法進行聚類,再將聚類完成的訂單用蟻群算法進行路徑優(yōu)化。最后驗證了所使用的方法在解決超市訂單分配和路徑優(yōu)化問題方面的可行性和有效性。關(guān)鍵詞:眾包配送;車輛路徑優(yōu)化;K-means算法;蟻群算法中圖分類號:F252.14? ? 文獻標(biāo)識碼:AAbstract: With the rapid development of internet, O2O business model has become a trend. As a terminal
物流科技 2021年7期2021-09-18
- 基于K-means算法的企業(yè)信用無監(jiān)督分類研究
于K-means算法的企業(yè)信用無監(jiān)督分類方法,通過對企業(yè)信息進行大數(shù)據(jù)分析,提取企業(yè)信用相關(guān)的內(nèi)容,再使用K-means算法對企業(yè)數(shù)據(jù)進行聚類,對目標(biāo)企業(yè)根據(jù)其聚類所在簇來評估信用等級,以此對企業(yè)的信用進行分類。關(guān)鍵詞:企業(yè)信用;信貸風(fēng)險;K-means算法;分類;特征選擇Abstract: The application of corporate credit classification can reduce the risk of credit bu
電腦知識與技術(shù) 2021年22期2021-09-14
- 基于企業(yè)應(yīng)用的K-means算法的實現(xiàn)與改進
;K-means算法中圖分類號:TP311? ? ? 文獻標(biāo)識碼:A文章編號:1009-3044(2021)18-0029-03開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):當(dāng)今關(guān)于大數(shù)據(jù)、云的研究愈發(fā)深入,可是如何用好這些數(shù)據(jù),發(fā)現(xiàn)這些數(shù)據(jù)背后隱藏的信息卻成為更具實際價值的工作,這也就是數(shù)據(jù)挖掘的概念。數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱藏其中人們事先不知道的、但又是潛在有用的信息和知識的過程。其與數(shù)據(jù)分析最大的區(qū)別在于未知性
電腦知識與技術(shù) 2021年18期2021-08-18
- 基于機器視覺的智慧城市路面裂縫檢測關(guān)鍵技術(shù)研究
,K-means算法,路面裂縫參數(shù)計算。本文重點闡述了基于機器視覺的智慧城市路面裂縫檢測關(guān)鍵技術(shù)研究。關(guān)鍵詞:路面裂縫檢測;圖像灰度化;迭代閾值分割;K-means算法中圖分類號:TP391;U41? ? 文獻標(biāo)識碼:A文章編號:1009-3044(2021)11-0174-02Crack Detection of Smart City Pavement Based on Machine Vision Research on Key Technologie
電腦知識與技術(shù) 2021年11期2021-05-23
- 基于改進YOLOv4算法的鋁材表面缺陷識別方法研究
;K-means算法中圖分類號:TP391.4? ? ? ? ? ? ?文獻標(biāo)識碼:A文章編號:2096-4706(2021)23-0096-05Research on Aluminum Surface Defect Identification Methods Based on Improved YOLOv4 AlgorithmLUAN Minghui, LI Songsong, LI Chen, WANG Yuheng, GUO Zhongyu(Sch
現(xiàn)代信息科技 2021年23期2021-05-07
- 融合了K近鄰與密度峰值算法的K-means算法
- means算法。為了攻克以上問題,改進算法采用峰值法以及融合了K近鄰算法的密度峰值算法逐一調(diào)整。通過在UCI數(shù)據(jù)集上測試及與原始K - means算法、最大最小距離距離算法在準(zhǔn)確率、穩(wěn)定性和處理數(shù)據(jù)速率方面的比較,其中最為突出的是,改進算法的準(zhǔn)確率達到了96%以上。關(guān)鍵詞:K-means算法;PCA降維;峰值法;KDPC算法中圖分類號:TP301.6? ? ? 文獻標(biāo)識碼:A文章編號:1009-3044(2021)08-0182-03Abstract
電腦知識與技術(shù) 2021年8期2021-04-22
- K-means聚類算法研究現(xiàn)狀
K-means算法是聚類算法中基于劃分的一種典型算法,是數(shù)據(jù)挖掘的一種常用的數(shù)據(jù)挖掘方法。該聚類算法容易實現(xiàn),應(yīng)用廣泛。但是也有一定的缺點,就是均值不好把握,K的取值很難確定,數(shù)據(jù)集比較難收斂,隱含類別的數(shù)據(jù)不平衡等,因此該算法有很多變體,從而很多人對其進行各種改進優(yōu)化。對此,本文從多個方面闡述K-means算法的改進優(yōu)化方法,并進行概括其優(yōu)缺點,分析問題。從而對該方法的發(fā)展進行展望。關(guān)鍵詞: K-means算法;數(shù)據(jù)挖掘;變體;改進優(yōu)化方法1 前言 隨
成功營銷 2021年10期2021-03-23
- 基于K-means算法實現(xiàn)電商企業(yè)ERP系統(tǒng)的大客戶跟蹤分析
;K-means算法中圖分類號:TP18;TP391 ? ? ? 文獻標(biāo)識碼:A文章編號:2096-4706(2021)13-0173-03To Achieve Key Customer Tracking Analysis of E-commerce Enterprise ERP System Based on K-means AlgorithmDAI Yuanquan(School of Information Engineering, Hubei Li
現(xiàn)代信息科技 2021年13期2021-02-19
- 基于K-means算法的Co-trainning的研究
。K-means算法是一種聚類算法,在對K-means算法研究和實現(xiàn)時,設(shè)計并實驗將K-means算法思想運用到Co-trainning算法特征集選取上,效果較好。關(guān)鍵詞:K-means算法;Co-trainning算法中圖分類號:TP311? ? ? 文獻標(biāo)識碼:A文章編號:1009-3044(2020)32-0216-021 引言早在1998年,Blum于“Combining labeled and unlabeled data with co-tra
電腦知識與技術(shù) 2020年32期2020-12-29
- 結(jié)合Harris和改進K-means的遙感圖像配準(zhǔn)算法
進K-means算法進行區(qū)域劃分,進行特征點匹配;最后,區(qū)域間利用RANSAC方法剔除錯誤匹配點,得到精確匹配點對。該算法減少了特征點數(shù)目,提高配準(zhǔn)精確度。實驗結(jié)果表明了算法的有效性。關(guān)鍵詞:Harris;圖像配準(zhǔn);K-means算法;隨機抽樣一致(RANSAC)中圖分類號:TP751? ? ?文獻標(biāo)識碼:A? ? 文章編號:1007-9416(2020)10-0000-00現(xiàn)今,隨著社會需求不斷增加,人們已經(jīng)不再滿足從單一圖像中獲取信息,多幅圖像的疊加融
數(shù)字技術(shù)與應(yīng)用 2020年10期2020-12-09
- 基于改進k-means算法的獼猴桃葉部病斑分割方法
經(jīng)k-means算法RGB(Red Green Blue) 顏色分量高度線性相關(guān)以及歐氏距離的尺度相關(guān)性對圖像分割結(jié)果產(chǎn)生的影響,并克服RGB空間色彩分布不勻的缺陷,提出了一種基于Lab顏色空間的改進 k-means的獼猴桃葉部病害圖像分割方法。首先改變顏色空間,將RGB轉(zhuǎn)換為Lab空間,由 L、a、b3分量組合表示每個像素點。其次,將馬氏距離代替歐氏距離進行改進,用改進后的k-means算法對圖像進行聚類。利用該方法對三種獼猴桃病害圖像進行測試,實驗結(jié)果
電腦知識與技術(shù) 2020年25期2020-11-02
- 基于目標(biāo)檢測網(wǎng)絡(luò)的交通標(biāo)志識別
用K-means算法對實驗數(shù)據(jù)進行聚類分析,確定適合LISA數(shù)據(jù)集的先驗框大小,實驗結(jié)果表明改進后的框架對比原始的yolov4框架和YOLOv3框架,其mAP值分別提高了0.37%和1.04%,說明改進后的YOLOv4框架在交通標(biāo)志識別方面具有較高的實用價值。關(guān)鍵詞:目標(biāo)檢測;交通標(biāo)志識別;K-means算法;LISA數(shù)據(jù)集中圖分類號:TP311.5 ? ? 文獻標(biāo)識碼:ATraffic Sign Recognition based on Target D
軟件工程 2020年10期2020-10-23
- 基于無線紅外熱成像儀的變電設(shè)備識別和檢測
k-means算法中圖分類號: TP 399 ? ? ?文獻標(biāo)志碼: AAbstract: The analysis of the massive infrared images collected by the wireless infrared thermal imager requires a lot of time and effort, and the diagnostic results are not correct. In order t
微型電腦應(yīng)用 2020年9期2020-10-13
- 基于K-Means和Logistic的壽險客戶流失預(yù)測模型研究
張馨予 門玉杰 孫曉紅摘 要:為了幫助壽險行業(yè)從海量業(yè)務(wù)交易中提取有效客戶信息并進行客戶保留,本文首先用K-Means算法進行壽險客戶的價值細(xì)分,初步判斷哪類客戶最有可能流失,并針對不同價值群體的客戶給予公司不同的建議;其次對細(xì)分后的客戶群體建立Logistic二分類回歸預(yù)測模型,比較與細(xì)分前的預(yù)測精度差異。實驗結(jié)果中,細(xì)分后客戶群對應(yīng)Logistic模型的準(zhǔn)確率、召回率和F1值較細(xì)分前均有提升,這說明客戶細(xì)分能為其流失預(yù)測提供有價值的信息,有助于壽險
中國商論 2020年17期2020-09-24
- 一種優(yōu)化初始聚類中心的自適應(yīng)聚類算法
的X-means算法,采用貝葉斯信息準(zhǔn)則(BIC)計算得分,利用K-Means算法二分相應(yīng)的簇,以此確定最優(yōu)類簇個數(shù);文獻[14]利用期望最大化算法理論,提出似然函數(shù)的碎石圖方法,對于不規(guī)則數(shù)據(jù)集的聚類結(jié)果比利用BIC方法更加可靠;文獻[15]利用最小方差與密度之間的關(guān)系,提出一種利用最小方差優(yōu)化初始聚類中心的方法,該方法在方差計算與比較上時間復(fù)雜度過高,且對于存在孤立點的數(shù)據(jù)不能獲得較好的聚類結(jié)果;文獻[16]采用最大最小距離方法,通過兩階段搜索獲取最佳
軟件導(dǎo)刊 2020年7期2020-07-26
- 最小局部方差優(yōu)化初始聚類中心的K-means算法
統(tǒng)K-means算法隨機選取初始聚類中心導(dǎo)致聚類結(jié)果隨機性大、優(yōu)劣不定的缺點,通過定義局部方差,利用方差反映數(shù)據(jù)密集程度的特性,提出一種基于最小局部方差優(yōu)化初始聚類中心的K-means算法。該算法選取數(shù)據(jù)集中局部方差最小的點作為一個初始聚類中心,并利用數(shù)據(jù)信息更新數(shù)據(jù)集,直到選到k個初始聚類中心,實現(xiàn)初始聚類中心優(yōu)化?;赨CI數(shù)據(jù)集與人工數(shù)據(jù)集進行實驗,與傳統(tǒng)K-means算法及最小方差優(yōu)化初始聚類中心的K-means算法進行性能比較。實驗結(jié)果表明,基于
軟件導(dǎo)刊 2020年6期2020-07-24
- 基于K-means的政府公文聚類方法
用K-means算法對公文進行分類。首先對政府公文進行分詞及去停用詞等數(shù)據(jù)預(yù)處理操作,再通過詞頻一逆文檔頻率(TF-IDF)權(quán)值計算方法,將處理后的政府文本信息轉(zhuǎn)換成二維矩陣,然后采用K-means算法進行聚類。使用清華大學(xué)THUCTC文本分類系統(tǒng)對公文聚類結(jié)果進行測試。實驗結(jié)果表明,采用K-means算法對公文進行聚類,準(zhǔn)確率達到82.93%,遠(yuǎn)高于政府網(wǎng)站公文分類準(zhǔn)確率。關(guān)鍵詞:文本聚類;詞頻一逆文檔頻率;K-means算法DOI:10.11907/r
軟件導(dǎo)刊 2020年6期2020-07-24
- 基于改進K-Means算法的圖書館讀者閱讀需求實證研究
權(quán)K-means算法[J].計算機應(yīng)用研究,2018,35(2):466-470.周本金,陶以政,紀(jì)斌,等.最小化誤差平方和K-Means初始聚類中心優(yōu)化方法[J].計算機工程與應(yīng)用,2018,54(15):48-52.何云斌,劉雪嬌,王知強,等.基于全局中心的高密度不唯一的K-means算法研究[J].計算機工程與應(yīng)用,2016,52(1):48-54.蔣麗,薛善良.優(yōu)化初始聚類中心及確定K值的K-means算法[J].計算機與數(shù)字工程, 2018,46
新世紀(jì)圖書館 2020年5期2020-07-14
- 數(shù)據(jù)挖掘中三種典型聚類算法的分析比較
—K-means算法、AGNES算法、DBSCAN算法,進行可視化聚類結(jié)果和FMI值比較分析,歸納出DBSCAN算法可以發(fā)現(xiàn)任意形狀的簇類,AGNES算法和K-Means算法在中小型數(shù)據(jù)集中挖掘得到球形簇的效果較好。關(guān)鍵詞:聚類;K-means算法;AGNES算法;DBSCAN算法中圖分類號:TP301 文獻標(biāo)識碼:A文章編號:1009-3044(2020)15-0052-051引言聚類是通過發(fā)現(xiàn)數(shù)據(jù)集中數(shù)據(jù)之間的相關(guān)關(guān)系,將數(shù)據(jù)分類到不同的類或簇的過程。
電腦知識與技術(shù) 2020年15期2020-07-04
- 基于機器學(xué)習(xí)的航空客戶價值分析
1)Kmeans算法先要假設(shè)將數(shù)據(jù)分成多少類,我認(rèn)為航空客戶群體可以分為5類。2)隨機選取k個目標(biāo)點,它們作為聚類中心3)計算數(shù)據(jù)集中每個點到K個聚類中心的距離,然后將它們分配到距離它們最近的聚類中心,這樣就能形成5個簇。4)因為本案例的數(shù)據(jù)量比較大,所以以上步驟得到簇是比較散的,而我們要的結(jié)果是要相似的越接近,不相似的越遠(yuǎn),所以算法會重復(fù)上面的步驟,直到得到合適的客戶群??傮w來說,K-Means算法的結(jié)果符合我的預(yù)期想法,我們可以從下圖中詳細(xì)地看出各類人
電腦知識與技術(shù) 2020年14期2020-07-04
- 基于k-means算法實現(xiàn)商品的聚類研究
;k-means算法;Python中圖分類號:TP311.13? ? ? 文獻標(biāo)識碼:A? ? ?文章編號:1007-9416(2020)04-0000-000引言如今網(wǎng)站的快速發(fā)展,人們的生活和工作都離不開網(wǎng)絡(luò)。人們的生活節(jié)奏也在逐漸加快,工作越來越忙了。網(wǎng)購網(wǎng)站吸納了眾多的群眾的參與,積累了大量的用戶資源。而且我國廣大的女性群體為網(wǎng)購網(wǎng)站提供了良好的用戶基礎(chǔ)[1]。一個好的網(wǎng)購網(wǎng)站可以帶運輸?shù)榷喾N產(chǎn)業(yè)的發(fā)展,但是目前的網(wǎng)購網(wǎng)站對用戶的數(shù)據(jù)處理有時候不夠
數(shù)字技術(shù)與應(yīng)用 2020年4期2020-06-22
- Faster RCNN的交通場景下行人檢測方法
;K-means算法;區(qū)域建議網(wǎng)絡(luò)DOI: 10. 11907/rjdk.192692開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):中圖分類號:TP306文獻標(biāo)識碼:A文章編號:1672-7800( 2020)004-0067-04Pedestrian Detection Method in Traffic Scene Based on Faster RCNNXU Xiang-qian, SUN Tao(kSchool of Mech.an ical Engi,
軟件導(dǎo)刊 2020年4期2020-06-19
- K均值優(yōu)化算法綜述
k-means算法源于信號處理中的一種向量量化方法,現(xiàn)在則更多地作為一種聚類分析方法流行于數(shù)據(jù)挖掘領(lǐng)域。在數(shù)據(jù)挖掘技術(shù)中常常使用聚類方法,而k-means算法作為最典型、最常見、實用度最廣的一種聚類算法,具有簡單易操作等優(yōu)點。但此算法需要人工設(shè)定聚類中心的數(shù)量,初始聚類中心,容易陷入局部最優(yōu),使得算法的時間復(fù)雜度變得較大,得到的聚類結(jié)果易受到k值與設(shè)定的初始聚類中心的影響,針對這些問題,本文介紹了k-means算法的改進方法,分析其優(yōu)缺點并提出了優(yōu)化算法
軟件 2020年2期2020-06-09
- 引入全局算法的小批量K-Means
;K-means算法;小批量[中圖分類號]TP301.6?[文獻標(biāo)志碼]AMini?Batch?K-Means?with?Global?AlgorithmWANG?Ying,WU?Guanmao(Department?of?Computer?Science?and?Engineering,Anhui?University?of?Scienceand?Technology,Huainan??232001,China)Abstract:A?small?batc
牡丹江師范學(xué)院學(xué)報(自然科學(xué)版) 2020年2期2020-05-28
- 基于Word2Vec模型和K-Means算法的信息技術(shù)文檔聚類研究?
與K-means算法融合的文本聚類研究[J].情報理論與實踐,2017(11):135-138.[3]周練.Word2vec的工作原理及應(yīng)用探究[J].圖書情報導(dǎo)刊,2015(02):145-148.[4]Chandrashekar G,Sahin F. A survey on feature selection methods[J].Computers & Electrical Engineering,2014(01):16-28.[5]Salton G
中國信息技術(shù)教育 2020年8期2020-04-27
- 機器學(xué)習(xí)的分類、聚類研究
;k-means算法中圖分類號:TP181文獻標(biāo)識碼:A文章編號:1009-3044(2020)04-0161-02收稿日期:2019-10-151 概述大數(shù)據(jù)時代的來臨使得數(shù)據(jù)量迅速膨脹,也為機器學(xué)習(xí)提供了更廣闊的舞臺。本文將對機器學(xué)習(xí)中分類和聚類及其常見算法進行論述。相信機器學(xué)習(xí)未來必將大放異彩。2 機器學(xué)習(xí)2.1 機器學(xué)習(xí)的定義,相較于依托專業(yè)公式進行純粹計算,機器學(xué)習(xí)通過模仿人類學(xué)習(xí)的過程,使計算機通過算法分析數(shù)據(jù)、從中學(xué)習(xí)、生成并優(yōu)化模型,以此得
電腦知識與技術(shù) 2020年4期2020-04-14
- 基于局部熵的點云精簡算法
K?means算法; 特征區(qū)域區(qū)分; 點云數(shù)據(jù); 曲率估計中圖分類號: TN911?34; TP391.9 ? ? ? ? ? ? ? ? ? 文獻標(biāo)識碼: A ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)01?0020?04A point cloud reduction algorithm based on local entropyDONG Jiamin, TIAN HuaAbstract: A point clo
現(xiàn)代電子技術(shù) 2020年1期2020-03-03
- 基于改進K-Means聚類算法的互聯(lián)網(wǎng)涉煙違法犯罪區(qū)域劃分研究
典K-means算法。1.4? ?最優(yōu)k值的確定k值的設(shè)定直接決定了K-Means算法的聚類簇個數(shù),如果設(shè)置不當(dāng)將直接影響聚類結(jié)果。以圖1樣本數(shù)據(jù)集為例,將k值分別設(shè)置為2和4時,聚類結(jié)果如圖2和圖3所示。由圖2和圖3可以得知,若k值設(shè)置不當(dāng),聚類結(jié)果明顯不符常理。其實很多情況下,對數(shù)據(jù)集進行簇劃分本身并沒有絕對清晰和正確的結(jié)論,這取決于人們對數(shù)據(jù)集本身意義的個體認(rèn)知。因此,研究能夠自動求解正確k值的算法是非常困難的,只能從多個角度對k取值進行評估。本文采
中國管理信息化 2019年22期2019-12-16
- 基于K—means算法對軌道結(jié)構(gòu)狀態(tài)變化的評估研究
于K-means算法對檢測數(shù)據(jù)進行聚類挖掘?qū)﹁F路軌道質(zhì)量進行預(yù)測和評判,為線路日常維修提供依據(jù)。關(guān)鍵詞:數(shù)據(jù)挖掘;K-means算法;聚類挖掘我國既有鐵路營業(yè)線總里程不斷增加,安全風(fēng)險也隨之增加,維修天窗時間短,檢測任務(wù)繁重。針對鐵路軌道設(shè)備病害的實時監(jiān)控主要依靠車載信息、人工添乘信息以及軌檢車數(shù)據(jù)信息。月度軌檢車檢測數(shù)據(jù)、便攜式添乘儀和車載信息,以及日常人工巡檢數(shù)據(jù)匯集成了一個多層次,多架構(gòu)的軌道檢測數(shù)據(jù)體系。每月數(shù)次的軌檢車數(shù)據(jù),也僅僅作為日常查尋病害
科學(xué)與財富 2019年19期2019-12-11
- 一種基于K-means算法的網(wǎng)絡(luò)流量異常檢測模型研究
于K-means算法的網(wǎng)絡(luò)流量異常檢測模型。該方法首先將網(wǎng)絡(luò)流量特征屬性量化為熵值進行分類,然后將K-means聚類分析算法運用在網(wǎng)絡(luò)流量異常檢測中,提高了檢測準(zhǔn)確率,從而實現(xiàn)安全監(jiān)測預(yù)警。該模型與傳統(tǒng)的一些網(wǎng)絡(luò)流量異常檢測模型相比,具有更高的準(zhǔn)確率。關(guān)鍵詞:流量異常檢測;K-means算法;流量特征隨著互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)數(shù)據(jù)不斷擴大,網(wǎng)絡(luò)威脅問題也越來越突出。各種異常事件與正常的業(yè)務(wù)流量混合在一起,特別是一些僵尸網(wǎng)絡(luò)、木馬病毒、拒絕服務(wù)、跨站腳本攻擊
無線互聯(lián)科技 2019年18期2019-12-05
- 高校學(xué)生評教系統(tǒng)中存在的若干問題及對策研究
;k-means算法中圖分類號:G645? ? ?文獻標(biāo)志碼:A? ? ?文章編號:1674-9324(2019)44-0239-02高校課堂教學(xué)的質(zhì)量是大學(xué)教育質(zhì)量的重要體現(xiàn)。目前國內(nèi)絕大部分高校教務(wù)處選擇高校學(xué)生評教系統(tǒng)作為高校教學(xué)質(zhì)量監(jiān)控的重要方式之一,把教師的評教得分作為教師工資、職稱評定、聘期考核等的重要依據(jù)。高校學(xué)生評教系統(tǒng)的使用對大范圍收集學(xué)生對教學(xué)的反饋信息、提高教師教學(xué)積極性和大學(xué)生學(xué)習(xí)的主動性有著重要作用。然而,在該系統(tǒng)實際的運行過程中
教育教學(xué)論壇 2019年44期2019-11-11
- 考慮流量均衡的多配送中心選址優(yōu)化方法
;K-means算法;整數(shù)規(guī)劃中圖分類號:F252.14文獻標(biāo)識碼:A0引言隨著我國物流業(yè)務(wù)量的逐年增長,配送中心作為物流網(wǎng)絡(luò)中的基礎(chǔ)節(jié)點,扮演著越來越重要的角色。關(guān)于配送中心的選址問題,除了需要考慮距離的因素外,其他復(fù)雜因素例如當(dāng)?shù)亟煌ㄇ闆r,經(jīng)濟發(fā)展因素,服務(wù)范圍等也需要納入考量。本文研究了考慮物流流量均衡的多配送中心選址問題,即為了服務(wù)若干客戶點,除了考慮與客戶點之間的距離,還應(yīng)保證各個配送中心所服務(wù)的客戶的物流流量需求差異較小,使得每個配送中心的利用
物流科技 2019年10期2019-11-07
- 基于大數(shù)據(jù)的客戶細(xì)分方法研究
;k-means算法隨著經(jīng)濟的不斷發(fā)展,市場中的大量產(chǎn)品供大于需,不同企業(yè)生產(chǎn)的同類同質(zhì)產(chǎn)品不免會產(chǎn)生激烈的競爭。在這種市場環(huán)境下,企業(yè)若想提升產(chǎn)品競爭力,就需要施行有針對性的營銷策略,將客戶分而治之,將重點逐漸從產(chǎn)品質(zhì)量的競爭向不同客戶滿意度的競爭進行轉(zhuǎn)變。在大數(shù)據(jù)時代的當(dāng)下,數(shù)據(jù)不斷反映著我們在日常生活的各種信息。通過對大量數(shù)據(jù)的分析與處理,對數(shù)據(jù)進行統(tǒng)一標(biāo)準(zhǔn)、屬性篩選從而獲取有用的信息。在如今的電子商務(wù)中,使用聚類的分析方法可以將客戶進行細(xì)分,企業(yè)則
科技風(fēng) 2019年20期2019-10-21
- 改進K-means算法在高校輿情中的應(yīng)用
的K-means算法對高校輿情進行聚類,獲取輿情熱點。通過聚類算法獲取熱點話題,進而對熱點輿情話題進行引導(dǎo),對改進高校學(xué)生思想政治工作作用顯著。對改進算法進行實驗,結(jié)果表明該算法準(zhǔn)確率達到75%,比傳統(tǒng)算法高出8%,改善了傳統(tǒng)算法的聚類效果。關(guān)鍵詞:高校輿情;聚類;K-means算法DOI:10. 11907/rjdk. 191734 開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):中圖分類號:TP319文獻標(biāo)識碼:A 文章編號:1672-7800(2019)00
軟件導(dǎo)刊 2019年7期2019-10-11
- K-means算法中文文獻聚類的Python實現(xiàn)
。K-means算法是非常典型的基于距離的聚類算法,將其用于中文文獻聚類,按照內(nèi)容相似性把一組文獻分成幾個類并發(fā)現(xiàn)其中的隱形知識。本文通過實例,總結(jié)了基于Python語言的K-means算法用于中文文獻聚類過程,通過CH指標(biāo)、輪廓系數(shù)指標(biāo)和SSE指標(biāo)這三個評價指標(biāo)選取K-means算法的初始聚類簇數(shù),即最優(yōu)k值的取值范圍,然后分別按照基于關(guān)鍵詞和基于摘要對文獻進行聚類,并對聚類結(jié)果進行比較分析,從而得出基于摘要對中文文獻進行聚類可以得到更好結(jié)果的結(jié)論,同一
軟件 2019年8期2019-10-08
- 基于K-means的手肘法自動獲取K值方法研究
的K-means算法利用手肘法選擇合適的K值在實際項目中應(yīng)用的較多,但是手肘法獲取K值自動性低,以及面對海量數(shù)據(jù)的處理,效率上也有待提高。提出利用手肘法關(guān)系圖初始點和末尾點連接的關(guān)系直線,求K值范圍下直線y值與誤差平方和的最大差值的方法,最大差值對應(yīng)的K值為手肘法的最優(yōu)肘點,由于手肘法需要多次迭代以及數(shù)據(jù)集稠密度對關(guān)系圖的影響較小,提出利用數(shù)據(jù)集預(yù)抽樣并且將程序部署在spark平臺之上的方式自動獲取手肘法的肘點K值,這樣不僅根據(jù)此方法自動獲取K-means
軟件 2019年5期2019-10-08
- 結(jié)合優(yōu)化支持向量機與K-means++的工控系統(tǒng)入侵檢測方法
進K-means算法與優(yōu)化后的支持向量機組合成入侵檢測模型,從而實現(xiàn)工業(yè)控制系統(tǒng)的異常檢測。實驗結(jié)果表明,所提方法在檢測速度和對各類攻擊的檢測率上得到明顯提升。關(guān)鍵詞:工業(yè)控制系統(tǒng);主成分分析;粒子群優(yōu)化算法;支持向量機;密度中心法;K-means算法中圖分類號:TP393.08文獻標(biāo)志碼:A文章編號:1001-9081(2019)04-1089-06Abstract: Aiming at the problem that traditional sing
計算機應(yīng)用 2019年4期2019-08-01
- 基于k-means算法的保險業(yè)數(shù)字化變革
;K-means算法;R語言中圖分類號:F842.6 文獻標(biāo)識碼:A 文章編號:1007-9416(2019)04-0121-021 我國車輛保險業(yè)現(xiàn)狀1.1 我國車輛保險業(yè)現(xiàn)狀中國目前的車險費率制度,大多數(shù)符合“從車主義”。即車險保費多少,主要取決于這輛車本身的各項情況,如車的購置價、座位數(shù)、排量、購車年限等,根據(jù)這些數(shù)據(jù)計算出一個基本的車險保費價格,再根據(jù)這輛車的上年理賠次數(shù)來打不同的折扣。這就導(dǎo)致了中國的車險定價模式非常的單調(diào),相似情況的車型,保費也
數(shù)字技術(shù)與應(yīng)用 2019年4期2019-08-01
- 改進的k-means聚類算法在公交IC卡數(shù)據(jù)分析中的應(yīng)用研究
統(tǒng)k-means算法中初始聚類中心隨機確定的問題,提出k-means改進算法。首先,定義變量權(quán)值,權(quán)值的大小等于樣本密度乘以簇間距離除以簇內(nèi)樣本平均距離,通過最大權(quán)值來確定聚類中心,克服了隨機確定聚類中心的不穩(wěn)定性。然后在Hadoop平臺上用Map-Reduce框架下實現(xiàn)算法的并行化。最后以南通公交IC刷卡記錄為例,通過改進的k-means聚類算法進行IC卡刷卡記錄的分析。實驗表明,在Hadoop平臺下改進k-means算法運行穩(wěn)定、可靠,具有很好的聚類效
軟件工程 2019年5期2019-07-03
- 智能教學(xué)系統(tǒng)中動態(tài)學(xué)生模型構(gòu)建
王賀 張秀梅摘? 要:隨著科技的發(fā)展,各個高校網(wǎng)絡(luò)教學(xué)模式日漸增加,而網(wǎng)絡(luò)教學(xué)是在一定教學(xué)理論和思想指導(dǎo)下,應(yīng)用多媒體和網(wǎng)絡(luò)技術(shù),通過師、生、媒體等,多邊、多向互動和對多種媒體教學(xué)信息的收集、傳輸、處理、共享來實現(xiàn)教學(xué)目標(biāo)的一種教學(xué)模式。該課題采用Clementine12.0數(shù)據(jù)挖掘環(huán)境中的K-Means方法,分析已有的一定數(shù)量的學(xué)習(xí)行為與效果之間的關(guān)聯(lián),建立“什么樣的學(xué)習(xí)行為能獲得什么效果”的規(guī)則,實現(xiàn)了對其學(xué)習(xí)效果的聚類分析。最終能根據(jù)所構(gòu)建的模型對學(xué)
科技資訊 2019年9期2019-06-27
- 基于布谷鳥搜索的聚類推薦算法研究綜述
;K-means算法;智能優(yōu)化算法DOI:10. 11907/rjdk. 182830中圖分類號:TP312文獻標(biāo)識碼:A文章編號:1672-7800(2019)004-0091-040 引言推薦系統(tǒng)已成為電子商務(wù)應(yīng)用中不可或缺的組成部分。推薦算法作為推薦系統(tǒng)的核心內(nèi)容,算法性能優(yōu)劣直接影響系統(tǒng)推薦的信息準(zhǔn)確性。因此,各學(xué)者提出了許多性能優(yōu)越的推薦算法,為用戶提供更準(zhǔn)確、更高效的推薦服務(wù),協(xié)同過濾算法是推薦系統(tǒng)領(lǐng)域應(yīng)用最廣泛也是最成功的推薦算法,但是仍然存
軟件導(dǎo)刊 2019年4期2019-06-09
- 基于異常檢測的K-means改進算法研究
:K-means算法作為較為普遍的聚類算法,聚類效果受孤立點、噪聲點和初始聚類中心影響較大。結(jié)合Isolation Forest算法計算數(shù)據(jù)中每個樣本的異常度系數(shù),根據(jù)離群值過濾比例計算得到異常度系數(shù)閾值,對高度異常值加以隔離,并對隔離后的數(shù)據(jù)集使用平均插值法求得初始聚類中心。運用改進K-means算法對真實數(shù)據(jù)集進行聚類分析,與此同時,通過比較多個離群值過濾比例下的聚類結(jié)果,找到離群值過濾比例的最優(yōu)取值。仿真結(jié)果表明,相比于原始算法,新算法顯著提升了聚類
軟件導(dǎo)刊 2019年4期2019-06-09
- 基于密度標(biāo)準(zhǔn)差優(yōu)化初始聚類中心的k_means改進算法
統(tǒng)k_means算法采用隨機法選擇初始聚類中心,易造成聚類結(jié)果陷入局部最優(yōu)解和聚類精度低的問題,而且易受孤立點的影響。為了解決這一問題,提出了一種基于密度標(biāo)準(zhǔn)差優(yōu)化初始聚類中心的改進算法。該算法先計算數(shù)據(jù)集樣本的平均值和標(biāo)準(zhǔn)差,接著計算每個數(shù)據(jù)點的密度分布函數(shù)值,然后計算樣本的平均密度和密度標(biāo)準(zhǔn)差,若小于密度標(biāo)準(zhǔn)差,則劃分為孤立點;搜索密度分布函數(shù)值數(shù)組中的最大值,那么最大值對應(yīng)的樣本點即為初始聚類中心,并將以初始聚類中心為原點,以樣本平均值為半徑的圓內(nèi)各
電腦知識與技術(shù) 2019年6期2019-05-22
- 基于MB—K—Means的網(wǎng)絡(luò)模型參數(shù)壓縮
k-means算法進行權(quán)重聚類,然后權(quán)重量化共享。利用算法能夠增加網(wǎng)絡(luò)的訓(xùn)練速度,在深度卷積神經(jīng)網(wǎng)絡(luò)上進行參數(shù)壓縮,減少網(wǎng)絡(luò)模型大小。實驗表明,在ImageNet-1000數(shù)據(jù)集上,AlexNet模型縮小了31倍,VGG模型的縮小了45倍。關(guān)鍵詞:網(wǎng)絡(luò)參數(shù);MB-K-Means算法;卷積網(wǎng)絡(luò);參數(shù)壓縮中圖分類號:TP393 文獻標(biāo)識碼:A 文章編號:1009-3044(2019)06-0157-021引言近幾年來,隨著技術(shù)的發(fā)展,深度神經(jīng)網(wǎng)絡(luò)所代表的AI
電腦知識與技術(shù) 2019年6期2019-05-22
- 基于k-means算法的網(wǎng)絡(luò)數(shù)據(jù)庫入侵檢測技術(shù)
于k-means算法的網(wǎng)絡(luò)數(shù)據(jù)庫入侵檢測技術(shù)為目標(biāo),從現(xiàn)階段入侵檢查技術(shù)與傳統(tǒng)聚類算法存在的問題入手,通過實驗反映改進進K-means算法,旨在為現(xiàn)階段網(wǎng)絡(luò)入侵提供新的研究反向與視角。關(guān)鍵詞:k-means算法;網(wǎng)絡(luò)數(shù)據(jù)庫;入侵檢測技術(shù)中圖分類號:TP393? ? ? 文獻標(biāo)識碼:A? ? ? 文章編號:1009-3044(2019)01-0034-021 入侵檢測技術(shù)現(xiàn)狀與數(shù)據(jù)挖掘網(wǎng)絡(luò)技術(shù)的飛速發(fā)展既為人們生活帶來了便利,也出現(xiàn)了安全問題,目前入侵檢測與
電腦知識與技術(shù) 2019年1期2019-03-14
- 聚類分析在內(nèi)部審計中的應(yīng)用研究
;k-means算法;疑點數(shù)據(jù);內(nèi)部審計doi : 10 . 3969 / j . issn . 1673 - 0194 . 2019. 01. 001[中圖分類號] F239.45 [文獻標(biāo)識碼] A [文章編號] 1673 - 0194(2019)01- 0004- 030 引 言聚類分析應(yīng)用于醫(yī)學(xué)、市場分析、信息安全、金融等多個領(lǐng)域。目前,在內(nèi)部審計中的應(yīng)用主要是在企業(yè)和同業(yè)間的差距分析,很少針對業(yè)務(wù)數(shù)據(jù)存在的問題進行分析,傳統(tǒng)的內(nèi)部審計限于單一的看
中國管理信息化 2019年1期2019-02-16
- 改進K-means算法的饋線線損計算
進K-means算法的饋線線損計算方法。充分利用線損信號中的時域信息,獲取線損信號中的平均線損率、線損率變異系數(shù)、線損率變化趨勢等表征線損信號的非平穩(wěn)特征。使用該算法對區(qū)域889條饋線線損進行計算分析,取輪廓系數(shù)最大時對應(yīng)的k值進行聚類分析,經(jīng)過65次迭代得到8個聚類結(jié)果,其中第7類平均線損率高達33.5%,第5類線損率為17.8%,但線損率變化趨勢達308??梢赃M一步對該類饋線上的用電客戶負(fù)荷曲線進行跟蹤分析,確定是否存在竊漏電行為。關(guān)鍵詞:饋線線損;改
軟件導(dǎo)刊 2019年12期2019-02-07
- 基于差分隱私的RDPk—means聚類方法
:k-means算法;差分隱私;隱私保護DOIDOI:10.11907/rjdk.181386中圖分類號:TP309文獻標(biāo)識碼:A 文章編號:1672-7800(2018)008-0205-03英文摘要Abstract:In order to solve the risk of privacy leakage in the clustering process of k-means clustering algorithm,under the premis
軟件導(dǎo)刊 2018年8期2018-10-29
- 基于高中信息技術(shù)考試成績挖掘的精準(zhǔn)化教學(xué)輔導(dǎo)初探
敖培摘要:本文首先分析了信息技術(shù)考試成績分析的必要性。在此基礎(chǔ)上,以我校高一某班級第一學(xué)期信息技術(shù)期末考試成績?yōu)檠芯繉ο螅捎肒-Means聚類算法對學(xué)生群體分類,針對不同分類學(xué)生的特點提出了相應(yīng)的差異化教學(xué)輔導(dǎo)策略;采用Apriori關(guān)聯(lián)規(guī)則算法對學(xué)生知識點掌握情況進行了關(guān)聯(lián)分析,針對分析結(jié)果提出了相應(yīng)的精細(xì)化教學(xué)輔導(dǎo)策略,為教師精準(zhǔn)化教學(xué)輔導(dǎo)提供有益的指導(dǎo)。關(guān)鍵詞:考試成績挖掘;K-Means算法;Apriori算法;教學(xué)輔導(dǎo)策略中圖分類號:G642.
教育教學(xué)論壇 2018年44期2018-10-13
- 基于多線激光雷達的道邊檢測算法
;K-means算法;直線擬合DOI:10.11907/rjdk.173108中圖分類號:TP306文獻標(biāo)識碼:A文章編號:1672-7800(2018)007-0023-04Abstract:Asthepreconditionofautonomousdriving,roadedgedetectionwascrucialforintelligentvehiclestorecognizethefreedrivingspace.Byanalyzingplent
軟件導(dǎo)刊 2018年7期2018-09-26