• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用探討

      2021-11-24 08:09:49楊昊天譚伊杰
      科學(xué)與生活 2021年18期
      關(guān)鍵詞:應(yīng)用方法數(shù)據(jù)挖掘

      楊昊天 譚伊杰

      摘要:機(jī)器學(xué)習(xí)算法是當(dāng)前數(shù)據(jù)挖掘活動中的重要算法,其在人工智能的技術(shù)支持下,可在完成樣本集學(xué)習(xí)與訓(xùn)練后,獲取運(yùn)算所需的模式與參數(shù)。本文對機(jī)器學(xué)習(xí)算法進(jìn)行分析,重點(diǎn)研究其應(yīng)用情況,確定其在定位問題、處理與采集數(shù)據(jù)以及其他的定位技術(shù)中的應(yīng)用情況,以此來更好地發(fā)揮出機(jī)器學(xué)習(xí)算法的作用,提升數(shù)據(jù)挖掘水平。

      關(guān)鍵詞:機(jī)器學(xué)習(xí)算法;數(shù)據(jù)挖掘;應(yīng)用方法

      數(shù)據(jù)挖掘技術(shù)是大數(shù)據(jù)時(shí)代中的一項(xiàng)重要技術(shù),可實(shí)現(xiàn)處理信息的技術(shù)需求,同時(shí)減少管理與應(yīng)用數(shù)據(jù)的成本。在實(shí)施挖掘數(shù)據(jù)的活動時(shí),可應(yīng)用機(jī)器學(xué)習(xí)算法,應(yīng)用計(jì)算機(jī)設(shè)備對人類行為加以模擬,以此展現(xiàn)出人工智能技術(shù)的優(yōu)勢。現(xiàn)研究如何在挖掘數(shù)據(jù)的過程中,應(yīng)用機(jī)器學(xué)習(xí)算法。

      1機(jī)器學(xué)習(xí)算法

      數(shù)據(jù)挖掘算法主要包括統(tǒng)計(jì)算法與機(jī)器學(xué)習(xí)算法。使用統(tǒng)計(jì)算法時(shí),需要展開判別與概率分析、聚類分析與相關(guān)性分析;采取機(jī)器學(xué)習(xí)算法時(shí),需引進(jìn)人工智能技術(shù),完成對數(shù)量較多的樣本集學(xué)習(xí)與訓(xùn)練后,可確定運(yùn)算所需的模式與參數(shù)。這兩種算法能夠?qū)?yīng)不同的數(shù)據(jù)挖掘目標(biāo)與領(lǐng)域,既可結(jié)合應(yīng)用,也能夠各自單獨(dú)使用。

      機(jī)器學(xué)習(xí)算法的優(yōu)勢體現(xiàn)在自組織學(xué)習(xí)與數(shù)據(jù)處理等方面,能夠滿足精準(zhǔn)識別的應(yīng)用要求,對問題進(jìn)行分類后實(shí)施數(shù)據(jù)處理。相比BP神經(jīng)網(wǎng)絡(luò),人工神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)效率高,其借助模型實(shí)現(xiàn)應(yīng)用目標(biāo),可用的模型具有多樣化的特點(diǎn),可對各種需求進(jìn)行滿足,魯棒性良好,描述能力強(qiáng),并且不需要專家支持作為前提。在運(yùn)用時(shí),必須掌握其存在的問題,如數(shù)據(jù)訓(xùn)練需要充足的時(shí)間,理解獲取的知識的智能化程度偏低,在可伸縮性與開放性方面也有受限的情況。與其他算法相比,機(jī)器學(xué)習(xí)算法需要對人工智能技術(shù)進(jìn)行依靠與運(yùn)用,收集大量的樣本,展開訓(xùn)練與學(xué)習(xí),運(yùn)算時(shí)則可以自動對相應(yīng)模式與參數(shù)進(jìn)行匹配,該技術(shù)具有較強(qiáng)的綜合性,對計(jì)算機(jī)科學(xué)、自動化。物理學(xué)以及數(shù)學(xué)等學(xué)科進(jìn)行綜合,進(jìn)而可在更多的領(lǐng)域中發(fā)揮作用,實(shí)現(xiàn)差異化的應(yīng)用目標(biāo)。在神經(jīng)網(wǎng)絡(luò)中運(yùn)用機(jī)器學(xué)習(xí)算法使,需建設(shè)出神經(jīng)元模型,確定數(shù)據(jù)具有的基本特點(diǎn),分析出相應(yīng)問題的結(jié)論。

      2數(shù)據(jù)挖掘中應(yīng)用機(jī)器學(xué)習(xí)算法

      2.1定位問題與建模

      移動終端已經(jīng)實(shí)現(xiàn)大范圍普及,手機(jī)用戶數(shù)量激增,借助移動設(shè)備提供的定位數(shù)據(jù),即可了解其所處的地理空間位置,對用戶信息進(jìn)行識別與挖掘,了解用戶偏好,區(qū)域發(fā)展情況等重要信息,投資者、運(yùn)營者以及政府可運(yùn)用信息開展實(shí)際活動。進(jìn)行數(shù)據(jù)挖掘活動時(shí)需要在海量信息中精準(zhǔn)提取并挖掘具有一定價(jià)值的數(shù)據(jù),挖掘過程中,應(yīng)運(yùn)用計(jì)算機(jī),對挖掘目標(biāo)進(jìn)行有效實(shí)現(xiàn),集合數(shù)據(jù),在線分析數(shù)據(jù),篩選數(shù)據(jù)等。對機(jī)器學(xué)習(xí)算法進(jìn)行應(yīng)用時(shí),首先可以實(shí)現(xiàn)對問題的定位,確定定位方式,不可忽視向量機(jī)存在的定位需求,做好構(gòu)建模型前的準(zhǔn)備工作;在定位區(qū)域中實(shí)施柵格化處理,并對類別進(jìn)行有效劃分;從終端處獲取測量信息并進(jìn)行整理,結(jié)合相關(guān)報(bào)告確認(rèn)終端位置,在機(jī)器學(xué)習(xí)算法的支持下,掌握柵格精準(zhǔn)度與距離度量,預(yù)估判斷移動終端柵格情況,通過機(jī)器學(xué)習(xí)算法來實(shí)現(xiàn)求解。

      2.2采集與處理數(shù)據(jù)

      以周邊邊長數(shù)值為10km的區(qū)域?yàn)檠芯繉ο?,?yīng)用模型,在該區(qū)域范圍內(nèi),對多個(gè)時(shí)間段的相應(yīng)數(shù)據(jù)進(jìn)行獲取,為了強(qiáng)化機(jī)器學(xué)習(xí)算法在定位活動中的有效性與精準(zhǔn)性,可將三批數(shù)據(jù)設(shè)置成訓(xùn)練數(shù)據(jù),定位數(shù)據(jù)為其中的最后一批數(shù)據(jù),清除定位數(shù)據(jù)周邊10m范圍內(nèi)的訓(xùn)練數(shù)據(jù),具體為前三組數(shù)據(jù)。對待定位的信息數(shù)據(jù)進(jìn)行確定后,繼續(xù)在各個(gè)時(shí)間點(diǎn)展開測量,明確數(shù)據(jù)的平均值與經(jīng)緯度,實(shí)施換算,所獲得的數(shù)據(jù)量更加真實(shí),定位不僅能夠滿足有效性要求,還能保持極高的定位效率。

      2.3應(yīng)用于定位活動

      在對移動終端進(jìn)行定位時(shí),機(jī)器學(xué)習(xí)算法雖然能夠滿足定位要求,但是應(yīng)用過程相對比較復(fù)雜,區(qū)域面積擴(kuò)大后,模型的分類以及數(shù)量也應(yīng)有所改變,同樣出現(xiàn)復(fù)雜化的特點(diǎn)。因此選擇機(jī)器學(xué)習(xí)算法時(shí),要考慮到區(qū)域面積發(fā)生變化后,往往需要消耗更長的時(shí)間。早期定位時(shí),主要采用基站的實(shí)際經(jīng)緯度。對邊長數(shù)值為10km的正方形展開切割,形成的小柵格為1km,計(jì)算小柵格的相應(yīng)數(shù)據(jù),即可實(shí)現(xiàn)對數(shù)據(jù)集信息的精準(zhǔn)定位,整合數(shù)據(jù)集。

      選定2km邊長的正方形,向量機(jī)在首次支持的環(huán)節(jié)中定位范圍設(shè)置成0.4km,第二次則能夠?qū)崿F(xiàn)自由輸出柵格數(shù)據(jù)的需求,可輸出經(jīng)緯度數(shù)據(jù),并以0.1km柵格作為基本中心。對比不同的定位結(jié)果,第二次定位計(jì)算過程更加復(fù)雜,既要完成向量機(jī)分類樣本的計(jì)算,同時(shí)還需進(jìn)行決策函數(shù)的計(jì)算,使用成對分類法來處理分類問題,分類問題的具體增加量與定位精度之間存在反比的關(guān)系,分類問題所形成的增加量與定位復(fù)雜化程度之間具有正比的關(guān)系,當(dāng)增加量逐步縮減時(shí),定位精度將隨之提高,同時(shí)復(fù)雜化程度也降低;而當(dāng)分類問題增加量呈現(xiàn)出上升趨勢后,定位復(fù)雜度將明顯增高,同時(shí)精度隨之降低。進(jìn)行向量機(jī)的首次定位后,應(yīng)選出大小適當(dāng)?shù)臇鸥瘢瑢Ψ诸悊栴}的數(shù)量實(shí)施最小化處理,依照處理結(jié)果設(shè)置向量機(jī)二次定位時(shí)柵格的尺寸,進(jìn)而獲得更加精準(zhǔn)的測量結(jié)果。

      處理數(shù)據(jù)樣本時(shí),也能夠突顯出機(jī)器學(xué)習(xí)算法所具有的計(jì)算推演優(yōu)勢,在線性數(shù)據(jù)中進(jìn)行采樣,在多維度的數(shù)據(jù)空間中展開精準(zhǔn)計(jì)算,如果維度數(shù)量過多,應(yīng)展開點(diǎn)積計(jì)算,注重非線性區(qū)域與線性區(qū)域之間的演變情況,進(jìn)而實(shí)現(xiàn)對復(fù)雜問題的有效解決,實(shí)現(xiàn)數(shù)據(jù)挖掘目標(biāo)。

      進(jìn)行三次定位時(shí),需要將K-近鄰法作為定位基礎(chǔ),首先掌握定位區(qū)域的具體面積,實(shí)施二次輸出后,了解經(jīng)緯度信息,根據(jù)經(jīng)緯度以及其他信息進(jìn)一步確定面積與邊長,為后續(xù)的定位做好完備的前期準(zhǔn)備工作,訓(xùn)練定位模型,在該定位模型中,必須對訓(xùn)練數(shù)據(jù)進(jìn)行綜合處理,結(jié)合具體的大小情況,展開合并與篩選,以此避免出現(xiàn)過多的重復(fù)計(jì)算行為,提升計(jì)算效率,縮短計(jì)算所需的時(shí)間,同時(shí)還需注意到當(dāng)選定的區(qū)域面積加大時(shí),定位的精確度與速度均會出現(xiàn)不同程度的降低。

      3結(jié)論

      本文主要對數(shù)據(jù)挖掘活動中的機(jī)器學(xué)習(xí)算法進(jìn)行分析,確定該種算法的優(yōu)勢與應(yīng)用情況,其在定位活動中有良好的表現(xiàn),確保滿足精準(zhǔn)度方面的要求。結(jié)合不同的數(shù)據(jù)挖掘需求,應(yīng)繼續(xù)完善機(jī)器學(xué)習(xí)算法,以此來將該算法的使用范圍進(jìn)一步擴(kuò)大,保持算法的優(yōu)越性的同時(shí),消除算法應(yīng)用問題,強(qiáng)化使用效果。

      參考文獻(xiàn)

      [1] 郭皓. 機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用研究[J]. 數(shù)字通信世界, 2019, 171(03):177-177.

      [2] 戴惠麗. 大數(shù)據(jù)背景下機(jī)器學(xué)習(xí)在數(shù)據(jù)挖掘中的應(yīng)用研究[J]. 呂梁教育學(xué)院學(xué)報(bào), 2019, 036(003):P.20-21.

      [3] 葉梓. 機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用[J]. 信息與電腦, 2019, 031(018):59-60.

      猜你喜歡
      應(yīng)用方法數(shù)據(jù)挖掘
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      關(guān)于新課標(biāo)理念在小學(xué)數(shù)學(xué)競賽中的應(yīng)用
      現(xiàn)代教育技術(shù)在高職數(shù)學(xué)教學(xué)中的具體應(yīng)用
      初中英語課堂教學(xué)中故事教學(xué)法的應(yīng)用芻議
      愉快教學(xué)法在初中英語教學(xué)中的應(yīng)用
      考試周刊(2016年90期)2016-12-01 21:38:54
      初中物理教學(xué)中探究式教學(xué)法的應(yīng)用討論
      數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
      微課在高中地理教學(xué)中的應(yīng)用研究探討
      文教資料(2016年19期)2016-11-07 11:15:58
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      成武县| 内黄县| 锦屏县| 青铜峡市| 水富县| 涟源市| 桦川县| 乐都县| 大名县| 南皮县| 新蔡县| 平江县| 石嘴山市| 新巴尔虎右旗| 广平县| 嫩江县| 民县| 姜堰市| 龙岩市| 新源县| 朝阳县| 会同县| 萨嘎县| 三穗县| 黎城县| 尉犁县| 讷河市| 顺义区| 大渡口区| 渝中区| 当涂县| 芦溪县| 柏乡县| 大连市| 东辽县| 米易县| 福清市| 祥云县| 扎兰屯市| 华池县| 高州市|