• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      Spline回歸在高校錄取分?jǐn)?shù)預(yù)測及志愿推薦中的應(yīng)用

      2020-02-01 08:57:28周昱彤張躍富劉競澤孫瑋潞呂震宇
      電子技術(shù)與軟件工程 2020年10期
      關(guān)鍵詞:錄取分?jǐn)?shù)平方和關(guān)鍵點(diǎn)

      周昱彤 張躍富 劉競澤 孫瑋潞 呂震宇*

      (1.華北理工大學(xué)經(jīng)濟(jì)學(xué)院 河北省唐山市 063000 2.華北理工大學(xué)管理學(xué)院 河北省唐山市 063000)

      (3.天津科技大學(xué) 天津市 300000)

      高考志愿填報(bào)工作中高校錄取分?jǐn)?shù)的預(yù)測對于考生來說至關(guān)重要,直接決定其志愿填報(bào)的質(zhì)量[1]。等效分法是一種常用的高校高考錄取分?jǐn)?shù)預(yù)測方法,該算法使用考生所在省份當(dāng)年一分一檔表將分?jǐn)?shù)轉(zhuǎn)換為排名位次,然后使用上一年度一分一檔表將排名位次反向轉(zhuǎn)換為分?jǐn)?shù),進(jìn)而實(shí)現(xiàn)不同年度錄取分?jǐn)?shù)的可比性,幫助考生結(jié)合往年高校錄取分?jǐn)?shù)確定志愿的填報(bào)方案。這種填報(bào)方法需要考生進(jìn)行大量的一分一檔表查找轉(zhuǎn)換工作。由于一分一檔表屬于離散型數(shù)據(jù),數(shù)據(jù)量較大,使得查找過程十分繁瑣不便。為此需要找到合適方法將大量的離散型數(shù)據(jù)進(jìn)行壓縮,以便于查找計(jì)算。

      1 現(xiàn)狀分析

      目前對離散型數(shù)據(jù)進(jìn)行壓縮使其連續(xù)化的方法有線性回歸、指數(shù)回歸、多項(xiàng)式回歸等,這些方法需要事先給出回歸方程,針對趨勢明顯的數(shù)據(jù)具有較好的回歸效果。但利用格學(xué)教育所提供的2018年河北省高考理科一分一檔表數(shù)據(jù)繪制出曲線圖(如圖1)發(fā)現(xiàn),一分一檔表曲線形狀并不規(guī)則,沒有明顯的典型回歸方程特征,無法使用現(xiàn)有回歸手段進(jìn)行連續(xù)化處理。而運(yùn)用Spline 樣條插值法所確定的樣條曲線是經(jīng)過或接近影響曲線形狀的一系列點(diǎn)的平滑曲線,該方法無需數(shù)據(jù)具有明顯的趨勢特征。因此可以通過設(shè)計(jì)一套通用Spline 回歸算法,實(shí)現(xiàn)對不規(guī)則一分一檔表的Spline 曲線回歸,進(jìn)而使得一分一檔表數(shù)據(jù)得到有效壓縮。

      2 Spline回歸算法設(shè)計(jì)

      本文設(shè)計(jì)的Spline 回歸算法采用模擬退火算法,首先初始設(shè)置較多的Spline 關(guān)鍵點(diǎn),動(dòng)態(tài)調(diào)整位置使誤差平方和最小。然后逐次從剩余的關(guān)鍵點(diǎn)中挑選并拿走一個(gè)關(guān)鍵點(diǎn),并確保該關(guān)鍵點(diǎn)拿走后產(chǎn)生的誤差平方和最小,直至達(dá)到指定關(guān)鍵點(diǎn)數(shù)量。

      Spline 回歸的設(shè)計(jì)思路:在一個(gè)有若干點(diǎn)的象限中擬合的Spline 曲線上,坐標(biāo)軸均勻劃分x 份,在曲線中找到對應(yīng)的x 個(gè)點(diǎn),逐個(gè)取走Spline 曲線中的點(diǎn),改變該曲線的關(guān)鍵點(diǎn)knot 個(gè)數(shù),會(huì)影響曲線的形狀[2],回歸曲線過未取走節(jié)點(diǎn)的同時(shí),擬合取走的節(jié)點(diǎn)。重復(fù)以上過程,使得每個(gè)被取走的點(diǎn)對曲線整體誤差平方和的影響最小,直到剩余節(jié)點(diǎn)等于設(shè)定節(jié)點(diǎn)數(shù)量,Spline 回歸曲線過剩余節(jié)點(diǎn)擬合為一條光滑的曲線。

      Spline 回歸具體算法如圖2所示。

      3 Spline回歸在志愿推薦中的應(yīng)用

      以圖1 為例,縱坐標(biāo)為分段對應(yīng)人數(shù),橫坐標(biāo)為高考分?jǐn)?shù),函數(shù)沒有明顯的典型回歸方程特征,使用本文設(shè)計(jì)的Spline 回歸算法將一分一檔表中分?jǐn)?shù)散點(diǎn)擬合為一條連續(xù)的光滑曲線。

      為了探討Spline 回歸曲線中初始點(diǎn)對結(jié)果的影響和不同數(shù)量關(guān)鍵點(diǎn)knot 對結(jié)果的影響,設(shè)計(jì)如下實(shí)驗(yàn):

      A、初始點(diǎn)對結(jié)果的影響對比分析以及實(shí)驗(yàn);

      圖1:2018年河北省高考理科一分一檔表

      圖2:Spline 回歸具體算法

      B、不同數(shù)量關(guān)鍵點(diǎn)knot 對結(jié)果的影響對比分析。

      3.1 實(shí)驗(yàn)A:初始點(diǎn)對結(jié)果的影響對比分析

      圖3:關(guān)鍵點(diǎn)knot 為10, 初始點(diǎn)分別為100、40

      圖4:初始點(diǎn)100,關(guān)鍵點(diǎn)knot 分別為15、10、8、6

      圖3 顯示,在關(guān)鍵點(diǎn)knot 為10 的情況下,初始點(diǎn)為100 的誤差平方和為208913.75,初始點(diǎn)為40 的誤差平方和為227130.07。對比可知,在初始點(diǎn)數(shù)量不同,關(guān)鍵點(diǎn)knot 數(shù)量相同的情況下,初始點(diǎn)越密,誤差平方和越小,spline 回歸擬合效果越好。

      3.2 實(shí)驗(yàn)B:不同數(shù)量關(guān)鍵點(diǎn)knot對結(jié)果的影響對比分析

      圖4 顯示,在初始點(diǎn)為100 的情況下,關(guān)鍵點(diǎn)為15 的誤差平方和為181309.37,關(guān)鍵點(diǎn)為10 的誤差平方和為208913.75,關(guān)鍵點(diǎn)為8 的誤差平方和為357710.45,關(guān)鍵點(diǎn)為6 的誤差平方和為602025.29。對比可知,在初始點(diǎn)數(shù)量相同,關(guān)鍵點(diǎn)knot 數(shù)量不同的情況下,關(guān)鍵點(diǎn)knot 數(shù)量越多,誤差平方和越小,回歸效果越好,但數(shù)據(jù)壓縮效果越差。此外,即便在終結(jié)點(diǎn)數(shù)量非常少的情況下,本算法仍然能夠得到較為滿意的回歸效果。

      4 結(jié)語

      針對一分一檔表為離散數(shù)據(jù)且數(shù)據(jù)量大,不方便查找的問題,本文設(shè)計(jì)了基于模擬退火算法的Spline 回歸算法,將不規(guī)則離散型數(shù)據(jù)連續(xù)化,在壓縮數(shù)據(jù)量的同時(shí)方便了分?jǐn)?shù)、排名間的映射。實(shí)驗(yàn)表明,該算法具有良好的擬合效果,在大幅壓縮原始數(shù)據(jù)量的情況下仍然能夠得到較好的擬合結(jié)果。

      猜你喜歡
      錄取分?jǐn)?shù)平方和關(guān)鍵點(diǎn)
      聚焦金屬關(guān)鍵點(diǎn)
      肉兔育肥抓好七個(gè)關(guān)鍵點(diǎn)
      K-Means聚類分析在高職高專院校招生中的應(yīng)用
      費(fèi)馬—?dú)W拉兩平方和定理
      學(xué)在財(cái)校,終得成材
      示范校建設(shè)對高職院校生源質(zhì)量的影響
      利用平方和方法證明不等式賽題
      勾股定理的擴(kuò)展
      關(guān)于四奇數(shù)平方和問題
      基于數(shù)據(jù)挖掘技術(shù)的五年制高職錄取
      永定县| 镇远县| 廊坊市| 田林县| 普宁市| 迁安市| 平顶山市| 温泉县| 托克逊县| 苍山县| 中超| 新安县| 林周县| 隆化县| 宕昌县| 淮南市| 益阳市| 工布江达县| 菏泽市| 德昌县| 和硕县| 河间市| 易门县| 青河县| 石家庄市| 永嘉县| 福鼎市| 水富县| 白朗县| 兰州市| 同心县| 伽师县| 蒙自县| 开江县| 乃东县| 子洲县| 鹰潭市| 垣曲县| 历史| 仪陇县| 湖口县|