• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于ID3算法的決策機(jī)場出租車去留問題

      2020-06-22 13:11:01吳美玲金迪徐楚臻何穎俞
      科技創(chuàng)新與應(yīng)用 2020年18期
      關(guān)鍵詞:主成分分析

      吳美玲 金迪 徐楚臻 何穎俞

      摘? 要:文章基于各城市機(jī)場與出租車的實(shí)際情況,對機(jī)場等級、機(jī)場吞吐量等因素進(jìn)行主成分分析,通過綜合評價(jià)模型預(yù)測司機(jī)去留,結(jié)合ID3算法建立決策出租車去留模型,分析不同情況下司機(jī)的選擇策略。結(jié)果表明,發(fā)現(xiàn)該模型訓(xùn)練集和檢驗(yàn)集的風(fēng)險(xiǎn)估算值分別為0.143和0.121,正確率分別為85.70%和87.90%,風(fēng)險(xiǎn)較小,分類正確率較高。

      關(guān)鍵詞:主成分分析;ID3算法;決策出租車去留模型

      中圖法分類號:O29? ? ? ? ?文獻(xiàn)標(biāo)志碼:A? ? ? ? ?文章編號:2095-2945(2020)18-0127-03

      Abstract: Based on the actual situation of airports and taxis in each city, this paper analyzes the factors such as airport level and airport throughput, forecasts the driver's leaving and staying through the comprehensive evaluation model, establishes the decision-making taxi leaving and staying model with ID3 algorithm, and analyzes the driver's choice strategy in different situations. According to the results, it is found that the risk estimates of the training set and the test set are 0.143 and 0.121, respectively, and the accuracy is 85.70% and 87.90%, respectively. The risk is small and the classification accuracy is high.

      Keywords: principal component analysis; ID3 algorithm; decision-making taxi leaving and staying model

      乘客下飛機(jī)后去往市區(qū),在合適的時(shí)機(jī),乘搭出租車無疑是優(yōu)選。而國內(nèi)多數(shù)機(jī)場的車道都是將送客與接客通道分開。這樣送客到機(jī)場的出租車司機(jī)將會面臨兩個(gè)選擇:前往機(jī)場蓄車池排隊(duì)等待載客、放棄機(jī)場載客直接空載返回市區(qū)拉客。對此,筆者作為數(shù)學(xué)與應(yīng)用數(shù)學(xué)、應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)、物聯(lián)網(wǎng)工程的學(xué)生,基于計(jì)算方法、數(shù)據(jù)分析、數(shù)學(xué)模型等課程的理論,為了減輕機(jī)場的人流量負(fù)擔(dān),并保障司機(jī)的利益最大化的情況,以各城市的機(jī)場與出租車的實(shí)際情況為例,對決策出租車的去留選擇進(jìn)行了研究。

      1 基于ID3算法的決策出租車去留模型

      根據(jù)機(jī)場等級[1]、機(jī)場吞吐量[2]、機(jī)場所在城市的出租車萬人擁有量[3]來選定所要研究的城市及其機(jī)場。其次,將影響出租車司機(jī)選擇的相關(guān)因素分為機(jī)場乘客數(shù)量的變化以及出租車司機(jī)的收益兩大類,層次劃分為:當(dāng)日屬性、天氣情況[4]、日旅客吞吐量;接客時(shí)間段、機(jī)場到達(dá)市區(qū)的距離、里程利用率[5]?;谝陨闲畔⒘浚治鲇绊懗鲎廛囁緳C(jī)決策的最佳因子。

      1.1 信息分類

      將影響司機(jī)選擇決策的7個(gè)影響因素進(jìn)行編號,分別為當(dāng)日屬性X1、天氣情況X2、日旅客吞吐量X3、接客時(shí)間段X4、機(jī)場到市區(qū)的距離X5、里程利用率X6和機(jī)場等級X7,并將這7個(gè)影響因素作為訓(xùn)練集:

      D={X1,X2,X3,X4,X5,X6,X7}

      其中,當(dāng)日屬性為X1={A1,A2},分別表示節(jié)假日、工作日;天氣情況為X2={B1,B2,B3},分別表示晴天、陰天和雨天;日旅客吞吐量為X3={C1,C2,C3,C4},分別表示[50,70)、[30,50)、[20,30)和[1,20)(萬/人次);接客時(shí)間段為X4={D1,D2},分別表示早間{5:00-23:00}和晚間{23:00-5:00};機(jī)場到市區(qū)的距離為X5={E1,E2,E3},分別表示[45,70)、[35,45)和[25,35)(公里);里程利用率為X6={F1,F(xiàn)2,F(xiàn)3},分別表示[80%,90%)、[70%,80%)和[60%,70%);機(jī)場等級為X7={G1,G2,G3,G4},分別表示I、II、III和IV級。

      1.2 基于主成分分析的綜合評價(jià)模型

      將收集的數(shù)據(jù)集通過軟件實(shí)現(xiàn),標(biāo)準(zhǔn)化后分析提取了四個(gè)主成分因子(當(dāng)日屬性、天氣情況[4]、日旅客吞吐量、接客時(shí)間段),數(shù)據(jù)處理得到每個(gè)影響因素在各主成分因子中所占的比重,結(jié)合每個(gè)主成分因子的貢獻(xiàn)率,得到基于7個(gè)影響因素的出租車司機(jī)選擇決策評價(jià)模型:

      基于評價(jià)模型,根據(jù)Z/*100%的綜合得分,給出在不同情況下司機(jī)的選擇方案,部分?jǐn)?shù)據(jù)詳見表1:

      1.3 決策樹模型[6]

      基于上述結(jié)果,結(jié)合ID3算法,將每個(gè)分類進(jìn)行信息處理,并構(gòu)建一個(gè)含有上述7個(gè)影響因素的訓(xùn)練集,編程實(shí)現(xiàn)不同屬性下的信息熵和信息增益值[7],生成一個(gè)關(guān)于出租車司機(jī)選擇策略的決策樹,具體見圖1。

      由圖1可知,機(jī)場等級是劃分司機(jī)決策最主要的因素,最次要的是里程利用率。機(jī)場等級不同,對應(yīng)的旅客吞吐量就不同,機(jī)場到市區(qū)的距離也不盡相同,但里程利用率一般在同一城市內(nèi)都相對固定且相差不大,因此對司機(jī)的影響相對較小。同時(shí),節(jié)假日和好的天氣也會增加旅客乘飛機(jī)的概率,而旅客吞吐量和接客時(shí)間段以及里程長短也會影響司機(jī)的收益。

      2 模型檢驗(yàn)

      以“南京祿口國際機(jī)場”為例,搜集數(shù)據(jù)對決策出租車去留模型用生長法進(jìn)行檢驗(yàn),用75%的樣本數(shù)據(jù)作為訓(xùn)練樣本,用25%的樣本數(shù)據(jù)作為檢驗(yàn)樣本。

      2.1 合理度分析

      通過SPSS分析,得到風(fēng)險(xiǎn)檢驗(yàn)表和分類檢驗(yàn)表(表2和表3):

      由表2可知,訓(xùn)練集中風(fēng)險(xiǎn)估算值為0.143,表明其中會存在14個(gè)左右的個(gè)案會被錯(cuò)誤歸類,模型檢驗(yàn)集中風(fēng)險(xiǎn)估算為0.121,表明其中會存在4個(gè)左右的個(gè)案被錯(cuò)誤分類,因此生成的決策樹存在一定的風(fēng)險(xiǎn),但風(fēng)險(xiǎn)較小。

      由表3可知,訓(xùn)練集中總體的正確百分比為85.70%,模型檢驗(yàn)集中總體的正確百分比為87.90%,同時(shí)每個(gè)觀察值的正確百分比都超過了80%,即生成的決策樹的分類正確率較高。

      綜上所述,生成的決策樹的分類正確率較高,同時(shí)風(fēng)險(xiǎn)較小,說明模型合理性較高。

      2.2 相關(guān)度分析

      由SPSS實(shí)現(xiàn),得到最終模型摘要見表4。

      由表4可知,在規(guī)定了機(jī)場的條件下,對出租車司機(jī)選擇影響較大的因素從高到低分別為:天氣情況、是否節(jié)假日、接客時(shí)間段、機(jī)場到市區(qū)的距離、日旅客吞吐量和里程利用率,與決策樹各個(gè)節(jié)點(diǎn)的排序基本類似,影響較大的都為天氣情況和是否節(jié)假日,影響一般的都為接客時(shí)間段、機(jī)場到市區(qū)的距離和日旅客吞吐量,影響較小的都為里程利用率。

      3 結(jié)束語

      本文采用的基于ID3算法的決策樹模型,考察到計(jì)算量相對較小,易于處理數(shù)據(jù),但容易引起過度擬合,從而導(dǎo)致抽樣數(shù)據(jù)不足以有效地代表實(shí)際待求問題。再進(jìn)一步作模型優(yōu)化,可以改用CART算法,采用剪枝手段,提前停止樹的增長或者對已經(jīng)生成的樹干按照一定的規(guī)則進(jìn)行后剪枝。同時(shí)該模型除了在本文中應(yīng)用于機(jī)場出租車司機(jī)決策方案的確定,還可適用于預(yù)測市場商品的銷售情況、數(shù)據(jù)挖掘等情景。

      參考文獻(xiàn):

      [1]https://baike.so.com/doc/4114578-4313773.html#4114578-4313773-2[EB/OL].

      [2]https://wiki.mbalib.com/wiki/Airport_passenger_throughput[EB/OL].

      [3]https://baike.so.com/doc/25554755-26597454.html[EB/OL].

      [4]http://www.360doc.com/content/14/0330/09/2283188_364852531.shtml[EB/OL].

      [5]https://baike.baidu.com/item/%E9%87%8C%E7%A8%8B%E5%88%A9%E7%94%A8%E7%8E%87/18611617[EB/OL].

      [6]張琳,陳燕,李桃迎,等.決策樹分類算法研究[J].計(jì)算機(jī)工程,2011,37(13):66-67+70.

      [7]許允之.基于隨機(jī)森林算法的徐州霧霾回歸預(yù)測模型[A].《環(huán)境工程》編委會、工業(yè)建筑雜志社有限公司.《環(huán)境工程》2019年全國學(xué)術(shù)年會論文集[C].《環(huán)境工程》編委會、工業(yè)建筑雜志社有限公司:《環(huán)境工程》編輯部,2019:175-179+185.

      猜你喜歡
      主成分分析
      Categorizing Compiler Error Messages with Principal Component Analysis
      關(guān)于AI上市公司發(fā)展水平評價(jià)
      大學(xué)生創(chuàng)業(yè)自我效能感結(jié)構(gòu)研究
      塔里木河流域水資源承載力變化及其驅(qū)動力分析
      我國上市商業(yè)銀行信貸資產(chǎn)證券化效應(yīng)實(shí)證研究
      基于NAR模型的上海市房產(chǎn)稅規(guī)模預(yù)測
      主成分分析法在大學(xué)英語寫作評價(jià)中的應(yīng)用
      江蘇省客源市場影響因素研究
      SPSS在環(huán)境地球化學(xué)中的應(yīng)用
      考試周刊(2016年84期)2016-11-11 23:57:34
      長沙建設(shè)國家中心城市的瓶頸及其解決路徑
      康马县| 宁海县| 台东县| 永福县| 徐闻县| 海门市| 加查县| 岳西县| 乃东县| 介休市| 招远市| 大荔县| 育儿| 通化市| 凉城县| 黄陵县| 华池县| 金寨县| 鹤峰县| 陇南市| 宜宾县| 邯郸县| 平陆县| 灌云县| 昌黎县| 惠州市| 嘉兴市| 苗栗县| 全州县| 榆树市| 二连浩特市| 安阳县| 肥城市| 南丰县| 若尔盖县| 南昌市| 卓尼县| 翼城县| 朝阳县| 辛集市| 山阴县|