• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于H2O自動(dòng)化機(jī)器學(xué)習(xí)的電動(dòng)自行車(chē)交通違法行為影響因素分析

      2024-12-31 00:00:00申遠(yuǎn)戴帥趙琳娜楊鈞劍侯志賢
      科技創(chuàng)新與應(yīng)用 2024年36期
      關(guān)鍵詞:隨機(jī)森林交通安全

      摘" 要:隨著電動(dòng)自行車(chē)保有量的逐年增長(zhǎng),電動(dòng)自行車(chē)交通事故死亡人數(shù)占交通事故總死亡人數(shù)的比例在不斷增加,在此背景下,探究電動(dòng)自行車(chē)違法行為影響因素對(duì)降低事故率和事故嚴(yán)重程度具有重要意義。該研究使用廈門(mén)島內(nèi)電動(dòng)自行車(chē)違法行為數(shù)據(jù),基于H2O自動(dòng)化機(jī)器學(xué)習(xí)(AtuoML)算法對(duì)電動(dòng)自行車(chē)的違法行為進(jìn)行影響因素分析,并與隨機(jī)森林(RF)算法進(jìn)行對(duì)比,結(jié)果表明H2O自動(dòng)化機(jī)器學(xué)習(xí)具有更好的預(yù)測(cè)精度和效率。此外,研究中還引入建成環(huán)境變量。研究結(jié)果表明,小型商鋪、居民小區(qū)等建成環(huán)境對(duì)違法行為具有正向影響,且小型商鋪在眾多影響因素中占主導(dǎo)地位。

      關(guān)鍵詞:交通安全;自動(dòng)化機(jī)器學(xué)習(xí);電動(dòng)自行車(chē)違法;建成環(huán)境;隨機(jī)森林

      中圖分類(lèi)號(hào):U491.31" " " 文獻(xiàn)標(biāo)志碼:A" " " " " 文章編號(hào):2095-2945(2024)36-0017-06

      Abstract: As the number of electric bicycles increases year by year, the proportion of electric bicycle traffic accident deaths in the total number of traffic accident deaths continues to increase. In this context, exploring the factors influencing electric bicycle illegal behaviors is important for reducing accident rates and accident severity. significance. This study used data on illegal behaviors of electric bicycles in Xiamen Island to analyze the influencing factors of illegal behaviors of electric bicycles based on the H2O automated machine learning (AutoML) algorithm, and compared it with the Random Forest (RF) algorithm. The results show that H2O automated machine learning has better prediction accuracy and efficiency. In addition, built environment variables were also introduced into the study. The research results show that built environments such as small shops and residential areas have a positive impact on illegal activities, and small shops dominate among many influencing factors.

      Keywords: traffic safety; automated machine learning; illegal electric bicycles; built environment; Random Forest (RF)

      隨著城市化進(jìn)程的加速和交通需求的日益增長(zhǎng),電動(dòng)自行車(chē)因其便捷性、經(jīng)濟(jì)型及環(huán)保性,在全球范圍內(nèi)迅速普及,電動(dòng)自行車(chē)的安全問(wèn)題也受到了越來(lái)越廣泛的關(guān)注。盡管電動(dòng)自行車(chē)的安全問(wèn)題越來(lái)越受到重視,但關(guān)于電動(dòng)自行車(chē)違法行為的系統(tǒng)性研究相對(duì)較少,現(xiàn)有研究大多集中在對(duì)交通事故的描述性統(tǒng)計(jì)和影響因素分析上。馬景峰等[1]研究了騎行者性別、年齡、電動(dòng)自行車(chē)類(lèi)別等因素對(duì)電動(dòng)自行車(chē)交通事故的影響。Wang等[2]研究了騎手對(duì)交通法規(guī)熟悉程度和頭盔使用與電動(dòng)自行車(chē)碰撞間的關(guān)系。上述研究為電動(dòng)自行車(chē)違法行為影響因素的選擇提供了一定參考,但仍不全面,例如未考慮建成環(huán)境因素,其作為影響人們出行行為的重要因素,理應(yīng)被納入電動(dòng)自行車(chē)違法行為研究的影響因素范疇。

      隨著模型與算法的進(jìn)步和發(fā)展,學(xué)者們開(kāi)始將更多樣、更先進(jìn)的統(tǒng)計(jì)模型和機(jī)器學(xué)習(xí)模型應(yīng)用于交通事故與違法行為的研究。范浩軒等[3]運(yùn)用卡方檢驗(yàn)方法分析交通違法行為與潛在影響因素之間的關(guān)系。Huang等[4]使用GWPR模型發(fā)現(xiàn),車(chē)禍與建筑環(huán)境之間關(guān)系的強(qiáng)度和方向隨空間變化而變化。隨著機(jī)器學(xué)習(xí)算法的快速迭代,自動(dòng)化機(jī)器學(xué)習(xí)(AutoML)使用廣泛的搜索算法來(lái)探索模型和參數(shù)的最優(yōu)組合,極大簡(jiǎn)化了傳統(tǒng)機(jī)器學(xué)習(xí)的工作流程復(fù)雜性。然而自動(dòng)化機(jī)器學(xué)習(xí)(AutoML)在交通安全領(lǐng)域的研究中應(yīng)用較少,其能否解決復(fù)雜的交通問(wèn)題仍然缺乏足夠的探索。

      綜上,本研究以廈門(mén)島為研究區(qū)域,考慮使用H2O平臺(tái)的自動(dòng)化機(jī)器學(xué)習(xí)(AtuoML)算法構(gòu)建電動(dòng)自行車(chē)違法行為的影響因素模型,并在特征變量中加入建成環(huán)境因素,旨在為降低電動(dòng)自行車(chē)事故嚴(yán)重程度和違法率,制定有效交通政策和預(yù)防措施提供理論支撐。

      1" 數(shù)據(jù)基礎(chǔ)

      1.1" 數(shù)據(jù)獲取與處理

      1.1.1" 道路數(shù)據(jù)

      本研究所用的廈門(mén)島路網(wǎng)數(shù)據(jù)來(lái)源于OpenStreetMap(OSM),采集于2023年8月,數(shù)據(jù)屬性主要包含道路名稱(chēng)、道路等級(jí)、道路空間位置等。具體道路等級(jí)分為主干道(圖1)、次干道(圖2)、支路(圖3)3種類(lèi)型。由于快速路禁止非機(jī)動(dòng)車(chē)通行,因此將快速路排除掉。

      使用ArcGIS軟件對(duì)道路數(shù)據(jù)進(jìn)行拓?fù)湫拚?,將所有道路融合后再?00 m作為間隔進(jìn)行分割。各類(lèi)型道路長(zhǎng)度、占比及分割數(shù)量見(jiàn)表1。

      1.1.2" 電動(dòng)自行車(chē)交通違法行為數(shù)據(jù)

      本研究使用2021—2023年廈門(mén)市電動(dòng)自行車(chē)交通違法行為數(shù)據(jù),提取廈門(mén)島內(nèi)的違法行為記錄,共22 832起,數(shù)據(jù)屬性包括編號(hào)、違法行為發(fā)生時(shí)間、違法地點(diǎn)和違法行為類(lèi)型等。同時(shí)使用高德API的地理編碼服務(wù)批量獲取違法地點(diǎn)的經(jīng)緯度坐標(biāo)。

      由于違法行為的研究需要考慮其空間效應(yīng),本研究沒(méi)有直接統(tǒng)計(jì)電動(dòng)自行車(chē)違法行為的頻數(shù)作為研究變量,而是使用核密度估計(jì)法,將違法行為密度均攤到道路上,并將道路分割為200 m的路段,作為研究單元。利用ArcGIS軟件對(duì)電動(dòng)自行車(chē)違法行為進(jìn)行核密度分析,違法行為密度結(jié)果如圖4所示。

      1.1.3" 建成環(huán)境數(shù)據(jù)

      在當(dāng)代城市規(guī)劃和環(huán)境研究中,建成環(huán)境指人類(lèi)制造或改造的空間及其配套的基礎(chǔ)設(shè)施,是人類(lèi)活動(dòng)發(fā)生的物理場(chǎng)所。Cervero等[5]于1997年提出建成環(huán)境“3D”模型并被廣泛應(yīng)用于交通領(lǐng)域研究,后于2009年拓展為“5D”模型。本研究選取與交通行為相關(guān)的興趣點(diǎn)(POI)、多樣性變量中的土地利用混合度,以及設(shè)計(jì)類(lèi)變量中的交叉口密度作為研究變量。研究使用的POI數(shù)據(jù)來(lái)源于高德地圖API提供的2022年廈門(mén)島內(nèi)的POI數(shù)據(jù),從中選取了11類(lèi)與違法行為研究較為密切的類(lèi)別作為特征變量,分別為餐飲、地鐵、公交、公司企業(yè)、居民小區(qū)、教育機(jī)構(gòu)、商業(yè)大廈、小型商鋪、休閑娛樂(lè)、醫(yī)療機(jī)構(gòu)和銀行,并統(tǒng)計(jì)路段半徑300 m范圍內(nèi)的各個(gè)POI數(shù)量,作為特征變量。其具體分布如圖5所示。

      本研究基于熵方法計(jì)算土地利用混合度,如果一個(gè)區(qū)域的土地被多種用途平均分配使用,那么它的熵值較高,意味著高度的混合和多樣性;相反,如果土地使用非常集中,即某一種或幾種用途占主導(dǎo),則熵值較低,反映出混合度較低,其計(jì)算公式如下所示

      通過(guò)ArcGIS軟件計(jì)算,廈門(mén)島土地利用混合度如圖6所示。

      交叉口密度與POI數(shù)據(jù)的處理方式一致,為路段半徑300 m范圍內(nèi)的交叉口數(shù)量,并整合到路段上,如圖7所示。

      1.2" 數(shù)據(jù)關(guān)聯(lián)

      以200 m路段為研究單元,利用ArcGIS等相關(guān)工具將違法行為密度、道路類(lèi)型、POI數(shù)據(jù)、土地利用混合度和交叉口密度等數(shù)據(jù)匯總到路段單元中,形成以違法行為密度為目標(biāo)變量,其他為特征變量的電動(dòng)自行車(chē)違法行為數(shù)據(jù)庫(kù),用于后續(xù)的H2O自動(dòng)化模型的分析,數(shù)據(jù)庫(kù)中所有特征變量的描述見(jiàn)表2。

      2" 模型構(gòu)建與結(jié)果分析

      2.1" 模型介紹

      H2O是一個(gè)由H2O.ai 公司開(kāi)發(fā)開(kāi)源的機(jī)器學(xué)習(xí)和數(shù)據(jù)分析平臺(tái),使自動(dòng)化機(jī)器學(xué)習(xí)技術(shù)得以在該平臺(tái)上實(shí)現(xiàn),即為H2O AutoML。H2O AutoML自動(dòng)處理許多機(jī)器學(xué)習(xí)工作流程中耗時(shí)的步驟,這允許用戶(hù)快速有效地開(kāi)發(fā)和部署高質(zhì)量的機(jī)器學(xué)習(xí)模型。H2O AutoML可以自動(dòng)訓(xùn)練和交叉驗(yàn)證多種模型,包括但不限于深度學(xué)習(xí)、梯度提升機(jī)、隨機(jī)森林和廣義線性模型等,同時(shí)它不僅可以訓(xùn)練單個(gè)模型,還會(huì)嘗試模型堆疊和集成技術(shù)來(lái)提升模型性能,并自動(dòng)進(jìn)行超參數(shù)調(diào)優(yōu),以找到最優(yōu)模型配置。

      隨機(jī)森林(Random Forest,RF)是機(jī)器學(xué)習(xí)中常見(jiàn)的經(jīng)典算法,廣泛應(yīng)用于多種領(lǐng)域,能夠獲得相對(duì)穩(wěn)定、無(wú)差的預(yù)測(cè)結(jié)果,同時(shí)避免過(guò)擬合的發(fā)生。

      2.2" 模型構(gòu)建

      本研究通過(guò)對(duì)比傳統(tǒng)的隨機(jī)森林(Random Forest,RF)模型與基于H2O AutoML技術(shù)構(gòu)建的預(yù)測(cè)模型在交通違法行為中的預(yù)測(cè)準(zhǔn)確性來(lái)驗(yàn)證所提出模型的效果。

      將收集到的數(shù)據(jù)進(jìn)行預(yù)處理后分別導(dǎo)入隨機(jī)森林模型和H2O平臺(tái)的AutoML框架中,通過(guò)split工具按照0.8∶0.2的比例對(duì)數(shù)據(jù)集進(jìn)行隨機(jī)分組,分組為訓(xùn)練集和測(cè)試集。在隨機(jī)森林模型中設(shè)置learning_rate=0.1,n_estimators=500,max_depth=5,在AutoML框架下設(shè)置最大模型數(shù)量為60。

      本研究采用常見(jiàn)的模型評(píng)估指標(biāo)均方根誤差(RMSE)和決定系數(shù)(R2)來(lái)評(píng)估模型的預(yù)測(cè)效果。均方根誤差用來(lái)衡量預(yù)測(cè)值與真實(shí)值之間的誤差,其值越小,則模型的擬合效果越好,預(yù)測(cè)準(zhǔn)確性越高;決定系數(shù)用于評(píng)估回歸模型的擬合度,其范圍通常在0到1之間,越接近1表示模型的預(yù)測(cè)效果越好。

      2個(gè)評(píng)估指標(biāo)的計(jì)算公式如下

      最終兩模型的訓(xùn)練結(jié)果見(jiàn)表3。在H2O AutoML算法下RMSE為2.55,小于隨機(jī)森林算法下的2.79;R2為85.26%,高于隨機(jī)森林下的82.42%。

      圖8為測(cè)試集與預(yù)測(cè)結(jié)果的散點(diǎn)圖,圖中點(diǎn)大多分布在擬合線兩側(cè),說(shuō)明二者擬合效果較好,但相較于隨機(jī)森林,H2O AutoML的點(diǎn)分布顯然更加集中。

      綜上,相較于隨機(jī)森林模型,H2O AutoML的預(yù)測(cè)效果更好,準(zhǔn)確性更高,因此本文最終采用基于H2O AutoML技術(shù)構(gòu)建的模型作為后續(xù)影響因素重要性分析的基準(zhǔn)模型。

      2.3" 結(jié)果分析

      本研究采用H2O平臺(tái)內(nèi)部提供的SHAP(SHapley Addictive exPlanations)可解釋框架和部分依賴(lài)圖(Partial Dependence Plot,PDP )進(jìn)行分析。

      2.3.1" SHAP和PDP方法簡(jiǎn)介

      SHAP可解釋框架可以解釋復(fù)雜的黑箱機(jī)器學(xué)習(xí)模型的預(yù)測(cè)結(jié)果,廣泛應(yīng)用于各種機(jī)器學(xué)習(xí)任務(wù)中,能夠增強(qiáng)模型的可信度和可靠性。其具體計(jì)算原理如下。

      首先,各個(gè)特征對(duì)某一個(gè)樣本的預(yù)測(cè)值的影響可以表示為

      式中:xi表示第i個(gè)特征值,?茁i表示特征i的權(quán)重,m表示總特征數(shù)。

      假設(shè)E[f(z)]表示不考慮特征時(shí)預(yù)測(cè)的基準(zhǔn)線,那么當(dāng)加入一個(gè)特征xi時(shí),其影響程度?準(zhǔn)i可以表示為

      式中:E(?茁ixi)表示特征i的平均貢獻(xiàn)值,將每個(gè)特征的貢獻(xiàn)值相加可以得到

      所有特征的貢獻(xiàn)之和即為模型的輸出結(jié)果。

      部分依賴(lài)圖可以展示單個(gè)特征對(duì)預(yù)測(cè)結(jié)果的影響,用于解釋預(yù)測(cè)模型中特定特征與預(yù)測(cè)結(jié)果之間的關(guān)系。其以圖形方式描述了變量對(duì)響應(yīng)的邊際效應(yīng)。

      2.3.2 特征重要性排序

      圖9展示了14個(gè)特征變量的重要性排序,圖中每個(gè)點(diǎn)即為樣本在相應(yīng)特征上的SHAP值,SHAP值大于0即對(duì)目標(biāo)變量有正向影響,小于0對(duì)目標(biāo)變量有負(fù)向作用。從圖中可以看出,重要性程度排名前四的為小型商鋪、居民小區(qū)、教育機(jī)構(gòu)和醫(yī)療機(jī)構(gòu),且對(duì)違法行為密度呈現(xiàn)正向影響。

      圖10顯示的是貢獻(xiàn)度排名前四的特征變量的部分依賴(lài)圖,可以看出小型商鋪、居民小區(qū)、教育機(jī)構(gòu)和醫(yī)療機(jī)構(gòu)與預(yù)測(cè)結(jié)果基本上呈現(xiàn)上升趨勢(shì),且數(shù)量達(dá)到一定值后預(yù)測(cè)結(jié)果不再變化。

      3 討論與結(jié)論

      通過(guò)上述解釋模型的可視化結(jié)果可以看出,小型商鋪、居民小區(qū)、教育機(jī)構(gòu)、醫(yī)療機(jī)構(gòu)、地鐵和公交等特征對(duì)電動(dòng)自行車(chē)違法行為密度具有正向影響,該結(jié)果與其他學(xué)者對(duì)電動(dòng)自行車(chē)事故影響因素研究的結(jié)論類(lèi)似[1,6],可見(jiàn)建成環(huán)境對(duì)違法行為和交通事故的影響在某種程度上具有共通性。

      其中小型商鋪的影響在眾多影響因素中占主導(dǎo)地位,該結(jié)果與行人交通事故影響因素的研究相似[7],推測(cè)小型商鋪對(duì)行人和非機(jī)動(dòng)車(chē)具有更大的吸引力,小型商鋪附近更容易發(fā)生與弱勢(shì)群體有關(guān)的違法行為和交通事故。

      此外,居民小區(qū)對(duì)違法行為的影響也較為顯著。居民小區(qū)內(nèi)外的交通情況較為復(fù)雜,且廈門(mén)島內(nèi)的居民區(qū)道路由于土地資源受限,一般設(shè)計(jì)的較為狹窄,且大部分未設(shè)非機(jī)動(dòng)車(chē)道(圖11),這導(dǎo)致人行道與非機(jī)動(dòng)車(chē)道共板(圖12)、機(jī)機(jī)動(dòng)車(chē)道與非機(jī)動(dòng)車(chē)道共板(圖13)的現(xiàn)象非常普遍,違法行為發(fā)生的概率也會(huì)更高。

      教育和醫(yī)療機(jī)構(gòu)對(duì)違法行為的影響也是正向的,但影響沒(méi)有前兩者顯著,其原因可能在于學(xué)校與醫(yī)院其本身建設(shè)成本高,數(shù)量較少,影響范圍有限,尤其對(duì)于電動(dòng)自行車(chē)用戶(hù)的影響,多集中于學(xué)校與醫(yī)院方圓3~5 km范圍內(nèi),正好是電動(dòng)自行車(chē)出行的舒適范圍。其他特征變量對(duì)電動(dòng)自行車(chē)違法行為沒(méi)有明顯傾向趨勢(shì),其更深層次的影響結(jié)果需進(jìn)一步探究。

      綜上,本研究通過(guò)構(gòu)建電動(dòng)自行車(chē)違法行為數(shù)據(jù)庫(kù)和H2O AutoML模型,初步探究了電動(dòng)自行車(chē)交通違法行為的影響因素,為電動(dòng)自行車(chē)違法行為的治理提供思路和方法,也為后續(xù)進(jìn)一步深入研究更多特征變量以及多因素的交互影響提供參考。

      參考文獻(xiàn):

      [1] 馬景峰,任剛,李豪杰,等.電動(dòng)自行車(chē)與機(jī)動(dòng)車(chē)事故嚴(yán)重性影響因素分析[J].交通運(yùn)輸系統(tǒng)工程與信息,2022,22(2):337-348.

      [2] WANG X,CHEN J,QUDDUS M,et al.Influence of familiarity with traffic regulations on delivery riders'ebike crashes and helmet use:Two mediator ordered Logit models[J].Accident:Analysis and Prevention,2021(159):106277.

      [3] 范浩軒,任剛,李豪杰,等.基于電子執(zhí)法數(shù)據(jù)的交通違法行為影響因素研究——以上虞區(qū)為例(英文)[J].Journal of Southeast University(English Edition),2021,37(2):227-236.

      [4] HUANG Y, WANG X, PATTON D. Examining spatial relationships between crashes and the built environment: a geographically weighted regression approach[J]. Journal of Transport Geography, 2018(69):221-233.

      [5] CERVERO R, KOCKELMAN K. Travel demand and the 3Ds: Density, diversity, and design[J]. Transportation research part D: Transport environmental Research Letters, 1997,2(3):199-219.

      [6] 王菁,董春嬌,李鵬輝,等.考慮建成環(huán)境的電動(dòng)自行車(chē)事故嚴(yán)重程度致因分析[J].交通運(yùn)輸系統(tǒng)工程與信息,2024,24(1):179-187.

      [7] 郭珮珺.基于社會(huì)感知數(shù)據(jù)的行人交通事故建模與影響因素分析[D].上海:華東師范大學(xué),2014.

      猜你喜歡
      隨機(jī)森林交通安全
      隨機(jī)森林在棉蚜蟲(chóng)害等級(jí)預(yù)測(cè)中的應(yīng)用
      基于二次隨機(jī)森林的不平衡數(shù)據(jù)分類(lèi)算法
      軟件(2016年7期)2017-02-07 15:54:01
      試論如何加強(qiáng)企業(yè)交通安全管理工作
      拱壩變形監(jiān)測(cè)預(yù)報(bào)的隨機(jī)森林模型及應(yīng)用
      探析道路因素對(duì)城市交通安全的影響
      鄉(xiāng)鎮(zhèn)道路交通安全
      青春歲月(2016年22期)2016-12-23 16:34:20
      農(nóng)村道路交通安全問(wèn)題
      青春歲月(2016年22期)2016-12-23 15:58:54
      基于交通安全的高速公路路線平縱組合設(shè)計(jì)
      公路設(shè)計(jì)應(yīng)考慮的交通安全因素研究
      基于隨機(jī)森林算法的飛機(jī)發(fā)動(dòng)機(jī)故障診斷方法的研究
      凯里市| 土默特右旗| 乌审旗| 聂拉木县| 山东| 望谟县| 昭平县| 麻城市| 曲水县| 大理市| 朔州市| 建宁县| 平昌县| 赫章县| 罗江县| 巨鹿县| 尚志市| 呈贡县| 辉县市| 石家庄市| 娄烦县| 盘山县| 宾川县| 邢台市| 延吉市| 楚雄市| 延安市| 保亭| 金堂县| 公主岭市| 长宁县| 万荣县| 永康市| 万州区| 交口县| 靖江市| 丹东市| 鲁山县| 临江市| 辽宁省| 承德市|