劉文武
(200093 上海市 上海理工大學(xué) 機(jī)械工程學(xué)院)
汽車行駛工況(Driving Cycle)是描述汽車行駛的速度-時(shí)間的曲線[1]。國(guó)家工信部根據(jù)該曲線來(lái)實(shí)驗(yàn)測(cè)算汽車油耗,所以工信部油耗是否與實(shí)際油耗相吻合與汽車行駛工況曲線有密切關(guān)系。目前我國(guó)采用的是歐洲NEDC 汽車行駛工況[2],但隨著汽車保有量的快速增長(zhǎng)以及道路交通狀況的變化,NEDC 與我國(guó)實(shí)際情況產(chǎn)生的誤差越來(lái)越大,所以制定反映我國(guó)實(shí)際道路行駛狀況的測(cè)試工況顯得越來(lái)越重要。我國(guó)地域遼廣,各個(gè)城市的發(fā)展程度、氣候條件及交通狀況不同,各城市間的汽車行駛工況存在明顯的差異性,基于城市自身的汽車行駛數(shù)據(jù)進(jìn)行城市汽車行駛工況的構(gòu)建研究也越來(lái)越迫切。
陳漢[3]等利用GPS 設(shè)備采集的哈爾濱市8 個(gè)區(qū)域的行駛數(shù)據(jù)構(gòu)建了乘用車的出行特征,利用主成分分析方法和聚類分析方法構(gòu)建出哈爾濱市乘用車工況。劉鵬[4]等提出一種組合主成分分析和聚類分析的數(shù)據(jù)處理方法,得出西安市區(qū)城市客車瞬態(tài)行駛工況,并采用樣車進(jìn)行仿真分析,進(jìn)一步對(duì)XATD-HBUS 工況及ECE 工況之間的差異進(jìn)行了對(duì)比驗(yàn)證。姜平[5]等基于離散小波變換數(shù)據(jù)壓縮理論對(duì)行駛數(shù)據(jù)進(jìn)行壓縮重構(gòu),根據(jù)特征參數(shù)構(gòu)建了城市道路代表行駛工況,并建立合肥市區(qū)典型道路的11 個(gè)行駛工況評(píng)價(jià)準(zhǔn)則。彭育輝[6]等采用優(yōu)化聚類與馬爾科夫鏈的組合方法構(gòu)建出城市環(huán)衛(wèi)車輛行駛工況,并基于運(yùn)動(dòng)學(xué)參數(shù)的有效性對(duì)行駛工況進(jìn)行了驗(yàn)證,證明了工況構(gòu)建方法的有效性和合理性。李耀華[7]等基于馬爾科夫鏈構(gòu)建了西安市城市公交某路線工況,采用特征值來(lái)驗(yàn)證該方法的有效性。
根據(jù)提供的數(shù)據(jù)建立一條能體現(xiàn)參與數(shù)據(jù)采集汽車行駛特征的工況曲線,使該曲線所體現(xiàn)的汽車運(yùn)動(dòng)特征能代表所采集數(shù)據(jù)的相應(yīng)特征。
為使采集的數(shù)據(jù)更能充分地反映福州地區(qū)的交通狀況,汽車行駛工況數(shù)據(jù)采集應(yīng)該有足夠廣的覆蓋面。數(shù)據(jù)采集主要在福州地區(qū)城市道路上進(jìn)行,路線包括市區(qū)道路、學(xué)校、車站、商業(yè)中心及高速、機(jī)場(chǎng)一些交通流量比較大的地方。通過(guò)GPS+傳感器設(shè)備對(duì)車輛行駛的速度、三向加速度、經(jīng)緯度以及燃油消耗率等數(shù)據(jù)進(jìn)行采集。連續(xù)采集了3 周,采樣頻率為1 Hz,共采集了496 467 組數(shù)據(jù)。圖1 所示為采集的數(shù)據(jù)繪制出的車輛運(yùn)動(dòng)軌跡。
圖1 數(shù)據(jù)采集車輛行駛路線Fig.1 Data collection vehicle driving route
假設(shè):(1)汽車正常的怠速范圍在600~800;(2)實(shí)驗(yàn)期間自然環(huán)境對(duì)采集設(shè)備的影響一致;(3)GPS 速度<1 和<0.1 包含在汽車怠速抖動(dòng)范圍內(nèi);(4)數(shù)據(jù)采集中汽車的動(dòng)力性能及燃油經(jīng)濟(jì)性等幾個(gè)指標(biāo)不發(fā)生變化;(5)不考慮汽車行駛過(guò)程中的風(fēng)阻系數(shù)等因素的影響;(6)x 為汽車的前進(jìn)方向,y 為轉(zhuǎn)彎方向,z 為垂直方向,如圖2 所示。
圖2 汽車運(yùn)動(dòng)學(xué)模型Fig.2 Kinematics model of the car
不良數(shù)據(jù)的存在使得數(shù)據(jù)系統(tǒng)丟失了大量有用信息。
(1)GPS 信號(hào)丟失造成的時(shí)間不連續(xù)。當(dāng)汽車駛?cè)敫邔咏ㄖ?、隧道等路段或GPS 設(shè)備受到干擾影響時(shí),可能出現(xiàn)丟失信號(hào)的情況。缺失值中大部分是穿越高層、短隧道的短時(shí)間斷點(diǎn);小部分是停在地下車庫(kù)但采集設(shè)備仍在運(yùn)行,以及穿越長(zhǎng)隧道的長(zhǎng)時(shí)間斷點(diǎn)。小于10 s 的斷點(diǎn)對(duì)汽車工況曲線的構(gòu)造的影響不大,使用Python 中的pandas 庫(kù)遍歷所有時(shí)間數(shù)據(jù)找到數(shù)據(jù)丟失造成的時(shí)間斷點(diǎn),采用均值插補(bǔ)方式進(jìn)行插補(bǔ);對(duì)10 s以上的斷點(diǎn)進(jìn)行補(bǔ)全會(huì)影響運(yùn)動(dòng)學(xué)片段的劃分從而影響曲線構(gòu)造的準(zhǔn)確性,所以不作處理。經(jīng)過(guò)處理發(fā)現(xiàn)斷點(diǎn)有4 196個(gè),補(bǔ)全的數(shù)據(jù)有3 693個(gè);
(2)汽車加、減速度異常數(shù)據(jù)。一般情況下,普通轎車最大減速度為8 m/s2,且0~100 km/s 的加速時(shí)間大于7 s,a 不在3.968 25~8.000 00 m/s2范圍內(nèi)的均視為異常值,這類數(shù)據(jù)對(duì)汽車工況曲線的準(zhǔn)確性產(chǎn)生重要影響。處理方法是異常值所對(duì)應(yīng)的GPS 車速清空,然后使用拉格朗日插值法進(jìn)行插值計(jì)算;
(3)長(zhǎng)期停車,如停車不熄火等候人、停車熄火了但采集設(shè)備仍在運(yùn)行、發(fā)動(dòng)機(jī)冷啟動(dòng)后怠速熱車、停車后不立即熄火等情況所采集的異常數(shù)據(jù)應(yīng)該直接移除,總共刪除的長(zhǎng)期停車異常數(shù)據(jù)有593 個(gè);
(4)加速是指汽車加速度>0.1 m/s2的連續(xù)過(guò)程,減速是指汽車加速度>-0.1 m/s2的連續(xù)過(guò)程,而勻速是指汽車加速度絕對(duì)值<0.1 非怠速的連續(xù)過(guò)程。故長(zhǎng)時(shí)間堵車可以理解為車速范圍為0<v<1,且加速度范圍為-0.1<a<0.1 的行駛過(guò)程,斷斷續(xù)續(xù)低速行駛則可理解為1<v<10,且a≤-0.1<∪a≥0.1 的行駛過(guò)程。長(zhǎng)時(shí)間堵車和斷斷續(xù)續(xù)低速行駛這類數(shù)據(jù)的存在會(huì)影響到運(yùn)動(dòng)片段的劃分,應(yīng)作歸零化處理。刪除掉的長(zhǎng)時(shí)間堵車和斷斷續(xù)續(xù)低速的數(shù)據(jù)有15 979 個(gè);
(5)一般認(rèn)為怠速時(shí)間超過(guò)180 s 為異常情況。在汽車非行駛時(shí)間段繼續(xù)進(jìn)行數(shù)據(jù)采集,這就造成了長(zhǎng)時(shí)間的怠速段。對(duì)超過(guò)180 s 的這部分?jǐn)?shù)據(jù)進(jìn)行刪除,以免造成構(gòu)建的車輛行駛工況的怠速比例較高、車速較低的情況,影響車輛行駛工況構(gòu)建的準(zhǔn)確性[8],共刪除的長(zhǎng)期停車異常數(shù)據(jù)有15 150 個(gè)。
針對(duì)不同的不良數(shù)據(jù),采取適合的處理方式對(duì)5 類不良數(shù)據(jù)進(jìn)行篩除,經(jīng)過(guò)處理以后的數(shù)量統(tǒng)計(jì)如表1 所示。
表1 不良數(shù)據(jù)處理統(tǒng)計(jì)Tab.1 Statistics of bad data processing
運(yùn)動(dòng)學(xué)片段是指汽車兩個(gè)怠速之間的行駛片段,一個(gè)完整的運(yùn)動(dòng)學(xué)片段通常包括4 個(gè)行駛工況:怠速、加速、減速和勻速工況[9]。此外還應(yīng)該滿足:每個(gè)運(yùn)動(dòng)學(xué)片段的時(shí)間長(zhǎng)度應(yīng)在20 s以上;每個(gè)運(yùn)動(dòng)學(xué)片段的運(yùn)行里程應(yīng)在10 m 以上;加速度在0.100 00~3.968 25 m/s2,減速度在-8.0~0.1 m/s2的范圍內(nèi)。使用MATLAB 編寫的程序?qū)Y選后的數(shù)據(jù)系統(tǒng)進(jìn)行運(yùn)動(dòng)學(xué)片段的劃分,最后共計(jì)得出的片段為5 984 個(gè)。
特征值數(shù)量過(guò)少會(huì)使得不能完全囊括運(yùn)動(dòng)學(xué)片段的信息而造成描述不準(zhǔn)確,最終搭建的汽車行駛工況曲線失真;數(shù)量過(guò)多則會(huì)造成信息重復(fù)冗雜而加大計(jì)算難度,浪費(fèi)人力物力資源。描述運(yùn)動(dòng)學(xué)片段的特征值有很多,最常用的是速度和加速度,但僅這兩個(gè)參數(shù)對(duì)運(yùn)動(dòng)學(xué)片段進(jìn)行描述會(huì)使得信息不完善,并且在劃分運(yùn)動(dòng)學(xué)片段時(shí),不同片段之間的加速和加速度數(shù)量具有差異性,這樣會(huì)導(dǎo)致計(jì)數(shù)緯度不同,加大分析的難度,因此本文選取了平均速度、平均行駛速度等9 個(gè)特征值來(lái)描述運(yùn)動(dòng)學(xué)片段信息,如表2 所示。
表2 特征值統(tǒng)計(jì)Tab.2 Eigenvalue statistics
確定好特征值的計(jì)算方法后,在MATLAB中用遍歷數(shù)據(jù)判斷法計(jì)算出5 984 個(gè)運(yùn)動(dòng)學(xué)片段的特征值,部分計(jì)算結(jié)果如表3 所示。
表3 特征值計(jì)算結(jié)果Tab.3 Eigenvalue calculation results
(續(xù)表)
為了構(gòu)建全面而接近真實(shí)的汽車行駛狀況,需要對(duì)特征值進(jìn)行分析,但各特征值數(shù)據(jù)重復(fù)冗余,如果完全采用高維度的運(yùn)動(dòng)學(xué)片段特征值進(jìn)行分析,盡管能保留數(shù)據(jù)的完整信息,但由于變量存在交疊信息,會(huì)導(dǎo)致模型復(fù)雜、增加無(wú)效工作,并且曲線的準(zhǔn)確性也會(huì)降低,所以在計(jì)算前需要通過(guò)主成分分析進(jìn)行數(shù)據(jù)降維處理以簡(jiǎn)化計(jì)算[10]。
處理后的運(yùn)動(dòng)學(xué)片段數(shù)據(jù)采用9 個(gè)特征值來(lái)描述運(yùn)動(dòng)學(xué)片段信息,得到特征值數(shù)據(jù)集。
相關(guān)系數(shù)絕對(duì)值越大,該主成分與這些特征參數(shù)的相關(guān)性越高,主成分代表性越強(qiáng)。相關(guān)系數(shù)絕對(duì)值較大表明該主成分綜合了這幾個(gè)相關(guān)系數(shù)絕對(duì)值大的特征參數(shù),該主成分的代表性越強(qiáng)。其中平均速度、最大速度、平均加速度為第1 主成分的特征值信息;第2 主成分與運(yùn)行時(shí)間、平均減速度、加速比例和減速比例的相關(guān)性較高;怠速比例和勻速比例的特征值信息為第3 主成分;第4 主成分代表最大加速度和最小減速度的特征值信息[11]。
短行程對(duì)應(yīng)的主成分得分是由標(biāo)準(zhǔn)化的特征參數(shù)矩陣與主成分系數(shù)矩陣相乘得到的,計(jì)算所得的各運(yùn)動(dòng)學(xué)片段的主成分得分是下文K 均值聚類分析的數(shù)據(jù)基礎(chǔ)。
聚類分析是用距離來(lái)定義樣本之間的相似程度的一種數(shù)據(jù)分析方法,在做聚類分析時(shí),各樣本之間的親密度對(duì)聚類分析的結(jié)果有重要影響。K 均值聚類法適用于大樣本數(shù)據(jù)分析,計(jì)算量相對(duì)較小,分類也更加合理。用MATLAB 編寫的均值聚類算法代碼對(duì)短行程聚類分析,根據(jù)對(duì)實(shí)際問(wèn)題的分析確定分類數(shù)k,在進(jìn)行計(jì)算時(shí)分別在各類中選擇出相應(yīng)的聚點(diǎn),再計(jì)算樣本數(shù)據(jù)與聚點(diǎn)之間的歐式距離,按照距離的大小進(jìn)行聚類劃分,重復(fù)多次,直到分類結(jié)束。本次分析共重復(fù)20 次,得到較為穩(wěn)定的聚點(diǎn)。聚類前后的數(shù)據(jù)統(tǒng)計(jì)如表4 和表5 所示。
表4 初始聚類中心Tab.4 Initial cluster center
表5 最終聚類中心Tab.5 Final cluster center
將所有運(yùn)動(dòng)學(xué)片段分3 類進(jìn)行聚類分析。聚三類分析的聚類結(jié)果如圖3 所示。
圖3 聚三類聚類結(jié)果Fig.3 Clustering results
聚類后形成了低速區(qū)間、高速區(qū)間以及介于高速區(qū)間和低速區(qū)間的中速區(qū)間三類數(shù)據(jù),在每一類數(shù)據(jù)中選取短行程,組合成為確定時(shí)間長(zhǎng)度的車輛行駛工況。在每一類中根據(jù)各個(gè)短行程與聚心的歐氏距離的大小選取短行程,計(jì)算各類短行程庫(kù)在整個(gè)短行程庫(kù)中所占的比例,結(jié)合需要構(gòu)建的沈陽(yáng)市乘用車城市道路行駛工況的持續(xù)時(shí)間,計(jì)算每類短行程在最終合成工況時(shí)的時(shí)間。計(jì)算公式如下:
計(jì)算得到最后構(gòu)建工況時(shí)三類短行程的時(shí)間占比和各自所占的時(shí)長(zhǎng),如表6 所示。
表6 各類工況時(shí)間占比Tab.6 Proportion of time under various working conditions
按3 類工況時(shí)間長(zhǎng)度的計(jì)算結(jié)果挑選出每類中具有代表性的短行程作為聚類中心,按運(yùn)動(dòng)學(xué)片段與聚類中心的距離最小的原則在3 類候選工況中挑選出運(yùn)動(dòng)學(xué)片段,將挑選出的運(yùn)動(dòng)學(xué)片段分別合成反映擁堵交通狀況的低速工況、反映暢通交通狀況的高速工況和反映綜合交通狀況的綜合工況。汽車的加速度-時(shí)間曲線如圖4 所示,合成的高速工況、中速工況和低速工況的代表性行駛工況時(shí)間-速度曲線分別如圖5(a)、(b)、(c)所示。
圖4 行駛工況加速度圖Fig.4 Driving cycle acceleration
圖5 高、中、低速工況代表性速度-時(shí)間圖Fig.5 Typical speed-time diagrams for high,medium and low speed conditions
基于K-均值聚類分析結(jié)果中聚類中心的大小,篩選出高、中、低速的運(yùn)動(dòng)學(xué)片段,最后將3 個(gè)工況組合成900 s 的汽車行駛工況,合成后的汽車行駛工況如圖6 所示。
圖6 汽車綜合行駛工況圖Fig.6 Comprehensive vehicle driving conditions
本次汽車行駛工況是對(duì)實(shí)際車輛行駛數(shù)據(jù)進(jìn)行分析來(lái)完成行駛工況搭建的,所以需要對(duì)構(gòu)建工況的數(shù)據(jù)與原始數(shù)據(jù)之間的差異進(jìn)行驗(yàn)證。由于汽車行駛工況的構(gòu)建是在對(duì)原始車輛行駛數(shù)據(jù)信息進(jìn)行預(yù)處理后進(jìn)行的,所以將對(duì)的特征值進(jìn)行行駛工況的有效性驗(yàn)證。均值插補(bǔ)法在處理小間斷點(diǎn)數(shù)據(jù)時(shí)具有比較好的可靠性,缺失值若是數(shù)值型的,就根據(jù)這個(gè)缺失值所在的其他對(duì)象值的平均值來(lái)進(jìn)行缺失值的補(bǔ)全[12]。
汽車行駛工況的有效性驗(yàn)證就是計(jì)算行駛工況的特征參數(shù)與預(yù)處理后數(shù)據(jù)特征參數(shù)的絕對(duì)誤差和相對(duì)誤差。對(duì)計(jì)算得出的誤差值進(jìn)行分析,以驗(yàn)證構(gòu)建的行駛工況是否合理。誤差計(jì)算公式:
式中:ε——預(yù)處理后汽車行駛工況特征參數(shù)j和相應(yīng)的原始數(shù)據(jù)之間的特征參數(shù)j 之間的相對(duì)誤差;xi——預(yù)處理后車輛行駛工況特征參數(shù)值;Xj——原始數(shù)據(jù)特征參數(shù)值。
計(jì)算得出各特征值之間的誤差值均小于10%,在合理范圍之內(nèi)。由此可見(jiàn),本文構(gòu)建的汽車行駛工況與實(shí)際情況接近,合理且有效,能較準(zhǔn)確地反映福州地區(qū)的汽車行駛工況。
本文通過(guò)對(duì)大量的汽車行駛采集數(shù)據(jù)進(jìn)行分析,采用主成分分析與聚類分析算法提取運(yùn)動(dòng)學(xué)片段,計(jì)算合成得出福州地區(qū)汽車行駛工況圖,反映出福州地區(qū)真實(shí)的車輛道路行駛狀況。計(jì)算得出各特征值之間的誤差值均小于10%,在合理范圍之內(nèi),能比較準(zhǔn)確地反映該城市的汽車行駛工況,對(duì)車輛行駛工況的深入研究提供一定的理論參考。