邵云飛,許 沖,胡惠晴
(1.上海理工大學(xué)機(jī)械工程學(xué)院;2.上海理工大學(xué)管理學(xué)院,上海 200093)
汽車行駛工況(Driving Cycle)通常用速度和時(shí)間序列表示,可以代表某一區(qū)域的行駛行為[1]。汽車行駛工況是量化汽車排放的重要指標(biāo),其主要目的是通過模擬真實(shí)的駕駛模式來評(píng)估汽車的污染排放和油耗。近幾十年來,汽車行駛工況一直被用來完成新車的排放認(rèn)證程序。中國一直采用歐洲排放認(rèn)證標(biāo)準(zhǔn)測試循環(huán),《世界輕型車測試程序》(World Light Vehicle Test Procedure,WLTP)將取代《新歐洲駕駛循環(huán)》(New European Driving Cycle,NEDC)成為新型輕型車排放認(rèn)證標(biāo)準(zhǔn)測試循環(huán)(圖1、圖2 分別展示了NEDC 行駛工況和WLTC 行駛工況)。然而,隨著中國汽車數(shù)量的快速增長,近年來中歐之間的駕駛狀況差異越來越大。駕駛周期能否充分反映汽車的真實(shí)駕駛情況,并提供更準(zhǔn)確的估計(jì),越來越受到關(guān)注。而且,我國幅員遼闊,各城市道路建設(shè)、人口密度及交通狀況各異,導(dǎo)致各城市的汽車行駛工況特征具有明顯差異。因此,基于城市自身的汽車行駛數(shù)據(jù)進(jìn)行城市汽車行駛工況構(gòu)建研究也越發(fā)迫切,希望所構(gòu)建的汽車行駛工況與該市汽車的行駛情況盡量吻合,理想情況是完全代表該市汽車行駛情況(也可以理解為對實(shí)際行駛情況的濃縮)。目前,北京、西安、沈陽等都已經(jīng)構(gòu)建了各自城市的汽車行駛工況[2-4]。
Fig.1 Driving cycle of NEDC圖1 NEDC 行駛工況
Fig.2 Driving cycle of WLTC圖2 WLTC 行駛工況
汽車行駛工況構(gòu)建本質(zhì)上屬于模式識(shí)別在實(shí)際工程中的一種應(yīng)用[5]。目前對于汽車能量管理控制策略的工況識(shí)別方法中,主流方法有神經(jīng)網(wǎng)絡(luò)[6-7]、聚類分析[8-9]。文獻(xiàn)[10]采用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行工況識(shí)別,但其特征提取不夠全面,模型訓(xùn)練樣本較少,且泛化能力較差;文獻(xiàn)[11]采用聚類分析法構(gòu)建了道路汽車行駛工況。文獻(xiàn)[12]利用聚類分析方法識(shí)別工況,然后基于馬爾可夫原理對不同工況進(jìn)行拼接,構(gòu)建出代表性工況;文獻(xiàn)[13]基于聚類分析法構(gòu)建出行駛工況,并基于相關(guān)系數(shù)法對構(gòu)建的行駛工況進(jìn)行評(píng)價(jià);文獻(xiàn)[14]采用聚類分析法構(gòu)建汽車行駛工況,但未能給出合理的評(píng)價(jià)體系。
在上述研究背景下,本文根據(jù)某城市輕型汽車實(shí)際道路行駛采集的數(shù)據(jù)(采樣頻率1Hz),基于主成分分析和Kmeans 聚類方法構(gòu)建汽車行駛工況曲線。首先,基于運(yùn)動(dòng)學(xué)片段原理對采集到的數(shù)據(jù)進(jìn)行劃分;然后,選取運(yùn)行時(shí)間、運(yùn)行速度、平均加速度、怠速時(shí)間比、速度的標(biāo)準(zhǔn)偏差等可以描述和評(píng)價(jià)這些片段的特征參數(shù)并進(jìn)行相應(yīng)計(jì)算,利用主成分分析法對于選取的運(yùn)動(dòng)學(xué)片段的特征參數(shù)進(jìn)行降維處理,減少計(jì)算量;然后將降維以后得到的4 個(gè)主成分作為研究變量,利用K-means 聚類對所有運(yùn)動(dòng)學(xué)片段進(jìn)行分類,得到3 類代表不同汽車行駛特征的片段,最后提出了基于總體特征參數(shù)偏差最小的片段選取方法,對備選工況片段進(jìn)行篩選,構(gòu)建出汽車行駛工況圖。以原始數(shù)據(jù)和所構(gòu)建的行駛工況的特征參數(shù)誤差作為汽車運(yùn)動(dòng)特征評(píng)估指標(biāo),用來評(píng)估所構(gòu)建的汽車行駛工況的合理性。得到的誤差結(jié)果越小,說明最終構(gòu)建出的汽車行駛工況的代表性越強(qiáng)。
主成分分析(Principal Component Analysis,PCA)[15]由Pearson 與1901 年第一次提出,用于數(shù)據(jù)分析及模型建立,它是一種基礎(chǔ)的、常用的分析方法。它基于降維理論,將原始的多變量指標(biāo)經(jīng)過線性變換,重新組建一組線性無關(guān)的綜合指標(biāo)替代原始指標(biāo)。
給定n個(gè)樣本,每個(gè)樣本中含有p個(gè)變量,構(gòu)成一個(gè)n×p階數(shù)據(jù)矩陣:
其中,x1,…,xp為原變量指標(biāo),z1,…,zm為新變量指標(biāo),方程組中系數(shù)的確定需滿足以下原則:①zi,zj,(i≠j,i,j=1,2,…,m) 相互無關(guān);②z1是x1,…,xp所有線性組合中方差最大的,z2是與z1無關(guān)的x1,…,xp的所有線性組合中方差最大的;zm是與z1,…,zm-1均不相關(guān)的x1,…,xp所有線性組合中方差最大的,則所組建的新指標(biāo)z1,…,zm分別是原來變量指標(biāo)x1,…,xp的第1,第2,…,第m主成分。
K-means 聚類是著名的劃分聚類算法,因簡潔和高效而得到了廣泛應(yīng)用[16]。K-means 的基本思想是:在給定k值和k個(gè)初始聚類簇中心點(diǎn)的情況下,將每個(gè)樣本點(diǎn)分到離其最近的簇中,之后重新計(jì)算每一個(gè)簇的中心點(diǎn)(取其平均值),再迭代進(jìn)行分配點(diǎn)和更新類簇中心點(diǎn)步驟,直至類簇中心點(diǎn)變化很小,或者達(dá)到指定的迭代次數(shù)。
K-means 聚類的具體計(jì)算步驟如下:
(1)首先確定一個(gè)k值,即原始數(shù)據(jù)集經(jīng)過聚類后得到k個(gè)集合。
(2)從原始數(shù)據(jù)集之間隨機(jī)選擇k個(gè)數(shù)據(jù)點(diǎn)作為聚類中心。
(3)對數(shù)據(jù)集中的每一個(gè)點(diǎn),計(jì)算其與每一個(gè)聚類中心的距離(如歐式距離),離哪個(gè)聚類中心近,就劃分到哪個(gè)聚類中心所屬的集合。
對于兩點(diǎn)之間的距離計(jì)算,有以下幾種方式:
歐式距離:
(4)將所有數(shù)據(jù)歸好集合后,一共有k個(gè)集合,然后重新計(jì)算每個(gè)集合的中心。
(5)如果新計(jì)算出來的聚類中心和原來聚類中心之間的距離小于某一個(gè)設(shè)置的閾值(表示重新計(jì)算的聚類中心的位置變化不大,趨于穩(wěn)定,或者說收斂),可以認(rèn)為聚類已經(jīng)達(dá)到期望結(jié)果,算法終止。
(6)假如新的聚類中心和原來聚類中心距離變化很大,需要迭代步驟(3)—步驟(5)。
運(yùn)動(dòng)學(xué)片段指汽車從怠速狀態(tài)初始階段到下一個(gè)怠速狀態(tài)初始階段之間的行車速度區(qū)間,如圖3 所示。可以看出,一個(gè)相對完整的運(yùn)動(dòng)學(xué)片段應(yīng)該包含怠速、加速、勻速和減速階段。其中,勻速階段不是必須階段,因?yàn)樵谝欢螌?shí)際的行駛過程中,可能沒有充足的勻速駕駛條件。
Fig.3 Kinematic segment definition圖3 運(yùn)動(dòng)學(xué)片段定義
本文以某城市的典型道路為對象,采集輕型汽車不同時(shí)間段內(nèi)在實(shí)際道路上行駛的數(shù)據(jù)(包含3 個(gè)數(shù)據(jù)文件,每個(gè)數(shù)據(jù)文件為同一輛車在不同時(shí)間段內(nèi)所采集的數(shù)據(jù)),采集的部分實(shí)驗(yàn)數(shù)據(jù)所呈現(xiàn)的速度、加速度如圖4、圖5 所示。
Fig.4 Speed-time diagram of test data圖4 實(shí)驗(yàn)數(shù)據(jù)呈現(xiàn)的速度—時(shí)間關(guān)系
Fig.5 Acceleration-time diagram of test data圖5 實(shí)驗(yàn)數(shù)據(jù)所呈現(xiàn)的加速度—時(shí)間關(guān)系
一個(gè)有效的運(yùn)動(dòng)學(xué)片段應(yīng)該包含4 個(gè)正常行駛狀態(tài),即怠速狀態(tài)、加速狀態(tài)、勻速狀態(tài)和減速狀態(tài),且一般不少于30s。汽車的速度—時(shí)間曲線通常情況下可以視為由若干個(gè)運(yùn)動(dòng)學(xué)片段組合而成,而汽車在不同交通狀況下、不同路線段、不同時(shí)間段都會(huì)得到不同的運(yùn)動(dòng)學(xué)片段。利用相應(yīng)的聚類算法可以將反映相似交通特征的運(yùn)動(dòng)學(xué)片段進(jìn)行歸類,以此形成幾類典型的片段庫,再從片段庫中挑選最優(yōu)的片段構(gòu)建代表性工況。
將試驗(yàn)數(shù)據(jù)依據(jù)運(yùn)動(dòng)學(xué)片段原理進(jìn)行劃分,得到若干運(yùn)動(dòng)學(xué)片段。在這些運(yùn)動(dòng)學(xué)片段中存在一些短時(shí)間片段和無效片段,如果不對這些異常片段進(jìn)行處理,將會(huì)導(dǎo)致后續(xù)的特征值分析結(jié)果出現(xiàn)很大誤差,最終導(dǎo)致建立的汽車行駛工況缺乏有效性。因此,如果一個(gè)運(yùn)動(dòng)學(xué)片段的總時(shí)長小于30s,則將該片段剔除。
根據(jù)上述原則進(jìn)行運(yùn)動(dòng)學(xué)片段的劃分和篩選后,所得運(yùn)動(dòng)學(xué)片段數(shù)目如表1 所示。部分運(yùn)動(dòng)學(xué)片段如圖6 所示。
Table 1 Number of kinematic segments表1 運(yùn)動(dòng)學(xué)片段劃分?jǐn)?shù)目
Fig.6 Partial kinematic segment圖6 部分運(yùn)動(dòng)學(xué)片段
每一個(gè)運(yùn)動(dòng)學(xué)片段都包含了若干個(gè)速度—時(shí)間點(diǎn),每個(gè)運(yùn)動(dòng)學(xué)片段也都有各自的運(yùn)動(dòng)學(xué)特征。工況構(gòu)建是從每一類運(yùn)動(dòng)學(xué)片段庫中,按照特定的選取規(guī)則挑選出符合要求的候選片段,然后進(jìn)行組合拼接形成最終工況。要描述和評(píng)價(jià)一個(gè)運(yùn)動(dòng)學(xué)片段,需要選取相應(yīng)的運(yùn)動(dòng)學(xué)特征參數(shù),這些運(yùn)動(dòng)學(xué)特征參數(shù)能夠盡可能全面地將運(yùn)動(dòng)學(xué)片段根據(jù)其運(yùn)行狀態(tài)進(jìn)行描述并形成基于運(yùn)動(dòng)學(xué)片段的數(shù)學(xué)模型。挑選適宜的運(yùn)動(dòng)學(xué)片段構(gòu)建汽車行駛工況以及對所構(gòu)建的代表性汽車行駛工況進(jìn)行評(píng)價(jià)有其基本準(zhǔn)則可行。為了便于運(yùn)動(dòng)學(xué)片段分類,本文將運(yùn)行時(shí)間、運(yùn)行速度、平均加速度、怠速時(shí)間比、速度的標(biāo)準(zhǔn)偏差等18 個(gè)運(yùn)動(dòng)學(xué)片段特征參數(shù)作為評(píng)價(jià)指標(biāo)。表2 是本文選擇的運(yùn)動(dòng)學(xué)片段特征參數(shù)以及它們的符號(hào)表示。計(jì)算出汽車行駛數(shù)據(jù)處理后得到的2 400 個(gè)運(yùn)動(dòng)學(xué)片段中每個(gè)片段的特征參數(shù)值,得到的特征值矩陣如表3 所示。
Table 2 Characteristic parameters of kinematic segments表2 運(yùn)動(dòng)學(xué)片段的特征參數(shù)
Table 3 Kinematic segment eigenvalue matrix表3 運(yùn)動(dòng)學(xué)片段特征值矩陣
基于主成分分析原理,給出主成分分析對于數(shù)據(jù)的計(jì)算步驟,如下:
(1)首先對變量進(jìn)行標(biāo)準(zhǔn)化處理,去除量綱影響,即:
其中,μ=E(xi),σi=Var(xi)。
(3)計(jì)算特征值和特征向量,利用|λI-R|=0 求解,并將得到的特征值按照其大小進(jìn)行排列,然后分別求出它們對應(yīng)的正交化特征向量ei,滿足‖ei‖=1。
(4)建立回歸方程計(jì)算貢獻(xiàn)率,當(dāng)累積貢獻(xiàn)率達(dá)到一定百分比時(shí),則認(rèn)為這些主成分可以綜合表示所有指標(biāo)所要表達(dá)的信息,從而達(dá)到降維目的。
貢獻(xiàn)率這一指標(biāo)指第i個(gè)主成分的方差在全部成分方差中所占比重;累計(jì)貢獻(xiàn)率指前i個(gè)主成分的綜合能力,用描述。
(5)提取出主成分,計(jì)算每一個(gè)主成分的得分。
根據(jù)上述定義,經(jīng)程序計(jì)算得到各主成分的特征參數(shù)值、貢獻(xiàn)率和累計(jì)貢獻(xiàn)率,如表4 所示。
Table 4 Principal component contribution rate and cumulative contribution rate表4 主成分貢獻(xiàn)率及累計(jì)貢獻(xiàn)率
由主成分分析法的原理可知,主成分特征值的大小表示該主成分反映原來特征參數(shù)能力的大小,特征值越大,表明該主成分能較大程度地替代原始變量。貢獻(xiàn)率代表一次性表示原來多個(gè)特征參數(shù)所反映信息量的能力,貢獻(xiàn)率越高,說明該主成分能反映特征參數(shù)的數(shù)目越多。在本文中,當(dāng)累計(jì)貢獻(xiàn)率超過80% 時(shí),即可認(rèn)為這幾個(gè)主成分能夠完全反映原理所有的特征參數(shù)。從表4 可以看出,前4 個(gè)主成分的累計(jì)貢獻(xiàn)率已達(dá)到80%,因此將這4 個(gè)主成分當(dāng)作運(yùn)動(dòng)學(xué)片段新的特征,能夠大大減少計(jì)算量。經(jīng)主成分分析計(jì)算后還得到了一個(gè)主成分載荷矩陣,該矩陣中的每一列元素都是原來特征參數(shù)與該列所代表的主成分的相關(guān)程度,數(shù)越大代表該特征與主成分關(guān)系越緊,能很大程度地反映主成分的信息量。前4 個(gè)主成分的載荷矩陣(主成分系數(shù)矩陣)如表5 所示。
Table 5 Component load matrix表5 主成分載荷矩陣
從表5 可以看出,第1 個(gè)主成分主要反映了平均速度、平均行駛速度、怠速時(shí)間比、加速時(shí)間比、減速時(shí)間比、速度標(biāo)準(zhǔn)差、最大速度、勻速時(shí)間共8 個(gè)特征參數(shù);第2 個(gè)主成分反映了平均加速度、平均減速度、加速度標(biāo)準(zhǔn)差、最大加速度、最大減速度共5 個(gè)特征參數(shù);第3 個(gè)主成分反映了怠速時(shí)間比、加速時(shí)間比、減速時(shí)間比、片段總時(shí)間共4 個(gè)參數(shù);第4 個(gè)主成分主要反映了平均減速度、最大加速度2 個(gè)特征參數(shù)。還可以得出,這4 個(gè)主成分能夠全部反映本文所列的運(yùn)動(dòng)學(xué)片段的所有特征參數(shù),將主成分載荷系數(shù)矩陣與標(biāo)準(zhǔn)化后的樣本數(shù)據(jù)矩陣相乘即可得到運(yùn)動(dòng)學(xué)片段的主成分得分矩陣。在此,本文選取前4 個(gè)主成分的得分值作為K-means 聚類的研究變量。
利用K-means 聚類法對由主成分分析最終得到的4個(gè)主成分得分矩陣進(jìn)行分類,2 400 個(gè)運(yùn)動(dòng)學(xué)片段被分為3類:第1 類有1 234 個(gè)片段,第2 類有980 個(gè)片段,第3 類有186 個(gè)片段。計(jì)算每一類總的特征參數(shù),以便更好判斷處于該類情形下的汽車行駛狀態(tài),如表6 所示。
Table 6 Comprehensive characteristic parameters of each class表6 各類綜合特征參數(shù)
每一個(gè)特征參數(shù)都或多或少可以反映該車運(yùn)行狀態(tài),在第1 類中,各特征參數(shù)大都處于比較中間的區(qū)間,可判斷該車處于相對中速情況中;在第2 類中,怠速時(shí)間比是3類中最大的,但平均速度最低,最大加速度和最小減速度也是這種情況,說明汽車一直進(jìn)行加減速操作,可判斷該車處于頻繁堵車的實(shí)際路況中,是低速情況;在第3 類中,平均速度相對最高,且勻速行駛時(shí)間最長,說明道路比較暢通,汽車處于相對高速狀況。
通過以上簡單分析,可以大致了解到此輛汽車大多數(shù)情況下都處于較低速度狀態(tài),通過主成分分析法得到的主成分可以使分類過程簡化、效率提高,分類效果也較理想。
將運(yùn)動(dòng)學(xué)片段分好類后,還要構(gòu)建最終的行駛工況曲線,其目的是盡可能真實(shí)地反映汽車在不同情況下的行駛狀況。由于每一類片段包含了一種或幾種特征參數(shù),若從每一類片段中挑選若干個(gè)片段,再組合起來,就能構(gòu)建出符合要求的工況曲線,因此有必要選擇合理的片段挑選方法,這關(guān)系到所構(gòu)建工況的準(zhǔn)確程度。
常用的選取方法有隨機(jī)選擇法[17]、最佳增量法[18]、VA 矩陣法[19]、小波變換法[20]等,隨機(jī)法思路簡單,挑選的片段具有隨機(jī)性,組合后誤差難以保證;最佳增量法在進(jìn)行比較時(shí),步驟繁瑣,計(jì)算量較大;V-A 矩陣法通過聯(lián)合概率密度分布矩陣挑選相關(guān)性最大的片段;小波變換法使用場景受限,但處理效果好。每種方法都有其適用范圍和限制,本文采用基于總體特征參數(shù)偏差最小的片段選取方法,該方法科學(xué)合理,易于以程序?qū)崿F(xiàn)。最終構(gòu)建的汽車行駛工況如圖7 所示。
Fig.7 Curve of final driving cycle圖7 最終行駛工況曲線
工況組合后,要判斷所構(gòu)建的汽車行駛工況是否合理,只需要將構(gòu)造前的運(yùn)動(dòng)學(xué)片段總的特征參數(shù)與構(gòu)造好的工況曲線的特征參數(shù)進(jìn)行相應(yīng)比較,并計(jì)算兩者之間的相對誤差,才能對構(gòu)造的好壞有量值評(píng)價(jià),構(gòu)建前后各特征參數(shù)及誤差如表7 所示。
可以清楚看出,實(shí)驗(yàn)數(shù)據(jù)和構(gòu)建工況的特征參數(shù)之間差異很小,而且誤差都在8% 以內(nèi),說明構(gòu)建的行駛工況比較合理,能夠較為全面地反映該城市實(shí)際道路行駛狀況。
Table 7 Characteristic parameter and error before and after construction表7 構(gòu)建前后各特征參數(shù)及誤差
本文以所得輕型汽車實(shí)際道路行駛數(shù)據(jù)為例,將大量行駛工況的數(shù)據(jù)劃分為運(yùn)動(dòng)學(xué)片段,選出18 個(gè)特征參數(shù)進(jìn)行研究。首先基于主成分分析法對運(yùn)動(dòng)學(xué)片段特征參數(shù)進(jìn)行降維處理,然后利用K-means 聚類方法對其進(jìn)行分類,最后基于總體特征參數(shù)偏差最小的片段選取方法,在構(gòu)建出一條具有代表性的行駛工況曲線的同時(shí),形成一個(gè)完善的汽車運(yùn)動(dòng)特征評(píng)價(jià)體系。
分析結(jié)果表明,本文利用城市汽車行駛數(shù)據(jù)進(jìn)行行駛工況的構(gòu)建研究,所使用的模型可靠便捷,所構(gòu)建曲線與實(shí)際工況具有較高的吻合度,在保證計(jì)算準(zhǔn)確度的同時(shí)具有一定科學(xué)價(jià)值,可為后續(xù)研究提供良好思路。