謝 艷, 李 平, 蔣 鴻
(中國(guó)空氣動(dòng)力研究與發(fā)展中心, 四川 綿陽(yáng) 621000)
過去,人們認(rèn)為許多數(shù)據(jù)都是陳舊的、無(wú)用的、冗余的,比如:飛機(jī)降落后,票價(jià)數(shù)據(jù)是陳舊的;網(wǎng)絡(luò)上搜索關(guān)鍵詞數(shù)據(jù)是無(wú)用的;風(fēng)洞常規(guī)試驗(yàn)中非階梯穩(wěn)定時(shí)刻的數(shù)據(jù)是冗余的,所以都被舍棄了[1-3]。
隨著大數(shù)據(jù)的引領(lǐng),一些互聯(lián)網(wǎng)公司首先成了大數(shù)據(jù)的贏家和先行者。通過用戶搜索和使用信息數(shù)據(jù)累積,可以綜合分析出用戶的喜好,甚至通過關(guān)鍵詞搜索的頻次和來源地分析,可以獲取流感爆發(fā)地及爆發(fā)規(guī)模等重要信息。目前大數(shù)據(jù)已成了新發(fā)明和深刻洞見之源泉。
對(duì)大數(shù)據(jù)的定義,到目前還沒有公認(rèn)的統(tǒng)一的標(biāo)準(zhǔn),但普遍認(rèn)為,大數(shù)據(jù)是指數(shù)據(jù)規(guī)模大且數(shù)據(jù)類型繁多。以盲人摸象為例:小數(shù)據(jù),僅幾個(gè)盲人摸摸大象的牙鼻身腳等特征部位,綜合后只能得出片面再加以猜想的結(jié)果;大數(shù)據(jù),可采用足夠多的盲人摸遍大象全身,再輔以坐標(biāo)、時(shí)間等相關(guān)信息,最后通過復(fù)雜多樣的綜合分析就可獲得大象全身的、動(dòng)態(tài)的、可精細(xì)到每個(gè)細(xì)節(jié)的大象外形結(jié)果。
由此,可看出大數(shù)據(jù)方法帶來的四個(gè)轉(zhuǎn)變:一是數(shù)據(jù)不再是隨機(jī)樣本,而是全體數(shù)據(jù);二是數(shù)據(jù)量和數(shù)據(jù)雜混性增加,導(dǎo)致數(shù)據(jù)處理復(fù)雜度呈指數(shù)型增長(zhǎng);三是大數(shù)據(jù)方便提供準(zhǔn)確的相關(guān)、概率等關(guān)系,可幫助人們明了因果關(guān)系[4-5];四是分析結(jié)論不再是抽樣數(shù)據(jù)趨勢(shì)再加推測(cè)的結(jié)果,而是全面的、可精細(xì)到細(xì)節(jié)的、可與多種信息相關(guān)聯(lián)的分析結(jié)果。
我國(guó)風(fēng)洞試驗(yàn)在幾十年間積累了大量的階梯抽樣采集的氣動(dòng)試驗(yàn)數(shù)據(jù)。目前大數(shù)據(jù)分析在風(fēng)洞試驗(yàn)方面的應(yīng)用研究主要集中在對(duì)風(fēng)洞歷年生產(chǎn)的氣動(dòng)試驗(yàn)數(shù)據(jù)的分析挖掘上[6-7]。而運(yùn)用大數(shù)據(jù)對(duì)風(fēng)洞試驗(yàn)全過程進(jìn)行研究方面則幾乎還是空白。分析其原因是傳統(tǒng)的風(fēng)洞常規(guī)試驗(yàn)采用階梯采集的方式,一次車只采集十?dāng)?shù)個(gè)階梯數(shù)據(jù),而其它的數(shù)據(jù)被認(rèn)為是無(wú)用的,直接就舍棄了。當(dāng)試驗(yàn)出現(xiàn)故障或者試驗(yàn)數(shù)據(jù)出現(xiàn)異常時(shí),人們很難從這么少的數(shù)據(jù)中得到更多的信息,定位故障,明確原因,所以只能采用換電源、換采集通道等多次的吹風(fēng)測(cè)試來定位故障,費(fèi)事費(fèi)力,浪費(fèi)能源,且效率不高。
自連續(xù)變迎角測(cè)力試驗(yàn)技術(shù)投入應(yīng)用,采集到了大量的風(fēng)洞試驗(yàn)全程的連續(xù)數(shù)據(jù)和信息,每次車的數(shù)據(jù)及信息量可達(dá)數(shù)十萬(wàn)。在對(duì)這些海量試驗(yàn)數(shù)據(jù)和信息的研究分析中,我們逐漸發(fā)現(xiàn)這些海量數(shù)據(jù)中富含許多階梯數(shù)據(jù)中沒有的頻率、概率、相關(guān)性等信息,可為風(fēng)洞試驗(yàn)數(shù)據(jù)和故障的深入分析等提供有力的支持。由此,我們探索開展了大數(shù)據(jù)在風(fēng)洞試驗(yàn)方面的應(yīng)用研究。
要應(yīng)用大數(shù)據(jù)方法深入分析風(fēng)洞試驗(yàn)全程,需要解決三個(gè)問題:一是風(fēng)洞試驗(yàn)全程大數(shù)據(jù)的采集;二是風(fēng)洞試驗(yàn)大數(shù)據(jù)的處理;三是風(fēng)洞試驗(yàn)大數(shù)據(jù)的可視化分析。下面簡(jiǎn)要介紹解決方案。
過去,風(fēng)洞常規(guī)試驗(yàn)采用階梯抽樣采集方法,即風(fēng)洞試驗(yàn)時(shí),迎角按照預(yù)先設(shè)定的階梯軌跡運(yùn)行(如:-2°、-1°、0°、1°、2°、4°、6°、8°、10°、12°共10個(gè)階梯),測(cè)量只采集階梯穩(wěn)定時(shí)刻的數(shù)據(jù),試驗(yàn)數(shù)據(jù)點(diǎn)與階梯數(shù)相同,數(shù)據(jù)少且時(shí)序、頻率等信息丟失,大數(shù)據(jù)應(yīng)用缺少數(shù)據(jù)和信息的支持。
為此,發(fā)明風(fēng)洞試驗(yàn)“全程連續(xù)采集,階梯時(shí)刻標(biāo)注,連續(xù)階梯兩全”的風(fēng)洞試驗(yàn)數(shù)據(jù)采集專利技術(shù)[8],即:風(fēng)洞起動(dòng)前10 s就起動(dòng)采集系統(tǒng),以300~2000 Hz的采樣率連續(xù)采集數(shù)據(jù),并記錄每點(diǎn)的時(shí)序,階梯穩(wěn)定時(shí)連續(xù)采集不變,只對(duì)穩(wěn)定時(shí)刻數(shù)據(jù)點(diǎn)進(jìn)行階梯標(biāo)注,然后繼續(xù)下一階梯,直到風(fēng)洞關(guān)車10 s后,結(jié)束連續(xù)采集,保存該次試驗(yàn)全程的連續(xù)試驗(yàn)數(shù)據(jù),并從連續(xù)試驗(yàn)數(shù)據(jù)中將標(biāo)注的全部階梯數(shù)據(jù)提取出來組成該次試驗(yàn)的階梯試驗(yàn)數(shù)據(jù)并保存。此采集方法即兼容傳統(tǒng)的階梯采集,又采集到試驗(yàn)全程的全部連續(xù)數(shù)據(jù)、時(shí)頻域信息等,使試驗(yàn)的宏觀全貌和各種細(xì)微、瞬時(shí)的數(shù)據(jù)信息得以保留,為大數(shù)據(jù)分析提供了數(shù)據(jù)支持。另外,此技術(shù)還為連續(xù)數(shù)據(jù)和階梯數(shù)據(jù)架起了相通的橋梁,使傳統(tǒng)的小數(shù)據(jù)分析和大數(shù)據(jù)分析可以相輔相成。
在專利技術(shù)的指導(dǎo)下,開發(fā)了2.4 m跨聲速風(fēng)洞、2 m超聲速風(fēng)洞測(cè)力/測(cè)壓試驗(yàn)采集全數(shù)據(jù)的采集軟件[3],解決了風(fēng)洞試驗(yàn)應(yīng)用大數(shù)據(jù)的數(shù)據(jù)來源問題。
傳統(tǒng)的風(fēng)洞試驗(yàn)處理程序的設(shè)計(jì)思想是:先梳理總結(jié)出風(fēng)洞試驗(yàn)數(shù)據(jù)有限種的處理方法,制定出數(shù)據(jù)處理規(guī)范,然后再依據(jù)規(guī)范,開發(fā)風(fēng)洞試驗(yàn)標(biāo)準(zhǔn)化的處理程序。按此設(shè)計(jì)思想開發(fā)的風(fēng)洞試驗(yàn)數(shù)據(jù)標(biāo)準(zhǔn)化處理程序在小數(shù)據(jù)時(shí)代,數(shù)據(jù)點(diǎn)和數(shù)據(jù)類型少、處理方法有限的情況下,是可以滿足數(shù)據(jù)處理需求的。但是,風(fēng)洞試驗(yàn)采用新采集方法后,數(shù)據(jù)量、數(shù)據(jù)類型、信息等大幅增加,數(shù)據(jù)處理方法亦呈指數(shù)型劇增,再沿用上述的程序設(shè)計(jì)思想,程序?qū)⒚媾R處理方法太多而程序不能全部涵蓋的困境。
為此,發(fā)明了自動(dòng)識(shí)別、自動(dòng)解析計(jì)算的通用風(fēng)洞試驗(yàn)數(shù)據(jù)處理程序?;驹O(shè)計(jì)思想為:程序設(shè)計(jì)前,先制定出識(shí)別數(shù)據(jù)和解析計(jì)算方法的規(guī)則,然后設(shè)計(jì)程序?qū)崿F(xiàn)輸入數(shù)據(jù)和計(jì)算方法;依據(jù)規(guī)則識(shí)別數(shù)據(jù)和解析計(jì)算方法;按識(shí)別和解析結(jié)果對(duì)數(shù)據(jù)進(jìn)行計(jì)算輸出。這種設(shè)計(jì)思想,就像是在人與程序之間建立了一種交流語(yǔ)言,人們可以將能想到的計(jì)算方法通過這種語(yǔ)言告訴程序,程序就可以明白并智能的實(shí)現(xiàn)人們的要求。采用此設(shè)計(jì)思想實(shí)現(xiàn)了處理程序數(shù)據(jù)類型和處理方法的無(wú)限拓展,為風(fēng)洞試驗(yàn)大數(shù)據(jù)任意計(jì)算方法的處理分析搭建了基礎(chǔ)的計(jì)算平臺(tái),解決了風(fēng)洞試驗(yàn)大數(shù)據(jù)多樣化處理的難題。
大數(shù)據(jù)分析最基本的方法就是數(shù)據(jù)特征提取和可視化分析,數(shù)據(jù)特征提取將蘊(yùn)含在大數(shù)據(jù)中的特征明顯化,而可視化分析則直觀的呈現(xiàn)出大數(shù)據(jù)的特征[9-15]。為此,開發(fā)了風(fēng)洞試驗(yàn)海量雜混大數(shù)據(jù)顯示分析軟件,風(fēng)洞試驗(yàn)大數(shù)據(jù)頻譜分析、相關(guān)性分析等計(jì)算和顯示分析軟件。解決了風(fēng)洞試驗(yàn)大數(shù)據(jù)的可視化分析問題。
2009年某型號(hào)尾支干擾測(cè)力試驗(yàn)(Ma=0.6),天平靜態(tài)正常,但試驗(yàn)時(shí),數(shù)據(jù)在小角度范圍出現(xiàn)異常跳動(dòng)見圖1。
(a)俯仰力矩 (b)阻力
在傳統(tǒng)的小數(shù)據(jù)(階梯數(shù)據(jù))分析方法中,因只有十余個(gè)數(shù)據(jù)點(diǎn),無(wú)法分析原因。采用大數(shù)據(jù)可視化分析,將故障車次與正常車次采集的試驗(yàn)全程(包括起動(dòng)關(guān)車前后)全部試驗(yàn)數(shù)據(jù)按時(shí)序顯示出來,見圖2,就能從圖中的時(shí)序關(guān)系上看出數(shù)據(jù)異常是因?yàn)轱L(fēng)洞起動(dòng)引起了天平電源異常跳動(dòng)所致,也即是天平電源的動(dòng)態(tài)特性異常所致。同時(shí),圖中細(xì)節(jié)也可以表現(xiàn)出天平階梯測(cè)值隨電源波動(dòng)的相關(guān)性等。更換電源后,數(shù)據(jù)恢復(fù)正常。
圖2 正常和故障情況的全部試驗(yàn)數(shù)據(jù)對(duì)比分析圖
此例是利用大數(shù)據(jù)可視化分析方法,將試驗(yàn)大數(shù)據(jù)按時(shí)序顯示在圖中,直接從圖中的時(shí)序關(guān)系上找出天平電源異常和恢復(fù)的時(shí)刻,以及異常時(shí)天平電源、天平信號(hào)的故障形態(tài)的應(yīng)用實(shí)例。
2015年某模型風(fēng)洞試驗(yàn)Ma=0.96時(shí)連續(xù)變迎角和階梯變迎角重復(fù)性驗(yàn)證,發(fā)現(xiàn)比較車次馬赫數(shù)差量小于0.002、迎角差量小于0.015°時(shí)的阻力系數(shù)CD差量卻高達(dá)0.0024,CD差量達(dá)到常規(guī)差量的8倍左右。CD曲線對(duì)比如圖3(a)。
(a)CD~α
(b)CD~Ma
表1 比較車次變量差相關(guān)系數(shù)計(jì)算結(jié)果
用比較車次全部有效數(shù)據(jù)的CD差量與試驗(yàn)中所有的其它變量的差量進(jìn)行相關(guān)分析計(jì)算,得知CD差量與Ma差量的相關(guān)系數(shù)最大,即,CD的誤差多因馬赫數(shù)誤差引起。計(jì)算結(jié)果見表1。
有了上述相關(guān)分析后,再看該模型CD隨Ma的變化曲線(圖3(b))。該模型CD在Ma=0.9處開始發(fā)散,因此當(dāng)Ma>0.9時(shí),Ma的微量變化,將引起CD的大幅變化。這也是該模型試驗(yàn)對(duì)Ma>0.9的控制精度要求極高的原因。
此例是利用大數(shù)據(jù)獲取數(shù)據(jù)間精準(zhǔn)的相關(guān)關(guān)系,再由相關(guān)關(guān)系指明因果關(guān)系的。該例雖然也可以從階梯數(shù)據(jù)中獲取類似的相關(guān)關(guān)系,但是,從少量階梯數(shù)據(jù)中獲取的相關(guān)關(guān)系的可信度大大降低。
近3年來,GWA、WTAS傾角傳感器在2 m量級(jí)風(fēng)洞的使用過程中,始終存在靜態(tài)工作正常但試驗(yàn)狀態(tài)就出現(xiàn)跳數(shù)的現(xiàn)象(跳數(shù)誤差≤1.5°)。使用了減振、抗噪等措施后問題依然存在,故障原因一直不明確。傾角傳感器測(cè)量故障曲線見圖4。
(a)Ma=0.9時(shí)WTAS傾角傳感器測(cè)得的傾角運(yùn)行軌跡(最大最小角度附近跳數(shù))
(b)Ma=0.6時(shí)WTAS傾角傳感器測(cè)得的傾角運(yùn)行軌跡(全程正常)
采用大數(shù)據(jù)分析方法,將3年來所有GWA、WTAS傾角傳感器的全部試驗(yàn)數(shù)據(jù)與試驗(yàn)條件等信息進(jìn)行概率和相關(guān)性分析,得出傾角傳感器跳數(shù)問題的宏觀表現(xiàn)規(guī)律:
(1)問題與馬赫數(shù)有關(guān)。在2.4 m跨聲速風(fēng)洞,當(dāng)Ma≥0.7,有跳數(shù),且強(qiáng)度和概率與馬赫數(shù)成正比;而在2 m超聲速風(fēng)洞,當(dāng)Ma≤2.75,有跳數(shù),但強(qiáng)度和概率與馬赫數(shù)成反比;相同馬赫數(shù),問題相似;
(2)問題與側(cè)滑角有關(guān),跳數(shù)強(qiáng)度和發(fā)生概率隨傾滑角的增大而降低;
(3)兩種傳感器跳數(shù)時(shí)而同時(shí),時(shí)而交錯(cuò);多數(shù)跳數(shù)發(fā)生時(shí),未見模型有明顯振動(dòng);
(4)跳數(shù)大多發(fā)生在最大、最小角度位置,且角度測(cè)值的絕對(duì)值始終偏小。
雖然大數(shù)據(jù)宏觀分析得出了傾角傳感器跳數(shù)問題較為準(zhǔn)確的概率和相關(guān)性的特征,但是傾角傳感器跳數(shù)為什么會(huì)與馬赫數(shù)和傾滑角相關(guān)仍然是個(gè)謎,需要再對(duì)大數(shù)據(jù)進(jìn)行更加深入的微觀分析,明確各種跳數(shù)的相關(guān)性。
(1)通過多種相關(guān)性分析發(fā)現(xiàn),GWA、WTAS傳感器與氣流脈動(dòng)(X)方向的頻譜相關(guān)性較強(qiáng),而GWA、WTAS傳感器的跳數(shù)頻率又與風(fēng)洞氣流脈動(dòng)強(qiáng)度的相關(guān)性較強(qiáng)。根據(jù)這兩個(gè)相關(guān)性特點(diǎn),推理出因GWA、WTAS敏感元件擺片正對(duì)氣流,所以對(duì)風(fēng)洞氣流脈動(dòng)敏感,導(dǎo)致跳數(shù)頻率和強(qiáng)度隨馬赫數(shù)變化,也即是隨脈動(dòng)強(qiáng)度變化;而當(dāng)β>0°時(shí),擺片軸線偏離氣流脈動(dòng)軸線,敏感性下降,故障頻率也隨之下降。傳感器擺片結(jié)構(gòu)及傾角傳感器頻譜與X、Y、Z方向頻譜的比較見圖5。
(2)GWA、WTAS傳感器跳數(shù)主要由兩種跳數(shù)組成(見圖6)。第一種,V字狀跳數(shù)。模型有可見的振動(dòng);跳數(shù)誤差與振幅成正比;跳數(shù)變化緩慢,周期約2.5 s;多個(gè)傳感器會(huì)同步跳;跳數(shù)多出現(xiàn)在大位置。第二種,毛刺狀跳數(shù)。模型無(wú)明顯振動(dòng);跳數(shù)誤差與干擾信號(hào)溢出量成正比;跳數(shù)變化迅速,周期約0.4 s;多個(gè)傳感器同步跳概率低;跳數(shù)多出現(xiàn)在最大、最小角度位置。
(3)根據(jù)兩種跳數(shù)相關(guān)關(guān)系的指引,推理這兩種跳數(shù)所產(chǎn)生的原因。第一種,V字狀跳數(shù)是模型和支桿的縱橫向振動(dòng)帶動(dòng)傾角傳感器振動(dòng),從而對(duì)多個(gè)傾角傳感器的敏感元件擺片帶來離心力的影響;第二種,毛刺狀跳數(shù)是由于軸向的高頻脈動(dòng)耦合上傾角傳感器擺片的固有頻率從而產(chǎn)生高能量的干擾信號(hào),造成傾角傳感器輸出信號(hào)在最大、最小位置時(shí)非對(duì)稱溢出所致。因多個(gè)傾角傳感器擺片的固有頻率不同,所以此類跳數(shù)通常在多個(gè)傳感器之間交錯(cuò)出現(xiàn)。
(a)風(fēng)洞試驗(yàn)時(shí)WTAS、GWA傳感器與X、Y、Z方向振動(dòng)傳感器頻譜的結(jié)果對(duì)比
(b)傳感器擺片結(jié)構(gòu)示意圖
(a)GWA、WTAS傳感器試驗(yàn)時(shí)在6.6°階梯平臺(tái)產(chǎn)生V字狀跳數(shù)
(b)FL-26風(fēng)洞Ma≥0.7時(shí)傾角傳感器測(cè)得的毛刺狀跳數(shù)
有了精確深入的跳數(shù)原因的分析后,制定了相應(yīng)的改進(jìn)措施。傾角傳感器GWA、WTAS在隨后的2.4 m跨聲速風(fēng)洞、2 m超聲速風(fēng)洞的多期試驗(yàn)中的取得了全程精準(zhǔn)測(cè)量無(wú)跳數(shù)現(xiàn)象的突破,解決了長(zhǎng)期存在的問題。
此例是一個(gè)較為典型的應(yīng)用大數(shù)據(jù)分析的例子,首先是利用歷年來大量試驗(yàn)數(shù)據(jù)獲取宏觀上的跳數(shù)問題與馬赫數(shù)、側(cè)滑角及流場(chǎng)脈動(dòng)等參數(shù)的概率分布和相關(guān)性;再拓展數(shù)據(jù)源,深入到微觀細(xì)節(jié)去探尋跳數(shù)問題與更加廣闊其它數(shù)據(jù)之間的聯(lián)系和相關(guān)性;最后,通過宏觀和微觀中獲得的多種相關(guān)性的引領(lǐng)分析,明確各種跳數(shù)產(chǎn)生的原因。
上述三個(gè)應(yīng)用實(shí)例中使用的分析數(shù)據(jù)全部是采用風(fēng)洞試驗(yàn)數(shù)據(jù)采集新方法采集的試驗(yàn)全程、全部試驗(yàn)數(shù)據(jù)[16-18]。
1)結(jié)合大數(shù)據(jù)分析的基礎(chǔ)方法,通過對(duì)傳統(tǒng)風(fēng)洞試驗(yàn)采集、處理方法的改進(jìn)創(chuàng)新,建立了一套集風(fēng)洞試驗(yàn)數(shù)據(jù)采集、分析、挖掘及結(jié)果展現(xiàn)為一體的風(fēng)洞試驗(yàn)大數(shù)據(jù)綜合分析處理系統(tǒng);
2)在風(fēng)洞試驗(yàn)中應(yīng)用大數(shù)據(jù)分析方法,既可以對(duì)試驗(yàn)宏觀現(xiàn)象進(jìn)行精準(zhǔn)分析,也可以對(duì)試驗(yàn)局部和細(xì)節(jié)進(jìn)行精細(xì)化微觀分析;
3)從風(fēng)洞試驗(yàn)大數(shù)據(jù)中挖掘出的頻率、概率、相關(guān)關(guān)系等數(shù)據(jù),可以為試驗(yàn)數(shù)據(jù)的深入分析、試驗(yàn)故障的準(zhǔn)確定位指明方向。
本項(xiàng)研究目前只是風(fēng)洞試驗(yàn)大數(shù)據(jù)分析的簡(jiǎn)易平臺(tái),驗(yàn)證了平臺(tái)建設(shè)中的一些關(guān)鍵設(shè)計(jì)思想,取得了階段性成果,實(shí)現(xiàn)了風(fēng)洞試驗(yàn)數(shù)據(jù)采集從傳統(tǒng)的階梯抽樣采集的小數(shù)據(jù)時(shí)代到采集試驗(yàn)全程全部試驗(yàn)數(shù)據(jù)和信息的大數(shù)據(jù)時(shí)代的初步轉(zhuǎn)變。但是,要繼續(xù)深入進(jìn)行風(fēng)洞試驗(yàn)的大數(shù)據(jù)研究,還需要進(jìn)一步夯實(shí)大數(shù)據(jù)軟硬件基礎(chǔ)平臺(tái)支撐能力。