文|南京城市建設(shè)管理集團(tuán)有限公司 韋勇 陳銘;通訊作者:河海大學(xué)計(jì)算機(jī)與信息學(xué)院/河海大學(xué)項(xiàng)目管理研究所 徐淑芳
建設(shè)項(xiàng)目的施工階段是項(xiàng)目全生命周期內(nèi)資源流動(dòng)和項(xiàng)目管理行為最為活躍的階段[1]。目前,建設(shè)工程施工現(xiàn)場(chǎng)的管理仍存在許多問(wèn)題,為解決這些問(wèn)題,政府及相關(guān)企事業(yè)單位出臺(tái)了許多政策和標(biāo)準(zhǔn),其中,應(yīng)用智慧工地強(qiáng)化建設(shè)項(xiàng)目信息化管理就是一種關(guān)鍵方法。在智慧工地產(chǎn)生了豐富數(shù)據(jù)資源的推動(dòng)下,對(duì)建設(shè)工程的監(jiān)管開(kāi)始從線下監(jiān)管向線上監(jiān)管轉(zhuǎn)變,研究人員開(kāi)始探索基于海量傳感器數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,替代傳統(tǒng)的人工監(jiān)測(cè)的方法。
施工揚(yáng)塵是城市空氣污染物的主要來(lái)源,采取更加有效的方法針對(duì)施工現(xiàn)場(chǎng)的揚(yáng)塵排放進(jìn)行管控,對(duì)改善城市空氣環(huán)境質(zhì)量至關(guān)重要。近年來(lái),我國(guó)建筑業(yè)穩(wěn)步發(fā)展,工程規(guī)模不斷擴(kuò)大,2021年我國(guó)建筑業(yè)企業(yè)房屋施工面積157.55 億平方米,比2020年增長(zhǎng)5.41%[2],建設(shè)工程的快速發(fā)展帶來(lái)的負(fù)面影響是日趨嚴(yán)重的環(huán)境問(wèn)題。針對(duì)此問(wèn)題,政府及相關(guān)企事業(yè)單位頒布了相關(guān)法律法規(guī)。例如,《大氣污染法》中針對(duì)建設(shè)工程,指出建設(shè)單位應(yīng)該將防止揚(yáng)塵污染的費(fèi)用列入成本決算中,并在施工承包的合同中明確施工單位的揚(yáng)塵治理責(zé)任。
基于此,本文以施工過(guò)程中的揚(yáng)塵監(jiān)管為例,通過(guò)自動(dòng)化的數(shù)據(jù)監(jiān)測(cè)手段將施工現(xiàn)場(chǎng)揚(yáng)塵監(jiān)測(cè)信息實(shí)時(shí)傳輸給監(jiān)管平臺(tái),通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方式檢測(cè)出異常的揚(yáng)塵數(shù)據(jù)序列,進(jìn)而診斷監(jiān)測(cè)設(shè)備的故障,實(shí)現(xiàn)對(duì)智慧工地?fù)P塵監(jiān)測(cè)設(shè)備的在線巡檢,以降低監(jiān)管方對(duì)各建設(shè)項(xiàng)目進(jìn)行質(zhì)量評(píng)價(jià)的監(jiān)理成本。
在監(jiān)管手段變得自動(dòng)化的過(guò)程中,出現(xiàn)許多新問(wèn)題:第一,數(shù)據(jù)時(shí)效性強(qiáng)。傳感器采集的數(shù)據(jù)一般為短時(shí)間內(nèi)產(chǎn)生的海量實(shí)時(shí)數(shù)據(jù),這些數(shù)據(jù)以時(shí)序數(shù)據(jù)的形式儲(chǔ)存,數(shù)據(jù)量大且時(shí)效性強(qiáng);第二,數(shù)據(jù)質(zhì)量差。施工現(xiàn)場(chǎng)由于人為、環(huán)境和設(shè)備故障等問(wèn)題,采集的數(shù)據(jù)往往存在各類異常情況。針對(duì)這些新問(wèn)題,急需一種適用于建設(shè)工程領(lǐng)域數(shù)據(jù)且時(shí)間復(fù)雜度低的時(shí)序數(shù)據(jù)異常檢測(cè)模型,以提高數(shù)據(jù)質(zhì)量,完善監(jiān)管手段。
時(shí)間序列(Times Series)異常檢測(cè)廣泛應(yīng)用于各個(gè)特定領(lǐng)域,例如工業(yè)界設(shè)備檢測(cè)[3]、網(wǎng)絡(luò)安全[4]、醫(yī)學(xué)診斷[5]等場(chǎng)景。不同應(yīng)用場(chǎng)景的數(shù)據(jù)特點(diǎn)不同,因此需要選用適配的檢測(cè)方法[6]。國(guó)內(nèi)外異常檢測(cè)方法種類根據(jù)基本檢測(cè)原理大致可以分為六種,即基于統(tǒng)計(jì)、距離、密度、分類的異常檢測(cè)?;诮y(tǒng)計(jì)的異常檢測(cè)方法,假設(shè)待檢數(shù)據(jù)服從于某種分布,然后用數(shù)據(jù)集去擬合分布模型,將明顯不符合擬合模型的數(shù)據(jù)判斷為可能的異常數(shù)據(jù)。該方法效率高、復(fù)雜度低,泛化能力一般;基于距離的異常度量方法是通過(guò)最近鄰來(lái)定義異常值,假設(shè)異常點(diǎn)的k 近鄰距離要遠(yuǎn)大于正常點(diǎn)的近鄰距離。適用于數(shù)據(jù)量較小的無(wú)監(jiān)督異常檢測(cè)場(chǎng)景;基于密度的異常檢測(cè)方法將鄰點(diǎn)的“距離”概念進(jìn)一步轉(zhuǎn)化為“領(lǐng)域”,該方法適用于密度不同的集群情況;基于分類的異常檢測(cè)方法將異常檢測(cè)看作異常和非異常的二分類問(wèn)題,可以使用有監(jiān)督或無(wú)監(jiān)督的學(xué)習(xí)方法解決二分類問(wèn)題。
雖然學(xué)術(shù)界針對(duì)時(shí)間序列異常檢測(cè)問(wèn)題已經(jīng)有了多種解決辦法,但結(jié)合工程管理領(lǐng)域知識(shí)和建設(shè)工程施工數(shù)據(jù)集的特點(diǎn),仍然沒(méi)有可以直接應(yīng)用于建設(shè)工程領(lǐng)域的異常檢測(cè)方法。本文以建設(shè)工程的揚(yáng)塵監(jiān)管為例,利用數(shù)據(jù)可視化和異常特征挖掘的方法,識(shí)別出三種最常見(jiàn)的揚(yáng)塵監(jiān)測(cè)數(shù)據(jù)異常模式。使用滑動(dòng)窗口的方法處理傳感器時(shí)序數(shù)據(jù),以時(shí)間窗為最小的異常檢測(cè)單位。通過(guò)監(jiān)測(cè)異常子序列,標(biāo)記該子序列的異常類型,從而追蹤產(chǎn)生該序列的設(shè)備,進(jìn)一步定位到該建設(shè)項(xiàng)目,實(shí)現(xiàn)基于領(lǐng)域知識(shí)和數(shù)據(jù)驅(qū)動(dòng)相結(jié)合的施工過(guò)程中揚(yáng)塵在線監(jiān)測(cè)方法。
定義2(多維時(shí)間序列):D 表示一個(gè)包含K 條具有相同時(shí)間點(diǎn)的時(shí)間序列S 的集合,稱為K 維時(shí)間序列,記作
定義4(基于滑動(dòng)窗口的時(shí)間窗):滑動(dòng)窗口是一種基于雙指針的一種思想,左指針tleft和右指針tright指向的元素之間形成一個(gè)窗口[sleft,sright)?;瑒?dòng)窗口長(zhǎng)度記作size,滑動(dòng)步長(zhǎng)記作slide。
N 市智慧工地監(jiān)管平臺(tái)是一個(gè)對(duì)該市建設(shè)項(xiàng)目進(jìn)行管理的信息綜合門(mén)戶。通過(guò)建立公開(kāi)的數(shù)據(jù)接口標(biāo)準(zhǔn),集成各項(xiàng)應(yīng)用系統(tǒng)數(shù)據(jù),以物聯(lián)網(wǎng)、云計(jì)算等技術(shù)為載體,用來(lái)可視化、數(shù)字化映射真實(shí)施工現(xiàn)場(chǎng)。該監(jiān)管平臺(tái)接入了2000 多個(gè)建設(shè)項(xiàng)目,項(xiàng)目數(shù)量多,人工巡檢的可行性和準(zhǔn)確率都十分低下。因此,本文從監(jiān)管應(yīng)用的視角出發(fā),構(gòu)建基于時(shí)間窗的揚(yáng)塵數(shù)據(jù)異常檢測(cè)模型,具體檢測(cè)流程如圖1所示。
圖1 基于時(shí)間窗的揚(yáng)塵監(jiān)測(cè)數(shù)據(jù)異常檢測(cè)流程圖
本文提出的基于時(shí)間窗的智慧工地?fù)P塵監(jiān)測(cè)數(shù)據(jù)異常檢測(cè)包括設(shè)備離線異常檢測(cè)、設(shè)備恒值異常和設(shè)備數(shù)值過(guò)低異常三種類型。
(1)設(shè)備離線異常包括設(shè)備長(zhǎng)時(shí)離線和短時(shí)離線。設(shè)備長(zhǎng)時(shí)離線是指一個(gè)建設(shè)項(xiàng)目中的設(shè)備 在檢測(cè)的時(shí)間段內(nèi)無(wú)數(shù)據(jù);短時(shí)離線是指一個(gè)建設(shè)項(xiàng)目的設(shè)備組ε 在檢測(cè)的時(shí)間段內(nèi)有數(shù)據(jù),但存在一個(gè)時(shí)間窗[sleft,sright),在該時(shí)間窗內(nèi),揚(yáng)塵監(jiān)測(cè)數(shù)據(jù)為空。
(2)恒值異常是指一個(gè)時(shí)間窗[sleft,sright)內(nèi),揚(yáng)塵數(shù)據(jù)波動(dòng)極小,不符合施工現(xiàn)場(chǎng)揚(yáng)塵排放特征。經(jīng)過(guò)反復(fù)實(shí)驗(yàn),本文定義時(shí)間窗的方差低于3 為異常。
(3)數(shù)值過(guò)低異常是指在一個(gè)時(shí)間窗[sleft,sright)內(nèi),揚(yáng)塵數(shù)據(jù)數(shù)值全部低于某個(gè)最低閾值。
每個(gè)建設(shè)項(xiàng)目包含一個(gè)設(shè)備組ε,該設(shè)備組包含不少于一個(gè)揚(yáng)塵監(jiān)測(cè)設(shè)備。若設(shè)備存在至少一種異常特征,則將該設(shè)備標(biāo)記為異常,并標(biāo)注具體異常類型;若某一建設(shè)項(xiàng)目包含至少一個(gè)異常設(shè)備,則標(biāo)記該項(xiàng)目,最終將檢測(cè)結(jié)果返回給智慧工地監(jiān)管平臺(tái)。
揚(yáng)塵監(jiān)測(cè)設(shè)備離線檢測(cè)包括兩種離線情況:(1)該項(xiàng)目對(duì)應(yīng)的設(shè)備組ε 為空,即設(shè)備全接入異常;(2)項(xiàng)目對(duì)應(yīng)的設(shè)備組ε 不為空,但設(shè)備采集的揚(yáng)塵時(shí)序數(shù)據(jù)S=在一個(gè)時(shí)間窗[sleft,sright)內(nèi)為空,即數(shù)據(jù)傳輸異常。
根據(jù)設(shè)備離線判斷條件:(1),判斷ε是否為空。如果設(shè)備組ε 為空,則將該建設(shè)項(xiàng)目標(biāo)記為離線異常;(2),遍歷設(shè)備組ε,使用窗口長(zhǎng)度為60 分鐘的滑動(dòng)窗口,以10 分鐘為滑動(dòng)步長(zhǎng)讀取揚(yáng)塵序列S,當(dāng)時(shí)間窗內(nèi)的數(shù)據(jù)滿足離線異常條件時(shí),對(duì)該項(xiàng)目進(jìn)行離線異常標(biāo)記。
算法1.離線異常M1檢測(cè)方法
將上述檢測(cè)算法寫(xiě)成Python 程序,對(duì)所選207 個(gè)建設(shè)項(xiàng)目進(jìn)行檢測(cè),異常結(jié)果信息中包括項(xiàng)目信息、建設(shè)、施工、監(jiān)理、運(yùn)維單位信息、揚(yáng)塵設(shè)備信息和異常類型等19 個(gè)特征。分析檢測(cè)結(jié)果,如表1所示,共 92 個(gè)項(xiàng)目存在設(shè)備離線問(wèn)題,對(duì)比人工線下檢測(cè)結(jié)果,人工與程序檢測(cè)存在四個(gè)項(xiàng)目的檢測(cè)結(jié)果不一致,
表1 離線異常檢測(cè)結(jié)果
算法2.離線異常M2檢測(cè)方法
將上述算法編寫(xiě)成Python 程序,對(duì)207 個(gè)項(xiàng)目的設(shè)備檢測(cè)數(shù)據(jù)進(jìn)行分析。分析結(jié)果,共 98 個(gè)項(xiàng)目存在揚(yáng)塵數(shù)據(jù)恒值異常問(wèn)題,M2異常表現(xiàn)為一個(gè)時(shí)間窗內(nèi)的揚(yáng)塵監(jiān)測(cè)數(shù)據(jù)波動(dòng)范圍極小。至少有一個(gè)設(shè)備被標(biāo)記為M2異常時(shí),對(duì)該項(xiàng)目進(jìn)行標(biāo)記,得到檢測(cè)結(jié)果如表2所示。
表2 恒值異常檢測(cè)結(jié)果
本文結(jié)合施工現(xiàn)場(chǎng)周圍揚(yáng)塵國(guó)控點(diǎn)監(jiān)測(cè)值和相關(guān)政策性文件,將數(shù)值過(guò)低異常的判斷閾值設(shè)置為20,即當(dāng)長(zhǎng)度為60 的時(shí)間窗內(nèi)全部數(shù)據(jù)小于20 時(shí),且非雨雪天時(shí),標(biāo)記為數(shù)值過(guò)低異常。
算法3.離線異常M3檢測(cè)方法
將上述算法編寫(xiě)成Python 程序,對(duì)207 個(gè)項(xiàng)目的設(shè)備檢測(cè)數(shù)據(jù)進(jìn)行分析。分析檢測(cè)結(jié)果,共 83 個(gè)項(xiàng)目存在揚(yáng)塵數(shù)據(jù)恒值異常問(wèn)題,M3異常表現(xiàn)為一個(gè)時(shí)間窗內(nèi)的揚(yáng)塵監(jiān)測(cè)數(shù)據(jù)低于最小閾值。
監(jiān)測(cè)設(shè)備巡檢是建設(shè)工程質(zhì)量監(jiān)管施工過(guò)程管理的關(guān)鍵步驟,智慧工地的應(yīng)用推動(dòng)了人工巡檢向在線巡檢的轉(zhuǎn)變。本文從建設(shè)工程在線監(jiān)管視角出發(fā),以高準(zhǔn)確率和低復(fù)雜度為優(yōu)化目標(biāo),構(gòu)建基于時(shí)間窗的揚(yáng)塵監(jiān)測(cè)數(shù)據(jù)異常檢測(cè)模型。檢測(cè)模型以一個(gè)時(shí)間窗內(nèi)的子序列為異常檢測(cè)最小單位,根據(jù)子序列的異常類型對(duì)產(chǎn)生數(shù)據(jù)子序列的設(shè)備進(jìn)行異常標(biāo)記,從而追蹤該設(shè)備的建設(shè)項(xiàng)目,將異常信息追加到建設(shè)項(xiàng)目信息中。揚(yáng)塵設(shè)備巡檢問(wèn)題和建設(shè)項(xiàng)目施工過(guò)程的監(jiān)管問(wèn)題轉(zhuǎn)換成基于時(shí)間窗的監(jiān)測(cè)數(shù)據(jù)異常性判斷問(wèn)題,減小了監(jiān)管成本和時(shí)間,拓寬了監(jiān)測(cè)數(shù)據(jù)的利用維度,有廣闊的應(yīng)用前景。在研究過(guò)程中,有以下幾點(diǎn)創(chuàng)新:
表3 數(shù)值過(guò)低異常檢測(cè)結(jié)果
(1)提出基于數(shù)據(jù)驅(qū)動(dòng)的建設(shè)工程監(jiān)管手段。對(duì)于建設(shè)工程施工揚(yáng)塵排放的數(shù)據(jù)監(jiān)測(cè)系統(tǒng)設(shè)計(jì)和開(kāi)發(fā)研究較多,但是對(duì)于監(jiān)測(cè)的海量時(shí)序數(shù)據(jù)如何利用,以及如何評(píng)判數(shù)據(jù)質(zhì)量情況研究較少。因此本文改變傳統(tǒng)研究視角,致力于檢測(cè)異常數(shù)據(jù),追蹤異常設(shè)備情況,從數(shù)據(jù)驅(qū)動(dòng)的角度進(jìn)行改善建設(shè)項(xiàng)目監(jiān)管現(xiàn)狀。
(2)定義了3 種揚(yáng)塵監(jiān)測(cè)數(shù)據(jù)異常特征。通過(guò)調(diào)研N 市某智慧工地監(jiān)管平臺(tái)中的207 個(gè)在建項(xiàng)目,歸納出三種揚(yáng)塵監(jiān)測(cè)數(shù)據(jù)異常模式,針對(duì)每種異常模式制定了時(shí)間復(fù)雜度較低的異常檢測(cè)方法,在實(shí)際應(yīng)用中檢測(cè)效果良好。
(3)構(gòu)建了3種揚(yáng)塵異常數(shù)據(jù)檢測(cè)算法。在方法改進(jìn)方面,查詢待檢數(shù)據(jù)時(shí)優(yōu)化了數(shù)據(jù)庫(kù)訪問(wèn)方法。將多條指令合并為一條,設(shè)置適當(dāng)?shù)呐R時(shí)存放表,輸入待檢序列的起始時(shí)間一次性將數(shù)據(jù)讀取到臨時(shí)表中,減少了數(shù)據(jù)庫(kù)的訪問(wèn)次數(shù)。異常檢測(cè)的最小單位為一個(gè)時(shí)間窗,有效排除了偶然因素造成的單個(gè)點(diǎn)異常對(duì)檢測(cè)準(zhǔn)確性的影響。
(1)政府部門(mén)
政府部門(mén)是建設(shè)工程的主要外部監(jiān)管方,需要根據(jù)建設(shè)工程特點(diǎn)制定相應(yīng)的約束規(guī)則以規(guī)范施工行為。通過(guò)本文構(gòu)建的揚(yáng)塵數(shù)據(jù)異常檢測(cè)框架,可以使政府監(jiān)管部門(mén)在智慧工地監(jiān)管平臺(tái)直觀量化看到施工現(xiàn)場(chǎng)的揚(yáng)塵排放異常性,進(jìn)而判斷監(jiān)測(cè)設(shè)備的異常性,對(duì)該設(shè)備對(duì)應(yīng)的項(xiàng)目進(jìn)行重點(diǎn)監(jiān)管。應(yīng)用本文構(gòu)建的基于時(shí)間窗的智慧工地?fù)P塵數(shù)據(jù)異常檢測(cè)方法,可以對(duì)揚(yáng)塵數(shù)據(jù)質(zhì)量進(jìn)行初步評(píng)價(jià),是政府制定激勵(lì)制度的重要數(shù)據(jù)支撐。將政府高耗能的人工監(jiān)管向線上監(jiān)管轉(zhuǎn)變,節(jié)約了政府監(jiān)管成本,緩解了政府信息不對(duì)稱的困境。
(2)建設(shè)單位
建設(shè)單位在智慧工地監(jiān)管體系中需要嚴(yán)格控制各類接入設(shè)備的質(zhì)量,通過(guò)人工檢測(cè)設(shè)備質(zhì)量耗時(shí)耗力。因此,基于數(shù)據(jù)分析的方法對(duì)揚(yáng)塵監(jiān)測(cè)設(shè)備的數(shù)據(jù)進(jìn)行質(zhì)量評(píng)價(jià),可以限制不同品牌的設(shè)備接入成本來(lái)控制設(shè)備接入的質(zhì)量,對(duì)于異常頻發(fā)的設(shè)備品牌,應(yīng)限制其接入施工現(xiàn)場(chǎng)。應(yīng)用本文構(gòu)建的基于時(shí)間窗的智慧工地?fù)P塵數(shù)據(jù)異常檢測(cè)方法,通過(guò)檢測(cè)揚(yáng)塵序列的異常性,進(jìn)而對(duì)該設(shè)備接入的項(xiàng)目進(jìn)行施工質(zhì)量評(píng)價(jià),督促相關(guān)施工方進(jìn)行整改,實(shí)現(xiàn)建設(shè)方基于數(shù)據(jù)驅(qū)動(dòng)的線上監(jiān)管手段。
(3)施工單位
施工方是施工現(xiàn)場(chǎng)過(guò)程管理的直接責(zé)任人,施工方在建設(shè)工程中處于信息優(yōu)勢(shì)地位,將其監(jiān)測(cè)數(shù)據(jù)接入智慧工地監(jiān)管平臺(tái),可以減少其機(jī)會(huì)主義,規(guī)范施工行為。揚(yáng)塵監(jiān)測(cè)不僅涉及施工質(zhì)量,而且不規(guī)范的排放可能會(huì)殃及施工周邊環(huán)境,需要施工方采取及時(shí)的控制手段。傳統(tǒng)的通過(guò)建設(shè)方抽檢再通知施工方進(jìn)行整改的方法不適用于揚(yáng)塵監(jiān)測(cè),揚(yáng)塵的不規(guī)范排放對(duì)環(huán)境造成的負(fù)面影響在一定程度上是不可逆的。因此,施工方通過(guò)智慧工地監(jiān)管平臺(tái)的揚(yáng)塵異常性監(jiān)測(cè)結(jié)果,可以直觀看到不符合排放標(biāo)準(zhǔn)或排放異常的項(xiàng)目信息和設(shè)備信息,在建設(shè)方責(zé)令整改前進(jìn)行整改,保證了控制措施的時(shí)效性和有效性。