賽題背景
在工地現(xiàn)場,驗(yàn)收人員需要對(duì)進(jìn)場鋼筋車上的鋼筋進(jìn)行現(xiàn)場人工點(diǎn)根,確認(rèn)數(shù)量后鋼筋車才能完成進(jìn)場卸貨。
目前,在眾多的工地現(xiàn)場仍在采用人工計(jì)數(shù)的方式,上述過程繁瑣、消耗人力且速度很慢(一般一車鋼筋需要半小時(shí),一次進(jìn)場盤點(diǎn)需數(shù)個(gè)小時(shí))。針對(duì)上述問題,希望通過手機(jī)拍照、目標(biāo)檢測計(jì)數(shù)、人工修改少量誤檢的方式智能、高效地完成此任務(wù)。
任務(wù)描述
本賽題基于廣聯(lián)達(dá)公司提供的鋼筋進(jìn)場現(xiàn)場的圖片和標(biāo)注數(shù)據(jù),希望參賽者綜合運(yùn)用計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù),實(shí)現(xiàn)拍照即可完成鋼筋點(diǎn)根任務(wù),大幅度提升建筑行業(yè)關(guān)鍵物料的進(jìn)場效率和盤點(diǎn)準(zhǔn)確性,將建筑工人從這項(xiàng)極其枯燥繁重的工作中解脫出來。比賽任務(wù)以算法在驗(yàn)證數(shù)據(jù)集上的精度為主要評(píng)估指標(biāo)。
賽題內(nèi)容和方向
在過去的20年中,廣聯(lián)達(dá)一直深耕建筑工程領(lǐng)域的數(shù)字化發(fā)展,在近些年的實(shí)踐中,我們也很深切地感受到建筑業(yè)企業(yè)在數(shù)字化轉(zhuǎn)型過程中,亟須拿到工地層面的數(shù)據(jù)作為科學(xué)決策的基礎(chǔ),而由于工地中的人為因素,導(dǎo)致這些基礎(chǔ)數(shù)據(jù)普遍存在準(zhǔn)確性和滯后性問題。
所以在本次大賽中,我們選擇了用AI技術(shù)改變工地上的一個(gè)業(yè)務(wù)場景,并以產(chǎn)生實(shí)際價(jià)值為切入點(diǎn),設(shè)定了《智能盤點(diǎn)—鋼筋數(shù)量AI識(shí)別》作為題目。
賽題價(jià)值
數(shù)鋼筋是人工智能、數(shù)字技術(shù)在工地現(xiàn)場的一個(gè)非常普遍卻能大幅提高勞動(dòng)效率的真實(shí)應(yīng)用場景。試想一下,鋼筋進(jìn)場如果可以通過人工智能技術(shù)識(shí)別種類、數(shù)量、粗細(xì)等,得出鋼筋的真實(shí)用量和用料,實(shí)現(xiàn)精細(xì)化管理,既快速高效,又能將建筑施工人員從這項(xiàng)枯燥繁重且無技術(shù)含量的工作中解脫出來,大幅提升建筑行業(yè)關(guān)鍵物料的進(jìn)場效率和盤點(diǎn)準(zhǔn)確性。
此外,相關(guān)算法還可以推廣應(yīng)用到建筑業(yè)的很多場景,如扣件、鋼板、鋼管、料堆等各種材料的盤點(diǎn),甚至可以廣泛應(yīng)用到其他行業(yè)。從數(shù)鋼筋問題入手,雖然看上去是一件小事情,但從更深層次上,解決了工地現(xiàn)場粗放性驗(yàn)收和管理的問題,甚至可以和整個(gè)項(xiàng)目管理形成良性閉環(huán),讓工程質(zhì)量更有保障。
《智能盤點(diǎn)—鋼筋數(shù)量AI識(shí)別》是AI技術(shù)落地的一次探索,將AI技術(shù)從學(xué)術(shù)領(lǐng)域應(yīng)用到工業(yè)界,挑戰(zhàn)既來自尋找合適的業(yè)務(wù)場景,也來自于將成熟的算法應(yīng)用于實(shí)際數(shù)據(jù)中會(huì)出現(xiàn)的種種意料之外的情形,這道賽題很好地展示了AI技術(shù)在復(fù)雜的實(shí)際業(yè)務(wù)場景中的巨大潛力。
賽題難點(diǎn)
這道題目的難點(diǎn)主要有三個(gè)方面:一是精度要求高,鋼筋的價(jià)格非常貴,且在實(shí)際使用中數(shù)量很大,誤檢和漏檢都需要人工在大量的標(biāo)記點(diǎn)中找出,所以需要精度非常高才能保證驗(yàn)收人員的使用體驗(yàn)。二是鋼筋尺寸不一,鋼筋的直徑范圍比較廣且截面形狀不規(guī)則、顏色不統(tǒng)一,拍攝的角度、距離也不完全受控,這將導(dǎo)致傳統(tǒng)算法在實(shí)際使用過程中很難達(dá)到穩(wěn)定的效果。三是邊界難以區(qū)分,一輛鋼筋車一次會(huì)運(yùn)輸多捆鋼筋,如果直接全部處理會(huì)存在邊緣角度差、遮擋等問題,目前普遍使用先單捆處理,最后再進(jìn)行合計(jì)的方式,這樣的處理方式需要對(duì)每捆鋼筋進(jìn)行分割或者對(duì)最終結(jié)果進(jìn)行去重。
這道題目的應(yīng)用場景看似簡單,但技術(shù)難度和對(duì)于參賽選手綜合能力的要求很高,主要考察參賽人員為業(yè)務(wù)場景尋找合適的算法以及在必要的情況下改進(jìn)算法的能力。對(duì)于參賽者而言,本題目的關(guān)鍵在于通過圖像點(diǎn)驗(yàn)密集的小物體,需要參賽者在算法上接受三方面的能力考驗(yàn)。一是計(jì)算機(jī)視覺(CV)方面的能力,無論從各種角度、各種光照條件下,對(duì)不同直徑的鋼筋都需要點(diǎn)驗(yàn)正確。這就對(duì)圖像本身的數(shù)據(jù)預(yù)處理、數(shù)據(jù)工程的能力帶來非常大的挑戰(zhàn),如何將機(jī)器學(xué)習(xí),包括深度學(xué)習(xí)等新技術(shù)應(yīng)用到其中至關(guān)重要。二是核心算法方面的能力,算法能做到精準(zhǔn),需要綜合運(yùn)用機(jī)器學(xué)習(xí)和深度學(xué)習(xí),并對(duì)計(jì)算機(jī)視覺模型進(jìn)行持續(xù)調(diào)優(yōu),最終能夠?qū)⒕忍嵘粮叩囊?。三是解決模型輕量化和小型化的能力,在產(chǎn)業(yè)落地的過程中,工地現(xiàn)場大多是信號(hào)弱,甚至是無網(wǎng)絡(luò)的環(huán)境,這就考驗(yàn)參賽者在不能應(yīng)用云端計(jì)算能力的前提下,如何用有限的計(jì)算資源實(shí)現(xiàn)精度的最大化。如果模型做得太復(fù)雜,精度確實(shí)可以提高,但現(xiàn)場實(shí)際場景是無法支撐應(yīng)用的。
在成果應(yīng)用及產(chǎn)業(yè)落地方面,建筑業(yè)正在經(jīng)歷著數(shù)字化的發(fā)展進(jìn)程,需要從實(shí)際的業(yè)務(wù)場景出發(fā),探尋數(shù)字化的方式,實(shí)現(xiàn)收益最大化。數(shù)字化是應(yīng)用先進(jìn)算法的必要條件,所以具備用算法解決實(shí)際業(yè)務(wù)問題的能力對(duì)推動(dòng)行業(yè)的數(shù)字化有重要意義。題目本身就從建筑工地的應(yīng)用場景出發(fā),通過AI技術(shù)解決工地的最實(shí)際問題,提前考慮了成果應(yīng)用的場景化。同時(shí),該成果也可以與物資等業(yè)務(wù)系統(tǒng)結(jié)合,實(shí)現(xiàn)建筑材料在進(jìn)出場和盤點(diǎn)過程的數(shù)字化管理,用數(shù)字提升工地整體的精細(xì)化管理水平。