摘要:目的:隨著城市化進(jìn)程的加快,高度集約化的超高層建筑應(yīng)運(yùn)而生。在超高層建筑設(shè)計(jì)過程中,需要綜合考慮眾多因素,如建筑結(jié)構(gòu)、建筑性能、平面布局等,可利用信息最大化生成對抗網(wǎng)絡(luò)InfoGAN,使機(jī)器自主學(xué)習(xí)和掌握超高層建筑三維形體信息,以豐富建筑師的設(shè)計(jì)思路。方法:文章首先提取典型超高層建筑模型并構(gòu)建高質(zhì)量的數(shù)據(jù)庫,為深度學(xué)習(xí)技術(shù)在超高層建筑設(shè)計(jì)中的應(yīng)用奠定理論和數(shù)據(jù)基礎(chǔ)。隨后利用InfoGAN的可解釋性特征進(jìn)行實(shí)驗(yàn),生成含三維形體信息的平面圖并進(jìn)行三維重建,最終得到多樣化的自定義設(shè)計(jì)方案。結(jié)果:通過最大化互信息的方式,實(shí)現(xiàn)對無標(biāo)簽數(shù)據(jù)的有效利用,生成具有可解釋特征的樣本。這為設(shè)計(jì)師提供了更多的方向選擇和更大的思考空間,有助于縮短設(shè)計(jì)思考的時(shí)間,提高設(shè)計(jì)效率。結(jié)論:通過基于InfoGAN的建筑形體生成方法,得到更具有可解釋性的建筑形體,能使設(shè)計(jì)師更清晰地理解生成建筑背后的設(shè)計(jì)原理和邏輯。
關(guān)鍵詞:InfoGAN;超高層建筑;形體生成
中圖分類號:TU972 文獻(xiàn)標(biāo)識碼:A 文章編號:1004-9436(2024)09-0-04
0 引言
隨著城市的持續(xù)擴(kuò)張,世界范圍內(nèi)涌現(xiàn)出多個(gè)引人注目的標(biāo)志性超高層建筑,引發(fā)了廣泛的學(xué)術(shù)和公眾討論。二戰(zhàn)結(jié)束后,各國進(jìn)入建設(shè)的新時(shí)代,科學(xué)技術(shù)不斷進(jìn)步,全球人口持續(xù)增長,傳統(tǒng)建筑形式在工作、生活等方面已無法滿足需求,隨著材料和結(jié)構(gòu)的進(jìn)步,超高層建筑逐漸增多[1]。同時(shí),隨著技術(shù)的迅速發(fā)展,機(jī)器在建筑設(shè)計(jì)中的作用日益凸顯。而深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)重要分支,其在2006年之后迅速發(fā)展,并取得顯著的成果[2]。這引發(fā)了學(xué)者們對其在建筑領(lǐng)域的應(yīng)用的興趣,為建筑行業(yè)的發(fā)展帶來了新的思路和機(jī)遇。
1 基于人工智能的生成式設(shè)計(jì)相關(guān)研究
由于計(jì)算機(jī)硬件和軟件的限制,早期機(jī)器參與設(shè)計(jì)的嘗試未取得重大突破。20世紀(jì)90年代初,隨著機(jī)器學(xué)習(xí)技術(shù)的出現(xiàn),建筑設(shè)計(jì)逐步邁向人工智能時(shí)代。通過人工智能技術(shù),建筑師和規(guī)劃者能夠更準(zhǔn)確地分析數(shù)據(jù)、模擬場景,從而更好地理解用戶需求和空間特征。以往的研究表明,結(jié)合人工智能技術(shù)生成建筑三維形體的方式按輸入數(shù)據(jù)類型可分為4類。
1.1 基于二維圖形的生成式設(shè)計(jì)
基于二維圖形的建筑生成式設(shè)計(jì)是一種利用計(jì)算機(jī)視覺和深度學(xué)習(xí)技術(shù)的自動(dòng)化方法。通過將建筑模型轉(zhuǎn)換為二維圖像并輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,系統(tǒng)能夠生成符合要求的三維建筑設(shè)計(jì)方案。2010年,斯坦福大學(xué)的保羅·梅雷爾等人采用貝葉斯網(wǎng)絡(luò)實(shí)現(xiàn)住宅建筑布局的自動(dòng)生成[3]。然而,由于該方法需要大量真實(shí)世界的數(shù)據(jù),且貝葉斯網(wǎng)絡(luò)無法完全捕捉所有復(fù)雜關(guān)系,生成的布局可能不符合實(shí)際需求。2019年,華南理工大學(xué)的劉宇波等學(xué)者展示了機(jī)器學(xué)習(xí)方法在建筑設(shè)計(jì)領(lǐng)域的應(yīng)用潛力,通過淺層神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)柏林自由大學(xué)建筑形體的自動(dòng)生成[4]。
1.2 基于體素的生成式設(shè)計(jì)
基于體素的生成式設(shè)計(jì)指降低建筑模型的精度,應(yīng)用其體素信息至3dCNN、3dGAN的神經(jīng)網(wǎng)絡(luò),模型經(jīng)訓(xùn)練后可隨機(jī)產(chǎn)生類似的低精度的基于體素的建筑模型。2021年,墨爾本皇家理工大學(xué)的王大宋等學(xué)者提出基于強(qiáng)化學(xué)習(xí)的體素化建筑形體生成方法,通過獎(jiǎng)勵(lì)評價(jià)可以生成復(fù)雜的體素化建筑形體,具有較強(qiáng)的靈活性和實(shí)用性[5]。
1.3 基于控制元素的生成式設(shè)計(jì)
基于控制元素的生成式設(shè)計(jì)是指將建筑模型的控制點(diǎn)或控制線作為原始數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,再將生成的數(shù)據(jù)逆向還原為三維建筑模型的方法。2021年,鄭豪開發(fā)了基于曲線控制點(diǎn)的神經(jīng)網(wǎng)絡(luò),通過傳統(tǒng)參數(shù)化建模方法建立3D模型數(shù)據(jù)庫,以更高的精度和更快的速度生成建筑幾何圖形。
1.4 基于自然語言的生成式設(shè)計(jì)
基于自然語言的生成式設(shè)計(jì)將處理后的自然語言作為神經(jīng)網(wǎng)絡(luò)輸入,生成符合描述的平面圖,再通過規(guī)則生成三維建筑模型。2020年,賓夕法尼亞大學(xué)的張航提出LAFGM模型,其能預(yù)測接近文本描述的3D形式,但生成結(jié)果仍為平面圖[6]。
1.5 小結(jié)
總體來說,建筑界開始關(guān)注深度學(xué)習(xí)算法與生成設(shè)計(jì)的結(jié)合。但研究集中在利用深度學(xué)習(xí)算法處理圖片、二維戶型平面以及三維維度,以探索智能設(shè)計(jì)的生成和優(yōu)化方法[7]。當(dāng)前的挑戰(zhàn)之一是直接將三維建筑模型信息輸入神經(jīng)網(wǎng)絡(luò),雖然可以避免信息丟失,但由于硬件限制和數(shù)據(jù)集不足,效果尚不盡如人意。與此相比,基于圖像的神經(jīng)網(wǎng)絡(luò)已相對成熟,但存在控制性和可解釋性不足的問題。因此本文從上述問題出發(fā),提出一種基于信息最大化生成對抗網(wǎng)絡(luò)的三維形體生成方法。
2 基于InfoGAN的三維形體生成方法
InfoGAN通過最大化互信息來獲得可解釋的特征表示,不需要依賴標(biāo)簽信息,能夠有效解決目標(biāo)信息不足的問題[8]。相較于普通的生成對抗網(wǎng)絡(luò)GAN,InfoGAN在生成器的輸入中引入一個(gè)附加參數(shù),即未知的隱變量。通過無監(jiān)督學(xué)習(xí)推斷其后驗(yàn)分布,生成具有可解釋特征的樣本。這種引入隱變量的方式賦予生成樣本一定的可控性和可解釋性,為深度學(xué)習(xí)任務(wù)提供更靈活的特征表示方式。
2.1 超高層建筑典型模型建立
通過對超高層建筑的形體信息進(jìn)行調(diào)研,發(fā)現(xiàn)超高層建筑的典型模型需要確定外表皮及內(nèi)部核心筒兩個(gè)層級的信息,各包含形狀和變形手法兩個(gè)方面,并確定形體設(shè)計(jì)參數(shù)的閾值。受建筑結(jié)構(gòu)、功能布局等多方面因素的影響,最終可以得到如表1所示的11種典型超高層建筑形體。
2.2 數(shù)據(jù)集制作
出于對計(jì)算機(jī)性能和多次重復(fù)實(shí)驗(yàn)的考慮,設(shè)定整個(gè)場地輪廓為48 m×48 m,同時(shí)按如下超高層建筑的生成步驟得到總計(jì)28 611個(gè)樣本。
第一,首先將地塊的中心作為外表皮和核心筒的中心,繪制邊長一定的外表皮邊框和核心筒邊框,從而得到底層的平面圖。
第二,其次,根據(jù)設(shè)計(jì)手法,以40 m為間隔,向上依次繪制對應(yīng)建筑類型的每一層外表皮的平面圖。具體來說,若設(shè)計(jì)手法為收縮/放大,須確定在0%~100%范圍內(nèi)的頂面面積占底面面積的百分比;若設(shè)計(jì)手法為扭轉(zhuǎn),須確定在0°~20°范圍內(nèi)的相鄰兩層間的順時(shí)針旋轉(zhuǎn)角度。
第三,將底層的外表皮邊框和頂層的外表皮邊框進(jìn)行放樣,從而得到一個(gè)320 m高的超高層建筑的外表皮的三維模型。
第四,同理得到核心筒的三維模型,進(jìn)而得到完整的包含外表皮和核心筒的三維模型。
第五,將每一層的平面圖分別繪制在一張48×48像素的圖像中,即將地塊中1 m對應(yīng)1像素,并劃分出48×48個(gè)以1像素為單位的方格。將外表皮邊框和核心筒邊框所在的格子設(shè)置為白色,外表皮邊框和核心筒邊框中間的格子也設(shè)置為白色,剩余設(shè)置為黑色,若平面中的邊框與格子邊框重合,那么將其下方或者右方的格子設(shè)置為白色,即可得到9張含有平面的二值圖。
第六,最后將9張含各層平面的圖片按從左到右、從上到下的順序以3為單位排列組成一張含9層平面的二值圖。
2.3 平面形式生成
智能體經(jīng)過2000代訓(xùn)練后的生成結(jié)果如圖1所示。其中,每一列代表一個(gè)離散的類別,每一行代表輸入的c2取定值、c1取不同連續(xù)值的圖像生成情況。首先觀察不同列,可知圖像被分為11類,與輸入數(shù)據(jù)的種類數(shù)相同,且具體種類情況也符合預(yù)期;其次由上到下觀察同一列不同行,可以看出,核心筒的面積隨著c1的變化呈現(xiàn)出逐漸變小的趨勢,因此可以認(rèn)為c1控制的是核心筒的大小。同時(shí)觀察到頂占底面積范圍的0%~100%中為50%,扭轉(zhuǎn)范圍的0°~20°中角度約為10°,此時(shí)可以估計(jì)出c2約取定值0.5。同理可以得到c2控制的是圖形設(shè)計(jì)手法的屬性的變化,即若是扭轉(zhuǎn)形體則對應(yīng)扭轉(zhuǎn)的角度變化,若是縮放圖形則對應(yīng)頂面面積與底面面積的占比。
2.4 空間形體生成
2.4.1 建筑圖紙預(yù)處理
圖像預(yù)處理是建筑圖紙識別的重要步驟之一,其準(zhǔn)確性和效率直接影響到后續(xù)建模和分析的結(jié)果。為了保留有用的邊界信息并消除噪聲干擾,需要進(jìn)行二值化處理,而選擇合適的閾值對保留有用信息至關(guān)重要。實(shí)踐發(fā)現(xiàn),平面圖的背景顏色在不同訓(xùn)練階段可能會(huì)有所不同,在訓(xùn)練后期通常趨于穩(wěn)定,灰度值接近128,若直接將128作為閾值可能導(dǎo)致噪聲干擾過多。為了解決閾值選擇的問題,采用OTSU自適應(yīng)閾值算法[9]。
2.4.2 基于ResNet的建筑平面功能識別
平面圖中同時(shí)包含外表皮和核心筒的框線,這構(gòu)成整個(gè)建筑圖紙的框架信息,因此識別建筑不同功能的框線非常重要??紤]在識別出平面圖中包含的外表皮和核心筒的框線后,利用其作為約束進(jìn)而完成對應(yīng)的三維圖形擬合。而在進(jìn)行外表皮和核心筒框線的分類時(shí),即使進(jìn)行降噪,但仍有一定的噪點(diǎn)存在,且生成的對象并不是光滑連續(xù)的線條,為實(shí)現(xiàn)自動(dòng)生成,考慮使用ResNet分類模型對這些不同的功能進(jìn)行分類。一般來說,ResNet是用來進(jìn)行圖片分類的,但功能分類與圖片分類存在差異,所以需要采取一定的轉(zhuǎn)化措施,即考慮平面中每一個(gè)點(diǎn)屬于核心筒內(nèi)的點(diǎn)還是外表皮內(nèi)的點(diǎn)。具體來說,對某一張平面圖,將其中某一個(gè)像素改變?yōu)榧t色,可得到144張含有單紅點(diǎn)的圖,再按照紅點(diǎn)出現(xiàn)的位置,將其分類為核心筒內(nèi)的點(diǎn)和外表皮內(nèi)的點(diǎn),這樣就可以在考慮整體平面信息的同時(shí)對點(diǎn)進(jìn)行分類。
2.4.3 三維形體擬合
最后利用改進(jìn)的Alpha shape算法對外表皮和核心筒的點(diǎn)陣分別進(jìn)行擬合得到擬合圖形,從而得到外表皮和核心筒三維模型。由實(shí)驗(yàn)結(jié)果表2可以看出,降噪后的建筑圖紙建立的點(diǎn)陣圖形狀較為規(guī)整,幾乎沒有偏離整體圖形較大的異常點(diǎn)存在。而由點(diǎn)陣圖經(jīng)改進(jìn)的Alpha Shape算法計(jì)算擬合得到的超高層建筑三維模型在立面上線條過渡圓滑,平面上也能夠反映核心筒和外表皮的圖形,從而實(shí)現(xiàn)精確的三維重建。
3 結(jié)語
本文研究建筑領(lǐng)域內(nèi)基于深度學(xué)習(xí)進(jìn)行建筑平面生成的問題,注意到GAN在應(yīng)用過程無法明確輸入與輸出的關(guān)系,導(dǎo)致生成的對象不受控制,具有不可解釋性,因此提出一種基于InfoGAN的建筑生成方法,結(jié)果表明通過無監(jiān)督學(xué)習(xí)方式得到可解釋的特征表示。同時(shí)本文還針對在建筑領(lǐng)域基于深度學(xué)習(xí)進(jìn)行建筑形體生成的問題,提出一種將三維的建筑形體信息轉(zhuǎn)譯為圖片并利用InfoGAN、基于圖形識別的超高層建筑三維重建技術(shù)進(jìn)行建筑形體生成的方法。該方法將InfoGAN網(wǎng)絡(luò)生成的含有9個(gè)平面信息的建筑圖紙二值化,并利用ResNet分類模型進(jìn)行建筑功能的劃分,最后基于改進(jìn)的Alpha Shape算法實(shí)現(xiàn)由2D到3D的重建。
參考文獻(xiàn):
[1] 張俊婉,李磊,陶卓民.全球摩天大樓時(shí)空格局演變及影響因素分析[J].現(xiàn)代城市研究,2023(6):75-81.
[2] 尹寶才,王文通,王立春.深度學(xué)習(xí)研究綜述[J].北京工業(yè)大學(xué)學(xué)報(bào),2015,41(1):48-59.
[3] 保羅·梅雷爾,埃里克·施庫夫扎,弗拉德倫·科爾圖恩.計(jì)算機(jī)生成的住宅建筑布局[C]//國際計(jì)算機(jī)協(xié)會(huì). 2010年度亞洲計(jì)算機(jī)圖形圖像與交互技術(shù)大會(huì)論文集.首爾:首爾大學(xué)工程學(xué)院,2010:1-12.
[4] 劉宇波,林文強(qiáng),鄧巧明,等.基于神經(jīng)網(wǎng)絡(luò)的建筑形態(tài)生成探索:以柏林自由大學(xué)為例[C]//全國高等學(xué)校建筑學(xué)專業(yè)教育指導(dǎo)分委員會(huì)建筑數(shù)字技術(shù)教學(xué)工作委員會(huì).共享·協(xié)同:2019全國建筑院系建筑數(shù)字技術(shù)教學(xué)與研究學(xué)術(shù)研討會(huì)論文集.廣州:華南理工大學(xué)建筑學(xué)院,2019:9.
[5] 王大宋,羅蘭·斯努克斯.生成設(shè)計(jì)的人工直覺:一種基于強(qiáng)化學(xué)習(xí)的方法[C]//數(shù)字未來執(zhí)行委員會(huì). 2020數(shù)字未來論文集:第二屆計(jì)算設(shè)計(jì)與機(jī)器人制造國際學(xué)術(shù)研討會(huì).上海:同濟(jì)大學(xué)建筑與城市規(guī)劃學(xué)院,2021:189-198.
[6] 張航.從文本到形態(tài)[C]//國際計(jì)算機(jī)輔助建筑設(shè)計(jì)協(xié)會(huì).第40屆建筑計(jì)算機(jī)輔助設(shè)計(jì)協(xié)會(huì)年會(huì)論文集.上海:同濟(jì)大學(xué)建筑與城市規(guī)劃學(xué)院,2020:238-247.
[7] 馬辰龍,朱姝妍,王明潔.機(jī)器學(xué)習(xí)技術(shù)在建筑設(shè)計(jì)中的應(yīng)用研究[J].南方建筑,2021(2):121-131.
[8] 程芳芳.基于GAN網(wǎng)絡(luò)的無線信道建模方法研究[D].大連:大連海事大學(xué),2022.
[9] 曹爽.基于OTSU算法的圖像閾值分割技術(shù)[D].太原:太原理工大學(xué),2018.
作者簡介:陳闖 (1996—),男,研究方向:建筑技術(shù)科學(xué)。