馬辰龍,朱姝妍,王明潔
當(dāng)前神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)技術(shù)被廣泛應(yīng)用于圖像識(shí)別推薦算法等領(lǐng)域,機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、人工智能等相關(guān)概念越來越被公眾所熟知[1]。機(jī)器學(xué)習(xí)及神經(jīng)網(wǎng)絡(luò)技術(shù)在建筑領(lǐng)域有哪些具體應(yīng)用,這些前沿技術(shù)如何介入建筑設(shè)計(jì)流程,成為許多建筑學(xué)者關(guān)注的問題。
機(jī)器學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)兩個(gè)概念既有關(guān)聯(lián)又有不同側(cè)重,存在混淆與誤讀,大多數(shù)建筑師仍無法窺探神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)的真實(shí)面目。本文基于知識(shí)圖譜手段梳理建筑及相關(guān)領(lǐng)域國(guó)際研究現(xiàn)狀,分析在建筑設(shè)計(jì)中運(yùn)用這一類工具的潛力及局限性;梳理面向建筑師及建筑設(shè)計(jì)階段的機(jī)器學(xué)習(xí)前沿研究成果,發(fā)掘其介入未來建筑設(shè)計(jì)流程的潛力。
機(jī)器學(xué)習(xí)(machine learning)是一門涉及概率論、統(tǒng)計(jì)學(xué)、凸分析等多門學(xué)科的交叉學(xué)科,從數(shù)據(jù)中獲取新的知識(shí),根據(jù)這些知識(shí)“經(jīng)驗(yàn)”改善自身性能,以對(duì)新的情況做出有效的決策,一定程度上模擬了人類的學(xué)習(xí)行為。從二十世紀(jì)五十年代初期至今涌現(xiàn)出基于邏輯表示的“符號(hào)主義”、基于神經(jīng)網(wǎng)絡(luò)的“連接主義”兩類派別,九十年代登場(chǎng)的以支持向量機(jī)(SVM)和核方法(kernel methods)為代表的“統(tǒng)計(jì)學(xué)習(xí)”(statistical learning)思想為當(dāng)代機(jī)器學(xué)習(xí)應(yīng)用提供了有效算法工具[2]。針對(duì)不同的機(jī)器學(xué)習(xí)任務(wù),算法工程師運(yùn)用不同的“機(jī)器學(xué)習(xí)算法”——如對(duì)帶標(biāo)記數(shù)據(jù)1)進(jìn)行分類的支持向量機(jī)(SVM)算法,k鄰近分類(KNN)算法,決策樹算法等;實(shí)現(xiàn)對(duì)帶標(biāo)記數(shù)據(jù)的回歸預(yù)測(cè)的LASSO算法;運(yùn)用對(duì)無標(biāo)記數(shù)據(jù)聚類分析的K-means算法,對(duì)高維數(shù)據(jù)降維分析以發(fā)掘內(nèi)在關(guān)聯(lián)的主成分分析(PCA)算法等[3]。
圖1 建筑設(shè)計(jì)領(lǐng)域機(jī)器學(xué)習(xí)潛在應(yīng)用熱點(diǎn)
機(jī)器學(xué)習(xí)領(lǐng)域的神經(jīng)網(wǎng)絡(luò)指的是“神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)”,描述了實(shí)現(xiàn)前述機(jī)器學(xué)習(xí)任務(wù)的一類工具的核心設(shè)計(jì)思想——受生物神經(jīng)網(wǎng)絡(luò)的啟發(fā)建構(gòu)神經(jīng)元模型以實(shí)現(xiàn)機(jī)器學(xué)習(xí)任務(wù)[2]。神經(jīng)網(wǎng)絡(luò)(neural network)是由具有適應(yīng)性的簡(jiǎn)單單元組成的廣泛并行互聯(lián)的網(wǎng)絡(luò),它的組織能夠模擬生物神經(jīng)系統(tǒng)對(duì)真實(shí)世界物體所做出的交互反應(yīng)[4]。
神經(jīng)網(wǎng)絡(luò)最基本的成分是神經(jīng)元(neuron),其他神經(jīng)元傳遞的信號(hào)通過帶權(quán)重的連接傳遞到某一神經(jīng)元,這些信號(hào)的總輸入通過激活函數(shù)(activation function)處理再傳遞給其他神經(jīng)元,把許多這樣的神經(jīng)元按一定的結(jié)構(gòu)連接起來便組成了不同類型的神經(jīng)網(wǎng)絡(luò)。一般地,神經(jīng)網(wǎng)絡(luò)的使用分為訓(xùn)練和預(yù)測(cè)兩個(gè)階段——訓(xùn)練階段輸入已知數(shù)據(jù),通過反向傳播算法(back propagation)更新神經(jīng)網(wǎng)絡(luò)得到各神經(jīng)元的權(quán)重值,在預(yù)測(cè)階段輸入需要預(yù)測(cè)的數(shù)據(jù),利用權(quán)重值更新過后的神經(jīng)網(wǎng)絡(luò)模型計(jì)算新數(shù)據(jù)的分類、回歸、聚類等預(yù)測(cè)結(jié)果[2]。然而,神經(jīng)網(wǎng)絡(luò)連接主義的本質(zhì)決定了其內(nèi)部的計(jì)算機(jī)制無法被明確解釋,成為一個(gè)“黑箱”工具。
Citespace軟件是基于知識(shí)圖譜原理進(jìn)行文獻(xiàn)分析的工具,通過分析不同文獻(xiàn)的引用關(guān)系特征、關(guān)鍵詞頻率可挖掘某一學(xué)科領(lǐng)域的研究熱點(diǎn)與研究趨勢(shì)[5]。廣義的建筑工程設(shè)計(jì)包含了建筑設(shè)計(jì)、建筑結(jié)構(gòu)、暖通空調(diào)系統(tǒng)、施工管理等領(lǐng)域,而作為“建筑學(xué)”的建筑設(shè)計(jì)相關(guān)研究則因其偏向于實(shí)踐,更具探索性與應(yīng)用性。目前在建筑工程相關(guān)領(lǐng)域,機(jī)器學(xué)習(xí)的主流研究集中于空調(diào)與能耗、建筑結(jié)構(gòu)、建筑工程管理等方向,適用于在復(fù)雜多變量場(chǎng)景下的數(shù)據(jù)預(yù)測(cè)及特征分析任務(wù)。
利用Scopus數(shù)據(jù)庫對(duì)建筑設(shè)計(jì)領(lǐng)域的前沿國(guó)際學(xué)術(shù)會(huì)議進(jìn)行文獻(xiàn)分析,共獲取1999~2019年間123篇研究文獻(xiàn)。由于國(guó)際會(huì)議論文相對(duì)于期刊論文引用量極少,無法進(jìn)行有效的文獻(xiàn)共引分析,利用CiteSpace軟件中的關(guān)鍵詞分析功能挖掘當(dāng)前機(jī)器學(xué)習(xí)在建筑設(shè)計(jì)領(lǐng)域的潛在應(yīng)用熱點(diǎn)。名詞性關(guān)鍵詞形成詞云,關(guān)鍵詞大小表示其出現(xiàn)次數(shù),關(guān)鍵詞的分布情況反應(yīng)了研究熱點(diǎn)的集中度,如圖1所示。
從可視化結(jié)果可以得出如下結(jié)論:
(1)城市設(shè)計(jì)(urban design/urban planning)相關(guān)問題被提及的頻次較高,且相關(guān)關(guān)鍵
(2)詞形成一定的集中度,具有較多元化的研究方向,包括了環(huán)境性能(environment performance)、建筑形態(tài)特征提?。╝rchitectural feature extraction)、社會(huì)交往(social life)等。
(3)建筑性能(building performance/performance model)、 機(jī) 器 自 動(dòng) 生 成(robotic automatic generation)、圖像分類(image classification)、設(shè)計(jì)決策(decision making)、不均勻線性材料(no-uniform linear material)等關(guān)鍵詞有較高出現(xiàn)頻率,
表1 面向建筑設(shè)計(jì)的機(jī)器學(xué)習(xí)前沿應(yīng)用文獻(xiàn)梳理
圖2 運(yùn)用SOM神經(jīng)網(wǎng)絡(luò)探索不同環(huán)境數(shù)據(jù)與人體生理反應(yīng)指標(biāo)的關(guān)聯(lián)性
(4)代表當(dāng)前較為熱門的研究方向。
(5)其他關(guān)鍵詞的涵蓋范圍相當(dāng)廣泛且分布較為平均,包括了建筑平面排布(architectural layout)、自由形態(tài)殼體(free-form shell)、BIM平臺(tái)的模型檢測(cè)(BIM-based model check)、進(jìn)化算法(evolutionary algorithm)、數(shù)據(jù)挖掘(data mining)、實(shí)時(shí)成本測(cè)算(real-time cost estimation)等大量不同研究方向,這代表了當(dāng)前學(xué)術(shù)界在各個(gè)細(xì)分研究方向上的探索實(shí)踐。
值得注意的是,由于機(jī)器學(xué)習(xí)當(dāng)前仍屬于一種新興技術(shù),其在建筑設(shè)計(jì)領(lǐng)域的應(yīng)用仍處于萌芽期,相關(guān)研究數(shù)量并不多,因此針對(duì)少量文獻(xiàn)的關(guān)鍵詞分析并不能保證獲得清晰準(zhǔn)確的研究脈絡(luò)。因此本文接下來將通過對(duì)最新國(guó)際會(huì)議文獻(xiàn)的人工篩選獲取更深入的研究現(xiàn)狀。
為了解決Scopus等數(shù)據(jù)庫對(duì)國(guó)際會(huì)議前沿文獻(xiàn)收錄的滯后性,通過人工檢索建筑領(lǐng)域最新研究文獻(xiàn)(包括了截至2020年6月的近三年重要國(guó)際會(huì)議及相關(guān)期刊論文),展現(xiàn)機(jī)器學(xué)習(xí)技術(shù)在建筑設(shè)計(jì)相關(guān)領(lǐng)域的前沿應(yīng)用圖景。根據(jù)算法架構(gòu)和研究領(lǐng)域側(cè)重,可將所有文獻(xiàn)劃分為12個(gè)算法大類和8個(gè)研究方向,將上述所有文獻(xiàn)呈現(xiàn)在表格中(表1)。
根據(jù)機(jī)器學(xué)習(xí)算法的復(fù)雜度將所有涉及到的機(jī)器學(xué)習(xí)算法劃分為非深度學(xué)習(xí)算法(non-deep learning)與深度學(xué)習(xí)算法(deep learning)。非深度學(xué)習(xí)算法除了傳統(tǒng)淺層神經(jīng)網(wǎng)絡(luò)(ANN)算法還包含回歸分析、SVM、SOM算法等,被廣泛應(yīng)用于除建筑設(shè)計(jì)之外的其他建筑工程領(lǐng)域。而深度學(xué)習(xí)算法涉及到多層復(fù)雜神經(jīng)網(wǎng)絡(luò),包括較熱門的CNN、GAN、RNN算法及風(fēng)格遷移算法、基于圖結(jié)構(gòu)的算法、強(qiáng)化學(xué)習(xí)(reinforced learning)算法等,深度學(xué)習(xí)算法對(duì)高維數(shù)據(jù)及抽象特征有更好的識(shí)別能力。
傳統(tǒng)非深度學(xué)習(xí)算法(不包含Simple ANN淺層神經(jīng)網(wǎng)絡(luò))的應(yīng)用集中于建筑形體、建筑性能與使用者行為等研究領(lǐng)域。雖然這些機(jī)器學(xué)習(xí)算法已被成熟運(yùn)用于結(jié)構(gòu)、暖通等工程領(lǐng)域,但在建筑設(shè)計(jì)領(lǐng)域的前沿研究中尚未被廣泛提及。其中,SOM自組織神經(jīng)網(wǎng)絡(luò)將高維數(shù)據(jù)映射到二維網(wǎng)格并進(jìn)行自組織聚類,可用于建筑形體推敲[15,16]、判斷復(fù)雜構(gòu)筑物的大量形態(tài)控制參數(shù)與最終建造結(jié)果間的關(guān)聯(lián)性[21]、環(huán)境要素與使用者各項(xiàng)生理指標(biāo)間復(fù)雜關(guān)聯(lián)性的分析[17](圖2),也可以被創(chuàng)造性地應(yīng)用于建筑風(fēng)環(huán)境的CFD擬合計(jì)算[18],具有較大的未來應(yīng)用潛力。內(nèi)森·布朗(Nathan Brown)等學(xué)者則將PCA主成分分析方法運(yùn)用于大跨桁架結(jié)構(gòu)的優(yōu)化流程,綜合桁架控制點(diǎn)的高度參數(shù),抽象為不同權(quán)重的影響桁架結(jié)構(gòu)性能的若干控制變量,保證建筑師能夠在直觀把握建筑結(jié)構(gòu)性能的前提下仍具有進(jìn)一步自由形態(tài)調(diào)整的余地[7]。值得注意的是,以上這些應(yīng)用均涉及到了建筑性能相關(guān)研究,以統(tǒng)籌復(fù)雜非線性的參數(shù)關(guān)系。
以Simple ANN(淺層神經(jīng)網(wǎng)絡(luò))為代表的機(jī)器學(xué)習(xí)算法可以從多變量高維數(shù)據(jù)集中學(xué)習(xí)對(duì)應(yīng)的輸入輸出關(guān)聯(lián)模式,從而建立一個(gè)輸入輸出關(guān)聯(lián)模型,通過將新數(shù)據(jù)輸入訓(xùn)練好的預(yù)測(cè)模型,可以預(yù)測(cè)對(duì)應(yīng)的數(shù)據(jù)輸出。這一性質(zhì)被廣泛運(yùn)用于建筑能耗預(yù)測(cè)相關(guān)領(lǐng)域以加快建筑能耗優(yōu)化的速度,并被成為“代理模型”或“元模型”方法(surrogate model/metamodel)[80,81,30-32](圖 3)。同樣地,元模型方法可以被用于結(jié)構(gòu)性能優(yōu)化方向,如在優(yōu)化過程中輔助設(shè)計(jì)師對(duì)整個(gè)方案搜索空間的性能趨勢(shì)的判斷[26]、加速結(jié)構(gòu)靜力學(xué)優(yōu)化計(jì)算[27],以及涉及更多材料特性設(shè)置的結(jié)構(gòu)性能快速預(yù)測(cè)[28]。相對(duì)于前述若干機(jī)器學(xué)習(xí)算法,淺層神經(jīng)網(wǎng)絡(luò)能夠更有效地捕捉復(fù)雜參數(shù)約束的內(nèi)在關(guān)聯(lián)性,應(yīng)用范圍更加廣泛。其可以擬合建筑形體隨控制點(diǎn)移動(dòng)而產(chǎn)生的形態(tài)變化[23],證明其敏銳捕捉非線性復(fù)雜參數(shù)關(guān)系以進(jìn)行插值計(jì)算的能力,這一能力也可進(jìn)一步應(yīng)用于進(jìn)行機(jī)械臂操作路徑的優(yōu)化[19,20]。王振宇等學(xué)者將國(guó)內(nèi)440個(gè)已建成博物館的周邊城市環(huán)境數(shù)據(jù)(公交站數(shù)量與方位、周邊道路等級(jí)等)和博物館主入口方位這一對(duì)數(shù)據(jù)作為輸入輸出,訓(xùn)練一個(gè)單隱層神經(jīng)網(wǎng)絡(luò),該神經(jīng)網(wǎng)絡(luò)可以根據(jù)新給定的博物館選址環(huán)境決策博物館最佳入口方位,同人工選取相比一致率達(dá)到70%~90%[22]??死锼沟侔病の鲓W伯格[8]和鄭豪[24]將形態(tài)參數(shù)作為神經(jīng)網(wǎng)絡(luò)輸入端,觀察者對(duì)形態(tài)美感的打分作為神經(jīng)網(wǎng)絡(luò)的輸出端,從而“模仿”人的主觀偏好,以輔助建筑形體優(yōu)化過程。上述兩類應(yīng)用可以看作對(duì)人類決策過程的擬合,是較為初級(jí)的“人工智能”。
CNN (卷積神經(jīng)網(wǎng)絡(luò))以其對(duì)二維圖像抽象特征的解讀能力成為圖像特征識(shí)別領(lǐng)域的重要工具。 吉村酉二(Yuji Yoshimura)等學(xué)者將不同風(fēng)格建筑師的作品圖像輸入一個(gè)深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練出的神經(jīng)網(wǎng)絡(luò)可以從新輸入的建筑圖像中辨別出抽象的建筑風(fēng)格特征,推測(cè)該建筑的風(fēng)格屬于哪位建筑師,并以偽色圖的形式表征該推測(cè)基于建筑圖像的哪些區(qū)域[36],這是二維圖像識(shí)別技術(shù)在建筑設(shè)計(jì)領(lǐng)域的最直觀應(yīng)用。更進(jìn)一步地,一個(gè)名為DANIEL的推薦系統(tǒng)可根據(jù)輸入的建筑平面圖提取建筑布局邏輯,對(duì)應(yīng)輸出若干具有相似特征的建筑平面,為購房者提供多樣化的候選方案[43]。除了進(jìn)行傳統(tǒng)的圖像識(shí)別與分類任務(wù)[36-44]以輔助建筑設(shè)計(jì)流程,卷積神經(jīng)網(wǎng)絡(luò)也可以在城市尺度上借助衛(wèi)星圖進(jìn)行自動(dòng)化的城市區(qū)塊類型識(shí)別[45],將卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用拓展到城市形態(tài)規(guī)劃領(lǐng)域。
圖3 基于機(jī)器學(xué)習(xí)的“代理模型”/“元模型”方法輔助建筑性能優(yōu)化過程
圖4 基于生成式對(duì)抗神經(jīng)網(wǎng)絡(luò)(GAN)的建筑平面設(shè)計(jì)流程及樹狀方案篩選界面
圖5 基于styleGAN的現(xiàn)代風(fēng)格建筑立面
圖6 基于pix2pixHD的城市風(fēng)貌意象生成
GAN(生成對(duì)抗神經(jīng)網(wǎng)絡(luò))的輸入輸出參數(shù)均為二維圖像數(shù)據(jù)。鄭豪、黃蔚欣等學(xué)者從lianjia.com網(wǎng)站獲取155個(gè)住宅戶型平面,并繪制對(duì)應(yīng)的功能色塊圖以不同顏色標(biāo)記房間功能,分別作為輸出與輸入端連接pix2pixHD 神經(jīng)網(wǎng)絡(luò)[82]進(jìn)行訓(xùn)練,訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)可以根據(jù)新輸入的功能色塊圖生成逼真的戶型平面圖[53]。這證明了將建筑平面布局當(dāng)作二維圖像進(jìn)行信息交換的可操作性。斯坦尼斯拉斯·夏約(Stanislas Chaillou)在此基礎(chǔ)上做了更進(jìn)一步的平面生成嘗試,運(yùn)用GAN神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了建筑紅線-建筑基底輪廓-房間劃分-門窗洞口設(shè)計(jì)-家具排布整個(gè)平面圖設(shè)計(jì)流程的模擬,每一步驟均可生成大量備選方案,依托實(shí)時(shí)的樹狀選取界面,設(shè)計(jì)師可以靈活篩選每一個(gè)步驟的生成結(jié)果[55](圖4)。另一方面,將場(chǎng)景照片作為媒介的研究也顯示出GAN神經(jīng)網(wǎng)絡(luò)的潛在價(jià)值:國(guó)內(nèi)小庫團(tuán)隊(duì)于2017年開始啟動(dòng)了“羅塞塔計(jì)劃”,利用styleGAN神經(jīng)網(wǎng)絡(luò),通過對(duì)大量已有的優(yōu)秀建筑設(shè)計(jì)案例進(jìn)行深入學(xué)習(xí), 建立一個(gè)關(guān)于設(shè)計(jì)風(fēng)格、邏輯與理念等的龐大知識(shí)庫, 并輸出學(xué)習(xí)后的智能設(shè)計(jì)成果供設(shè)計(jì)師參考[59](圖5)。STEINFELD等學(xué)者的GAN Loci研究比較了Pix2pixHD和styleGAN兩種神經(jīng)網(wǎng)絡(luò)再現(xiàn)不同城市“場(chǎng)所精神”(Genius Loci)的潛力,證明了GAN神經(jīng)網(wǎng)絡(luò)對(duì)抽象特征的強(qiáng)大識(shí)別歸納能力[58](圖6)。
RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))相對(duì)于CNN可以靈活處理不等長(zhǎng)的數(shù)據(jù)序列,因此被用于文本、語音的語義分析等領(lǐng)域。這使得其除了可基于時(shí)序數(shù)據(jù)進(jìn)行人流行為模擬[66]之外,還可以結(jié)合圖結(jié)構(gòu)2)進(jìn)行建筑平面拓?fù)湎嗨菩缘淖R(shí)別[63],不均勻材料的變形特性預(yù)測(cè)[64,65]。進(jìn)一步地,如果將建筑設(shè)計(jì)步驟看作時(shí)序數(shù)據(jù)訓(xùn)練RNN神經(jīng)網(wǎng)絡(luò),則可以讓其理解非線性的設(shè)計(jì)決策過程,協(xié)助建筑師做方案決策[67]。
用于二維圖像的風(fēng)格遷移(style transfer)技術(shù)、多用于社交數(shù)據(jù)處理的圖結(jié)構(gòu)、強(qiáng)化學(xué)習(xí)算法分別在輔助設(shè)計(jì)師獲取創(chuàng)作靈感[68-73]、建筑空間拓?fù)潢P(guān)系識(shí)別[75-77]、基于動(dòng)態(tài)反饋的生成式設(shè)計(jì)[78]和結(jié)構(gòu)優(yōu)化方法[79]等研究方向上找到了自己的一席之地。其中,孫澄教授團(tuán)隊(duì)將風(fēng)格遷移技術(shù)運(yùn)用于三維建筑形體,基于二維概念意向圖的語義信息輔三維建筑形體的風(fēng)格推敲,這為未來的建筑創(chuàng)作提供了新的思路[74]。
特征識(shí)別技術(shù)隨著近期CNN神經(jīng)網(wǎng)絡(luò)的熱門而受到廣泛關(guān)注,基于CNN神經(jīng)網(wǎng)絡(luò)的特征識(shí)別方法主要依托于二維圖像,其被運(yùn)用于不同的建筑設(shè)計(jì)分支領(lǐng)域幫助設(shè)計(jì)師實(shí)現(xiàn)效率提升。YURI KATO等學(xué)者結(jié)合CNN與google maps提取街道界面色彩搭配模式[38]以為接下來的建筑與城市規(guī)劃決策提供依據(jù);KIM, JINSUNG等學(xué)者研究了機(jī)器學(xué)習(xí)如何幫助計(jì)算機(jī)自動(dòng)識(shí)別未知建筑構(gòu)件的類型[37]。
在城市形態(tài)層面的機(jī)器學(xué)習(xí)運(yùn)用也主要基于將城市規(guī)劃圖像的像素化處理,進(jìn)而利用CNN、GAN、Style Transfer等算法進(jìn)行抽象特征的識(shí)別和基于此的形態(tài)風(fēng)格轉(zhuǎn)換。同濟(jì)大學(xué)彭茜等學(xué)者論述了當(dāng)前人工智能在城市規(guī)劃領(lǐng)域的應(yīng)用前景,并利用CNN網(wǎng)絡(luò)對(duì)城市紋理和土地利用分類進(jìn)行大規(guī)模、精細(xì)的判別[45](圖7)。
對(duì)建筑平面與空間拓?fù)涞难芯縿t形成了兩種截然不同的路徑,第一種是前文提及的基于GAN網(wǎng)絡(luò)的生成式設(shè)計(jì)方法,其利用建筑平面的像素格式圖像進(jìn)行訓(xùn)練以獲取新的平面布局方案,然而這種平面生成方式并不能直接同矢量建模軟件進(jìn)行精確的數(shù)據(jù)交換。第二種基于圖結(jié)構(gòu)的機(jī)器學(xué)習(xí)方法則更能有效表達(dá)建筑空間的拓?fù)潢P(guān)系,具有更大潛力融入傳統(tǒng)建筑設(shè)計(jì)流程[63,75-77](圖8、9)。
圖7 基于CNN神經(jīng)網(wǎng)絡(luò)的城市形態(tài)識(shí)別
圖8 建筑平面圖的拓?fù)浞治?/p>
圖9 三維建筑體的空間組織圖結(jié)構(gòu)可視化
建筑形體層面,除了對(duì)形體控制參數(shù)、主觀評(píng)價(jià)參數(shù)間內(nèi)在關(guān)聯(lián)性的提取之外,另一個(gè)具有潛在價(jià)值的研究方向是如何將三維的建筑形體信息轉(zhuǎn)譯以供機(jī)器學(xué)習(xí)算法調(diào)用。將建筑的三維形態(tài)進(jìn)行像素化,將其看作三維分布的像素點(diǎn),則可創(chuàng)建對(duì)應(yīng)的三維卷積神經(jīng)網(wǎng)絡(luò)(3dCNN)。大衛(wèi)·牛頓(David Newton)在grasshopper平臺(tái)鏈接Keras神經(jīng)網(wǎng)絡(luò)工具建立了3dCNN網(wǎng)絡(luò),該神經(jīng)網(wǎng)絡(luò)目前可以識(shí)別建筑的三種特征[47]。米蓋爾(Jaime de Miguel)等學(xué)者則在此基礎(chǔ)上增加了每個(gè)采樣“像素點(diǎn)”周圍的鄰接信息,經(jīng)轉(zhuǎn)譯后的建筑形體信息被輸入自編碼網(wǎng)絡(luò)(autoencoder),建筑形體信息通過4層隱含層被壓縮為一個(gè)隱空間(latent space)中的向量;訓(xùn)練兩種不同建筑形體,在隱空間的兩個(gè)對(duì)應(yīng)向量間進(jìn)行平滑采樣則可取得兩種建筑形體特征間的混合結(jié)果[25](圖10),這與基于SOM算法的建筑形體研究[16]結(jié)果相似(圖11)。STEINFELD等學(xué)者建立了機(jī)器學(xué)習(xí)在生成式設(shè)計(jì)中的應(yīng)用框架,其對(duì)建筑三維形體的轉(zhuǎn)譯采取了另一種路徑:將建筑三維實(shí)體不同方向的切割面圖像作為神經(jīng)網(wǎng)絡(luò)的輸入端以描述形體信息,進(jìn)一步利用GAN神經(jīng)網(wǎng)絡(luò)生成新的三維實(shí)體,證明了這一形體轉(zhuǎn)譯方法的可行性[60](圖12)。
機(jī)械臂建造方向,結(jié)構(gòu)優(yōu)化方向,使用者行為分析方向,建筑性能分析與優(yōu)化方向,機(jī)器學(xué)習(xí)作為模式識(shí)別的工具均體現(xiàn)出其應(yīng)用潛力。其中,安洛斯·柯尼斯(Angelos Chronis)等學(xué)者利用GAN神經(jīng)網(wǎng)絡(luò)建立了基于Rhinoceros3D的實(shí)時(shí)建模可視化平臺(tái),專注于解決城市尺度的環(huán)境性能模擬,該神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù)為表達(dá)建筑高程的灰度圖像,實(shí)時(shí)輸出數(shù)據(jù)為行人高度的風(fēng)壓與日照輻射偽色圖,其足以輔助建筑師直觀感知建筑布局對(duì)城市風(fēng)熱環(huán)境的影響,以進(jìn)行更全面的城市形態(tài)優(yōu)化[62]。該算法被整合于最新發(fā)布的Giraffe城市設(shè)計(jì)平臺(tái)中作為地面風(fēng)環(huán)境舒適度計(jì)算的工具包,其快速的性能反饋效果在建筑界引起了廣泛討論3)。SOM算法也有此方面的應(yīng)用,依托Mathematica數(shù)值計(jì)算SOM神經(jīng)網(wǎng)絡(luò)進(jìn)行CFD的擬合,快速生成三維風(fēng)場(chǎng)數(shù)據(jù)[18]。Thomas Wortmann等學(xué)者依托于元模型思路開發(fā)了元啟發(fā)式優(yōu)化算法,并基于此開發(fā)了grasshopper平臺(tái)內(nèi)的優(yōu)化插件Opossum,該優(yōu)化算法相比于遺傳算法等傳統(tǒng)優(yōu)化算法,能夠在較小的迭代次數(shù)下獲得更優(yōu)異的性能優(yōu)化結(jié)果[35]。
當(dāng)前面向建筑師的機(jī)器學(xué)習(xí)相關(guān)研究與應(yīng)用尚處于萌芽期,本小節(jié)介紹現(xiàn)階段可供建筑師運(yùn)用的機(jī)器學(xué)習(xí)工具與接口,以及對(duì)應(yīng)的典型應(yīng)用路徑。
圖10 基于自編碼網(wǎng)絡(luò)的建筑形體特征混合方法
圖11 基于SOM網(wǎng)絡(luò)的建筑形體特征混合方法
圖12 基于多視圖的建筑形態(tài)轉(zhuǎn)譯
當(dāng)前有各類成熟的機(jī)器學(xué)習(xí)算法工具包,分別具有不同的側(cè)重。Accord.NET Framework、NeuronDotNet.dll、AForge.Neuro.dll/ NLOptDotNet.dll等工具包為輕量級(jí)的基于.NET的機(jī)器學(xué)習(xí)算法包,在進(jìn)行插件編寫時(shí)可直接調(diào)用對(duì)應(yīng)的.dll文件實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法。但這些工具尚無法完成深度學(xué)習(xí)等復(fù)雜的機(jī)器學(xué)習(xí)任務(wù),也無法調(diào)用GPU進(jìn)行高負(fù)荷的機(jī)器學(xué)習(xí)計(jì)算。Python作為一種“膠水語言”4)被機(jī)器學(xué)習(xí)工程師青睞,Scikit-learn作為python環(huán)境下的通用的機(jī)器學(xué)習(xí)算法框架,提供了大量執(zhí)行機(jī)器學(xué)習(xí)算法的模塊化方案以用于數(shù)據(jù)挖掘和分析,幾乎覆蓋了機(jī)器學(xué)習(xí)的所有主流算法,但并未針對(duì)當(dāng)前熱門的深度學(xué)習(xí)技術(shù)優(yōu)化。當(dāng)前在深度學(xué)習(xí)領(lǐng)域被廣為采用的框架為Keras、tensorflow、pytorch、Caffe等,可通過python接口靈活搭建自定義的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),目前大多數(shù)深度學(xué)習(xí)相關(guān)研究基于上述深度學(xué)習(xí)框架。MATLAB作為工程領(lǐng)域廣為應(yīng)用的軟件,也包含機(jī)器學(xué)習(xí)模塊,通過MATLAB API可實(shí)現(xiàn)MATLAB與外部工程設(shè)計(jì)軟件的實(shí)時(shí)數(shù)據(jù)傳輸。
當(dāng)前主流機(jī)器學(xué)習(xí)研究集中于對(duì)圖像、文本等大數(shù)據(jù)媒體資料的處理。直接運(yùn)用這類媒體資料解決建筑領(lǐng)域的相關(guān)問題并不需要3D建模軟件的參與。如在鄭豪[53]、STEINFELD[58]等學(xué)者的相關(guān)研究中,戶型平面圖、街景圖片作為輸入輸出媒介,使用經(jīng)典的styleGAN、Pix2PixHD等基于二維圖像的機(jī)器學(xué)習(xí)算法包生成需要的二維圖像結(jié)果,整個(gè)過程均直接利用Python編程平臺(tái)實(shí)現(xiàn)。
基于3D建模軟件實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法有兩條主要路徑:建模軟件自帶的插件工具;3D軟件與成熟算法平臺(tái)的數(shù)據(jù)互通。
軟件自帶的插件工具將機(jī)器學(xué)習(xí)算法進(jìn)行打包,不需設(shè)計(jì)師進(jìn)行自定義編程,因此能夠快速將機(jī)器學(xué)習(xí)算法融入設(shè)計(jì)流程。在Rhinoceros3D平臺(tái)下有若干第三方算法grasshopper插件支持實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法:opossum優(yōu)化插件[83,84]、Lunchbox、Owl、Crow、Dodo、ANT插件等(表2)。受限于軟件平臺(tái),上述插件均不能鏈接GPU并行計(jì)算,其參數(shù)的設(shè)置和修改具有局限性,而這些參數(shù)的調(diào)整往往是神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)中最重要的問題[85]。Lunchbox插件也有基于Revit的Dynamo平臺(tái)版本,包含了與grasshopper平臺(tái)同樣的機(jī)器學(xué)習(xí)算法。
表2 支持機(jī)器學(xué)習(xí)算法的grasshopper插件匯總
3D軟件與外部機(jī)器學(xué)習(xí)工具的數(shù)據(jù)交互有兩種方式——通過插件互通與通過交換文件鏈接。在Rhinoceros3D平臺(tái)下可通過Ghcpython和ghpython remote插件直接在grasshopper界面內(nèi)調(diào)用numpy、scipy、keras、tensorflow等機(jī)器學(xué)習(xí)相關(guān)運(yùn)算庫,方便建立無縫的機(jī)器學(xué)習(xí)流程;在Revit的Dynamo平臺(tái)下也可以通過Python、C#編程語言實(shí)現(xiàn)以上數(shù)據(jù)交換。Houdini 中的PDG參數(shù)化平臺(tái)基于Python語言同樣可以鏈接tensorflow、pytorch等經(jīng)典機(jī)器學(xué)習(xí)算法庫,官方網(wǎng)站介紹了基于機(jī)器學(xué)習(xí)的快速地形生成方法[86]。另外,將3D軟件內(nèi)的數(shù)據(jù)以.csv等格式導(dǎo)出后也便于在python平臺(tái)、MATLAB等計(jì)算模擬平臺(tái)調(diào)用,但交換文件的儲(chǔ)存與讀取會(huì)耗費(fèi)大量的時(shí)間,在處理超大規(guī)模數(shù)據(jù)時(shí)將成為速度瓶頸。
國(guó)內(nèi)孫澄教授團(tuán)隊(duì)提出了人工智能與建筑師協(xié)同方案創(chuàng)作的設(shè)計(jì)模式,并利用深度學(xué)習(xí)技術(shù)開發(fā)了實(shí)現(xiàn)人機(jī)協(xié)同方案設(shè)計(jì)的智能設(shè)計(jì)系統(tǒng)(Quick Desgin Generator),此系統(tǒng)是典型的基于3D建模軟件的機(jī)器學(xué)習(xí)實(shí)現(xiàn)方式——在grasshopper內(nèi)將建筑三維數(shù)據(jù)轉(zhuǎn)換為二維信息,使用Python語言鏈接grasshopper參數(shù)化平臺(tái)與tensorflow機(jī)器學(xué)習(xí)框架,結(jié)合二維建筑意象圖片進(jìn)行風(fēng)格遷移并反饋回grasshopper生成三維體量。該方法成功地將建筑設(shè)計(jì)意向特征融合進(jìn)三維建筑體量,輔助設(shè)計(jì)師進(jìn)行方案創(chuàng)作[74]。
本文系統(tǒng)性地梳理了機(jī)器學(xué)習(xí)及神經(jīng)網(wǎng)絡(luò)技術(shù)在當(dāng)前建筑領(lǐng)域的前沿研究,以盡可能還原這一先進(jìn)技術(shù)在建筑領(lǐng)域的應(yīng)用圖景。綜合前述分析可得出機(jī)器學(xué)習(xí)技術(shù)在建筑設(shè)計(jì)領(lǐng)域的現(xiàn)狀特征和未來研究趨勢(shì),可以概括為以下五個(gè)方面:
(1)ANN、SVM、PCA等傳統(tǒng)機(jī)器學(xué)習(xí)工具在建筑工程領(lǐng)域應(yīng)用廣泛,雖然沒有深度學(xué)習(xí)技術(shù)那樣具有“魔力”,但其在性能優(yōu)化相關(guān)領(lǐng)域仍具有巨大的應(yīng)用潛力。正如同濟(jì)大學(xué)的研究顯示的那樣[33],借助機(jī)器學(xué)習(xí)技術(shù)將量化的建筑性能指標(biāo)同建筑形體特征相耦合并快速進(jìn)行性能反饋,更符合建筑越來越“智能化”的需求。
(2)基于二維圖像的機(jī)器學(xué)習(xí)算法(CNN/GAN等神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu))在拓展建筑師創(chuàng)造力的方向具有巨大潛力,隨著相關(guān)研究的深入,這些機(jī)器學(xué)習(xí)的介入將變得更具實(shí)用化,這種實(shí)用化已經(jīng)在建筑形體創(chuàng)意等方向初步顯露[73,74]。
(3)如何將建筑的三維信息保真地轉(zhuǎn)譯為機(jī)器學(xué)習(xí)可以“理解”和操作的數(shù)據(jù)是一個(gè)具有重要意義的研究方向。高保真的建筑三維信息處理將極大促進(jìn)涉及建筑形態(tài)的機(jī)器學(xué)習(xí)相關(guān)應(yīng)用。
(4)在將機(jī)器學(xué)習(xí)作為輔助工具的前提下,可以在整個(gè)設(shè)計(jì)流程中綜合運(yùn)用不同的機(jī)器學(xué)習(xí)算法以提高設(shè)計(jì)效率[21],且應(yīng)當(dāng)進(jìn)行不同機(jī)器學(xué)習(xí)算法的篩選,以獲得最優(yōu)性能[9,65]。
(5)雖然當(dāng)前主流3D建模平臺(tái)引入了若干機(jī)器學(xué)習(xí)算法插件,當(dāng)前主流的機(jī)器學(xué)習(xí)算法應(yīng)用仍然依托于tensorflow、pytorch等經(jīng)典機(jī)器學(xué)習(xí)算法庫,依托python等語言接口將3D建模軟件同機(jī)器學(xué)習(xí)算法相鏈接的方式將成為相當(dāng)長(zhǎng)時(shí)期內(nèi)的主流。
建筑學(xué)作為一門結(jié)合了藝術(shù)與工程的學(xué)科具有其獨(dú)特性,建筑師應(yīng)同時(shí)考慮美學(xué)需求和建筑性能需求,機(jī)器學(xué)習(xí)及神經(jīng)網(wǎng)絡(luò)相關(guān)工具為建筑師提供了從直觀的數(shù)據(jù)視角呈現(xiàn)復(fù)雜問題的能力,其強(qiáng)大的數(shù)據(jù)整合與特征識(shí)別能力也可輔助建筑師進(jìn)行快速和窮盡式的方案優(yōu)選。這些強(qiáng)大的工具有助于將建筑師從枯燥的比較試錯(cuò)中解放出來,將當(dāng)前的“勞動(dòng)密集型”設(shè)計(jì)轉(zhuǎn)變?yōu)椤爸橇γ芗汀痹O(shè)計(jì),同時(shí)也有助于建筑師更多地聚焦于建筑的非物質(zhì)要素,在建筑性能需求、設(shè)計(jì)美學(xué)和社會(huì)關(guān)懷間找到更好的平衡,擴(kuò)展建筑學(xué)的邊界。
圖、表來源
圖1、3:作者繪制;圖2:參考文獻(xiàn)[17];
圖4:參考文獻(xiàn)[55];圖5:參考文獻(xiàn)[59];
圖6:參考文獻(xiàn)[58];圖7:參考文獻(xiàn)[45];
圖8:參考文獻(xiàn)[75];圖9:參考文獻(xiàn)[76];
圖10:參考文獻(xiàn)[25];圖11:參考文獻(xiàn)[16];
圖12:參考文獻(xiàn)[60];表1、表2:作者繪制。
注釋
1)在監(jiān)督式學(xué)習(xí)和半監(jiān)督式學(xué)習(xí)任務(wù)中,機(jī)器學(xué)習(xí)算法在訓(xùn)練階段接受一組帶標(biāo)記數(shù)據(jù),訓(xùn)練完成的機(jī)器學(xué)習(xí)算法可以根據(jù)新輸入的未標(biāo)記數(shù)據(jù)猜測(cè)可能的標(biāo)簽。如在動(dòng)物圖像識(shí)別任務(wù)的訓(xùn)練階段,輸入的帶標(biāo)記數(shù)據(jù)為動(dòng)物的圖像和對(duì)應(yīng)的動(dòng)物種類標(biāo)簽。這些標(biāo)記數(shù)據(jù)通常需要人工/專家進(jìn)行注釋。
2)圖結(jié)構(gòu)相對(duì)于線性結(jié)構(gòu)和樹形結(jié)構(gòu),是一種復(fù)雜的非線性結(jié)構(gòu),圖結(jié)構(gòu)由節(jié)點(diǎn)(Vertex)和邊(Edge)組成,邊代表節(jié)點(diǎn)之間的連接;圖結(jié)構(gòu)中任意兩個(gè)節(jié)點(diǎn)之間都可能由邊連接。根據(jù)邊是否具有方向性,圖結(jié)構(gòu)分為有向圖與無向圖。用圖結(jié)構(gòu)可以對(duì)現(xiàn)實(shí)中許多復(fù)雜系統(tǒng)進(jìn)行建模,如知識(shí)圖譜關(guān)系、社交關(guān)系、交通網(wǎng)絡(luò)、計(jì)算機(jī)網(wǎng)絡(luò)、消費(fèi)市場(chǎng)等。
3)giraffe是一個(gè)在線的城市設(shè)計(jì)平臺(tái),官網(wǎng)地址:https://www.giraffe.build/
4)膠水語言(glue language)是特指用來方便連接各類軟件組件以實(shí)現(xiàn)整體業(yè)務(wù)流程的語言(像膠水一樣好用),其僅作為一個(gè)中間處理模塊調(diào)用各類其他語言編寫的核心程序并進(jìn)行綜合處理。由于python作為腳本語言的具有極高的代碼可讀性和靈活的語法,和擁有豐富的第三方庫,其更適合作為膠水語言。