蔡超麗,李純純,黃 琳,楊鐵軍
(1. 桂林理工大學廣西嵌入式技術(shù)與智能系統(tǒng)重點實驗室,廣西桂林 541006;2. 桂林理工大學材料科學與工程學院,廣西桂林 541006)
陶瓷材料是一種多晶體材料,可以廣泛應(yīng)用于生物醫(yī)療、民生和軍工等多個領(lǐng)域[1,2]. 研究人員通常利用掃描電子顯微鏡(Scanning Electron Microscope,SEM)對陶瓷樣品掃描成像,通過分析圖像中晶粒的尺寸分布來估計陶瓷樣品的性能[3]. 圖1展示了一種陶瓷材料SEM 圖像,由晶粒和晶界(晶粒間的空隙)組成,其中晶粒根據(jù)形狀可分為圓柱狀晶粒(實線標注)和板條狀晶粒(虛線標注). 晶粒的形狀、大小、數(shù)量和分布對陶瓷材料性能有著直接的影響[4],因此統(tǒng)計分析SEM圖像中晶粒尺寸和分布對陶瓷材料的研究有重要的意義.
圖1 陶瓷晶粒SEM圖像
當前對陶瓷材料的SEM 圖像中的晶粒分析主要依靠人工手段,統(tǒng)計結(jié)果具有明顯的局限性. 首先,一幅SEM 圖像包含大量的陶瓷晶粒,人工統(tǒng)計耗時耗力,效率低難度大;其次,晶粒形狀不規(guī)則,對比度較低,人工統(tǒng)計易受到主觀影響而導(dǎo)致統(tǒng)計結(jié)果出現(xiàn)偏差[5],因此,研究晶粒尺寸分布的自動分析方法很有必要. 起初,基于邊緣檢測的算法[6]被用于分割晶粒,但對于不清晰晶粒輪廓的提取并不理想;為了更好地提取晶粒的封閉輪廓,Qing 等[7]先對邊緣信息進行增強,然后使用分水嶺算法[8]進行晶粒分割,但存在“過度分割”問題;因此,Heilbronner 等[9]提出了一種基于梯度濾波的自動晶界檢測方法,但輸入圖像的質(zhì)量和數(shù)量對結(jié)果影響較大. 這些方法采用傳統(tǒng)的圖像處理技術(shù)對晶粒進行分割,但是陶瓷晶粒SEM 圖像中的晶粒內(nèi)部灰度不均勻,晶粒大小不一致且形狀不規(guī)則,分割準確性并不高且無法區(qū)分不同的晶粒類型.
受到卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)[10]在醫(yī)學圖像分割[11]、遙感圖像分割[12]中的應(yīng)用的啟發(fā),Jiang F 等[13]提出了一種基于神經(jīng)網(wǎng)絡(luò)和模糊聚類算法的砂巖晶粒分割方法;Boyuan 等[14]提出了一種改進的U-Net[11]神經(jīng)網(wǎng)絡(luò)架構(gòu)和加權(quán)損失函數(shù),提高了晶粒邊界檢測結(jié)果且適用于多晶材料分割;雷濤等人[4]將富卷積特征網(wǎng)絡(luò)[15]與分水嶺算法結(jié)合實現(xiàn)了較準確的晶粒分割,但圖像質(zhì)量對分割結(jié)果影響較大. 這些方法在設(shè)計CNN 模型時,需要進行大量的參數(shù)調(diào)優(yōu)(如調(diào)整CNN 的網(wǎng)絡(luò)層數(shù)、拓撲結(jié)構(gòu)和每層的卷積核大小、數(shù)量等).
神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索(Neural Architecture Search,NAS)[16]促進了CNN 架構(gòu)設(shè)計的自動化. 該方法能針對分割任務(wù)自動構(gòu)建高性能的CNN 架構(gòu)[17,18]. NAS 的關(guān)鍵過程包括搜索空間定義,制定搜索策略和性能評估策略[19]. 搜索策略定義了使用怎樣的算法可以快速準確地找到最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)配置,如基于強化學習[20,21]和進化算法[22]搜索最優(yōu)架構(gòu). 性能評估策略定義了如何評估候選結(jié)構(gòu)的性能以更高效地找到最佳網(wǎng)絡(luò)架構(gòu),如網(wǎng)絡(luò)映射[23]等.
搜索空間用于定義可搜索的網(wǎng)絡(luò)結(jié)構(gòu)[19],最終產(chǎn)生的網(wǎng)絡(luò)體系結(jié)構(gòu)的性能與搜索空間的定義密切相關(guān). 早期NAS 的搜索空間采用鏈式結(jié)構(gòu)[24],每一層的輸出作為下一層的輸入. 受到ResNet[25]中跳躍連接的啟發(fā),多分支結(jié)構(gòu)被提出以增加網(wǎng)絡(luò)連接的多樣性和融合不同尺度的特征.NAS 可以直接搜索整個網(wǎng)絡(luò),但這種方式往往需要耗費巨大的計算資源[16]. 為了提高搜索效率,NAS 可以先搜索有效且可重復(fù)的子網(wǎng)絡(luò)結(jié)構(gòu)(如Cell 或Block),再堆疊最佳Cell 或Block 構(gòu)成整體的CNN[26,27]. 目前,基于NAS 自動構(gòu)建的CNN 在基礎(chǔ)圖像分類性能指標上已經(jīng)超過人工設(shè)計的CNN[21,27].
在陶瓷晶粒分割這樣的圖像分割任務(wù)中,由于晶粒的特征提取與空間定位是兩種不同的任務(wù),無法將圖像分類的CNN方法直接遷移至圖像分割. 基于編碼-解碼神經(jīng)網(wǎng)絡(luò)架構(gòu)(Encoding and Decoding Neural Architecture,EDNA)的CNN 考慮到了圖像分割的特殊性,例如具有對稱編碼-解碼結(jié)構(gòu)的U-Net[11]將深層語義特征與細粒度淺層信息融合,生成更準確的分割圖像;使用多層轉(zhuǎn)置卷積網(wǎng)絡(luò)改善解碼器的DeconvNet[28]能更好的確定目標的粗略信息和細節(jié)信息;SegNet[29]在編碼階段保留池化操作的空間位置信息,即池化索引(Pooling indices),然后在解碼階段利用Pooling indices恢復(fù)更加準確的目標位置. 這些手工設(shè)計的圖像分割神經(jīng)網(wǎng)絡(luò)為基于NAS的圖像分割模型提供了一定的神經(jīng)網(wǎng)絡(luò)架構(gòu)基礎(chǔ).
為了提高CNN 設(shè)計的自動化程度并進一步提高陶瓷晶粒圖像分割的準確性,一種改進的基于編碼-解碼神經(jīng)網(wǎng)絡(luò)架構(gòu)的NAS 方法被提出. 本文的主要貢獻如下:
(1)提出了一種針對陶瓷晶粒分割的NAS方法. 該方法基于EDNA定義搜索空間,將搜索空間分為編碼空間和解碼空間并且同時進行搜索. 其中,編碼空間采用融合深層和淺層特征的多分支式結(jié)構(gòu),解碼空間則采用精細捕獲特征映射的簡單鏈式結(jié)構(gòu). 然后,將搜索到的最佳Cell堆疊形成EDNA的CNN并應(yīng)用于陶瓷晶粒分割. 我們將其命名為編碼解碼-神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索(Encoding and Decoding-Neural Architecture Search,ED-NAS).
(2)構(gòu)建了一個陶瓷晶粒數(shù)據(jù)集,并且ED-NAS 方法在該數(shù)據(jù)集上與一些人工設(shè)計的SOTA 圖像分割方法相比能夠?qū)崿F(xiàn)更好的CNN 架構(gòu)設(shè)計效率和具有競爭力的模型評估精度.
該方法主要包括三個步驟:搜索空間定義,搜索最佳Cell 和Cell 堆疊與測試(如圖2 所示). 首先,為了能夠更好地在圖像分割任務(wù)中融合多尺度信息并恢復(fù)空間信息,基于EDNA 定義搜索空間,其中編碼Cell(Encoding cell,E-cell)采用多分支結(jié)構(gòu),解碼Cell(Decoding cell,D-cell)采用鏈式結(jié)構(gòu);然后,采用強化學習[30]方法分別搜索最佳的E-cell和D-cell;最后,將搜索到的最佳Cell 堆疊起來形成EDNA 的CNN,進行陶瓷晶粒分割測試.
圖2 ED-NAS方法總體流程圖
基于EDNA 的CNN 主要由編碼器和解碼器組成,編碼器提取不同尺度的圖像特征,解碼器將編碼器中的抽象特征恢復(fù)為原始圖像大小并逐步修復(fù)圖像細節(jié),實現(xiàn)像素級分類. 受到U-Net[11]、SegNet[29]等的啟發(fā),ED-NAS的候選網(wǎng)絡(luò)也采用了EDNA.
首先,多尺度信息的充分融合對分割準確性有較大的影響[31]. 為了充分提取到圖像的多尺度特征,可采用具有跳躍連接的多分支結(jié)構(gòu)[25]. 因此,在NAS中搜索具有多分支結(jié)構(gòu)的子網(wǎng)絡(luò)作為E-cell.
解碼器主要捕獲特征映射中的多尺度信息并分層逐級實現(xiàn)每個像素的類別標注[11],因此,在解碼階段,預(yù)期使用簡單的鏈式結(jié)構(gòu)更好地恢復(fù)空間位置信息.與其它NAS 的搜索空間不同的是,我們的候選網(wǎng)絡(luò)不僅僅使用一種空間結(jié)構(gòu)(只有鏈式結(jié)構(gòu)[16]或者只有多分支結(jié)構(gòu)[17]),而是搜索兩種類型的Cell. 在編碼階段,采用多分支結(jié)構(gòu)的搜索空間,即搜索E-cell;在解碼階段,采用鏈式結(jié)構(gòu)的搜索空間,即搜索D-cell.
一個E-cell 中通常包含多個Block,每個Block 是一個雙分支結(jié)構(gòu),將來自前面Cell的兩個輸入張量映射為一個輸出張量.Block 的輸入和操作的選擇由控制器決定. 如圖3(a)所示,E-cell 中的Block 可以使用一個四元 組 編 碼{I1,OP1,I2,OP2}表 示,其 中I1,I2代 表 一 個Block 的兩個分支輸入;OP1,OP2∈O代表Block 兩個分支的操作,O代表候選操作集合.
圖3 Cell空間的表示
一個D-cell 中也包含多個Block,但一個Block 僅接受來自前面一個Cell 的輸入,呈鏈式結(jié)構(gòu)(如圖3(b)所示). D-cell 中的Block 使用二元組編碼{I1,OP1}表示,其中I1代表Block的輸入,OP1∈O代表Block的操作.
候選操作除了使用普通卷積(conv)之外,還包括能夠降低參數(shù)數(shù)量和運算成本的深度可分離卷積(depthwise separable convolution,dw conv)以及能夠增大感受野的空洞卷積(dilated convolution,dl conv)以及最大池化操作(如表1所示).
表1 候選操作集合
采用與ENAS[30]中相似的搜索策略搜索最佳E-cell和D-cell. 首先,基于循環(huán)神經(jīng)網(wǎng)絡(luò)[32]的控制器包含兩個采樣器,分別對四元組編碼的E-cell和二元組編碼的D-cell 同時進行采樣. 1 個E-cell 四元組編碼對應(yīng)1 個Block,包含2 個操作碼(見表1),1 個D-cell 二元組編碼僅包含1 個操作碼. 控制器采樣N個Block 編碼構(gòu)建1個E-cell 或D-cell,通過堆疊多個E-cell 和D-cell 構(gòu)建基于EDNA的候選網(wǎng)絡(luò),使用隨機梯度下降算法來進行訓(xùn)練,并在驗證集上進行驗證. 根據(jù)候選網(wǎng)絡(luò)的分割精度(Mean Intersection over Union,mIoU),采用基于策略梯度[33]的強化學習算法更新控制器的參數(shù)(如候選操作的采樣概率等). 之后,進行新一輪的采樣,直到獲得最優(yōu)分割準確性的候選網(wǎng)絡(luò).
將搜索到的最佳E-cell和D-cell堆疊起來構(gòu)建用于陶瓷晶粒分割的CNN. 如圖4 所示,我們分別堆疊L個E-cell 和D-cell 構(gòu)建基于EDNA 的神經(jīng)網(wǎng)絡(luò). 為了不在搜索時引入更大的參數(shù)量,我們將下采樣(Max-pooling)操作固定在每個E-cell 后面,上采樣(Upsampling)操作固定在每個D-cell 前面. 為了保留編碼階段的空間位置信息,在解碼階段的上采樣中融合池化索引[29]來恢復(fù)目標的空間位置,即將解碼器生成的特征映射與池化索引相融合生成更準確的分割圖像. 在神經(jīng)網(wǎng)絡(luò)的最后使用Softmax對最后一個解碼器產(chǎn)生的高維特征映射進行類別轉(zhuǎn)換得到最終的分割結(jié)果.
圖4 堆疊Cell 構(gòu)建基于EDNA 的神經(jīng)網(wǎng)絡(luò)(編碼器采用多個E-cell 堆疊構(gòu)成,解碼器采用相同數(shù)量的D-cell 堆疊構(gòu)成,每個E-cell 緊跟一個Maxpooling層,并且將Pooling indices復(fù)制給解碼器對應(yīng)的D-cell供其使用)
實驗采用PyTorch 1.4.0 實現(xiàn),系統(tǒng)環(huán)境為Win10,
CPU Intel i7,DDR4 RAM 16 GB,GPU GTX1070 Ti 8 GB.
實驗包括搜索和測試兩個階段. 在搜索階段,分別對比了不同Block 數(shù)量(N)的候選網(wǎng)絡(luò)分割準確性,以確定最佳Cell 包含的Block 數(shù)量;進一步,對比了D-cell 采用多分支和鏈式結(jié)構(gòu)的候選網(wǎng)絡(luò)分割準確性,以驗證Dcell 的鏈式結(jié)構(gòu)的優(yōu)越性. 在測試階段,采用搜索到的最佳Cell 構(gòu)造基于EDNA 的神經(jīng)網(wǎng)絡(luò),對比了不同Cell堆疊個數(shù)(L)的神經(jīng)網(wǎng)絡(luò)分割準確性,并與ERFNet[34]、U-Net[11]、ENet[35]、FCN-16[12]、DeepLabv3[36]和SegNet[29]等6種SOTA方法進行了比較.
陶瓷晶粒圖像采用日立S-4800 冷場發(fā)射掃描電子顯微鏡拍攝,采集的圖像分辨率從1 280×960 像素到2 560×1 920像素,如圖5左側(cè)所示.
采集的SEM 圖像主要包括板條狀和圓柱狀2 種形態(tài)的陶瓷晶粒. 由于單張圖像中晶粒數(shù)目較多,若直接在原始圖像中標記,那么一個樣本需要手工標記幾十個同類型的晶粒,工作量很大. 為了提高手工標記的效率和減少同一樣本中同類型對象的重復(fù)標記,采用隨機選擇裁剪區(qū)域的方式,且控制一個區(qū)域內(nèi)的晶體數(shù)量為2~3 個. 這樣做還能增加樣本數(shù)量的規(guī)模,減少單個樣本的數(shù)據(jù)量,有利于后續(xù)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練. 裁剪后的圖像如圖5 右側(cè)所示,其中3 張裁剪后的圖像樣本都包含完整的板條狀和圓柱狀晶粒,每個樣本包含的晶??倲?shù)為2~3.
圖5 原始圖像(左側(cè))和裁剪后的圖像(右側(cè))
接下來,使用js-segment-annotator-master 對圖像樣本進行標注(https://github.com/kyamagu/js-segment-annotator). 板條狀晶粒區(qū)域標記為1,圓柱狀晶粒區(qū)域標記為2,其他區(qū)域(背景)標注為0. 圖6展示了可視化后的標注結(jié)果示例. 標注后的數(shù)據(jù)集包含629 個圖像樣本和對應(yīng)的標注結(jié)果(Ground Truth,GT). 該數(shù)據(jù)集進一步按照7:1:2的比例被隨機劃分為訓(xùn)練集、驗證集和測試集. 表2顯示了數(shù)據(jù)集的數(shù)量分布及類別標簽.
圖6 可視化后的標注結(jié)果示例
表2 數(shù)據(jù)集數(shù)量分布及標簽
在搜索階段,控制器的學習率為0.003 5,訓(xùn)練epochs 為50,優(yōu)化算法采用Adam;候選神經(jīng)網(wǎng)絡(luò)使用SGD 進行訓(xùn)練,batch size 為1,epochs 為300,學習率為0.05(指數(shù)型衰減),其它參數(shù)與ENAS[30]相同. 在測試階段,堆疊的神經(jīng)網(wǎng)絡(luò)采用Adam 進行訓(xùn)練,batch size為2,學習率為0.000 04,共訓(xùn)練150 個epochs. 搜索階段采用訓(xùn)練集進行訓(xùn)練,采用驗證集評估候選網(wǎng)絡(luò)分割準確性. 測試階段同樣采用訓(xùn)練集進行訓(xùn)練,采用測試集評估搜索到的神經(jīng)網(wǎng)絡(luò). 評估指標均采用mIoU.
首先,對比在不同N值下,D-cell 采用鏈式結(jié)構(gòu)或多分支結(jié)構(gòu)時候選網(wǎng)絡(luò)分割準確性. 分別設(shè)置N=3,4,對應(yīng)的L=4,3(保證在不同N值下候選網(wǎng)絡(luò)的Block 總數(shù)相當),D-cell 分別采用鏈式和多分支結(jié)構(gòu),多分支結(jié)構(gòu)D-cell 的編碼形式與E-cell 相同.N=3,4 時搜索到的最佳Cell分別命名為Best-cellN=3和Best-cellN=4.
表3列舉了這4種候選網(wǎng)絡(luò)的最佳驗證準確性. 由表3 可知,當N=4,L=3,D-cell 采用提出的鏈式結(jié)構(gòu)時,mIoU 最高(56.6%). 當N,L值相同,D-cell 采用鏈式結(jié)構(gòu)時均比多分支結(jié)構(gòu)更高. 在相同的Block 總數(shù)條件下,N=4比N=3時更高.
表3 候選網(wǎng)絡(luò)最佳驗證準確性比較
這4 種候選網(wǎng)絡(luò)的最佳Cell 結(jié)構(gòu)分別如圖7、圖8所示. 圖7 展示了D-cell 采用鏈式結(jié)構(gòu)時Best-cellN=3和Best-cellN=4的 結(jié) 構(gòu),Best-cellN=4的E-cell 和D-cell 均 多1個Block,D-cell 的一個Block 的輸入僅來自前一個Block 的輸出,結(jié)構(gòu)相對簡單;N=4 時,連接和操作的更多選擇使結(jié)構(gòu)更豐富的E-cell 能夠捕獲更全面的特征映射,對應(yīng)的D-cell 恢復(fù)更精細的特征信息,由表3 可知,其對應(yīng)候選網(wǎng)絡(luò)獲得了更好的準確性. 圖8 展示了D-cell 采用多分支式結(jié)構(gòu)時Best-cellN=3和Best-cellN=4的結(jié)構(gòu),與圖7 相比,其D-cell 與E-cell 均采用多分支結(jié)構(gòu),綜合表3 分析,具有較為復(fù)雜的多分支結(jié)構(gòu)D-cell候選網(wǎng)絡(luò)獲得的分割精度比鏈式結(jié)構(gòu)的更低. 搜索多分支結(jié)構(gòu)最佳Cell 約耗費87 GPU-時,遠高于搜索簡單鏈式結(jié)構(gòu)最佳Cell(約61 GPU-時).
圖7 D-cell采用鏈式結(jié)構(gòu),不同N值時的最佳Cell結(jié)構(gòu)
圖8 D-cell采用多分支結(jié)構(gòu),不同N值時的最佳Cell結(jié)構(gòu)
因此,將采用多分支結(jié)構(gòu)E-cell 和鏈式結(jié)構(gòu)D-Cell的EDNA神經(jīng)網(wǎng)絡(luò)在陶瓷晶粒數(shù)據(jù)集上進行測試.
測試階段,堆疊更深的神經(jīng)網(wǎng)絡(luò)以獲得最佳的分割準確性. 測試時,分別設(shè)置L=3,4,5,6 并采用圖7 中兩種最佳Cell(Best-cellN=3,Best-cellN=4)進行堆疊實驗.
圖9 展示了兩種最佳Cell 在不同L值時構(gòu)建的EDNA 神經(jīng)網(wǎng)絡(luò)在陶瓷晶粒測試集上的分割準確性比較.總體來看,L從3 增加為5 時,mIoU 隨著L的增大而增加,但當L繼續(xù)增大到6 時,mIoU 均有所下降. 當L=3時,Best-cellN=3和Best-cellN=4構(gòu)建的神經(jīng)網(wǎng)絡(luò)分割準確性很接近(mIoU≈0.5);當L增加至4,5 和6 時,BestcellN=4的分割準確性均比Best-cellN=3高. 當L=5,N=4時,獲得最優(yōu)的分割準確性,該神經(jīng)網(wǎng)絡(luò)將被選擇在陶瓷晶粒數(shù)據(jù)集上進行測試并與其它方法進行比較.
圖9 不同N值下堆疊L個最佳Cell的EDNA神經(jīng)網(wǎng)絡(luò)的準確性比較
表4展示了ED-NAS、ERFNet[34]、U-Net[11]、ENet[35]、FCN-16[12]、DeepLabv3[36]和SegNet[29]在陶瓷晶粒數(shù)據(jù)集上的分割準確性比較. 由表4 可見,ED-NAS 的分割準確性最高(mIoU=68.9%). SegNet 略低于ED-NAS 分割準確性(mIoU=68.0%),它和ED-NAS 均采用了EDNA和Pooling indices,但ED-NAS 中的E-cell 使用跳躍連接融合了淺層和深層特征,特征提取更加豐富精細,從而整體分割準確性比SegNet 更好. 雖然采用EDNA 的UNet 在邊界信息模糊的醫(yī)學圖像中表現(xiàn)出色,但在陶瓷晶粒圖像分割中其mIoU 約為47.7%. 采用級聯(lián)模塊和金字塔池化框架的DeepLabv3 能夠擴大感受野提取多尺度信息,但與ED-NAS 相比,對晶粒分割的整體準確性仍有欠缺.ERFNet和ENet的體系結(jié)構(gòu)在神經(jīng)網(wǎng)絡(luò)深度或者寬度方面均有所欠缺,導(dǎo)致網(wǎng)絡(luò)性能不高,其mIoU也都低于50%.
表4 不同方法在陶瓷晶粒數(shù)據(jù)集上的分割準確性
圖10 展示了ED-NAS 和其它幾種方法在陶瓷晶粒上分割結(jié)果的示例. 第1 列為原始圖像,第2 列為GT,隨后幾列為各種方法的分割結(jié)果. RFNet、U-Net 和FCN-16 的分割結(jié)果與GT 有很大偏差;ENet 和Deep-Labv3 對有些圖像的預(yù)測結(jié)果有較高的準確度,但對只有一種晶粒類別圖像的預(yù)測有較大偏差;SegNet 的結(jié)果相對比較準確,但在有些圖像的邊界像素點的預(yù)測上仍存在一定誤差,而ED-NAS在一定程度上消除了這種誤差,取得了更好的分割準確性.
圖10 幾種方法在陶瓷晶粒數(shù)據(jù)集上的分割結(jié)果示例
本文提出了一種基于NAS的陶瓷晶粒SEM 圖像分割方法. 該方法能夠根據(jù)陶瓷晶粒數(shù)據(jù)集,自動搜索多分支結(jié)構(gòu)的E-cell 和鏈式結(jié)構(gòu)的D-cell,并采用堆疊方式構(gòu)建基于EDNA 的神經(jīng)網(wǎng)絡(luò)取得了較高的分割準確度. 此外,該方法在實驗結(jié)果上表明多分支結(jié)構(gòu)E-cell和鏈式結(jié)構(gòu)D-Cell 的候選網(wǎng)絡(luò)準確度更高于多分支結(jié)構(gòu)的E-cell 和D-cell 候選網(wǎng)絡(luò). 所提出的方法能夠為陶瓷晶粒數(shù)據(jù)集自動設(shè)計有效的CNN 模型,與先進的手工設(shè)計的神經(jīng)網(wǎng)絡(luò)相比,表現(xiàn)出了具有競爭力的結(jié)果.為進一步提高陶瓷晶粒分割準確率,下一步研究將考慮添加能夠捕獲更多上下文信息的操作模塊(如注意力模塊)來改善搜索空間,并改進搜索策略以獲得更好分割性能的神經(jīng)網(wǎng)絡(luò)架構(gòu).