中南民族大學計算機科學學院 龍文漢 藍佳寧 張東偉
隨著中醫(yī)技術(shù)的不斷發(fā)揚與傳承,中草藥作為我國的重要醫(yī)藥材料,中草藥領(lǐng)域的發(fā)展應用一直受到專家學者的重視。目前隨著深度學習技術(shù)的快速發(fā)展,將該技術(shù)結(jié)合各種實際場景,用來解決現(xiàn)實生活中的問題成為當前的一種趨勢。因此,本系統(tǒng)利用深度學習技術(shù),將人工智能技術(shù)與民族中草藥進行結(jié)合,采用最新的圖像識別算法模型,開發(fā)設(shè)計一款基于圖像識別的中草藥查詢鑒別系統(tǒng),解決目前民族中草藥領(lǐng)域識別分類方面存在的問題,并將其應用于實際生活。
中草藥查詢鑒別系統(tǒng)將圍繞中草藥識別模型展開設(shè)計開發(fā),通過移動設(shè)備傳入相關(guān)的中草藥圖像,并搭載在服務(wù)器上的識別模型進行識別,并且將相關(guān)的中草藥信息返回于移動設(shè)備進行展示。該系統(tǒng)主要功能如下:
(1)首頁展示:首頁展示界面應簡潔大方,主要設(shè)置文字搜索查詢、拍照識別查詢、歷史識別查詢?nèi)N功能入口。文字搜索查詢:可以輸入待查詢中草藥的名稱、學名、別名等,同時支持模糊查詢;上傳圖像的識別查詢:用戶可于移動設(shè)備上通過使用攝像頭進行拍照上傳待識別的圖片,或者直接從已經(jīng)存在于相冊中的待識別圖片進行上傳照片并且通過服務(wù)端的網(wǎng)絡(luò)模型進行識別。同時,待識別的照片可以是自然情況下的中草藥植物狀態(tài)照片,也可以是已經(jīng)處理過后的草藥藥材狀態(tài)的照片;歷史識別查詢:用戶識別過的照片會留存查詢記錄,用戶可直接通過記錄再次查詢,避免重復上傳問題。
(2)草藥資料庫:通過上述三種查詢方式可以直接進入到對應草藥的資料庫,直接查詢到相關(guān)草藥的信息,該界面將展示待查詢草藥的詳細資料。具體系統(tǒng)功能組件結(jié)構(gòu)如圖1所示。
圖1 功能組件結(jié)構(gòu)
在軟件系統(tǒng)開發(fā)中,架構(gòu)可以確定整個系統(tǒng)中硬件與軟件之間的銜接以及通信過程。架構(gòu)設(shè)計是為了提高系統(tǒng)的穩(wěn)定性,實現(xiàn)系統(tǒng)在高并發(fā)情況下可穩(wěn)定運行。本中草藥查詢鑒別系統(tǒng)的架構(gòu)為C/S架構(gòu)模式,即客戶端/服務(wù)端模式。其中客戶端主要為用戶的移動應用,服務(wù)端則為部署好的云服務(wù)器。在移動應用端主要負責待查詢草藥的上傳以及搜索結(jié)果的展示功能;服務(wù)器端則實現(xiàn)接受移動設(shè)備上傳輸?shù)奈淖只驁D片,利用網(wǎng)絡(luò)模型的識別結(jié)果在中草藥數(shù)據(jù)庫中進行識別,并且返回移動設(shè)備進行展示。系統(tǒng)框架設(shè)計如圖2所示。
圖2 架構(gòu)設(shè)計圖
在深度學習中減少模型的參數(shù)量一直是學者的研究方向,其中最為著名的是MobileNet-v1、MobileNet-v2等輕量級網(wǎng)絡(luò)。本系統(tǒng)中使用的識別網(wǎng)絡(luò)則采用結(jié)合兩者優(yōu)點的MobileNet-v3。該網(wǎng)絡(luò)主要具有兩個創(chuàng)新點:(1)互補搜索技術(shù)組合:在網(wǎng)絡(luò)結(jié)構(gòu)利用platform-aware NAS與NetAdapt兩種技術(shù),第一個技術(shù)是在計算和參數(shù)量受限的前提下搜索網(wǎng)絡(luò)的各個模塊,即模塊級搜索(Block-wise Search),第二個技術(shù)是對各個模塊確定之后網(wǎng)絡(luò)層的微調(diào)。(2)網(wǎng)絡(luò)結(jié)構(gòu)改進:基于MobileNet-v2網(wǎng)絡(luò)斷部在最后一步有一定的計算量,為了減少計算量將最后的平均池化層前移,同時刪除最后一個卷積層。MobileNet-v3由激勵函數(shù)swish進行數(shù)值近似的h-swish激活函數(shù),如公式(1)所示。
基于以上兩個創(chuàng)新點,MobileNet-v3在精度上優(yōu)于前兩個系列網(wǎng)絡(luò)的同時,在檢測速度上也具有優(yōu)勢。MobileNet-v3網(wǎng)絡(luò)塊結(jié)構(gòu)如圖3所示。
圖3 MobileNet-v3網(wǎng)絡(luò)塊結(jié)構(gòu)
圖4 模型訓練結(jié)果可視化
表1 MobileNet-v3模型性能指標
通過在1.5T機械硬盤,顯卡為NVIDIA Tesla P4,運行顯存為32G,使用GPU加速計算機配置環(huán)境上,使用Python編程語言下搭建Paddle深度學習框架進行訓練。
最終模型訓練結(jié)果如圖4所示,該模型在訓練過程中acc1(正確標簽與預測結(jié)果相同的概率)以及acc5(正確標簽在預測輸出結(jié)果最高5項中的概率)在前期收斂速度較快,并且最終穩(wěn)定與0.9左右。同時loss值則在前期快速收斂,并且最終達到0.027左右。而lr則隨著訓練進度不斷減小,有利于在前期快速達到最優(yōu)解區(qū)間,在后期能逐漸穩(wěn)定于最終解。
最終模型性能結(jié)果如表1所示,該模型在保證94%以上準確率的同時,其預測時間保持在0.3左右。于此同時,經(jīng)過訓練之后獲得的模型體積(網(wǎng)絡(luò)模型中的參數(shù)量)也較小。以上實驗結(jié)果滿足圖像識別領(lǐng)域中快速、準確的要求,因此將該網(wǎng)絡(luò)運用于本中草藥查詢鑒別系統(tǒng)中。
總結(jié):隨著科學和技術(shù)的快速發(fā)展,將深度學習、計算機視覺等新一代信息技術(shù)應用到現(xiàn)實生活中解決實際問題已經(jīng)是不可避免的趨勢。當前形勢下,我國對中草藥醫(yī)學方面采取了積極的發(fā)掘、保護和利用等政策,這促使中草藥領(lǐng)域的事業(yè)有了較快的恢復與發(fā)展。本系統(tǒng)緊隨新時代熱點,將深度學習、圖像識別技術(shù)與移動軟件應用開發(fā)相結(jié)合,將目前高性能模型Mobilenet-v3部署于本中草藥查詢鑒別系統(tǒng)中,并將其作為核心技術(shù)應用到系統(tǒng)實現(xiàn)。經(jīng)過實踐應用,該查詢鑒別系統(tǒng)能在生活中能準確、快速的識別中草藥材,可以幫助人們快速辨認中草藥并且普及中草藥的相關(guān)知識。