張懿,黃江蘭,田立勤,欒尚敏
(華北科技學(xué)院,計(jì)算機(jī)學(xué)院,三河 101601)
1955年,John McCarthy與Marvin Lee Minsky以及Claude Elwood Shannon一同作為發(fā)起者,在達(dá)特茅斯學(xué)院邀請眾多專家學(xué)者開會共同研討人工智能,在會議上正式確立人工智能(Artificial Intelligence)為一專業(yè)術(shù)語,開始了人工智能學(xué)術(shù)角度的專精研究。達(dá)特茅斯會議是人工智能誕生的標(biāo)志性事件[1],奠定了人工智能快速發(fā)展的基調(diào),而發(fā)展至今的深度學(xué)習(xí)、識別技術(shù)在城市應(yīng)急管理領(lǐng)域的研究,對于分析事故,改善城市安全具有重要意義。
機(jī)器學(xué)習(xí)是指可以提供計(jì)算機(jī)能力而無需顯式編程的研究領(lǐng)域。Tom Mitchell定義機(jī)器學(xué)習(xí)為:對于某類給定的任務(wù)T和合理的性能度量P,如果某計(jì)算機(jī)程序在T上以P衡量的性能隨著經(jīng)驗(yàn)E而自我完善,性能逐步提高,則稱該計(jì)算機(jī)程序從經(jīng)驗(yàn)E學(xué)習(xí)[2]。機(jī)器學(xué)主要解決的是聚類、分類、預(yù)測和降維四類問題,可分類為有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、深度學(xué)習(xí)等。在應(yīng)急管理領(lǐng)域使用機(jī)器學(xué)習(xí)技術(shù)對于數(shù)據(jù)的訓(xùn)練處理是非常重要的。
監(jiān)督學(xué)習(xí)是指用有標(biāo)簽的數(shù)據(jù)集來預(yù)測新數(shù)據(jù)的值或類型,主要進(jìn)行模型的預(yù)測泛化處理。若預(yù)測的是離散數(shù)值,該類學(xué)習(xí)稱為分類。預(yù)測的是連續(xù)數(shù)值,則該類學(xué)習(xí)稱為回歸。
分類是利用實(shí)際模型來預(yù)測屬性和標(biāo)簽未知的對象類別的一種描述尋找和分類數(shù)據(jù)類型以及概念的過程,分類可以達(dá)到利用模型預(yù)測不知道的對象的目的。若涉及兩個類別,稱為二分類(binary classification)任務(wù),若涉及多個類別,稱為多分類任務(wù)(multi-class classification),例如事故多責(zé)任判定,文件分類判定技術(shù)等[3]。
(1)
線性回歸的一般形式為:
Y=β0+β1X1+β2X2+β3X3+…+βpXp+ε
(2)
其中ε~N(0,σ2),β0~βp為未知參數(shù),全部建模殘差平方之和ε應(yīng)盡量達(dá)到最小,并且用1進(jìn)行殘差平方之和的偏執(zhí)擬合。對β0~βp求偏導(dǎo)并等于0,得到正規(guī)方程:
XTXβ=XTY
(3)
=(XTX)-1XTY
(4)
找到最小的β,就可以擬合構(gòu)造直線找到數(shù)據(jù)的關(guān)系。但是在實(shí)際問題中常常會有X的屬性個數(shù)大于樣本個數(shù)的情況,即XTX不是滿秩矩陣或者正定矩陣,則會得到多個,且都能使誤差平方和達(dá)到最小化,選擇哪個解作為輸出,將由學(xué)習(xí)算法的歸納偏好決定。常見的做法是引入正則化項(xiàng),如嶺回歸等。
邏輯回歸是在線性回歸的求解結(jié)果上添加輸入值為z的Sigmoid函數(shù):
(5)
其中:
z=ω0x0+ω1x1+ω2x2+…+ωnxn(6)
Sigmoid函數(shù)圖像類似階躍函數(shù),目的是將數(shù)值結(jié)果轉(zhuǎn)化成0到1之間的概率來實(shí)現(xiàn)Logistic回歸,計(jì)算回歸系數(shù)和特征值的乘積并且求和,最后把結(jié)果代到Sigmoid激活,可以得出一個范圍在0~1之間的數(shù)值,可畫出一條分類線。大于0.5的數(shù)據(jù)被映射為1,小于0.5的數(shù)據(jù)則被映射為0。[5]從而輸出離散的分類。屬于監(jiān)督學(xué)習(xí)的常見模型有線性分類器、SVM等。監(jiān)督學(xué)習(xí)算法有:K-近鄰算法(K-Nearest Neighbors,KNN)[6]、決策樹(Decision Trees)[7]、樸素貝葉斯(Naive Bayes)[8]等。
無監(jiān)督學(xué)習(xí)是指用完全無標(biāo)簽的數(shù)據(jù)集來預(yù)測新數(shù)據(jù)的值或類型,假設(shè)數(shù)據(jù)空間中相似樣本一般距離較近來將樣本進(jìn)行分類。在無監(jiān)督學(xué)習(xí)中,關(guān)聯(lián)分析、聚類問題和維度減少是三種重要問題。關(guān)聯(lián)分析指發(fā)現(xiàn)不同事物同時出現(xiàn)的概率,廣泛應(yīng)用于購物籃問題。[9]聚類分析是指將訓(xùn)練數(shù)據(jù)集里的數(shù)據(jù)分成很多個小組,每個小組形成一個“簇”(cluster),預(yù)先并不設(shè)置類別,訓(xùn)練數(shù)據(jù)無標(biāo)簽,目的是聚合相似的數(shù)據(jù),但是不探討數(shù)據(jù)小組的具體內(nèi)容,最后根據(jù)結(jié)果差別得出信息。維度約減是指在減少數(shù)據(jù)維度的同時又不損失有意義的信息,可以利用特征提取法和特征選擇法來實(shí)現(xiàn),特征選擇法是選擇原始變量的子集,而特征提取法是把數(shù)據(jù)從高維度向低維度進(jìn)行轉(zhuǎn)換。
深度學(xué)習(xí)(Deep Learning)概念源于M-P模型[10]與Hopfield神經(jīng)網(wǎng)絡(luò)[11]。人工神經(jīng)網(wǎng)絡(luò)(ANN)代表著一種自上而下的思路,類似于生物大腦神經(jīng)元的作業(yè)機(jī)理與運(yùn)行機(jī)制,每個神經(jīng)元通過特定的激勵函數(shù),處理并計(jì)算來自另外的神經(jīng)元傳入信號,信號輸入到輸入層,經(jīng)由隱層處理,再到達(dá)輸出層,這一過程達(dá)到了分層學(xué)習(xí)的目的。深度學(xué)習(xí)模型是一些幾何函數(shù)一個個地作用在數(shù)據(jù)上參與運(yùn)算,這些運(yùn)算被組織成為層,層進(jìn)行堆疊則形成圖。
圖1 一個深度學(xué)習(xí)結(jié)構(gòu)圖
圖中圓代表一個神經(jīng)節(jié)點(diǎn),相鄰的層節(jié)點(diǎn)之間彼此有鏈接,同層或越層節(jié)點(diǎn)彼此之間無連接。Layer1為一個輸入層,最終計(jì)算出來的H函數(shù)即預(yù)測值的層為輸出層,中間的層為負(fù)責(zé)數(shù)據(jù)變換的隱層,每一條直線代表了該節(jié)點(diǎn)到下一節(jié)點(diǎn)的權(quán)重,而且會存在偏置b,權(quán)重(weight)是在訓(xùn)練過程中需要學(xué)習(xí)的參數(shù),其中保存著模型的知識,權(quán)重把這些層進(jìn)行參數(shù)化,得出預(yù)測值后,用損失函數(shù)即真實(shí)值和預(yù)測值的誤差最小化來衡量網(wǎng)絡(luò)準(zhǔn)確性,為這些權(quán)重找到合適值即深度學(xué)習(xí)。
在《懸崖上的愛》中,野生動物研究專家方東升是個一出場就自帶光環(huán)的人物,他常年在野外考察,在研究領(lǐng)域獲獎無數(shù),深受包括岳西在內(nèi)的學(xué)生敬仰和崇拜。但讓方東升在野生動物研究這條路上抵達(dá)巔峰的,卻是多年前的一場婚姻危機(jī)給他帶來的性命威脅。方東升最初在事業(yè)上的成功吸引了許多女性,一時間女人的肉體成了是他獵物①,讓他充分享受到征服的快感。
從輸入層通過隱層到輸出層的運(yùn)動為正向傳播。相應(yīng)的,建立神經(jīng)網(wǎng)絡(luò)時,會出現(xiàn)初始的權(quán)重與誤差,迭代一次后,該誤差與成本函數(shù)梯度在外層通過隱層返回,可減少錯誤,此時網(wǎng)絡(luò)的權(quán)重會被更新,即為誤差反向傳播。深度學(xué)習(xí)是學(xué)習(xí)樣本數(shù)據(jù)的表示層次與內(nèi)在規(guī)律[12],是多層的神經(jīng)網(wǎng)絡(luò)模型且層和層之間的聯(lián)系更為復(fù)雜,通過分層提取信息進(jìn)行學(xué)習(xí),達(dá)到了高效的目的。深度學(xué)習(xí)主要涵蓋四個發(fā)展路徑。分別是卷積神經(jīng)網(wǎng)絡(luò)(CNN)[13]、生成網(wǎng)絡(luò)[14]、序列模型[15]、增強(qiáng)學(xué)習(xí)[16]。
在人工智能以及大數(shù)據(jù)的新技術(shù)思維背景之下,通過應(yīng)急管理部和各級政府的數(shù)字化轉(zhuǎn)型,事后完善恢復(fù)系統(tǒng)也愈發(fā)成熟。發(fā)展迅速且火熱的深度學(xué)習(xí)技術(shù)通過訓(xùn)練數(shù)據(jù)、提高算法和建模精度使得事故的善后恢復(fù)和預(yù)防大大提高了效果,規(guī)模龐大且有效的數(shù)據(jù)是深度學(xué)習(xí)技術(shù)得以提高的重要來源,對于各類突發(fā)事件各環(huán)節(jié)的數(shù)據(jù)進(jìn)行訓(xùn)練,可以為事前預(yù)防系統(tǒng)提供更加準(zhǔn)確的分析處理能力,利用建模來可視化數(shù)據(jù),做到更加智能的預(yù)防,從而提高智慧城市應(yīng)急管理系統(tǒng)的響應(yīng)能力。
數(shù)據(jù)挖掘(Data Mining)是一種涉及統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫技術(shù)以及機(jī)器學(xué)習(xí)的綜合性技術(shù)。主要分為預(yù)測性數(shù)據(jù)挖掘和描述性數(shù)據(jù)挖掘兩類[17]。
應(yīng)急管理信息大數(shù)據(jù)系統(tǒng)的構(gòu)建是至關(guān)重要的,在事發(fā)響應(yīng)、事中處理的過程中,由于各種突發(fā)事故所處的具體條件和環(huán)境不相同,各個時間段的特殊形勢、規(guī)模、性質(zhì)和后果不同,受到事故影響的人民群眾情況不同,因此事中處理的步驟程序也各有不同。人工智能在事中處理系統(tǒng)中的應(yīng)用,主要體現(xiàn)在良好控制的環(huán)節(jié)當(dāng)中,其中最重要的是社會輿論。社會輿論是突發(fā)事件發(fā)生后在社會上流傳最快的消息之一,一般分為正向輿論和負(fù)面輿論。正向輿論可以對事故的處理起到激勵作用,消解人民對于事故發(fā)生后的恐慌情緒,但負(fù)面的輿論以及謠言往往會引起人們的恐慌和反社會情緒,從而嚴(yán)重?cái)_亂社會秩序,間接地影響事故的處理與社會恢復(fù)。
表1中列出十大經(jīng)典數(shù)據(jù)挖掘算法(Top 10 data mining algorithms)[18]。
表1 十大數(shù)據(jù)挖掘算法
為了控制負(fù)面輿論,數(shù)據(jù)挖掘技術(shù)會作為合理的處理手段運(yùn)用到各種社交網(wǎng)絡(luò)和各大網(wǎng)絡(luò)平臺中,根據(jù)相關(guān)關(guān)鍵詞對或?qū)⒃斐韶?fù)面輿論的言語或謠言進(jìn)行自動捕捉和刪除,將嚴(yán)重危害社會穩(wěn)定的散播謠言人員的網(wǎng)絡(luò)IP捕獲,避免負(fù)面信息的滋生,從而起到控制事態(tài)的作用。
語音識別是一種使機(jī)器識別并且理解人類語音輸入信號含義的一種模式識別技術(shù),該技術(shù)旨在將語音轉(zhuǎn)換為命令編碼或者字符文本,設(shè)計(jì)一定的程序使計(jì)算機(jī)明白人類講話的語義并進(jìn)行合理判斷。
圖2 語音識別流程圖
首先對采集的非平穩(wěn)語音信號進(jìn)行預(yù)處理,過濾掉無用信息及其背景噪聲,然后運(yùn)用特定方法計(jì)算語音聲學(xué)參數(shù)來提取相應(yīng)的特征參數(shù),再模式識別提取到的參數(shù)。其中包含兩階段:第一階段是訓(xùn)練,即提取語音樣本的特征參數(shù)作為訓(xùn)練數(shù)據(jù),設(shè)置模型參數(shù)初始值時要相對合理,使識別系統(tǒng)的識別效果達(dá)到最好;之后進(jìn)行識別,把要識別的語音信號特征依據(jù)特定規(guī)則進(jìn)行對照處理,最終利用模式識別算法得出需要的結(jié)果。特征參數(shù)的選擇決定了識別結(jié)果的準(zhǔn)確度與模板庫是否準(zhǔn)確、模型參數(shù)的優(yōu)劣。
隱馬爾可夫模型(HMM)理論假設(shè)時間序列系統(tǒng)是由一系列隱狀態(tài)構(gòu)成,不同的隱狀態(tài)之間的轉(zhuǎn)換是系統(tǒng)運(yùn)行的本質(zhì),來觀察并分析語音基礎(chǔ)時間序列[26]。
顯式馬爾可夫模型可看作一個以一定概率自動轉(zhuǎn)換狀態(tài)的過程,具有無后效性的特性即:
P(pt=Si|pt-1=Sj,pt-2=Sk,……)=P(pt=Si|pt-1=Sj)
(7)
其中t>1,Sk為一時刻的任意狀態(tài)。還具有齊次性的特點(diǎn)即:
P(pt=Si|pt-1=Sj)=P(pu=Si|pu-1=Sj)
(8)
其中u為任意時刻,說明狀態(tài)轉(zhuǎn)移概率與時間無關(guān)。而隱馬爾可夫模型則是雙重隨機(jī)過程,不僅狀態(tài)之間的轉(zhuǎn)移是一個隨機(jī)過程,而且狀態(tài)的輸出也是一個隨機(jī)過程。此外,隱馬爾可夫模型的輸出僅與當(dāng)前狀態(tài)有關(guān),具有輸出獨(dú)立性。
先進(jìn)行時間序列分段,然后根據(jù)時序性與相似性來聚類這些時間序列分段,把每個聚類看作一種隱狀態(tài)從而得出狀態(tài)轉(zhuǎn)移概率矩陣,建立基于分段的初始隱馬爾科夫模型,對隱狀態(tài)下的時間序列分段的分布做出估計(jì),由于隱含因子直接存在轉(zhuǎn)換概率,就可以得到與顯式狀態(tài)之間的輸出概率,再利用迭代法,對初始隱馬爾科夫模型不斷精確直到得出最終模型。文獻(xiàn)[27]最終得出的隱馬爾科夫模型的每一種狀態(tài)都可以和接收到的語音幀一一對應(yīng),現(xiàn)如今傳統(tǒng)的隱馬爾科夫模型廣泛運(yùn)用在時間歸一法,在事故救援與分析成因有廣泛應(yīng)用前景。
計(jì)算機(jī)視覺(Computer Vision,CV)是利用了攝像機(jī)以及電腦替代人眼使得計(jì)算機(jī)擁有人類的雙眼所具有的分割、分類、識別、跟蹤、判別決策等功能。
物體識別和檢測即給定一張輸入圖片,算法能夠自動找出圖片中的常見物體,并將其所屬類別及位置輸出。物體分類與檢測在很多領(lǐng)域有廣泛應(yīng)用,包括安防領(lǐng)域的人臉識別、行人檢測、智能視頻分析、行人跟蹤等,交通領(lǐng)域的交通場景物體識別、車輛計(jì)數(shù)、逆行檢測、車牌檢測,以及互聯(lián)網(wǎng)領(lǐng)域的基于內(nèi)容的圖像檢索、相冊自動歸類等[28]。
在事故預(yù)防過程中,人工智能下的視頻識別技術(shù)得以運(yùn)用,通過視頻資料的讀取和識別,來監(jiān)測并判定其中的內(nèi)容是否符合預(yù)先設(shè)定的報(bào)警條件,如果條件符合則通過傳感器觸發(fā)報(bào)警?;镜膶θ俗R別內(nèi)容有人的舉動、人的面目表情、人的步態(tài)等信息,而對物識別可識別物品缺失,線路故障、區(qū)域變化、滯留監(jiān)測等。運(yùn)用視頻識別,可有效地代替人工的查找和報(bào)告事故隱患,達(dá)到應(yīng)急響應(yīng)智能化的轉(zhuǎn)變。但該技術(shù)仍有許多缺陷,很多理想效果并未完全實(shí)現(xiàn)。
語義分割是將圖片中的物體場景分割出來,是自動駕駛、醫(yī)學(xué)圖像處理、圖像檢索、目標(biāo)分類等視覺分析的基礎(chǔ)。例如,在自動駕駛領(lǐng)域,需要對道路、行人、車輛等復(fù)雜情況進(jìn)行分析,從而才能對汽車發(fā)出操作指令。在對這些物體分析之前,首先需要進(jìn)行語義分割,即將事故道路、行人以及車輛分割出來。在醫(yī)學(xué)圖像處理領(lǐng)域,首先要將病灶區(qū)分割出來,才能對病灶進(jìn)行量化分析[29]。
隨著人工智能發(fā)展日趨成熟,怎樣將不斷涌現(xiàn)的技術(shù)在應(yīng)急管理體系各層次深度融合、綜合應(yīng)用,給城市應(yīng)急管理與安防行業(yè)提出了更高的挑戰(zhàn),尤其是經(jīng)過此次新冠疫情后,突發(fā)衛(wèi)生公共問題會使得人工智能的應(yīng)用領(lǐng)域不斷擴(kuò)展與深入,使損失降到最低,為國家發(fā)展創(chuàng)造更大的價值。