黃治 周勁 何葉
摘 要:無人駕駛汽車的測試技術(shù)主要是通過虛擬測試和場地測試的方法來檢測無人駕駛汽車的智能化水平,通過不斷的學(xué)習(xí)和總結(jié)經(jīng)驗(yàn)來提高無人駕駛的安全性, 這種方法耗費(fèi)大量的人力物力以及時(shí)間。為此,從文本的角度出發(fā),利用駕駛行為相關(guān)文本,通過NLP技術(shù)和基于規(guī)則的方法構(gòu)建一個(gè)無人駕駛規(guī)則庫,依據(jù)這個(gè)規(guī)則庫來輔助測試無人駕駛汽車能否滿足道路安全要求。實(shí)驗(yàn)結(jié)果表明,對《中華人民共和國道路交通安全法實(shí)施條例》處理后規(guī)則提取的正確率為 89.85%,駕考題庫文本的正確率為87.33%。
關(guān)鍵詞:駕駛規(guī)則庫;自然語言處理;提取
中圖分類號:TP181????? 文獻(xiàn)標(biāo)識碼:A
Research on Automatic Extraction Method of Driverless Rules
HUANG Zhi1 ,ZHOU Jin1 ,HE Ye2
(1.State Grid Hunan Electric Power Limited Company,Changsha, Hunan 410014,China;
2.China Merchants Bank Network Technology Co. LTD,Shenzhen, Guangdong 518057,China)
Abstract:Nowadays, the test technology of driverless vehicle mainly tests the intelligent level of driverless vehicle by means of virtual test and field test, and improves the safety of driverless vehicle by continuous learning and summarizing experience. This method consumes a lot of manpower, material resources and time. Therefore, from the perspective of text, this paper uses the driving behavior related text, through NLP technology and rule-based method to build an driverless rule base, according to which to help test whether the driverless vehicle can meet the requirements of road safety. The experimental results show that the accuracy rate of rule extraction is 89.85% and the accuracy rate of driving test database text is 87.33%.
Key words:driving rule base; natural language processing;extraction
隨著人工智能的不斷進(jìn)步和在汽車領(lǐng)域的應(yīng)用,汽車的智能水平正逐步提高,無人駕駛汽車的測試方法也在不斷的更新[1]。無人駕駛汽車作為解決智能交通、安全出行的重要方案,保證其不會造成交通事故并能夠避免危險(xiǎn)的發(fā)生是無人駕駛汽車測試的重要目標(biāo)。
從已發(fā)布的無人駕駛汽車的安全性和可靠性評估中,為了測試事故率極低的目標(biāo)汽車,僅道路測試就需要行駛不計(jì)其數(shù)的里程數(shù)[2]。而隨著虛擬現(xiàn)實(shí)技術(shù)的發(fā)展,虛擬測試逐漸成為主流測試方法之一,對不同駕駛情況進(jìn)行仿真,針對仿真結(jié)果來優(yōu)化無人駕駛汽車[3]。一些測試研究人員從傳統(tǒng)軟件測試的角度出發(fā),通過對交通規(guī)則進(jìn)行形式化分析來對無人駕駛車輛行為進(jìn)行驗(yàn)證。如文獻(xiàn)[4]提出一種形式化方式來驗(yàn)證自動車輛安全性。文獻(xiàn)[5]使用基于邏輯的方法,確定無人駕駛車輛在事故中應(yīng)承擔(dān)的責(zé)任。文獻(xiàn)[6]利用線性時(shí)序邏輯(LTL)形式化了部分德國超車交通規(guī)則。目前國內(nèi)對于交通法規(guī)在無人駕駛汽車測試方面的研究主要放在了無人駕駛汽車造成的犯罪和認(rèn)定[7]。而對于交通法規(guī)上的應(yīng)用,研究重點(diǎn)放在了信息的抽取和使用上,如文獻(xiàn)[8]利用NLP技術(shù)構(gòu)建了一個(gè)開源交通信息采集及分析系統(tǒng)來幫助道路的規(guī)劃。
自然語言處理(NLP)相關(guān)的技術(shù)研究不斷創(chuàng)新和發(fā)展,其應(yīng)用也擴(kuò)展到社會的各個(gè)方面。文獻(xiàn)[9]通過Stanford NLP工具包對winemag網(wǎng)站上的7萬多條葡萄酒評論,通過顏色、氣味、城市等關(guān)鍵詞進(jìn)行文本分類處理,從而對葡萄酒進(jìn)行評級。文獻(xiàn)[10]開發(fā)一套自然語言處理工具,用于識別和注釋意大利語文本報(bào)告中的各種考古實(shí)體。文獻(xiàn)[11]利用NLP技術(shù)處理早期的軟件需求,包括實(shí)現(xiàn)劃分需求優(yōu)先級和分類等目標(biāo),并提出了9種建議使用的NLP相關(guān)工具。而隨著深度學(xué)習(xí)的研究并不斷進(jìn)步,人們利用深度學(xué)習(xí)的模型來解決各種NLP問題,并取得了巨大的成功。文獻(xiàn)[12]總結(jié)了產(chǎn)生對抗性文本的最新方法,并提出了一個(gè)分類法來對文本進(jìn)行分類。文獻(xiàn)[13]提出了一個(gè)基于深度學(xué)習(xí)的NLP本體種群系統(tǒng)來填充生物分子網(wǎng)絡(luò)本體,從文本數(shù)據(jù)中識別、提取和分類涉及生物分子網(wǎng)絡(luò)本體概念的新實(shí)例。文獻(xiàn)[14]利用神經(jīng)網(wǎng)絡(luò)在漢語分詞中的應(yīng)用,提出了一種利用高資源語料庫改進(jìn)低資源分詞的轉(zhuǎn)移學(xué)習(xí)方法。文獻(xiàn)[15]對web上大量的醫(yī)學(xué)診斷的相關(guān)信息進(jìn)行提取,開發(fā)了一個(gè)智能系統(tǒng),通過患者對病痛的描述,智能為患者推薦藥物。文獻(xiàn)[16]利用開放式信息抽取模型和詞匯特征以及語義關(guān)系,從哈薩克雙語新聞網(wǎng)站的文本中提取句子中的主謂賓,并以RDF三元組格式表示。
上述文獻(xiàn)研究了無人駕駛汽車的測試方法和自然語言處理的應(yīng)用,但是在國內(nèi)并沒有某項(xiàng)研究是利用交通法規(guī)來生成規(guī)則庫來輔助無人駕駛汽車測試。因此本研究提出一種利用NLP技術(shù)和基于規(guī)則的無人駕駛規(guī)則庫的生成方法。
1 相關(guān)研究
1.1 NLP
自然語言處理技術(shù)服務(wù)于大數(shù)據(jù)的文本處理,它的主要任務(wù)包括分詞和詞性標(biāo)注,對句法、語義、篇章的分析,文本的分類以及自然語言的生成,以及信息的檢索和抽取等等。自然語言處理的基礎(chǔ)流程主要是下面五個(gè)步驟:
1)獲取語料。語料是在實(shí)際生活中使用過的語言材料,語料的集合稱為語料庫。語料庫就是一個(gè)電子文本集合。實(shí)驗(yàn)中的語料庫來源主要有三種:一是公司或者組織積累或者整理的大量紙質(zhì)材料或者電子文檔;二是選擇國內(nèi)外研究人員歸納總結(jié)的開放數(shù)據(jù)集;三是通過爬蟲,在網(wǎng)頁中抓取自己所需要的數(shù)據(jù)。
2)語料預(yù)處理。對語料進(jìn)行預(yù)處理主要包括四個(gè)步驟:語料清洗、分詞、詞性標(biāo)注和去停用詞。語料清洗是將現(xiàn)有語料中,不符合研究內(nèi)容或者視為噪音的部分去除掉;分詞主要是將句子拆分成一個(gè)個(gè)單獨(dú)的詞;詞性標(biāo)注是將每個(gè)詞標(biāo)注上詞性標(biāo)簽,如a、v、p等等;清除停用詞是將文本中一些標(biāo)點(diǎn)符號、語氣詞、助詞等不影響句子語義的詞語去掉,方便之后處理,這一步驟是否需要根據(jù)任務(wù)目標(biāo)來看。
3)特征化,也稱為向量化。主要把字詞表示成向量,這樣可以通過計(jì)算機(jī)計(jì)算向量的偏差來表現(xiàn)不同詞之間的相似性。在這個(gè)階段常用是詞向量和詞袋模型(BOW)這兩種方法。
4)模型訓(xùn)練。在構(gòu)造好特征向量之后,使用不同的機(jī)器學(xué)習(xí)如KNN、K-meand或者深度學(xué)習(xí)模型如CNN、RNN、LSTM來進(jìn)行訓(xùn)練。在實(shí)驗(yàn)主要通過調(diào)節(jié)參數(shù)來提高模型的泛化能力。
5)對模型的效果進(jìn)行評估。主要通過準(zhǔn)確率、召回率和F值等指標(biāo)來衡量模型的好壞。
在駕駛規(guī)則庫提取中,只進(jìn)行了前兩步流程,之后并未構(gòu)建相應(yīng)的模型,而是直接使用LTP訓(xùn)練好的數(shù)據(jù)模型對字詞進(jìn)行標(biāo)注。
1.2 LTP
LTP語言技術(shù)平臺(Language Technology Platform),是哈爾濱工業(yè)大學(xué)開發(fā)的一套中文語言處理系統(tǒng),它包括了詞性標(biāo)注、角色標(biāo)注等中文語言處理模塊。并且LTP提供基于動態(tài)鏈接庫(DLL)的API,網(wǎng)絡(luò)服務(wù)以及可視化工具來分析結(jié)果。
LTP是一套高性能的中文NLP分析工具,它將一系列底層的自然語言處理任務(wù)進(jìn)行封裝,通過接口的方式對外提供服務(wù),使上層研究人員可以在底層任務(wù)的基礎(chǔ)上開始進(jìn)行研究而無需訓(xùn)練相應(yīng)的模型,節(jié)省了大量研究時(shí)間和減少了學(xué)習(xí)成本。針對除C++之外的不同開發(fā)語言,官方對LTP的接口進(jìn)行了相對應(yīng)的再次封裝的,如Java語言的ltp4j,Python語言的PyLTP。本課題主要開發(fā)語言是Python,因此選擇了PyLTP。在后續(xù)實(shí)驗(yàn)中,都將使用LTP工具進(jìn)行分詞、詞性標(biāo)注、語義角色標(biāo)注等工作。
2 規(guī)則提取方法
2.1 駕駛規(guī)則提取流程
在獲得文本的語料庫之后,將對語料庫進(jìn)行語義角色標(biāo)注,并對標(biāo)注進(jìn)行去冗余處理。在本課題的方法中,將給出兩種去冗余標(biāo)注的方法以及對應(yīng)的提取規(guī)則。通過自定義提取規(guī)則對標(biāo)注文本進(jìn)行提取。
2.2 過濾冗余標(biāo)注
LTP進(jìn)行角色標(biāo)注的結(jié)果是有多種情況的,且存在同一條語料在不同標(biāo)注場次有不同結(jié)果,只有先選出最完整的能夠準(zhǔn)確表達(dá)語義的標(biāo)注,才能進(jìn)行之后的分析。這一步至關(guān)重要,因?yàn)槿绻鄙倬渥映煞?,那么之后的提取變得毫無意義。這種影響語義理解的標(biāo)注結(jié)果我們稱之為錯(cuò)誤角色標(biāo)注。下面提供了兩種過濾冗余標(biāo)注的方法。
方法一:整行標(biāo)注清除。
該方法主要是用于從多行標(biāo)注結(jié)果中選擇出最合適的一條或者幾條標(biāo)注。該方法主要實(shí)現(xiàn)邏輯如下:
1)保存每一個(gè)role的最小序列號start和最大序列號end,作為下一個(gè)role的min、max的數(shù)值。
2)當(dāng)滿足start <= min<= max <= end 時(shí),表示上一個(gè)role的內(nèi)容不如當(dāng)前role,刪除掉上一輪role。
3)當(dāng)滿足max >= end 時(shí),說明這個(gè)標(biāo)注的區(qū)間已經(jīng)在上一個(gè)role中存在了,舍棄這個(gè)標(biāo)注。
4)對角色標(biāo)注有錯(cuò)誤的語料打上標(biāo)記,輸出過濾結(jié)果。
方法二:單個(gè)標(biāo)注清除。
與方法一刪去整一條role不同,該方法對每一條role中的標(biāo)注進(jìn)行判斷,最后得到的結(jié)果中沒有重復(fù)的標(biāo)注區(qū)間。該方法主要實(shí)現(xiàn)邏輯如下:
1)將多個(gè)role中的標(biāo)注都放到詞典中,以動詞序列+短語起始序列+短語終止序列號為鍵,以標(biāo)注+標(biāo)注區(qū)間為值。
2)當(dāng)某個(gè)區(qū)間是另一個(gè)區(qū)間的子集,刪除該區(qū)間。
3)重新構(gòu)建role數(shù)據(jù)格式,每個(gè)role中按標(biāo)注區(qū)間的起始序號升序排序。
4)對角色標(biāo)注有錯(cuò)誤的語料打上標(biāo)記,結(jié)果role按動詞序列升序排序,輸出結(jié)果。
2.3 提取規(guī)則
根據(jù)過濾冗余標(biāo)注的第一種方法——整行標(biāo)注清除法,該方法會對整行標(biāo)注進(jìn)行刪除,它的結(jié)果特點(diǎn)在于在去重的基礎(chǔ)上最大化的保留了原始的角色標(biāo)注結(jié)果。根據(jù)標(biāo)注過濾結(jié)果的特點(diǎn)進(jìn)行分析,可以構(gòu)建相應(yīng)的提取規(guī)則來提取條件短語和行為短語。提取規(guī)則一流程如圖2所示。
根據(jù)過濾冗余標(biāo)注的第二種方法——單個(gè)標(biāo)注清除法,該方法對全部的標(biāo)注進(jìn)行了篩選、排序,并重新構(gòu)建輸出格式,這樣的結(jié)果去除了重復(fù)成分,且按照詞語的初始序列范圍的初始序列來對標(biāo)注排序,保證了詞語標(biāo)注在原語料中的順序。單個(gè)標(biāo)注清除法得到的結(jié)果標(biāo)注可以分為兩類處理,一類是只有一行role的情況,另一類是有多行role的情況。這兩種提取流程組成提取規(guī)則二。
當(dāng)標(biāo)注結(jié)果只有一行role時(shí),駕駛條件和行為的提取流程如圖3所示。
當(dāng)結(jié)果是有多行role時(shí),不用再單獨(dú)考慮每一類標(biāo)注類型,直接利用標(biāo)注和詞語特征提取條件和行為短語。每一行role的處理如流程圖4所示。
2.4 提取后處理
在根據(jù)角色標(biāo)注特征將短語放入條件隊(duì)列和行為隊(duì)列之后,可以根據(jù)自定義的條件詞詞典和行為詞詞典對結(jié)果進(jìn)行進(jìn)一步分類處理。由于在過濾冗余標(biāo)注處理中,動詞并未進(jìn)入去重標(biāo)準(zhǔn),因此存在多余的動詞,所以需要對條件隊(duì)列和行為隊(duì)列中的短語去重。并且可以刪除“駕駛?cè)恕?、“駕駛?cè)艘边@種主語或者主謂短語等等無效詞,這些詞語的去除不會影響提取結(jié)果,保留下來拼接語句時(shí)反而導(dǎo)致語句不通順。
2.5 標(biāo)注錯(cuò)誤語句處理方法
由于在過濾冗余標(biāo)注階段,被標(biāo)記為錯(cuò)誤標(biāo)注的句子過多,針對這些句子繼續(xù)提取駕駛條件和行為。觀察文本發(fā)現(xiàn)以‘,為分割符對句子分塊,大多數(shù)情況下,最后一塊的短語一定是駕駛行為,并且部分句子以逗號分隔條件和行為,如“準(zhǔn)備超車,應(yīng)當(dāng)提前開啟左轉(zhuǎn)向燈。”,逗號之前是條件,逗號之后是行為。而對于除最后一塊短語的前面所有的語句塊先全部看做駕駛條件。之后,通過行為詞詞典構(gòu)建正則表達(dá)式,將捕獲到行為詞的條件隊(duì)列中的語句塊移動至行為隊(duì)列中。
3 實(shí)驗(yàn)結(jié)果
3.1 數(shù)據(jù)獲取
從華律網(wǎng)中的民商法類部分,通過直接復(fù)制文本的方法獲取到《安全條例》文本,獲取的文本存為TXT格式。
駕考題庫文本的獲取,可在聚合數(shù)據(jù)官網(wǎng)注冊登陸之后,申請唯一appKey作為用戶憑證,之后進(jìn)行數(shù)據(jù)請求獲得所有題庫,以JSON形式存儲。
3.2 預(yù)處理
《安全條例》中部分文本與駕駛規(guī)則無關(guān),部分條例是關(guān)于非機(jī)動車、行人等等,這些內(nèi)容直接過濾。之后對剩余的文本進(jìn)行標(biāo)準(zhǔn)化處理,主要過程如下:
分句。對于一條安全條例,可能存在多個(gè)句子。因此,以標(biāo)點(diǎn)符號“?!被蛘摺?”來切分句子。
關(guān)聯(lián)語句處理。在一些安全條例中可能存在在多類條件下,車輛需滿足的同一駕駛行為。比如:“機(jī)動車在行駛過程中遇到以下情形之一時(shí)”。這需要將多類條件與相應(yīng)行為合并成一條語句。也可能存在一個(gè)大條件下,多個(gè)小條件下的駕駛行為,如:“機(jī)動車轉(zhuǎn)彎時(shí)要恪守以下規(guī)定”等條例。處理文本時(shí),將大條件放入每一條規(guī)定的最前面。
句子拆分。條例中當(dāng)有多個(gè)并列詞語時(shí),將其拆成多個(gè)以并列詞之一為主語的句子。一般來說,并列詞語都是以“、”分隔詞語,當(dāng)分隔詞之間是“或”的關(guān)系,就可通過字符串切割加文本拼接進(jìn)行處理,然后人工調(diào)整結(jié)果。但如果詞之間是“與”的關(guān)系,就不能拆分,而是作為一條語句處理。
去除多余主語。在文本中,所有的行為的發(fā)起者都是機(jī)動車,因此去除“機(jī)動車”不會影響語義,且有利于之后的語義角色分析的準(zhǔn)確度。
而關(guān)于駕考題庫的預(yù)處理,由于圖片無法處理,所以JSON數(shù)據(jù)中的圖片類型的題目不在本課題研究的考慮范圍內(nèi)。其次,很多駕考題目是關(guān)于扣分、罰款的刑罰條例,駕駛?cè)嘶緝渲R,以及一些危險(xiǎn)操作的危害等,這些與本課題的研究的駕駛行為關(guān)系不大,均通過過濾詞將這些題目過濾掉。之后通過答案映射表,將每條數(shù)據(jù)的question字段和answer字段進(jìn)行拼接,將問題和答案合并成一條通順的語句。這個(gè)過程主要通過正則表達(dá)式的匹配和字符串的拼接來進(jìn)行。
在對文本進(jìn)行過濾和標(biāo)準(zhǔn)化之后,即可利用LTP工具進(jìn)行分詞,在分詞后將駕駛專業(yè)術(shù)語重新拼接,之后進(jìn)行詞性標(biāo)注,至此,我們得到了《安全條例》語料庫和駕考題庫語料庫。
3.3 實(shí)驗(yàn)結(jié)果
1)《安全條例》文本規(guī)則提取結(jié)果
注意:上表中標(biāo)注錯(cuò)誤語句條數(shù)的數(shù)量在±2中浮動,錯(cuò)誤提取語句條數(shù)也在±2中浮動。
從實(shí)驗(yàn)數(shù)據(jù)來看,由于《安全條例》文本數(shù)量較少,兩種方式的規(guī)則提取正確率差別不大。但從結(jié)果來看,對《安全條例》文本的規(guī)則提取選擇方式一,即整行標(biāo)注清除的方法清除冗余標(biāo)注,并選擇相對應(yīng)的抽取規(guī)則一。
發(fā)現(xiàn)標(biāo)注錯(cuò)誤語句中可正確提取語句的情況如表2所示。
經(jīng)過方式一對文本進(jìn)行規(guī)則提取,并對LTP工具標(biāo)注錯(cuò)誤的語句進(jìn)行進(jìn)一步處理,最終從《安全條例》文本中提取規(guī)則的情況如表3所示。
通過處理,最后對《安全條例》文本的駕駛規(guī)則提取準(zhǔn)確率為89.85%。
2)駕考題庫文本規(guī)則提取結(jié)果
注意:上表中標(biāo)注錯(cuò)誤語句條數(shù)的數(shù)量在±4中浮動,錯(cuò)誤提取語句條數(shù)也在±4中浮動。
綜上數(shù)據(jù),對駕考題庫文本的規(guī)則提取選擇方式二,即單個(gè)標(biāo)注清除的方法清除冗余標(biāo)注,并選擇相對應(yīng)的抽取規(guī)則二。
對標(biāo)注錯(cuò)誤的語句進(jìn)行處理后得到數(shù)據(jù)如表5所示。
經(jīng)過方式二對駕考題庫文本進(jìn)行規(guī)則提取,并對標(biāo)注錯(cuò)誤的語句進(jìn)行了進(jìn)一步處理,最終從架考題庫文本中提取規(guī)則的情況如表6所示。
由實(shí)驗(yàn)結(jié)果可知,經(jīng)過處理,對駕考題庫文本的駕駛規(guī)則提取準(zhǔn)確率提升為87.33%。
3.4 駕駛規(guī)則庫展示
駕駛規(guī)則庫最終可展示為兩種形式,一種是以TXT文件形式存儲駕駛規(guī)則,另一種則是在數(shù)據(jù)庫中存儲,后者主要是為了之后方便利用提取的規(guī)則數(shù)據(jù)。TXT文件形式如圖5所示。
4 結(jié) 論
主要對無人駕駛規(guī)則庫的規(guī)則提取方法進(jìn)行研究。通過網(wǎng)頁爬蟲和API接口調(diào)用獲取了《安全條例》和駕考題庫兩類與交通規(guī)則相關(guān)的文本,通過選定過濾詞典將不相關(guān)的文本去除,最后通過人工和程序?qū)ΜF(xiàn)有文本進(jìn)行標(biāo)準(zhǔn)化。之后通過哈工大語言技術(shù)平臺LTP中已經(jīng)訓(xùn)練好的數(shù)據(jù)模型對語料進(jìn)行分詞和詞性標(biāo)注處理。通過基于規(guī)則的方式對語料標(biāo)注結(jié)果進(jìn)行駕駛條件和駕駛行為的提取。提出了兩種過濾冗余標(biāo)注的方法,并針對不同的方法處理的結(jié)果,又提出了兩種相應(yīng)的提取規(guī)則。實(shí)驗(yàn)數(shù)據(jù)表明,該方法在駕駛規(guī)則的提取上取得了不錯(cuò)的效果,也為后續(xù)無人駕駛測試工作提供一條新思路。
本研究仍存在一些不足,如LTP工具在角色標(biāo)注方面存在著不確定性,對提取規(guī)則的準(zhǔn)確率有限制。之后可以嘗試使用其他的語言處理工具如 ICTCLAS、HaNLP、斯坦福分詞系統(tǒng)等等。另外,提出的方法對一些特殊的句子無法進(jìn)行提取,之后可以擴(kuò)充相應(yīng)的提取規(guī)則或者使用其他方法來優(yōu)化系統(tǒng)。其次,本研究只對《安全條例》和駕考題庫進(jìn)行了處理,在以后的研究中,要擴(kuò)充語料的來源。比如可以針對錯(cuò)誤的行為進(jìn)行相應(yīng)的提取,并且可以從交通事故等文本中來提取駕駛規(guī)則。
參考文獻(xiàn)
[1] 吳海飛,宋雪松,曹寅. 自動駕駛汽車測試評價(jià)方法體系研究[J]. 質(zhì)量與標(biāo)準(zhǔn)化, 2018, (5):50-52.
[2] 范志翔,孫巍,潘漢中,等.自動駕駛汽車測試技術(shù)發(fā)展現(xiàn)狀與思考[J].中國標(biāo)準(zhǔn)化,2017,(20):47-48.
[3] ZHANG Shou-wen, HU Jia-hao, WANG Zi-ran. Autonomous-driving vehicle test technology based on virtual reality[J].The Journal of Engineering, 2018, (16):1768-1771.
[4] ALTHOFF M, JOHN M. D. Online verification of automated road vehicles using reachability analysis[J]. IEEE Transactions on Robotics. 2014,30(4): 903-918.
[5] RIZALDI A,MATTHIAS A. Formalising traffic rules for accountability of autonomous vehicles[C]. IEEE 18th International Conference on Intelligent Transportation Systems,2015: 1658-1665.
[6] RIZALDI A, KEINLOLZ J. Formalising and monitoring traffic rules for autonomous vehicles in Isabelle/HOL[C]. International Conference on Integrated Formal Methods 2017: Integrated Formal Methods ,2017:50-66.
[7] 時(shí)怡.自動駕駛汽車的交通事故責(zé)任分析及規(guī)則應(yīng)對[J].六盤水師范學(xué)院學(xué)報(bào),2019,31(05):72-78.
[8] 呂宜生,陳圓圓,趙學(xué)亮,等.開源交通信息獲取及分析系統(tǒng)[A]. 2017中國自動化大會(CAC2017)暨國際智能制造創(chuàng)新大會(CIMIC2017)論文集[C]. 2017:942-949.
[9] HENDRICKX I, LEFEVER E, CROIJMANS I, et al. Antal van den Bosch:very quaffable and great fun: applying NLP to wine reviews[C]. Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics, 2016:306-312.
[10]FELICETTI A, WILLIAMS D, GALLUCCIO I, et al. NLP tools for knowledge extraction from Italian archaeological free text[C]. 2018 3rd Digital Heritage International Congress (Digital HERITAGE) held jointly with 2018 24th International Conference on Virtual Systems & Multimedia (VSMM 2018), San Francisco, CA, USA, 2018: 1-8.
[11]NAZIR F, BUTT W H, ANWAR M.W, et al. (2017) The applications of natural language processing (NLP) for software requirement engineering -a systematic literature review[C]. In: Kim K., Joukov N. (eds) Information Science and Applications 2017. ICISA 2017. Lecture Notes in Electrical Engineering, Springer, Singapore,2017,424:1-10.
[12]ALSHEMAL I, JUGAI KALITA B.Improving the reliability of deep neural networks in NLP: a review[J]. Knowledge-Based Systems,2020,105210 :1-19.
[13]AYADI? A, SAMET A,? ZANNI-MERK C.Ontology population with deep learning-based NLP: a case study on the Biomolecular Network Ontology[C]. 23rd International Conference on Knowledge-Based and Intelligent Information & Engineering Systems,KES:2019: 572-581.
[14]XU Jing-jing, MA Shu-ming, ZHANG Yi, et al. Transfer deep learning for low-resource Chinese word segmentation with a novel neural network. NLPCC 2017: 721-730.
[15]PRIYADARSHI A, KUMAR SAHA S.Web information extraction for finding remedy based on a patient-authored text: A Study on Homeopathy[J]. NetMAHIB,2020, 9(1): 1-12.
[16]KHAIROVA N, PETRASOVA S, MAMYRBAYEV O, et al. Open information extraction as additional source for Kazakh ontology generation[J]. ACIIDS ,2020: 86-96.