99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

<sup id="cccc8"><cite id="cccc8"></cite></sup>

<blockquote id="cccc8"></blockquote>

<nav id="cccc8"></nav>

<nav id="cccc8"><code id="cccc8"></code></nav><noscript id="cccc8"><dd id="cccc8"></dd></noscript>

?

面向醫(yī)學(xué)領(lǐng)域的智能問答APP設(shè)計(jì)與實(shí)現(xiàn)

2019-06-06 04:21:26黃夢禧張青川陳龍王世錦

軟件導(dǎo)刊 2019年3期

關(guān)鍵詞：模式匹配自然語言處理人工智能

黃夢禧張青川陳龍王世錦

摘要：隨著醫(yī)療大數(shù)據(jù)時(shí)代的到來，自然語言處理技術(shù)在醫(yī)學(xué)領(lǐng)域發(fā)展迅速，而問答系統(tǒng)能夠準(zhǔn)確、簡潔地用自然語言回答用戶提出的問題，因此其在醫(yī)學(xué)領(lǐng)域的應(yīng)用具有重要研究價(jià)值?；谧匀徽Z言處理技術(shù)、樸素貝葉斯分類算法、詞向量、模糊匹配技術(shù)等，設(shè)計(jì)并實(shí)現(xiàn)了一款實(shí)用的面向醫(yī)學(xué)領(lǐng)域的智能問答APP。通過對(duì)問題的檢索，針對(duì)問題類型制定分類規(guī)則，并向用戶返回檢索結(jié)果;基于Bigram、詞頻、對(duì)齊文本的評(píng)估模型，可大大增加候選答案的正確率與簡潔度;基于證據(jù)與候選答案的評(píng)分機(jī)制，可減少誤報(bào)以及對(duì)結(jié)果的重復(fù)檢索。

關(guān)鍵詞：人工智能;自然語言處理;問答APP;模式匹配;貝葉斯分類

DOI：10. 11907/rjdk. 182109

中圖分類號(hào)：TP319 文獻(xiàn)標(biāo)識(shí)碼：A 文章編號(hào)：1672-7800（2019）003-0094-06

0 引言

隨著計(jì)算機(jī)的普及，尤其是互聯(lián)網(wǎng)的興起，如今已進(jìn)入信息化時(shí)代，因此對(duì)信息的有效處理成為人們迫切需求。面對(duì)大量用戶群、幾何式增長的網(wǎng)絡(luò)數(shù)據(jù)及高質(zhì)量的檢索需求，性能良好的搜索引擎層出不窮，在一定程度上為用戶在海量數(shù)據(jù)中的搜索提供了便利。然而，目前搜索引擎尚存在大量不足之處。首先，引擎返回的相關(guān)網(wǎng)頁文檔太多，且內(nèi)容全而不精，用戶需要花費(fèi)大量時(shí)間瀏覽文檔，因而不能快速發(fā)現(xiàn)有用信息[1];其次，用戶需要以關(guān)鍵字或關(guān)鍵字組合的方式輸入檢索內(nèi)容，搜索引擎僅停留在語言表層，并未深入語義，因此不能很好地改善搜索結(jié)果。

為了彌補(bǔ)傳統(tǒng)搜索引擎的缺陷，智能問答系統(tǒng)應(yīng)運(yùn)而生。阿蘭·麥熙生·圖靈設(shè)計(jì)的圖靈測試系統(tǒng)為最早的問答系統(tǒng)。傳統(tǒng)問答系統(tǒng)研究領(lǐng)域較為局限，其依賴于人工智能技術(shù)，主要由兩部分組成：人工編制的知識(shí)庫與語言接口[2]。由于詞匯量有限，且問題是一個(gè)封閉集合，基本不存在語言與語義歧義問題，相應(yīng)合成的答案有規(guī)律可循。因此，早期的人工智能探索僅局限于實(shí)驗(yàn)室應(yīng)用，而無法大量投入工業(yè)生產(chǎn)，也不具備實(shí)用價(jià)值。20世紀(jì)90年代，開放的基于文本的問答系統(tǒng)開始出現(xiàn)在人們視野中，以大規(guī)模真實(shí)語料庫為基礎(chǔ)的機(jī)器學(xué)習(xí)與統(tǒng)計(jì)研究開始取代傳統(tǒng)搜索引擎。問答系統(tǒng)也成為學(xué)術(shù)界近年來的研究熱點(diǎn)，并被列為自然語言研究的重要分支之一。

問答系統(tǒng)是一種能用簡潔而準(zhǔn)確的自然語言快速回答用戶提問的智能化系統(tǒng)[3]。當(dāng)用戶需要檢索信息時(shí)，只需用自然語言描述問題，輸入問答系統(tǒng)中，系統(tǒng)經(jīng)過問題分析、模式匹配與語義抽取等步驟，最終生成準(zhǔn)確、簡潔的答案。一個(gè)智能問答APP具有較強(qiáng)的問題分析能力是十分重要的，但現(xiàn)有問答APP尚不能完全實(shí)現(xiàn)人的智能。一方面，傳統(tǒng)問答APP都是返回大段文本，而不能直接輸出答案，或者只能采用簡單的模式匹配技術(shù)生成答案;另一方面，目前證據(jù)評(píng)分算法以及候選答案估值技術(shù)已應(yīng)用于智能問答APP中，但在答案準(zhǔn)確性、適用性與及時(shí)性等方面仍不夠完善。

面向醫(yī)學(xué)領(lǐng)域的智能問答APP包括淺層語義分析、信息檢索、候選答案提取與估值功能。其中，淺層語義分析使用分詞+詞性標(biāo)注技術(shù)及依存句法分析技術(shù)[4]，可提高分析準(zhǔn)確性，解決問題語義歧義并對(duì)問題進(jìn)行分類;信息檢索采用信息預(yù)處理與信息索引技術(shù)，以從海量信息中篩選有用信息，降低信息噪音并且減少信息搜索時(shí)間，整理為最終的正確答案，同時(shí)可提高在本地知識(shí)庫及網(wǎng)絡(luò)中的檢索速度與搜索精確度[5];候選答案提取與估值使用基于詞距、詞頻與文本對(duì)齊的評(píng)價(jià)模型，整理搜索結(jié)果生成答案候選集，并評(píng)估候選答案質(zhì)量，生成最佳答案返回給用戶。

本文對(duì)面向醫(yī)學(xué)領(lǐng)域的智能問答APP進(jìn)行研究，基于醫(yī)療網(wǎng)站實(shí)際QA問答記錄，面向廣大用戶群體推出一款實(shí)用的智能醫(yī)療問答軟件。該系統(tǒng)能夠準(zhǔn)確理解自然語言提出的問題，并為用戶返回準(zhǔn)確、簡潔的答案。

1 軟件設(shè)計(jì)方案

本文設(shè)計(jì)一個(gè)面向醫(yī)學(xué)領(lǐng)域的智能問答APP，根據(jù)APP的設(shè)計(jì)需求與設(shè)計(jì)目標(biāo)，本文重點(diǎn)研究了問題分類、信息檢索、候選答案提取3個(gè)模塊的功能，以期提高問答APP的檢索效率與效果。

1.1 軟件需求與設(shè)計(jì)目標(biāo)

該智能問答APP的處理速度應(yīng)能適應(yīng)手機(jī)硬件速度，響應(yīng)時(shí)間一般不超過5s，并且嚴(yán)格區(qū)分?jǐn)?shù)據(jù)處理權(quán)限，禁止越權(quán)處理數(shù)據(jù)。APP處理用戶輸入的問題，并將檢索結(jié)果返回客戶端。問答APP需求如圖1所示。

用戶需求如下：①根據(jù)APP端提供的問題示例，提出符合規(guī)則的問題;②用戶可以查詢歷史紀(jì)錄，亦可直接從搜索記錄中找尋答案;③用戶可以獲取與答案有關(guān)的詳細(xì)證據(jù)，追根究底，全面剖析問題。

APP功能如下：①獲取用戶數(shù)據(jù)并進(jìn)行分析與管理，將其存入數(shù)據(jù)庫，不定期地進(jìn)行訓(xùn)練學(xué)習(xí)，返回用戶關(guān)心的信息，不斷提高APP的查全率與查準(zhǔn)率;②處理用戶請(qǐng)求，根據(jù)用戶輸入及時(shí)響應(yīng)。響應(yīng)速度是衡量APP的重要指標(biāo)之一，考慮多種可用于優(yōu)化性能的指標(biāo)，及時(shí)觸發(fā)對(duì)應(yīng)事件;③定義APP可以處理的問題模式，并對(duì)APP進(jìn)行訓(xùn)練，提高解答正確率，并豐富問題模式，完善APP功能，讓用戶與APP交流更加自然流暢;④在界面上為用戶提供友好的交互手段。

設(shè)計(jì)目標(biāo)為：①具有較強(qiáng)的實(shí)時(shí)性，能夠及時(shí)將收集的信息與提取的候選答案返回用戶;②能夠篩除大量無用信息，提高APP搜索效率，節(jié)省存儲(chǔ)空間;③在搜索更新及時(shí)且保證準(zhǔn)確性的情況下占用較低的網(wǎng)絡(luò)開銷，大幅減少冗余數(shù)據(jù);④APP資源占用率較小，尤其是將CPU占用率控制在1%以下。

1.2 重點(diǎn)問題與技術(shù)難點(diǎn)

1.2.1 重點(diǎn)問題

問答APP主要由3部分組成：語義理解、信息檢索、答案生成[6]。3個(gè)主要模塊功能的實(shí)現(xiàn)涉及兩種核心技術(shù)：自然語言處理技術(shù)與信息檢索技術(shù)。自然語言處理即解決用戶用自然語言提出的問題。首先APP對(duì)用戶進(jìn)行淺層語義分析，利用分詞技術(shù)識(shí)別其中關(guān)鍵詞;然后通過詞語相似度算法研究技術(shù)，將相似詞提交給檢索系統(tǒng);APP提取關(guān)鍵詞進(jìn)行本地知識(shí)庫與網(wǎng)絡(luò)檢索，生成答案候選集;最后通過語義結(jié)構(gòu)比較與句子相似度算法研究，在相似度最大的框架抽取答案[7]。

1.2.2 技術(shù)難點(diǎn)

智能問答APP核心問題是其能否準(zhǔn)確、快速地回答用戶提出的問題，即APP能否正確理解用戶提問，以及能否理解用戶的錯(cuò)誤輸入，返回正確結(jié)果[8]。這涉及到知識(shí)庫梳理、問題理解、問題檢索3方面內(nèi)容，并且考慮到漢字的復(fù)雜性及中文的獨(dú)特性，需要攻克更多技術(shù)難題。英語直接采用空格分隔，疑問句和陳述句可以通過特殊與一般疑問詞進(jìn)行區(qū)分，但中文是用標(biāo)點(diǎn)符號(hào)分隔，且詞與詞之間無空格，所以需要采用分詞技術(shù)[9]進(jìn)行中文語言處理。另外，由于缺乏公用語料庫，問答APP僅局限于有限域。

2 智能問答APP設(shè)計(jì)

2.1 APP業(yè)務(wù)邏輯流程

智能問答APP主要由4部分組成：問題分類、證據(jù)獲取、證據(jù)評(píng)分與候選答案評(píng)分[10]。APP業(yè)務(wù)邏輯流程如圖2所示。

用戶輸入問題，APP獲取問題后進(jìn)行語言處理，包括分詞和詞性標(biāo)注，以及判斷詞語間的依存語法關(guān)系。同時(shí)數(shù)據(jù)庫檢索本地緩存，查看是否存在相同問題，如果有，則返回問題證據(jù)及答案[11];若沒有，則從互聯(lián)網(wǎng)檢索問題證據(jù)，并存入數(shù)據(jù)庫。此時(shí)，APP已完成問題類型的確定，結(jié)合對(duì)證據(jù)的評(píng)分，提取候選答案。最后，候選答案模塊對(duì)所有候選項(xiàng)進(jìn)行評(píng)分，返回Top3內(nèi)的答案及其置信度。

2.2 問題分類模塊設(shè)計(jì)

問題分類模塊利用預(yù)處理技術(shù)標(biāo)記分詞，再采用規(guī)定的3種分類模式，通過綜合評(píng)價(jià)得出問題所屬分類，并存儲(chǔ)到MySQL數(shù)據(jù)庫中。問題分類模塊部署在阿里云服務(wù)器（Ubuntu）上，是APP的3個(gè)核心模塊之一。問題分類模塊需要考慮的問題包括：文本信息的全面性、準(zhǔn)確性，以及盡量占用較少的APP資源與網(wǎng)絡(luò)資源[12]。

該模塊使用樸素貝葉斯分類器，層次分類思想主要選擇詞匯、詞性、相關(guān)詞、命名實(shí)體、中心語塊等作為特征，將問題分成7大類：人物、病狀、疾病名、藥品、實(shí)體、定義、未知[13]。智能問答APP的問題分類采用模式匹配方法，具體分為3種：直接匹配模式（C1）、基于問題分詞的詞與詞性匹配模式（C2）、基于問題主謂賓的詞與詞性匹配模式（C3）[14]。將所有問題與3類模式進(jìn)行匹配并綜合打分，選出分值最高的問題類型。

若用戶輸入問題不符合規(guī)定類型，則向APP返回匹配失敗指令，再進(jìn)行類型強(qiáng)制轉(zhuǎn)換，再次對(duì)轉(zhuǎn)換后的問題進(jìn)行模式匹配。該模塊功能設(shè)計(jì)如圖3所示。

語言預(yù)處理質(zhì)量將影響問題分類結(jié)果。中文語言處理程序復(fù)雜，且問題分類不夠細(xì)致，僅定義了7個(gè)大類，對(duì)于不符合中文規(guī)范或超出APP定義的問題類型，則無法得到理想結(jié)果。目前APP處理效果較好的問題類型包括人物、病癥、疾病名、藥品4大類[15]。

2.3 證據(jù)收集模塊

傳統(tǒng)問答APP僅使用本地?cái)?shù)據(jù)庫緩存的內(nèi)容向用戶提供證據(jù)文本，該模式存在很多問題：一方面本地緩存數(shù)量有限，無法滿足用戶多方面需求;另一方面，由于大多數(shù)候選答案使用模式匹配算法，有限的語料庫導(dǎo)致候選答案有跡可循，或產(chǎn)生一些讓用戶啼笑皆非的無意義答案。因此，本APP使用數(shù)據(jù)庫與搜索引擎相結(jié)合的證據(jù)收集方式，不僅提高了檢索效率，豐富了本地語料庫，而且抽取了更多證據(jù)文本，豐富了候選答案層次。綜上所述，該模塊設(shè)計(jì)能夠滿足APP對(duì)效率、精確度、時(shí)效性3方面要求。

證據(jù)收集模塊主要功能為：證據(jù)檢索與證據(jù)評(píng)分。當(dāng)用戶提出一個(gè)問題，首先檢索本地?cái)?shù)據(jù)庫是否存在相同問題，有則返回?cái)?shù)據(jù)庫里存儲(chǔ)的問題答案與證據(jù);否則，根據(jù)分詞模塊處理得出的關(guān)鍵字組合，利用網(wǎng)絡(luò)檢索相關(guān)文本信息。APP通過證據(jù)評(píng)分模型評(píng)判證據(jù)對(duì)問題的支持度，然后按照分?jǐn)?shù)從高到低的順序傳遞給候選答案提取模塊。

2.4 候選答案提取模塊

答案提取模塊主要評(píng)價(jià)候選答案可信度，通過抽取函數(shù)提取證據(jù)中的有效關(guān)鍵詞，再利用候選答案評(píng)分模型計(jì)算每個(gè)候選答案分值，只留下排名前三的候選答案，最后傳遞給用戶展示界面。

提取函數(shù)提取的關(guān)鍵字即為可能的答案，表1給出一些提取函數(shù)尋找的目標(biāo)樣例（p是文本，ψ是中心詞，f是提取函數(shù)）。

提取多個(gè)候選答案后，由于中文語言處理技術(shù)不夠完善，關(guān)鍵詞里夾雜著無關(guān)文本，致使候選答案質(zhì)量參差不齊，因此需要對(duì)所有候選答案進(jìn)行評(píng)分。本APP共使用7種候選答案評(píng)分模型，然后根據(jù)問題分類及證據(jù)分詞結(jié)果選擇一種評(píng)分模型，并隨機(jī)為其賦予一個(gè)值（一般為1），或者使用綜合評(píng)分模型執(zhí)行簡單的線性加權(quán)得出最終得分，最后按從高到低的順序得出其置信度。

2.5 用戶界面設(shè)計(jì)

用戶界面部署在用戶接口層，即客戶端。該智能問答APP有兩個(gè)主界面：APP首頁與人機(jī)問答界面。該APP遵循用戶界面設(shè)計(jì)的3大原則：①置界面于用戶控制之下;②減少用戶記憶負(fù)擔(dān);③保持界面一致性。此外，為了讓頁面更加美觀，功能更豐富，摒棄了傳統(tǒng)頁面編寫方法，而使用MUI框架，使用戶體驗(yàn)更好，且人機(jī)交互性良好。

3 智能問答APP實(shí)現(xiàn)

3.1 程序開發(fā)

開發(fā)語言為：Java、JS、JavaScript。

開發(fā)環(huán)境為：Hbuilder、Myeclipse、MySQL、Maven 3.3.3，JDK1.8，Tomcat8.0。

程序結(jié)構(gòu)如圖5所示。

3.1.1 問題分類模塊

問題分類模塊定義了問題結(jié)構(gòu)、類型與枚舉方式。APP對(duì)問題進(jìn)行分詞與詞性標(biāo)注后[16]，共定義了4種問題類型：人物、病癥、疾病名、藥品。在問題類型枚舉程序中增加了新的問題類型，并在詞性與問題類型之間作映射。然后在資源目錄中增加新的模式匹配規(guī)則，以支持對(duì)新問題類型的判定。APP定義 3 個(gè)文件代表不同抽象層級(jí)的模式，只需在其中一個(gè)文件中增加新模式即可。在問題類型轉(zhuǎn)換類中將模式匹配規(guī)則映射為枚舉類，系統(tǒng)從控制臺(tái)獲取問題，進(jìn)行語料處理后（分詞與詞性標(biāo)記）開始對(duì)問題進(jìn)行分類。問題分類代碼結(jié)構(gòu)如表2所示。

本問答APP使用樸素貝葉斯分類器進(jìn)行問題分類，使用一個(gè)簡單的流程圖介紹該算法（x是待分類項(xiàng)，y是類別，i是類別序列），如圖6所示。

對(duì)于給定的待分類項(xiàng)，求解在此項(xiàng)條件下各類別發(fā)生的概率，以及此待分類項(xiàng)屬于最大概率值所對(duì)應(yīng)的類別。確定最佳問題分類后，依據(jù)關(guān)鍵詞進(jìn)行證據(jù)檢索。

3.1.2 證據(jù)收集模塊

證據(jù)收集模塊首先定義證據(jù)結(jié)構(gòu)title和snippst，再對(duì)收集到的證據(jù)文本進(jìn)行分詞，最后對(duì)同一問題，不同證據(jù)的重要性不同，所以證據(jù)有不同分值，且有多個(gè)候選答案。

根據(jù)該模塊設(shè)計(jì)理念，APP設(shè)置文件與百度搜索引擎兩種方式檢索證據(jù)。APP首先從本地?cái)?shù)據(jù)庫查詢已有問題及答案，然后利用百度搜索引擎從網(wǎng)上獲取問題證據(jù)，收集大量文本證據(jù)后，對(duì)其進(jìn)行評(píng)分，最后根據(jù)分詞結(jié)果，選擇最適合的證據(jù)評(píng)分模型，得出證據(jù)最終得分。

本APP共使用4種評(píng)分模型，考慮到檢索效率，不是將4種模型評(píng)分后選擇評(píng)價(jià)度最高的模型，而是根據(jù)問題結(jié)構(gòu)選擇一種模型進(jìn)行評(píng)分，再隨機(jī)賦予該模型權(quán)重。APP將證據(jù)評(píng)分乘以其指定模型權(quán)重，即為證據(jù)最終得分。APP過濾得分較低的證據(jù)，只留下分值較高的證據(jù)文本。

3.1.3 候選答案提取模塊

首先從證據(jù)文本中提取候選答案，再通過候選答案過濾組件，過濾候選答案出現(xiàn)在問題中的文本，然后選擇候選答案評(píng)估模型與權(quán)重，最后得出候選答案最終分值[17]。綜合考慮算法實(shí)現(xiàn)難易程度以及對(duì)準(zhǔn)確率的要求，本APP使用模式匹配算法抽取候選答案[18]。采用一個(gè)簡單的流程圖介紹該算法，如圖7所示。

每一份證據(jù)文本都可提取一個(gè)候選答案，但不是所有答案都符合條件。因此，使用7種評(píng)分模型，根據(jù)候選答案結(jié)構(gòu)選出最適合的評(píng)分模型，并隨機(jī)賦予權(quán)重。將候選答案分值乘以對(duì)應(yīng)模型權(quán)重即為候選答案最終得分[19]，APP只留下分值排名靠前的答案并輸出。

3.2 問答APP功能展示

3.2.1 展示內(nèi)容

展示指標(biāo)一：提供Web控制端的客戶端管理方式，整個(gè)Web端對(duì)APP資源占用率較低。不斷更新數(shù)據(jù)庫，對(duì)APP進(jìn)行問答訓(xùn)練，針對(duì)APP指定的問題模式，提高問題回答的準(zhǔn)確率與時(shí)效性。需要提供以下完整功能：①對(duì)用戶觸發(fā)規(guī)則的行為給予文字反饋;②用戶輸入問題;③用戶獲取答案。

展示指標(biāo)二：應(yīng)用本文的數(shù)據(jù)過濾算法后，能夠在保證數(shù)據(jù)準(zhǔn)確性的前提下減少對(duì)多余數(shù)據(jù)的采集，從而避免產(chǎn)生過多冗余數(shù)據(jù)，減少網(wǎng)絡(luò)開銷。

展示指標(biāo)三：采用本文的信息過濾機(jī)制后，可適應(yīng)用戶需求，大幅減少重復(fù)答案的產(chǎn)生，從而提高APP適用性。

3.2.2 功能展示

問答APP支持文本和語音輸入。文本輸入和語音輸入方式分別如圖8、圖9所示。

問答APP對(duì)用戶輸入進(jìn)行識(shí)別處理，并快速應(yīng)答。應(yīng)答界面如圖10所示。

APP通過配置文件與映射文件將JAVA對(duì)象或持久化對(duì)象（Persistent Object，PO）映射到數(shù)據(jù)庫中，然后通過對(duì)持久化對(duì)象的操作實(shí)現(xiàn)對(duì)數(shù)據(jù)的增加、查詢等操作[20]。若用戶輸入本地緩存中的問題，則APP查詢數(shù)據(jù)庫，直接找尋答案和證據(jù);若用戶隨機(jī)輸入問題，則APP會(huì)同時(shí)使用數(shù)據(jù)庫與網(wǎng)絡(luò)搜索引擎進(jìn)行查詢，并返回結(jié)果，之后再將該問題存入數(shù)據(jù)庫，更新question與evidence表格中的內(nèi)容。

3.3 問答APP測試

測試本APP時(shí)，使用postman作為測試工具，發(fā)出GET類型請(qǐng)求命令，導(dǎo)入存儲(chǔ)了100個(gè)參數(shù)值的測試文件，對(duì)APP的開放接口進(jìn)行并發(fā)批量測試，設(shè)置迭代次數(shù)為100次，以測試問答APP的應(yīng)答性能。

3.3.1 性能測試

具體測試命令為：{{baseURL}}/Alice2/QA？q={{q}}，其中{{baseURL}}全局變量表示發(fā)送HTTP請(qǐng)求的URL，{{q}}表示請(qǐng)求參數(shù)。測試結(jié)果如表3所示。

以上測試結(jié)果顯示，在設(shè)置時(shí)延為10ms的情況下，平均事務(wù)響應(yīng)時(shí)間為2.73s，可滿足APP的性能要求。

3.3.2 準(zhǔn)確率測試

本軟件的訓(xùn)練數(shù)據(jù)集是醫(yī)療問答網(wǎng)站上用戶與醫(yī)生的真實(shí)對(duì)話。測試的數(shù)據(jù)輸入是用戶用自然語言表達(dá)的問題，輸出數(shù)據(jù)為軟件的回答。測試了100條問答數(shù)據(jù)，由專業(yè)醫(yī)生對(duì)輸出結(jié)果進(jìn)行評(píng)估[21]，評(píng)估標(biāo)準(zhǔn)為：A：準(zhǔn)確;B：基本準(zhǔn)確，但有不合理的地方;C：不準(zhǔn)確，根據(jù)實(shí)際情況選擇對(duì)應(yīng)字母。最終評(píng)估結(jié)果統(tǒng)計(jì)如圖11所示。

測試及評(píng)估結(jié)果顯示，問答APP的準(zhǔn)確率可達(dá)到61%，表明問答APP對(duì)癥狀具有較好的推斷能力，能夠根據(jù)問診查詢輸出較為準(zhǔn)確的應(yīng)答，具有較強(qiáng)的實(shí)用性。另外，在測試中發(fā)現(xiàn)，在醫(yī)療網(wǎng)站中問答次數(shù)較少的，例如一些疑難雜癥，問答APP對(duì)其認(rèn)識(shí)則不夠充分，但該問題在數(shù)據(jù)量增大之后會(huì)得到一定程度改善。因此，有必要收集更多數(shù)據(jù)作進(jìn)一步訓(xùn)練。

4 結(jié)語

隨著人工智能的迅速發(fā)展，對(duì)智能問答APP的要求也越來越高。本文在總結(jié)當(dāng)前人工智能與自然語言處理發(fā)展現(xiàn)狀的基礎(chǔ)上，對(duì)智能問答APP進(jìn)行了深入研究，以提高其準(zhǔn)確性、及時(shí)性與適用性。

本文主要研究工作和結(jié)論有以下幾個(gè)方面：

（1）本文設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)面向醫(yī)學(xué)領(lǐng)域的智能問答APP，該APP分為后臺(tái)與客戶端兩部分，后臺(tái)為業(yè)務(wù)邏輯層與數(shù)據(jù)訪問層，客戶端為用戶接口層與展示層。通過后臺(tái)對(duì)數(shù)據(jù)進(jìn)行處理，在客戶端輸出數(shù)據(jù)，并支持用戶自定義回答模式，適應(yīng)性強(qiáng)。智能問答APP還可以更改閾值，定制輸出信息的長度與深度，其簡單易實(shí)現(xiàn)，能減少重復(fù)答案的產(chǎn)生，且準(zhǔn)確率高。

（2）本文采用Get/Post相結(jié)合的數(shù)據(jù)傳輸方式將采集到的數(shù)據(jù)從后臺(tái)傳輸?shù)杰浖?，該?shù)據(jù)傳輸方式有較強(qiáng)的及時(shí)性，可大大縮短數(shù)據(jù)傳輸時(shí)間。

（3）本文設(shè)計(jì)的APP基于模式匹配算法輸出答案，在不遺漏數(shù)據(jù)且不降低準(zhǔn)確性的前提下過濾長度不合適的答案，從而降低了網(wǎng)絡(luò)開銷，減少冗余數(shù)據(jù)產(chǎn)生。

目前APP還存在以下待改進(jìn)之處：①本文設(shè)計(jì)的APP采用分詞與詞性標(biāo)注技術(shù)對(duì)問題進(jìn)行預(yù)處理，語義處理能力較差，因此未來APP可以對(duì)問題增加淺層語義分析，以提高APP對(duì)問題的理解能力，能夠識(shí)別同一語義的不同提問模式;②該APP基于模式匹配算法提取答案，雖提高了答案匹配速度，但在答案準(zhǔn)確性和層次復(fù)雜度等方面略有欠缺，可使用卷積神經(jīng)網(wǎng)絡(luò)算法、遺傳退火算法等提高候選答案模塊提取的效率與精度，豐富答案類型與層次。

參考文獻(xiàn)：

[1] 毛先領(lǐng)，李曉明. 問答系統(tǒng)研究綜述[J]. 計(jì)算機(jī)科學(xué)與探索，2012，6（3）：193-207.

[2] 王樹西. 問答系統(tǒng)：核心技術(shù)、發(fā)展趨勢[J]. 計(jì)算機(jī)工程與應(yīng)用，2005（18）：1-3.

[3] 劉芳，于斐. 面向醫(yī)療行業(yè)的智能問答系統(tǒng)研究與實(shí)現(xiàn)[J]. 微電子學(xué)與計(jì)算機(jī)，2012，29（11）：95-98.

[4] 汪紅林. 基于依存分析的語義角色標(biāo)注研究[D]. 蘇州：蘇州大學(xué)，2009.

[5] 劉毅. 人工智能的歷史與未來[J]. 科技管理研究，2004（6）：121-124.

[6] 劉件，魏程. 中文分詞算法研究[J]. 微計(jì)算機(jī)應(yīng)用，2008（8）：11-16.

[7] 黃妮. 網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)中的分詞與句子相似度算法研究[D]. 西安：陜西師范大學(xué)， 2012.

[8] 邢超. 智能問答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 北京：北京交通大學(xué)，2015.

[9] 趙凡博. 淺析中文分詞技術(shù)及其方法[J]. 世界家苑，2011（12）：228.

[10] 徐燦，王東輝. 非結(jié)構(gòu)化文檔的開放域自動(dòng)問答系統(tǒng)技術(shù)研究[D]. 杭州：浙江大學(xué)，2017.

[11] 莫洪武. 分布式多級(jí)緩存技術(shù)在選課系統(tǒng)中的應(yīng)用[J]. 廣西教育，2014（7）：183-185.

[12] 劉勇. 體育市場調(diào)查與分析[M]. 北京：高等教育出版社，2004.

[13] 段利國. 開放域中文問答系統(tǒng)關(guān)鍵技術(shù)研究[D]. 太原：太原理工大學(xué)， 2011.

[14] BARSKAR R， AHMED G F， BARSKAR N. An approach for extracting exact answers to question answering （QA） system for English sentences[J]. Procedia Engineering， 2012， 30：1187-1194.

[15] LAPSHIN V A. Question-answering systems： development and prospects[J].Automatic Documentation & Mathematical Linguistics， 2012，46（3）：138-145.

[16] 羅熹. 基于評(píng)論信息的內(nèi)容感知方法研究[D]. 成都：電子科技大學(xué)，2015.

[17] 李桂蘭，余正濤，毛存禮，等. 旅游領(lǐng)域?qū)嶓w答案的抽取[J]. 廣西師范大學(xué)學(xué)報(bào)：自然科學(xué)版， 2009， 27（1）：181-184.

[18] 蔡恒，張帥. 基于BF算法改進(jìn)的字符串模式匹配算法[J]. 電腦編程技巧與維護(hù)，2014（22）：14-15，33.

[19] 常毅. 開放領(lǐng)域的問答系統(tǒng)研究[D]. 北京：中國科學(xué)院研究生院（計(jì)算技術(shù)研究所），2004.

[20] 肖輝輝，段艷明，蘭小機(jī). 基于Hibernate的XML數(shù)據(jù)存儲(chǔ)方法[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用，2009，18（10）：189-192，163.

[21] 李超. 智能疾病導(dǎo)診及醫(yī)療問答方法研究與應(yīng)用[D]. 大連：大連理工大學(xué)，2016.

（責(zé)任編輯：黃 ?。?/p>

猜你喜歡

模式匹配自然語言處理人工智能

基于模式匹配的計(jì)算機(jī)網(wǎng)絡(luò)入侵防御系統(tǒng)

電子制作(2019年13期)2020-01-14 03:15:32

2019：人工智能

商界(2019年12期)2019-01-03 06:59:05

具有間隙約束的模式匹配的研究進(jìn)展

移動(dòng)信息(2018年1期)2018-12-28 18:22:52

OIP-IOS運(yùn)作與定價(jià)模式匹配的因素、機(jī)理、機(jī)制問題

中央民族大學(xué)學(xué)報(bào)(自然科學(xué)版)(2018年3期)2018-11-09 01:16:38

人工智能與就業(yè)

IT經(jīng)理世界(2018年20期)2018-10-24 02:38:24

數(shù)讀人工智能

小康(2017年16期)2017-06-07 09:00:59

基于組合分類算法的源代碼注釋質(zhì)量評(píng)估方法

計(jì)算機(jī)應(yīng)用(2016年12期)2017-01-13 01:24:36

下一幕，人工智能！

南風(fēng)窗(2016年19期)2016-09-21 16:51:29

面向機(jī)器人導(dǎo)航的漢語路徑自然語言組塊分析方法研究

電腦知識(shí)與技術(shù)(2016年10期)2016-06-16 21:16:32

漢哈機(jī)器翻譯中的文字轉(zhuǎn)換技術(shù)研究

電腦知識(shí)與技術(shù)(2016年5期)2016-04-14 11:12:38

軟件導(dǎo)刊2019年3期

軟件導(dǎo)刊的其它文章: 高校學(xué)習(xí)管理系統(tǒng)選型研究; 基于MOOC的大學(xué)計(jì)算機(jī)基礎(chǔ)翻轉(zhuǎn)課堂實(shí)踐與探索; 新工科建設(shè)中地方普通高校過程化教育研究與實(shí)踐; “現(xiàn)代網(wǎng)絡(luò)通信工程設(shè)計(jì)”課程建設(shè)模式探索; 新工科背景下智慧課堂教學(xué)模式研究; 面向大數(shù)據(jù)專業(yè)的Java課程改革研究

黑水县| 浙江省| 龙里县| 天长市| 友谊县| 孝义市| 金平| 海宁市| 普兰店市| 镇坪县| 黎川县| 淮阳县| 曲阳县| 定州市| 巴彦县| 莲花县| 辰溪县| 定西市| 喀喇沁旗| 留坝县| 红安县| 溧水县| 临城县| 札达县| 新安县| 靖安县| 东乡县| 永修县| 隆回县| 石渠县| 邹城市| 辽中县| 吉木乃县| 遵义县| 绥芬河市| 衢州市| 青阳县| 陇西县| 渭源县| 逊克县| 黄大仙区|

<nav id="4cccc"><code id="4cccc"></code></nav>

<noscript id="4cccc"><dd id="4cccc"></dd></noscript>