• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      智能醫(yī)療領(lǐng)域問答系統(tǒng)研究與實(shí)現(xiàn)

      2021-06-18 03:41:56奕利泰通訊作者牛梓雨劉思嘉倪曉雅羅紹愷
      信息記錄材料 2021年5期
      關(guān)鍵詞:意圖圖譜檢索

      奕利泰,董 晨(通訊作者),牛梓雨,劉思嘉,倪曉雅,羅紹愷

      (天津理工大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院 天津 300384)

      1 引言

      醫(yī)療大數(shù)據(jù)時(shí)代的到來,深度學(xué)習(xí)、自然語言處理等技術(shù)在醫(yī)學(xué)領(lǐng)域發(fā)展迅速,基于人工智能的醫(yī)療問答系統(tǒng)正在改變醫(yī)療生態(tài),具有重要的應(yīng)用前景。如何快速、準(zhǔn)確、簡潔地用自然語言回答用戶的提問,成為醫(yī)療問答系統(tǒng)中待解決的關(guān)鍵問題。傳統(tǒng)的數(shù)據(jù)庫查詢反饋的結(jié)果難以滿足速度和準(zhǔn)確度的要求,基于自然語言處理的知識庫問答相對于傳統(tǒng)的搜索引擎,能快速反饋給用戶精準(zhǔn)的回答。本項(xiàng)目將分布在互聯(lián)網(wǎng)中的非結(jié)構(gòu)化的醫(yī)療相關(guān)數(shù)據(jù)整合起來,建立嚴(yán)格結(jié)構(gòu)化的醫(yī)療知識圖譜,保存在阿里云服務(wù)器端,使用基于雙向Transformer的聯(lián)合學(xué)習(xí)模型執(zhí)行知識抽取,使用基于深度學(xué)習(xí)的Stack-propagation框架識別醫(yī)療輸入問句,重新轉(zhuǎn)化為知識圖譜的查詢索引,快速反饋給用戶最精準(zhǔn)的醫(yī)療答案。

      2 系統(tǒng)架構(gòu)及功能實(shí)現(xiàn)

      系統(tǒng)采用阿里云服務(wù)器+客戶端架構(gòu),以Android APP形式實(shí)現(xiàn)與用戶交互。云服務(wù)器主要功能有:數(shù)據(jù)采集、知識圖譜構(gòu)建、聯(lián)合學(xué)習(xí)模型構(gòu)建、問句理解模型構(gòu)建、醫(yī)療信息檢索、用戶安全管理以及系統(tǒng)性能評價(jià)。Android客戶端主要功能有:智能醫(yī)療問答、好友社交推薦、飲食計(jì)劃、運(yùn)動健康推薦、醫(yī)療資訊推送及機(jī)構(gòu)檢索、醫(yī)療詞條查詢等。

      圖1 系統(tǒng)功能模塊

      3 系統(tǒng)關(guān)鍵技術(shù)實(shí)現(xiàn)

      3.1 構(gòu)建知識圖譜

      本項(xiàng)目使用Scrapy框架和Webdriver爬取垂直醫(yī)療網(wǎng)站中的信息,使用Neo4j圖數(shù)據(jù)庫構(gòu)建醫(yī)療知識圖譜[1]供服務(wù)器檢索,主要包括疾病、癥狀、藥物、治療方式、醫(yī)療器械等節(jié)點(diǎn)。結(jié)構(gòu)化數(shù)據(jù)使用配合爬蟲的腳本直接置入Neo4j圖數(shù)據(jù)庫中[2],非結(jié)構(gòu)化以及半結(jié)構(gòu)化數(shù)據(jù)需要經(jīng)過知識抽取后,再置入Neo4j圖數(shù)據(jù)庫中。數(shù)據(jù)庫規(guī)模涵蓋33645個醫(yī)療信息實(shí)體節(jié)點(diǎn)以及290881個實(shí)體關(guān)系,足以提供問答系統(tǒng)的數(shù)據(jù)需求,通過構(gòu)建知識圖譜可進(jìn)一步分擔(dān)算法壓力。

      3.2 構(gòu)建基于雙向Transformer的實(shí)體識別和關(guān)系抽取的聯(lián)合學(xué)習(xí)模型

      由于醫(yī)療問題的特殊性,構(gòu)建知識圖譜要求精確度高。一般情況下,除少部分專門處理過的數(shù)據(jù)(例如百科)之外,對于同一疾病的癥狀的描述在語料庫中過于多樣化,需要設(shè)計(jì)模型篩取關(guān)鍵詞,構(gòu)建最精確最簡潔的知識圖譜。本項(xiàng)目使用基于雙向Transformer的聯(lián)合學(xué)習(xí)模型執(zhí)行知識抽取。

      深度學(xué)習(xí)模型將使用Python語言的Tensorflow2.0框架訓(xùn)練,再部署到阿里云服務(wù)器中運(yùn)行。同時(shí),引入stack-propagation框架的思想,令關(guān)系抽取的模型直接使用實(shí)體識別的輸入,使兩種任務(wù)不同的訓(xùn)練集和驗(yàn)證集同時(shí)調(diào)整一個模型,讓神經(jīng)網(wǎng)絡(luò)最大化地貼合醫(yī)療應(yīng)用。通過這種訓(xùn)練方式可讓兩個應(yīng)用各自的網(wǎng)絡(luò)層得到對方學(xué)習(xí)到的特征。相比流水線的任務(wù),基于雙向Transformer的實(shí)體識別和關(guān)系抽取的聯(lián)合學(xué)習(xí)模型,構(gòu)建的模型冗余參數(shù)更少,運(yùn)行速度更快。

      3.3 基于stack-propagation框架的意圖識別+槽位填充模型

      輸入問句中的實(shí)體以及問句意圖有較強(qiáng)的相關(guān)性,為了準(zhǔn)確理解醫(yī)療輸入問句,采用基于Stack-propagation的意圖識別及槽填充算法[3]實(shí)現(xiàn)醫(yī)療輸入問句解析。首先進(jìn)行意圖識別,由于問句的長短不統(tǒng)一,使用Bi-LSTM可以處理長度不統(tǒng)一的數(shù)據(jù)向量,Bi-LSTM即是雙向循環(huán)的LSTM層。LSTM是在循環(huán)神經(jīng)網(wǎng)絡(luò)中增加了一條供先前節(jié)點(diǎn)學(xué)習(xí)到的特征流通的通路,由一個遺忘門和一個記憶門決定該特征的去留[4]。通過該方法循環(huán)神經(jīng)網(wǎng)絡(luò),可以彌補(bǔ)不能保留上下文信息的缺點(diǎn),輸入經(jīng)過Bi-LSTM層后計(jì)算自注意力C。

      得到C后與Bi-LSTM]串聯(lián)輸出合并成一個向量,將意圖分類轉(zhuǎn)化為單詞分類。

      槽填充任務(wù)依賴于意圖識別的結(jié)果[5],將分類后的單詞填入槽位。仍采用單向LSTM作為解碼器,對于第i時(shí)刻的隱層狀態(tài)表示如下:

      直接將第i個時(shí)刻的意圖分類結(jié)果作為輸入指導(dǎo)槽位的預(yù)測,提升問答的準(zhǔn)確度。智能問答展示頁面如圖2所示:

      圖2 智能問答展示頁面

      3.4 推薦系統(tǒng)設(shè)計(jì)

      將用戶x檢索過的醫(yī)療健康等關(guān)鍵詞集定義為N(x),則N(u)∩N(v)表示檢索過的關(guān)鍵詞,投票為1,未檢索過的關(guān)鍵詞投票為0。N(u)∪N(v)則表示檢索過的關(guān)鍵詞的并集的元素個數(shù)。Jaccard系數(shù)的實(shí)現(xiàn)是將醫(yī)療關(guān)鍵詞向量堆疊成矩陣,將其中一方的矩陣轉(zhuǎn)置。因?yàn)橄蛄块L度統(tǒng)一可以點(diǎn)積,點(diǎn)積后返回相似的關(guān)鍵詞個數(shù)。系統(tǒng)定期抽取各個用戶的檢索歷史存儲在云服務(wù)器,利用Jaccard系數(shù)計(jì)算醫(yī)療、飲食和運(yùn)動關(guān)鍵詞之間的相似度,進(jìn)行健康飲食、運(yùn)動方案推薦。飲食推薦展示頁面如圖3所示:

      圖3 飲食推薦展示頁面

      4 系統(tǒng)實(shí)現(xiàn)

      智能醫(yī)療問答系統(tǒng)架構(gòu)分為五個層級,分別是中臺、后臺、數(shù)據(jù)分析、索引引擎以及數(shù)據(jù)庫。中臺主要攔截并捕獲客戶端請求。后臺主要實(shí)現(xiàn)數(shù)據(jù)交互。數(shù)據(jù)分析層主要解析醫(yī)療輸入問句。搜索層為Neo4j數(shù)據(jù)庫服務(wù)器提供知識圖譜的搜索索引。數(shù)據(jù)庫層采用關(guān)系型數(shù)據(jù)庫Mysql及圖數(shù)據(jù)庫Neo4j實(shí)現(xiàn)。采集3000條問答作為測試集,對比使用關(guān)鍵詞匹配的醫(yī)療問答,智能醫(yī)療問答系統(tǒng)的問答準(zhǔn)確率可達(dá)90%。

      猜你喜歡
      意圖圖譜檢索
      原始意圖、對抗主義和非解釋主義
      法律方法(2022年2期)2022-10-20 06:42:20
      陸游詩寫意圖(國畫)
      制定法解釋與立法意圖的反事實(shí)檢驗(yàn)
      法律方法(2021年3期)2021-03-16 05:56:58
      繪一張成長圖譜
      2019年第4-6期便捷檢索目錄
      補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
      中成藥(2017年3期)2017-05-17 06:09:01
      主動對接你思維的知識圖譜
      專利檢索中“語義”的表現(xiàn)
      專利代理(2016年1期)2016-05-17 06:14:36
      燕山秋意圖
      雜草圖譜
      织金县| 凤山市| 乌鲁木齐县| 荔波县| 黎川县| 阳江市| 枣阳市| 白山市| 通州区| 寻乌县| 南华县| 曲水县| 绿春县| 原阳县| 新竹市| 通渭县| 依安县| 高密市| 宣汉县| 五指山市| 若尔盖县| 方城县| 北流市| 龙州县| 郴州市| 清丰县| 阜南县| 大冶市| 栖霞市| 郎溪县| 望江县| 丹东市| 宁河县| 大厂| 邵阳市| 舒城县| 无棣县| 阜宁县| 博乐市| 台州市| 奎屯市|