• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      COVID19知識(shí)圖譜構(gòu)建與應(yīng)用研究

      2021-12-08 13:30:40楊帥王小紅趙志剛潘景山武魯
      關(guān)鍵詞:新型冠狀病毒肺炎質(zhì)量評(píng)價(jià)可視化分析

      楊帥 王小紅 趙志剛 潘景山 武魯

      摘要: 為方便科研人員了解COVID19的致病機(jī)理、人體免疫、藥物治療和疫苗研發(fā)等科研動(dòng)態(tài),本文對(duì)COVID19知識(shí)圖譜進(jìn)行構(gòu)建與應(yīng)用研究。采用半自動(dòng)化知識(shí)圖譜構(gòu)建方法,設(shè)計(jì)構(gòu)建流程,搭建COVID19知識(shí)圖譜模式層。從核心醫(yī)學(xué)期刊、核心中醫(yī)藥期刊、權(quán)威藥物數(shù)據(jù)庫(kù)及百科等數(shù)據(jù)源獲取數(shù)據(jù),并采用爬蟲爬取和人工結(jié)合的方法進(jìn)行數(shù)據(jù)獲取、解析和存儲(chǔ)工作。同時(shí),基于Neo4J構(gòu)建COVID19科學(xué)文獻(xiàn)知識(shí)圖譜、中藥治療知識(shí)圖譜和西藥治療知識(shí)圖譜,并實(shí)現(xiàn)知識(shí)圖譜的融合。為保證知識(shí)圖譜的質(zhì)量,對(duì)知識(shí)圖譜三元組進(jìn)行統(tǒng)計(jì)與校驗(yàn),實(shí)現(xiàn)知識(shí)圖譜質(zhì)量控制,并在COVID19知識(shí)圖譜的數(shù)據(jù)基礎(chǔ)上,進(jìn)行中藥方劑頻次分析、中藥材頻次分析、中藥有效成分頻次分析及西藥研究熱度分析。分析結(jié)果表明,麻杏石甘湯、疏風(fēng)解毒膠囊、連花清瘟方是中醫(yī)臨床中常用于治療新冠肺炎的中藥方劑;而Remdesivir、Chloroquine、Darunavir是研究熱度最高的新冠臨床治療西藥。說(shuō)明COVID19知識(shí)圖譜在中藥有效成分挖掘、中藥方劑潛在作用機(jī)制研究、藥物相互作用等方面都具有研究?jī)r(jià)值。該研究在弘揚(yáng)傳統(tǒng)中醫(yī)藥文化、推進(jìn)中醫(yī)現(xiàn)代化、探索中藥方劑的有效成分和潛在作用機(jī)制等方面具有重要意義。

      關(guān)鍵詞:新型冠狀病毒肺炎; 知識(shí)圖譜; 本體; 知識(shí)融合; 質(zhì)量評(píng)價(jià); 可視化分析

      中圖分類號(hào): TP182; R181.3 文獻(xiàn)標(biāo)識(shí)碼: A

      基金項(xiàng)目: 山東省自然科學(xué)基金項(xiàng)目(ZR2020MF145);山東省重點(diǎn)研發(fā)計(jì)劃(2019JZZY010113);國(guó)家發(fā)改委重大工程(Z135060000070)

      2019年12月以來(lái),全球新型冠狀病毒(corona virus disease 2019,COVID19)疫情肆虐,造成了嚴(yán)重的社會(huì)和經(jīng)濟(jì)損失。截止2021年8月19日,全球累計(jì)確診2.1億人、死亡440萬(wàn)人。面對(duì)如此嚴(yán)峻的疫情,世界各國(guó)的科研人員對(duì)COVID19展開了深入研究。知識(shí)圖譜由Google公司2012年提出,旨在實(shí)現(xiàn)關(guān)系數(shù)據(jù)的存儲(chǔ)與表示,已廣泛應(yīng)用于數(shù)據(jù)檢索、關(guān)系推理等方面。目前,醫(yī)療醫(yī)藥領(lǐng)域已構(gòu)建一系列知識(shí)圖譜[1],例如:蛋白質(zhì)相互作用知識(shí)圖譜、中醫(yī)藥知識(shí)圖譜[2]等。由于在COVID19抗疫過(guò)程中暴露出缺乏數(shù)據(jù)支撐的問(wèn)題,而知識(shí)圖譜在抗疫大數(shù)據(jù)支撐、藥物推薦、病患軌跡跟蹤等方面發(fā)揮著不可替代的作用。國(guó)內(nèi)多家機(jī)構(gòu)相繼發(fā)布了多個(gè)新冠病毒知識(shí)圖譜;OpenKG共享了多個(gè)COVID19知識(shí)圖譜[35],涵蓋診療、臨床、英雄、物資等方面,而其在COVID19科學(xué)文獻(xiàn)和藥物治療等方面鮮有涉及。清華大學(xué)AMiner和智譜AI團(tuán)隊(duì)合作完成了COKG19,其數(shù)據(jù)規(guī)模大、且涵蓋眾多知識(shí)領(lǐng)域,但在知識(shí)粒度方面有待細(xì)化?;诖?,為了便于科研人員探究COVID19的最新進(jìn)展,了解COVID19的致病機(jī)理、臨床研究、人體免疫、疫苗研發(fā)和藥物治療等科研動(dòng)態(tài),本文研制了COVID19知識(shí)圖譜。COVID19知識(shí)圖譜由COVID19科學(xué)文獻(xiàn)知識(shí)圖譜、西藥治療知識(shí)圖譜和中藥治療知識(shí)圖譜3部分融合組成,給出了COVID19命名、起源、傳播、致病機(jī)理、預(yù)防、臨床研究、人體免疫等方面的知識(shí),可以為醫(yī)護(hù)人員提供臨床治療藍(lán)本、推薦藥物治療方案。同時(shí),圖譜收集了國(guó)內(nèi)中醫(yī)藥治療COVID19的治療方案,對(duì)于弘揚(yáng)傳統(tǒng)中醫(yī)藥文化、推進(jìn)中醫(yī)現(xiàn)代化、探索中藥方劑的有效成分和潛在作用機(jī)制等方面都具有重要意義。

      1知識(shí)圖譜構(gòu)建

      1.1總體流程

      COVID19知識(shí)圖譜涵蓋科學(xué)文獻(xiàn)、中藥治療、西藥治療等方面的知識(shí),數(shù)據(jù)異構(gòu),且來(lái)源廣泛,因此本文采用半自動(dòng)化知識(shí)圖譜構(gòu)建方法[6]。COVID19知識(shí)圖譜構(gòu)建流程如圖1所示。

      首先進(jìn)行數(shù)據(jù)獲取和知識(shí)融合[7],通過(guò)數(shù)據(jù)爬取和文件解析方法,獲取有效數(shù)據(jù)并進(jìn)行知識(shí)融合;其次基于獲取數(shù)據(jù)進(jìn)行本體設(shè)計(jì)[8];再次參照各本體進(jìn)行知識(shí)圖譜構(gòu)建和融合,分別構(gòu)建COVID19科學(xué)文獻(xiàn)知識(shí)圖譜、西藥治療知識(shí)圖譜和中藥治療知識(shí)圖譜,并進(jìn)行知識(shí)圖譜融合,形成COVID19知識(shí)圖譜;最后進(jìn)行知識(shí)圖譜質(zhì)量評(píng)價(jià)[9],借助知識(shí)圖譜質(zhì)量評(píng)價(jià)方法,實(shí)現(xiàn)對(duì)COVID19知識(shí)圖譜的數(shù)據(jù)質(zhì)量控制。

      1.2本體框架設(shè)計(jì)

      本體框架設(shè)計(jì)主要包括確定構(gòu)建目標(biāo)和構(gòu)建模式層。COVID19知識(shí)圖譜的構(gòu)建目標(biāo)是集成高質(zhì)量的COVID19科學(xué)文獻(xiàn)知識(shí),面向科研人員提供高效便捷的知識(shí)共享服務(wù);COVID19知識(shí)圖譜的模式層包括COVID19科學(xué)文獻(xiàn)、中藥治療、西藥治療3大類,參照本體及本體間關(guān)系的設(shè)計(jì)需求,細(xì)化各個(gè)子類,知識(shí)圖譜結(jié)構(gòu)如圖2所示。

      圖2中,白色框表示知識(shí)圖譜,藍(lán)色框表示本體,綠色框表示屬性,黃色框表示本體中的對(duì)象。COVID19科學(xué)文獻(xiàn)是指頂級(jí)醫(yī)學(xué)期刊收錄的學(xué)術(shù)論文,其本體包含論文、知識(shí)類別、科研人員、科研機(jī)構(gòu)和學(xué)術(shù)期刊等5個(gè)子類。其中,知識(shí)類別是對(duì)每篇文獻(xiàn)所屬知識(shí)領(lǐng)域的劃分,具體包含病毒起源、病毒傳播、命名、臨床研究、人體免疫、疫苗研發(fā)、藥物治療、致病機(jī)理等34個(gè)知識(shí)類別。中藥治療是指臨床治療新冠病患時(shí)使用的中藥處方,其本體包含中藥方劑、中藥相關(guān)文獻(xiàn)、中藥材、中藥有效成分等4個(gè)子類,其中,中藥材是中藥方劑的成分,中藥有效成分是中藥材的有效藥物成分;西藥治療是指臨床治療新冠患者時(shí)使用的西藥,其本體包含西藥和西藥相關(guān)論文2個(gè)子類。其中,西藥相關(guān)論文是指藥物在研發(fā)、臨床過(guò)程中發(fā)表的論文。文中涉及的本體數(shù)據(jù)均進(jìn)行了人工審核,以保證數(shù)據(jù)質(zhì)量。

      1.3數(shù)據(jù)獲取和知識(shí)融合

      1.3.1數(shù)據(jù)來(lái)源

      由于缺乏開源、結(jié)構(gòu)化、細(xì)粒度且符合構(gòu)建需求的數(shù)據(jù),COVID19知識(shí)圖譜需要從核心醫(yī)學(xué)期刊、核心中醫(yī)藥期刊、權(quán)威藥物數(shù)據(jù)庫(kù)及百科等數(shù)據(jù)源獲取數(shù)據(jù),數(shù)據(jù)大多是半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)[10]。

      1)COVID19科學(xué)文獻(xiàn)數(shù)據(jù)來(lái)源。COVID19科學(xué)文獻(xiàn)數(shù)據(jù)來(lái)源主要是世界頂級(jí)醫(yī)學(xué)期刊的論文,COVID19科學(xué)文獻(xiàn)數(shù)據(jù)來(lái)源如表1所示。預(yù)印版主要有arxiv、biorxiv、medRxiv等,Cell及其子刊包含Cell、Cell Discovery、cell research等期刊,Nature及其子刊包含Nature、Nature Medicine等期刊,Lancet及其子刊包含Lancet、The Lancet Infectious Diseases等期刊??傮w上,頂級(jí)醫(yī)學(xué)期刊的數(shù)據(jù)源占比達(dá)56%,高質(zhì)量的數(shù)據(jù)來(lái)源保證了知識(shí)圖譜的質(zhì)量。

      2)西藥數(shù)據(jù)來(lái)源。西藥數(shù)據(jù)主要來(lái)源于DrugBank(版本5.1.7,20200702版)數(shù)據(jù)庫(kù),其為阿爾伯塔大學(xué)運(yùn)維的一個(gè)生物信息學(xué)和化學(xué)信息學(xué)數(shù)據(jù)庫(kù)[11],包含13 791種藥物條目,其中有2 653種經(jīng)批準(zhǔn)的小分子藥物、1 417種經(jīng)批準(zhǔn)的生物技術(shù)(蛋白質(zhì)\肽)藥物、131種營(yíng)養(yǎng)品和6 451種實(shí)驗(yàn)藥物。為了應(yīng)對(duì)COVID19疫情,DrugBank設(shè)計(jì)了COVID19專欄,面向科學(xué)界提供當(dāng)前用于臨床治療COVID19藥物信息,諸如Remdesivir、Ritonavir、Chloroquine等新冠臨床治療藥物都涵蓋其中。

      3)中藥數(shù)據(jù)來(lái)源。中藥數(shù)據(jù)來(lái)源主要是《中草藥》、《中藥材》雜志及百科數(shù)據(jù)。《中藥材》雜志是經(jīng)國(guó)家科委和新聞出版署批準(zhǔn)出版的國(guó)內(nèi)外公開發(fā)行的國(guó)家級(jí)中藥科技學(xué)術(shù)性刊物,由天津藥物研究院和中國(guó)藥學(xué)會(huì)共同主辦。百度百科是國(guó)內(nèi)知名的中文百科類知識(shí)庫(kù),其醫(yī)學(xué)條目由領(lǐng)域?qū)<?、各大醫(yī)藥研究所合作編輯,所涵蓋的醫(yī)學(xué)條目可信度高、數(shù)據(jù)完整。本文主要篩選了《中草藥》、《中藥材》雜志發(fā)表的中藥治療COVID19方劑、中藥方劑有效成分挖掘方面的文獻(xiàn)數(shù)據(jù)。中藥方劑、藥材和中藥有效成分的細(xì)粒度信息來(lái)源于百科數(shù)據(jù)。

      1.3.2數(shù)據(jù)獲取

      針對(duì)半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),本研究采用自動(dòng)化和半自動(dòng)化結(jié)合的方法[12]獲取數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)(例如:權(quán)威醫(yī)學(xué)期刊文獻(xiàn)、中藥文獻(xiàn))來(lái)源廣泛,且多為PDF格式,采用爬蟲爬取和人工結(jié)合的方法進(jìn)行數(shù)據(jù)獲取和存儲(chǔ)工作。結(jié)構(gòu)化數(shù)據(jù)(例如:DrugBank數(shù)據(jù)、百科數(shù)據(jù))采用爬蟲爬取和程序解析的數(shù)據(jù)獲取方法。

      1.3.3數(shù)據(jù)解析

      對(duì)于OWL和XML格式的本體文件,一般采用Jena、Owlready2等工具進(jìn)行解析,提取本體文件中的實(shí)體、屬性、實(shí)體間關(guān)系數(shù)據(jù)。本文的數(shù)據(jù)源為科學(xué)文獻(xiàn)、數(shù)據(jù)庫(kù)和百科數(shù)據(jù),不包含本體文件,未采用以上本體解析工具。對(duì)于結(jié)構(gòu)化數(shù)據(jù),本文基于Python編寫解析程序,進(jìn)行數(shù)據(jù)解析、數(shù)據(jù)清洗、格式規(guī)范工作。對(duì)于非結(jié)構(gòu)化數(shù)據(jù),由于PDF解析技術(shù)發(fā)展水平的限制,為保證數(shù)據(jù)質(zhì)量,出于數(shù)據(jù)準(zhǔn)確性的考慮,本研究采用人工方法解析PDF數(shù)據(jù),并借助領(lǐng)域?qū)<胰斯ぬ崛∮行畔ⅰ?/p>

      1.3.4知識(shí)融合

      通過(guò)以上方法獲得的多源異構(gòu)數(shù)據(jù),需要進(jìn)行知識(shí)融合。為了提高知識(shí)圖譜的數(shù)據(jù)質(zhì)量,采用人工方法進(jìn)行知識(shí)融合[13]。首先通過(guò)實(shí)體鏈接,解決多源異構(gòu)數(shù)據(jù)中的實(shí)體沖突問(wèn)題,將表示同一對(duì)象的多個(gè)實(shí)體歸并為具有全局唯一標(biāo)識(shí)的實(shí)體對(duì)象[14]。其次通過(guò)知識(shí)合并,將多個(gè)來(lái)源描述同一實(shí)體的知識(shí)合并在一起。

      在COVID19知識(shí)圖譜構(gòu)建過(guò)程中對(duì)中藥方劑、中藥材、學(xué)術(shù)期刊、科研機(jī)構(gòu)等實(shí)體進(jìn)行數(shù)據(jù)規(guī)范和實(shí)體鏈接工作。新英格蘭醫(yī)學(xué)雜志實(shí)體在不同的數(shù)據(jù)源具備不同的名稱,例如:新愛(ài)爾蘭醫(yī)學(xué)雜志(the new england journal of medicine,NEJM),需要進(jìn)行實(shí)體對(duì)齊,避免歧義,實(shí)體與對(duì)齊實(shí)體如表2所示。

      由于同種中藥材經(jīng)過(guò)不同方法處理會(huì)產(chǎn)生多種衍生藥材,同類中藥方劑由于制劑方法、藥材成分的細(xì)微差異會(huì)衍生出不同的中藥產(chǎn)品,需要加以區(qū)分。例如:藿香正氣水、藿香正氣口服液、藿香正氣散藥效一致,藥材成分大致相同,卻是不同的中藥產(chǎn)品。半夏曲、生半夏、清半夏、姜半夏、法半夏都是由半夏制備而成,炮制方法不同,具備不同功效。

      本文采用“實(shí)體子實(shí)體”知識(shí)融合方法,實(shí)體子實(shí)體知識(shí)融合如表3所示。例如:連花清瘟方、連花清

      瘟膠囊、連花清瘟片、連花清瘟顆粒是同一中藥方劑的不同衍生產(chǎn)品,藥材成分、藥效和適應(yīng)癥基本相同,僅在制劑工藝和藥劑狀態(tài)上有差別,為保留多個(gè)連花清瘟產(chǎn)品的差異性,并保持產(chǎn)品間的共性,本文采用“實(shí)體子實(shí)體”知識(shí)融合方法,實(shí)現(xiàn)了中藥方劑及其衍生產(chǎn)品、中藥材及其衍生藥材的實(shí)體對(duì)齊與知識(shí)融合。

      1.4知識(shí)圖譜構(gòu)建與融合

      本研究基于Neo4J,構(gòu)建COVID19知識(shí)圖譜。圖譜包括COVID19科學(xué)文獻(xiàn)知識(shí)圖譜、中藥治療知識(shí)圖譜、西藥治療知識(shí)圖譜3部分。中藥治療和西藥治療均屬于“藥物治療”的范疇。本研究將中藥治療知識(shí)圖譜和西藥治療知識(shí)圖譜作為“藥物治療”知識(shí)類別的子類,從而實(shí)現(xiàn)知識(shí)圖譜的融合,知識(shí)圖譜融合如圖3所示。

      1.5知識(shí)圖譜質(zhì)量評(píng)價(jià)

      知識(shí)圖譜在構(gòu)建過(guò)程中難免出現(xiàn)錯(cuò)誤[15],為了保證COVID19知識(shí)圖譜的質(zhì)量,本研究通過(guò)人工抽樣檢測(cè)的方法實(shí)現(xiàn)知識(shí)圖譜中三元組質(zhì)量的校驗(yàn)[16],并制定抽樣策略如下:

      1)西藥治療數(shù)據(jù)取自DrugBank的結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)質(zhì)量高,隨機(jī)采樣1/10,人工校驗(yàn)其實(shí)體及屬性有無(wú)錯(cuò)誤。

      2)中藥治療數(shù)據(jù)來(lái)源于科學(xué)文獻(xiàn),該數(shù)據(jù)在解析過(guò)程中更易產(chǎn)生錯(cuò)誤,隨機(jī)采樣3/10進(jìn)行校驗(yàn)。

      3)COVID19科學(xué)文獻(xiàn)數(shù)據(jù)體量大,數(shù)據(jù)源質(zhì)量可靠,隨機(jī)采樣1/10進(jìn)行校驗(yàn)。

      本研究按以上方式采樣348條三元組。為了得到準(zhǔn)確的質(zhì)量評(píng)價(jià)結(jié)果,將以上數(shù)據(jù)分發(fā)給6人檢驗(yàn),檢驗(yàn)者都是具備專業(yè)背景的人員,且對(duì)COVID19知識(shí)圖譜很了解,檢驗(yàn)結(jié)果有質(zhì)量保障[17]。采樣標(biāo)注后得到的準(zhǔn)確率為96.38%,因此本文構(gòu)建的知識(shí)圖譜具有質(zhì)量保證。

      2知識(shí)圖譜可視化與數(shù)據(jù)分析

      2.1知識(shí)圖譜可視化展示

      對(duì)COVID19知識(shí)圖譜的西藥治療、中藥治療和COVID19科學(xué)文獻(xiàn)等3種類別三元組數(shù)量進(jìn)行統(tǒng)計(jì),知識(shí)圖譜三元組數(shù)量統(tǒng)計(jì)如表4所示。

      COVID19知識(shí)圖譜收錄了376篇國(guó)際頂級(jí)醫(yī)學(xué)期刊文獻(xiàn)、93篇中醫(yī)藥核心期刊文獻(xiàn)、136篇西藥治療科學(xué)文獻(xiàn),同時(shí)還包含文獻(xiàn)的PDF源文件、文獻(xiàn)摘要、中文概要、關(guān)鍵詞、文獻(xiàn)鏈接、相關(guān)科研報(bào)道等內(nèi)容。此外,還收錄了40種中藥方劑、112味中藥材、86個(gè)中藥有效成分、32種西藥、324名科研人員、62類學(xué)術(shù)期刊、193個(gè)科研機(jī)構(gòu)的數(shù)據(jù),并對(duì)以上數(shù)據(jù)進(jìn)行了細(xì)粒度化處理。其中,40種中藥方劑是已發(fā)表的論文、用于預(yù)防或治療輕癥新冠肺炎患者的中藥,112味中藥材是40種中藥方劑的藥材成分,86個(gè)中藥有效成分是文獻(xiàn)中已實(shí)驗(yàn)證明的。COVID19知識(shí)圖譜的可視化如圖4所示。

      2.2知識(shí)圖譜數(shù)據(jù)分析

      本研究在COVID19知識(shí)圖譜的數(shù)據(jù)基礎(chǔ)上進(jìn)行了中藥方劑頻次分析、中藥材頻次分析、中藥有效成分頻次分析和西藥研究熱度分析。中藥方劑頻次分析如圖5所示。由圖5可以看出,麻杏石甘湯[18]、疏風(fēng)解毒膠囊、達(dá)原飲、金花清感顆粒、連花清瘟方、清肺排毒湯、小柴胡湯、玉屏風(fēng)散是中醫(yī)臨床中常用于治療新冠肺炎的中藥方劑。在最常見(jiàn)的中藥材中,用于治療新冠肺炎的中藥方劑有甘草、黃岑、連翹、蒼術(shù)、柴胡、厚樸、茯苓和金銀花,中藥材頻次分析如圖6所示。針對(duì)新冠肺炎,最有效的中藥有效成分包括槲皮素[19]、山奈酚、黃岑素、刺芒柄花素、漢黃岑素、β谷甾醇、尼泊爾鳶尾異黃酮、豆甾醇、異鼠李素、木犀草素等,中藥有效成分頻次分析如圖7所示。

      在治療新冠肺炎方面,Remdesivir[20]、Chloroquine、Darunavir、Favipiravir、Umifenovir、Bevacizumab是研究熱度最高的新冠臨床治療西藥。此外,COVID19知識(shí)圖譜在中藥有效成分挖掘、中藥方劑潛在作用機(jī)制研究、藥物相互作用等方面都具有研究?jī)r(jià)值。

      3結(jié)束語(yǔ)

      本文主要對(duì)COVID19知識(shí)圖譜構(gòu)建與應(yīng)用進(jìn)行研究,該研究提供了新型冠狀病毒肺炎本體建模藍(lán)本,為多模態(tài)、海量COVID19數(shù)據(jù)的組織與存儲(chǔ)提供了模式支撐,也為下階段的COVID19知識(shí)智能問(wèn)答、COVID19科學(xué)文獻(xiàn)細(xì)粒度分類、中藥有效成分挖掘等應(yīng)用研究提供了數(shù)據(jù)支持,其在COVID19科學(xué)研究、科學(xué)抗疫等方面都具備積極作用。同時(shí),本文工作也存在數(shù)據(jù)體量偏小、自動(dòng)化程度較低等問(wèn)題,需要在今后的工作中擴(kuò)大知識(shí)圖譜規(guī)模、細(xì)化知識(shí)粒度、提高自動(dòng)化構(gòu)建水平。

      參考文獻(xiàn):

      [1]Schmidt E, Birney E, Croft D, et al. Reactomea knowledgebase of human biological pathways[C]∥On the Move to Meaningful Internet Systems 2006: OTM 2006 Workshops pt. 1; Lecture Notes in Computer Science. European Bioinformatlss Institute (EMBLEBI), Wellcome Trust Genome Campus, Hinxeon, Cambridgeshire, CBIO ISD, UK, 2006: 710719.

      [2]阮彤, 孫程琳, 王昊奮, 等. 中醫(yī)藥知識(shí)圖譜構(gòu)建與應(yīng)用[J]. 醫(yī)學(xué)信息學(xué)雜志, 2016, 37(4): 813.

      [3]蔣秉川, 游雄, 李科, 等. 利用地理知識(shí)圖譜的COVID19疫情態(tài)勢(shì)交互式可視分析[J]. 武漢大學(xué)學(xué)報(bào), 2020, 45(6): 836845.

      [4]陳曉慧, 劉俊楠, 徐立, 等. COVID19病例活動(dòng)知識(shí)圖譜構(gòu)建——以鄭州市為例[J]. 武漢大學(xué)學(xué)報(bào): 信息科學(xué)版, 2020, 45(6): 816825.

      [5]向軍毅, 胡慧君, 劉宇, 等. COVID19物資知識(shí)圖譜的構(gòu)建[J]. 武漢大學(xué)學(xué)報(bào): 理學(xué)版, 2020, 66(5): 409417.

      [6]Luo Z W, Xie R, Chen W, et al. Automatic domain terminology extraction and its evaluation for domain knowledge graph construction[J]. Web Intelligence and Agent Systems, 2018, 16(3): 173185.

      [7]阮彤, 王夢(mèng)婕, 王昊奮, 等. 垂直知識(shí)圖譜的構(gòu)建與應(yīng)用研究[J]. 知識(shí)管理論壇, 2016, 1(3): 226234.

      [8]Nadeau D, Sekine S. A survey of named entity recognition and classification[J]. Lingvisticae Investigationes, 2007, 30(1): 326.

      [9]Zhao Y, Li Z Q, Deng W, et al. Learning entity type structured embeddings with trustworthiness on noisy knowledge graphs[J]. KnowledgeBased Systems, 2021, 215(3): 106630106639.

      [10]Guo Q Y, Zhuang F Z, Qin C, et al. A survey on knowledge graphbased recommender systems[J]. Scientia Sinica Informationis, 2020, 50(7): 937953.

      [11]Marcheggiani D, Titov I. Discretestate variational autoencoders for joint discovery and factorization of relations[J]. Transactions of the Association for Computational Linguistics, 2016, 4(2): 231244.

      [12]Jung K, Kim K I, Jain A K. Text information extraction in images and video: a survey[J]. Pattern Recognition, 2004, 37(5): 977997.

      [13]楊一帆, 馬進(jìn), 王海濤, 等. 基于簡(jiǎn)介文本的中文人物關(guān)系圖譜屬性補(bǔ)全與糾錯(cuò)[J]. 中國(guó)科學(xué), 2020, 50(7): 10031018.

      [14]Chang C H, Kayed M, Girgis M R, et al. A survey of web information extraction systems[J]. IEEE Transactions on Knowledge and Data Engineering, 2006, 18(10): 14111428.

      [15]Wang Q, Chang L. An intelligent maximum power extraction algorithm for inverterbased variable speed wind turbine systems[J]. IEEE Transactions on Power Electronics, 2004, 19(5): 12421249.

      [16]Rozenfeld B, Feldman R. Selfsupervised relation extraction from the Web[J]. Knowledge and Information Systems, 2008, 17(1): 1733.

      [17]Xu K, Feng Y S, Huang S F, et al. Semantic relation classification via convolutional neural networks with simple negative sampling[J]. Computer Science, 2015, 71(7): 941949.

      [18]樊冬麗, 廖慶文, 鄢丹, 等. 基于生物熱力學(xué)表達(dá)的麻黃湯和麻杏石甘湯的寒熱藥性比較[J]. 中國(guó)中藥雜志, 2007, 32(5): 421424.

      [19]王春, 吳秋華, 王志, 等. 槲皮素與牛血清白蛋白相互作用的研究[J]. 光譜學(xué)與光譜分析, 2006, 26(9): 16721675.

      [20]Eastman R T, Roth J S, Brimacombe K R, et al. Remdesivir: A review of its discovery and development leading to emergency use authorization for treatment of COVID19\[J\]. ACS Central Science, 2020, 6(5): 672683.

      作者簡(jiǎn)介: 楊帥(1992),男,碩士,研究實(shí)習(xí)員,主要研究方向?yàn)閳D神經(jīng)網(wǎng)絡(luò)、知識(shí)圖譜和藥物研發(fā)。

      通信作者: 趙志剛(1980),男,碩士,副研究員,主要研究方向?yàn)榇髷?shù)據(jù)和知識(shí)圖譜。Email: zhaozhg@sdas.org

      Research on the Construction and Application of COVID19 Knowledge Graph

      YANG Shuai, WANG Xiaohong, ZHAO Zhigang, PAN Jingshan, WU Lu

      (Qilu University of Technology (Shandong Academy of Sciences),

      Shandong Computer Science Center(National Supercomputer Center in Jinan), Jinan 250000, China)

      Abstract: ?In order to facilitate scientific researchers to understand the pathogenic mechanism of COVID19, human immunity, drug treatment and vaccine development and other scientific research trends, this article constructs and applies research on the COVID19 knowledge graph. The semiautomated knowledge graph construction method is used to design the construction process and build the COVID19 knowledge graph model layer. We obtain data from data sources such as core medical journals, core traditional Chinese medicine journals, authoritative drug databases and encyclopedias, and use crawler crawling and artificial combination methods for data acquisition, analysis and storage. At the same time, based on Neo4J, we construct a knowledge graph of COVID19 scientific literature, a knowledge graph of traditional Chinese medicine treatment, and a knowledge graph of western medicine treatment, and realize the integration of knowledge graphs. In order to ensure the quality of the knowledge graph, the knowledge graph triples are counted and verified to achieve the quality control of the knowledge graph, and on the basis of the data of the COVID19 knowledge graph, the frequency analysis of traditional Chinese medicine prescriptions, the frequency analysis of traditional Chinese medicine materials, and the effectiveness of traditional Chinese medicine are carried out. Component frequency analysis and western medicine research popularity analysis. The analysis results show that Maxing Shigan Decoction, Shufeng Jiedu Capsules, and Lianhua Qingwen Decoction are commonly used in traditional Chinese medicine to treat new coronary pneumonia; ?and Remdesivir, Chloroquine, and Darunavir are the most researched Western medicines for the clinical treatment of new crowns. It shows that the COVID19 knowledge graph has research value in the mining of active ingredients of Chinese medicine, the study of the potential mechanism of Chinese medicine prescriptions, and drug interactions. The research is of great significance in promoting the culture of traditional Chinese medicine, advancing the modernization of Chinese medicine, and exploring the effective ingredients and potential mechanisms of Chinese medicine prescriptions.

      Key words: covid19; knowledge graph; ontology; knowledge fusion; quality evaluation; visual analysis

      猜你喜歡
      新型冠狀病毒肺炎質(zhì)量評(píng)價(jià)可視化分析
      新型冠狀病毒肺炎的CT影像特點(diǎn)及應(yīng)用價(jià)值
      疑似及確診新冠肺炎的臨床及胸部CT影像特點(diǎn)
      曲靖地區(qū)13例新型冠狀病毒肺炎的中西醫(yī)結(jié)合診治初探
      我國(guó)職業(yè)教育師資研究熱點(diǎn)可視化分析
      職教論壇(2016年26期)2017-01-06 19:04:59
      聲波吹灰技術(shù)在SCR中的應(yīng)用研究
      科技傳播(2016年19期)2016-12-27 16:18:28
      可視化分析技術(shù)在網(wǎng)絡(luò)輿情研究中的應(yīng)用
      國(guó)內(nèi)外政府信息公開研究的脈絡(luò)、流派與趨勢(shì)
      BP神經(jīng)網(wǎng)絡(luò)在軟件質(zhì)量評(píng)價(jià)中的應(yīng)用研究 
      基于AHP的大學(xué)生畢業(yè)論文質(zhì)量評(píng)價(jià)體系研究
      “中職+應(yīng)用本科”會(huì)計(jì)專業(yè)人才培養(yǎng)質(zhì)量評(píng)價(jià)體系的構(gòu)建
      渝中区| 阿克苏市| 青阳县| 石首市| 榕江县| 克拉玛依市| 宁都县| 合川市| 昌宁县| 唐山市| 科尔| 南京市| 鱼台县| 洪湖市| 辉南县| 大洼县| 海林市| 绥芬河市| 奈曼旗| 西城区| 天水市| 博白县| 温州市| 微博| 赫章县| 南丰县| 乌拉特中旗| 辽中县| 申扎县| 宜丰县| 高阳县| 仁寿县| 宜昌市| 佛学| 古蔺县| 扎鲁特旗| 绵竹市| 江安县| 马边| 海晏县| 白水县|