• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于Neo4j的育兒知識圖譜構(gòu)建研究與實(shí)踐

      2021-11-03 01:58曾紅艷韋昌法
      現(xiàn)代信息科技 2021年8期
      關(guān)鍵詞:知識圖譜育兒

      曾紅艷 韋昌法

      DOI:10.19850/j.cnki.2096-4706.2021.08.002

      摘? 要:文章闡述了構(gòu)建育兒知識圖譜的意義,對知識圖譜和圖數(shù)據(jù)庫Neo4j進(jìn)行了簡要介紹。論述了育兒知識圖譜的構(gòu)建思路,開展了育兒知識圖譜構(gòu)建實(shí)踐,詳細(xì)介紹了育兒知識數(shù)據(jù)獲取、育兒知識數(shù)據(jù)處理、育兒知識數(shù)據(jù)存儲和育兒知識圖譜數(shù)據(jù)展示等過程。基于Neo4j的育兒知識圖譜構(gòu)建實(shí)踐,為進(jìn)一步構(gòu)建基于知識圖譜的育兒知識服務(wù)系統(tǒng),進(jìn)而為用戶提供高效便捷的育兒知識服務(wù)奠定了堅(jiān)實(shí)的基礎(chǔ)。

      關(guān)鍵詞:知識圖譜;圖數(shù)據(jù)庫;Neo4j;育兒

      中圖分類號:TP391.1? ? ? ?文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2021)08-0005-04

      Research and Practice on the Construction of Childcare Knowledge Graph

      Based on Neo4j

      ZENG Hongyan,WEI Changfa

      (School of Information Science and Engineering,Hunan University of Chinese Medicine,Changsha? 410208,China)

      Abstract:This paper expounds the significance of constructing childcare knowledge graph,and briefly introduces the knowledge graph and graph database Neo4j. It discusses the construction idea of childcare knowledge graph,carries out the construction practice of childcare knowledge graph,and introduces in detail the processes of childcare knowledge data acquisition,childcare knowledge data processing,childcare knowledge data storage and childcare knowledge graph data display,etc. The construction practice of childcare knowledge graph based on Neo4j has laid a solid foundation for further building a childcare knowledge service system based on knowledge graph and then provides users with efficient and convenient childcare knowledge services.

      Keywords:knowledge graph;graph database;Neo4j;childcare

      0? 引? 言

      嬰幼兒時(shí)期是人生中體格和智力發(fā)育最快的階段,也是對疾病抵抗力較低的時(shí)期,而初為父母的家長普遍缺乏健康育兒知識[1]。因此如何向家長們?nèi)娑咝У貍鞑タ茖W(xué)育兒知識,減少由于無知和不正確的育兒方式帶給兒童傷害,這是一個(gè)值得關(guān)注的問題。

      目前,家長主要是從書籍、報(bào)紙、雜志和網(wǎng)絡(luò)上獲取育兒知識,也通過向老年人請教、與其他家長交流等人際傳播方式學(xué)習(xí)育兒知識。介紹育兒知識的書籍和報(bào)紙、雜志雖然不少,但是質(zhì)量上卻良莠不齊;網(wǎng)絡(luò)媒體雖然已經(jīng)成為家長最喜歡的育兒知識學(xué)習(xí)渠道,但是家長卻無法確認(rèn)網(wǎng)絡(luò)媒體所提供的育兒知識的可信度,豐富的網(wǎng)絡(luò)育兒知識資源反而給家長們帶來了選擇上的困難[2,3]。因此,基于權(quán)威可靠的育兒知識來源開展育兒知識圖譜的構(gòu)建研究,進(jìn)而基于育兒知識圖譜為家長提供科學(xué)、健康的育兒知識服務(wù),具有重要的價(jià)值和意義。

      1? 知識圖譜和圖數(shù)據(jù)庫Neo4j簡介

      谷歌公司2012年提出了知識圖譜這一新概念[4],它本質(zhì)上是一種結(jié)構(gòu)化的知識表示形式。現(xiàn)實(shí)生活中的事物和關(guān)系可以借助知識圖譜的“實(shí)體、屬性和關(guān)系”來進(jìn)行描述。隨著知識圖譜技術(shù)體系的不斷發(fā)展和完善,目前知識圖譜已經(jīng)在電商、金融、媒體、醫(yī)藥和司法等眾多垂直領(lǐng)域得到廣泛應(yīng)用[5]

      在醫(yī)療知識圖譜的構(gòu)建方面,研究者已經(jīng)開展了不少有意義的研究工作。例如,侯夢薇等人[6]針對醫(yī)療領(lǐng)域大數(shù)據(jù)專業(yè)性強(qiáng)且結(jié)構(gòu)復(fù)雜等特點(diǎn),對醫(yī)學(xué)知識圖譜架構(gòu)和構(gòu)建技術(shù)進(jìn)行了剖析。俞思偉等人[7]提出了醫(yī)療知識圖譜的構(gòu)建方法,以及將其應(yīng)用于基于醫(yī)療知識庫的疾病輔助診斷系統(tǒng)的方法。

      圖數(shù)據(jù)庫是一種非關(guān)系型數(shù)據(jù)庫,它是基于圖論實(shí)現(xiàn)的一種數(shù)據(jù)庫。不同于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫將數(shù)據(jù)存在庫表字段中,圖數(shù)據(jù)庫將數(shù)據(jù)和數(shù)據(jù)之間的關(guān)系存在節(jié)點(diǎn)和邊中,稱之為“節(jié)點(diǎn)”和“關(guān)系”。Neo4j是一款知名的圖數(shù)據(jù)庫產(chǎn)品,它憑借嵌入式、高性能和輕量級等優(yōu)勢,越來越受到關(guān)注[8]。

      目前,基于知識圖譜技術(shù)來構(gòu)建育兒知識圖譜的工作尚未見報(bào)道,因此筆者擬利用人工智能技術(shù)從多源異構(gòu)的育兒知識來源中采集育兒知識,基于Neo4j圖數(shù)據(jù)庫構(gòu)建育兒知識圖譜,為進(jìn)一步構(gòu)建基于知識圖譜的育兒知識服務(wù)系統(tǒng)奠定基礎(chǔ)。

      2? 育兒知識圖譜構(gòu)建思路

      圖1展示了育兒知識圖譜構(gòu)建思路。筆者首先通過查閱權(quán)威可靠的育兒書籍和相關(guān)文獻(xiàn)來了解育兒知識,梳理育兒知識體系;利用人工智能技術(shù)將電子版育兒書籍和文獻(xiàn)中的育兒知識提取為文本數(shù)據(jù),并將采集到的育兒知識數(shù)據(jù)存儲到MySQL數(shù)據(jù)庫中,完成數(shù)據(jù)的結(jié)構(gòu)化處理;借助Neo4j數(shù)據(jù)庫存儲育兒知識數(shù)據(jù),構(gòu)建育兒知識圖譜。

      3? 育兒知識圖譜構(gòu)建實(shí)踐

      根據(jù)上述的育兒知識圖譜構(gòu)建思路,筆者開展了育兒知識圖譜構(gòu)建實(shí)踐,具體步驟包括:育兒知識數(shù)據(jù)獲取、育兒知識數(shù)據(jù)處理、育兒知識數(shù)據(jù)存儲和育兒知識圖譜數(shù)據(jù)展示。

      3.1? 育兒知識數(shù)據(jù)獲取

      為了確保育兒知識圖譜的質(zhì)量,筆記從權(quán)威可靠的育兒書籍和相關(guān)文獻(xiàn)中獲取育兒知識。相關(guān)的權(quán)威育兒書籍包括:《兒科學(xué):第9版(國家衛(wèi)生健康委員會(huì)“十三五”規(guī)劃教材)》《中醫(yī)兒科學(xué):第10版(全國中醫(yī)藥行業(yè)高等教育“十三五”規(guī)劃教材)》和《美國兒科學(xué)會(huì)育兒百科:第7版》。相關(guān)的權(quán)威文獻(xiàn)包括:WS/T 678-2020《嬰幼兒輔食添加營養(yǎng)指南》(中華人民共和國衛(wèi)生行業(yè)標(biāo)準(zhǔn))、《嬰幼兒喂養(yǎng)與營養(yǎng)指南》(中華預(yù)防醫(yī)學(xué)會(huì)兒童保健分會(huì)發(fā)布)等。

      通過查閱上述權(quán)威育兒書籍和文獻(xiàn),根據(jù)家長所關(guān)心的育兒問題,將育兒知識分為營養(yǎng)知識、穿著知識、保健護(hù)理知識、生長發(fā)育知識、兒童教育知識和常見兒科疾病知識等六大類。

      利用人工智能技術(shù)將電子版育兒書籍和文獻(xiàn)中的育兒知識提取為文本數(shù)據(jù),具體過程為:利用Python編程技術(shù)對電子版育兒書籍和文獻(xiàn)進(jìn)行處理,如果能夠從電子版文檔中直接復(fù)制文本,則快速復(fù)制出文本;如果無法從電子版文檔中直接復(fù)制文本,則對文檔進(jìn)行截圖處理,將育兒知識條目保存為圖片文件,并調(diào)用百度AI開發(fā)平臺的通用文字識別功能對圖片文件進(jìn)行文字識別,從而獲取育兒知識文本數(shù)據(jù)。

      3.2? 育兒知識數(shù)據(jù)處理

      上述的育兒知識數(shù)據(jù)獲取步驟獲得的是育兒知識文本數(shù)據(jù),為了構(gòu)建育兒知識圖譜,需要對這些數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理。利用Python編程技術(shù)從育兒知識文本數(shù)據(jù)中提取出育兒知識條目,將知識條目歸入營養(yǎng)知識、穿著知識、保健護(hù)理知識、生長發(fā)育知識、兒童教育知識和常見兒科疾病知識中的某一類別。

      因筆者將基于Neo4j來構(gòu)建育兒知識圖譜,而Neo4j存儲的數(shù)據(jù)主要有兩類,即節(jié)點(diǎn)和關(guān)系,故育兒知識數(shù)據(jù)存入MySQL數(shù)據(jù)庫進(jìn)行結(jié)構(gòu)化處理時(shí),MySQL數(shù)據(jù)庫表設(shè)計(jì)為節(jié)點(diǎn)表和關(guān)系表兩大類。節(jié)點(diǎn)表如表1所示,包含id、node_name和node_category屬性;關(guān)系表如表2所示,包含id、id_start、node1_name、id_end、node2_name和relationships屬性。

      3.3? 育兒知識數(shù)據(jù)存儲

      將MySQL數(shù)據(jù)庫中的育兒知識數(shù)據(jù)以CSV文件格式導(dǎo)出,然后將整理好的節(jié)點(diǎn)CSV文件和節(jié)點(diǎn)關(guān)系CSV文件通過Cypher語言導(dǎo)入到Neo4j數(shù)據(jù)庫中,構(gòu)建出存儲育兒知識的知識圖譜,為進(jìn)一步構(gòu)建基于知識圖譜的育兒知識服務(wù)系統(tǒng)奠定基礎(chǔ)。

      從MySQL數(shù)據(jù)庫中導(dǎo)出的CSV文件的SQL語句形式及詳細(xì)說明:

      select * from 數(shù)據(jù)庫表 into outfile '導(dǎo)出的目錄和文件名' character set gbk fields terminated by '字段間分隔符' optionally enclosed by '字段包圍符';

      #into outfile '導(dǎo)出的目錄和文件名'命令用來指定導(dǎo)出的目錄和文件名。

      #fields terminated by '字段間分隔符'命令是對字段間的分隔符進(jìn)行定義。

      #optionally enclosed by '字段包圍符'命令指出包圍非數(shù)值型字段的字符。

      從MySQL數(shù)據(jù)庫中導(dǎo)出的CSV文件如圖2所示。

      最后通過Cypher LOAD CSV命令將所有CSV文件導(dǎo)入Neo4j數(shù)據(jù)庫中,共計(jì)1 239個(gè)節(jié)點(diǎn)數(shù)據(jù)和2 086個(gè)關(guān)系數(shù)據(jù)。利用Neo4j的Python API包py2neo連接好Neo4j數(shù)據(jù)庫后,即可將所有節(jié)點(diǎn)和關(guān)系文件載入Neo4j,以導(dǎo)入“寶寶”節(jié)點(diǎn)和“對象”關(guān)系為例,其命令格式為:

      graph = Graph("http://localhost:7474", username="neo4j",password="123456")#連接Neo4j

      #1.節(jié)點(diǎn)文件載入

      cql='''USING PERIODIC COMMIT 100 LOAD CSV FROM 'file:///baby_info.csv' AS line CREATE (g:寶寶 { baby_id:? line[0], node_name: line[1], node_cate: line[2],baby_stage: line[3], baby_age_message: line[4]? });'''

      result = graph.run(cql)

      print(result,"寶寶實(shí)體 存儲成功")

      #2.關(guān)系文件的載入

      cql='''USING PERIODIC COMMIT 300 LOAD CSV FROM 'file:///baby_age_info.csv' AS line MATCH (a:寶寶), (m:年齡) WHERE a.baby_id = line[1] AND m.idbaby_age = line[3] CREATE (a) - [r:對象{relationships:line[5]}] -> (m) RETURN r;'''

      result = graph.run(cql)

      print(result,"寶寶<-->年齡 存儲成功")

      表3對部分知識圖譜實(shí)體類型進(jìn)行了說明,表4對部分知識圖譜關(guān)系屬性類型進(jìn)行了說明。

      3.4? 育兒知識圖譜數(shù)據(jù)展示

      育兒知識圖譜構(gòu)建完成后,即可在圖數(shù)據(jù)庫Neo4j的瀏覽器端查看構(gòu)建知識圖譜的成果。如圖3所示,Neo4j瀏覽器端將不同的實(shí)體類別用不同的顏色進(jìn)行區(qū)分,其中第1種顏色節(jié)點(diǎn)表示育兒信息實(shí)體,第2種顏色節(jié)點(diǎn)表示年齡實(shí)體,第3種顏色節(jié)點(diǎn)表示兒童營養(yǎng)實(shí)體,第4種顏色節(jié)點(diǎn)表示兒童穿著屬性實(shí)體,第5種顏色節(jié)點(diǎn)表示保健護(hù)理屬性實(shí)體,第6種顏色節(jié)點(diǎn)表示生長發(fā)育屬性實(shí)體,第7種顏色節(jié)點(diǎn)表示教育屬性實(shí)體,第8種顏色節(jié)點(diǎn)表示兒科疾病屬性實(shí)體。連接育兒信息實(shí)體與屬性實(shí)體之間的邊則表示相應(yīng)的育兒階段所包含的各方面育兒知識,這在一定程度上模擬了查閱“育兒百科”的過程。

      Neo4j數(shù)據(jù)庫提供了Cypher語言對數(shù)據(jù)庫進(jìn)行CRUD(Create,Read,Update,Delete)操作,從而實(shí)現(xiàn)對育兒知識的快捷檢索和遍歷等功能,為進(jìn)一步構(gòu)建基于知識圖譜的育兒知識服務(wù)系統(tǒng)奠定基礎(chǔ)。

      4? 結(jié)? 論

      本文研究了一種基于Neo4j的育兒知識圖譜構(gòu)建方法,通過查閱權(quán)威可靠的育兒知識來源,對育兒知識體系進(jìn)行梳理,利用人工智能技術(shù)將電子版育兒書籍和文獻(xiàn)中的育兒知識提取為文本數(shù)據(jù),將采集到的育兒知識數(shù)據(jù)存儲到MySQL數(shù)據(jù)庫中,完成數(shù)據(jù)的結(jié)構(gòu)化處理,借助Neo4j數(shù)據(jù)庫存儲育兒知識數(shù)據(jù),實(shí)現(xiàn)育兒知識圖譜的構(gòu)建。筆者將進(jìn)一步利用命名實(shí)體識別和關(guān)系抽取技術(shù)自動(dòng)從育兒知識數(shù)據(jù)中抽取實(shí)體與關(guān)系,以擴(kuò)充現(xiàn)有的知識圖譜,并構(gòu)建基于知識圖譜的育兒知識服務(wù)系統(tǒng),為廣大用戶提供權(quán)威可靠、高效便捷的育兒知識服務(wù)。

      參考文獻(xiàn):

      [1] 李沛霖,王茜,劉凱佳.淺析健康育兒知識普及中存在的問題及對策——基于傳播學(xué)的角度 [J].改革與開放,2017(5):53-57.

      [2] 柏瑩,周彤.關(guān)于幼兒家長利用新媒體平臺學(xué)習(xí)的調(diào)查 [J].現(xiàn)代交際,2019(8):15-16.

      [3] 張晨.育兒微信公眾號與城市家長育兒理念及策略研究——以渭南市臨渭區(qū)為例 [J].今傳媒,2021,29(4):24-28.

      [4] 漆桂林,高桓,吳天星.知識圖譜研究進(jìn)展 [J].情報(bào)工程,2017,3(1):4-25.

      [5] 劉燁宸,李華昱.領(lǐng)域知識圖譜研究綜述 [J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2020,29(6):1-12.

      [6] 侯夢薇,衛(wèi)榮,陸亮,等.知識圖譜研究綜述及其在醫(yī)療領(lǐng)域的應(yīng)用 [J].計(jì)算機(jī)研究與發(fā)展,2018,55(12):2587-2599.

      [7] 俞思偉,范昊,王菲,等.基于知識圖譜的智能醫(yī)療研究 [J].醫(yī)療衛(wèi)生裝備,2017,38(3):109-111+126.

      [8] 楊振,萬為清.圖數(shù)據(jù)庫的研究和應(yīng)用 [J].電腦編程技巧與維護(hù),2020(12):91-93.

      作者簡介:曾紅艷(1998—),女,漢族,湖南婁底人,本科在讀,研究方向:醫(yī)學(xué)信息工程;通訊作者:韋昌法(1982—),男,壯族,廣西巴馬人,副教授,博士研究生在讀,研究方向:中醫(yī)智能輔助診療。

      收稿日期:2021-04-15

      基金項(xiàng)目:湖南省自然科學(xué)基金資助項(xiàng)目(20 20JJ4461);湖南省教育廳資助科研項(xiàng)目(20B431)

      猜你喜歡
      知識圖譜育兒
      國內(nèi)圖書館嵌入式服務(wù)研究主題分析
      國內(nèi)外政府信息公開研究的脈絡(luò)、流派與趨勢
      基于知識圖譜的產(chǎn)業(yè)集群創(chuàng)新績效可視化分析
      基于知識圖譜的產(chǎn)業(yè)集群創(chuàng)新績效可視化分析
      基于知識圖譜的智慧教育研究熱點(diǎn)與趨勢分析
      從《ET&S》與《電化教育研究》對比分析中管窺教育技術(shù)發(fā)展
      育兒神器
      育兒Q&A
      育兒Q&A
      育兒博客
      长阳| 满城县| 天镇县| 乐昌市| 黄陵县| 德保县| 大石桥市| 永宁县| 河源市| 普兰店市| 阿克陶县| 阳山县| 徐闻县| 双鸭山市| 罗江县| 乐亭县| 临沭县| 永德县| 北京市| 当涂县| 高要市| 嘉峪关市| 嘉兴市| 宜宾县| 榆中县| 开封县| 会泽县| 共和县| 峨山| 曲沃县| 新巴尔虎左旗| 丹江口市| 万宁市| 陆川县| 英超| 馆陶县| 民县| 仁寿县| 基隆市| 西盟| 茌平县|