王欣欣
摘 要:隨著信息技術(shù)的發(fā)展,數(shù)字化時代的到來,數(shù)學(xué)的作用日益凸顯,且初中數(shù)學(xué)對學(xué)生有舉足輕重的作用。然而對于一些中學(xué)生來說,對數(shù)學(xué)知識的學(xué)習(xí)存在著很大的個體差異性。由此,可利用Neo4j構(gòu)建一個關(guān)于初中數(shù)學(xué)學(xué)科各章節(jié)目錄中所包含的知識點的知識圖譜,幫助學(xué)生在學(xué)習(xí)過程中,提高學(xué)習(xí)效率。除此之外,利用爬蟲技術(shù)爬取一定數(shù)量的數(shù)學(xué)題目進(jìn)行研究。通過知識圖譜將題目所包含的知識點對應(yīng)到各個章節(jié),有助于學(xué)生對知識進(jìn)行復(fù)習(xí)鞏固。
關(guān)鍵詞:初中數(shù)學(xué);Neo4j ?知識圖譜爬蟲
中圖分類號:G63 ? ? ? ? ?文獻(xiàn)標(biāo)識碼:A ? ? ? ? ?文章編號:1673-9132(2020)17-0083-02
DOI:10.16657/j.cnki.issn1673-9132.2020.17.041
知識圖譜技術(shù)已經(jīng)廣泛應(yīng)用到金融、工業(yè)、醫(yī)學(xué)、教育等領(lǐng)域, 成為真實世界研究中的熱點問題[1]。知識圖譜就是以科學(xué)知識為研究對象,以可視化的方式來揭示科學(xué)知識的發(fā)展歷程及其結(jié)構(gòu)關(guān)系,并且以空間結(jié)構(gòu)的形式將學(xué)科內(nèi)部或多學(xué)科間的交互關(guān)系展示出來。因此,知識圖譜不僅可以對知識進(jìn)行查找、匹配、獲取、推送和共享等功能,還具有智能工具化和可視化的特性[2]。通過知識圖譜,將網(wǎng)頁中的非結(jié)構(gòu)化文本內(nèi)容中提取出實體及實體關(guān)系,將這些文本內(nèi)容轉(zhuǎn)化為相互連接的圖譜結(jié)構(gòu)[3]。
初中數(shù)學(xué)知識有著自己獨(dú)有的特點,可以分成多個模塊。如果對于中考生復(fù)習(xí)來說,按照模塊復(fù)習(xí)更為系統(tǒng),但對于初一、初二年級的學(xué)生來說,他們并沒有系統(tǒng)的將知識學(xué)完,因此按照章節(jié)幫助學(xué)生查漏補(bǔ)缺是最為有效也是最為合適的。本研究是根據(jù)數(shù)學(xué)題目中的考查范圍大,題量和題型多等特點,幫助學(xué)生提取出題目中考查的知識點,然后對應(yīng)到教材中的章節(jié)里面,可以及時地幫助學(xué)生了解自己的薄弱知識點,從而有的放矢地填補(bǔ)缺漏。因此文章所構(gòu)建的知識圖譜是通過教材中的各章節(jié)來組織的。
附圖1是整個流程圖,先構(gòu)建知識圖譜,然后將題目分詞之后與圖譜中的知識節(jié)點做匹配,再對應(yīng)到相關(guān)章節(jié)內(nèi)容中。
一、知識圖譜的繪制
知識圖譜是一種基于圖的數(shù)據(jù)結(jié)構(gòu),由節(jié)點和邊組成。其中節(jié)點即實體,邊即實體之間的關(guān)系。目前可用于知識圖譜繪制的軟件有多種,其中使用的較多的有Cite Space、Gephi、Neo4j等[1]。由于Neo4j在知識圖譜的繪制中有著獨(dú)特的優(yōu)勢:以圖的結(jié)構(gòu)存儲,可以存儲圖的節(jié)點、屬性和邊,這有助于提高數(shù)據(jù)庫的性能;同時它的安裝過程比較簡單[4]。因此本文將利用Neo4j軟件對所獲得的知識節(jié)點,知識節(jié)點之間的關(guān)系進(jìn)行知識圖譜的繪制。
本文所采用的語言工具是python語言,使用的系統(tǒng)是Windows7系統(tǒng)。
(一)實體識別
數(shù)學(xué)知識的實體即節(jié)點,本文采用人教版初中數(shù)學(xué)教材,利用里面各章節(jié)的目錄及其所包含的知識點作為知識圖譜中的節(jié)點,具體節(jié)點信息示例如下:
在七年級上冊中,第一章目錄為有理數(shù),其節(jié)目錄第一節(jié)正數(shù)和負(fù)數(shù),則其所包含的知識點為正數(shù)、負(fù)數(shù)等。
(二)關(guān)系識別
鑒于節(jié)點統(tǒng)計完之后,我們可以統(tǒng)計節(jié)點與節(jié)點之間的關(guān)系。一般根據(jù)目錄做的節(jié)點關(guān)系的統(tǒng)計為包含關(guān)系。因為這主要是為了學(xué)生針對性地學(xué)習(xí)某一節(jié)的內(nèi)容而制訂的,是針對各章節(jié)的知識點來進(jìn)行統(tǒng)計分析的,因此并沒有系統(tǒng)地將各模塊的知識點的關(guān)系統(tǒng)計出來,對于各知識點之間的關(guān)系在之后制作各模塊知識圖譜的時候?qū)M(jìn)行統(tǒng)計。文中關(guān)于各節(jié)點之間的關(guān)系主要體現(xiàn)了節(jié)點之間的包含關(guān)系,因為主要是想讓學(xué)生通過錯題對應(yīng)到各節(jié)內(nèi)容中,以此來補(bǔ)習(xí)自己所欠缺的知識。
(三)知識圖譜繪制
以上將節(jié)點信息和節(jié)點關(guān)系信息統(tǒng)計出來之后,利用neo4j軟件并結(jié)合python語言將知識圖譜繪制出來,如圖2所示。由于知識圖譜包含的內(nèi)容較多,因此這張圖只是展示了部分節(jié)點和節(jié)點間的關(guān)系。
二、初中數(shù)學(xué)問題研究
(一)數(shù)據(jù)來源
本文主要研究學(xué)生有不會的題目或是出錯的題目時,如何將這些題目對應(yīng)到教材中準(zhǔn)確地補(bǔ)習(xí)自己欠缺的知識點。因此在選取數(shù)據(jù)時通過網(wǎng)絡(luò)爬蟲的技術(shù)對21世紀(jì)教育網(wǎng)中的初中數(shù)學(xué)試題進(jìn)行爬取,然后對試題進(jìn)行數(shù)據(jù)的清洗。
(二)分 詞
當(dāng)我們獲取知識點的時候,要通過分詞的方法來進(jìn)行。這樣就可以將之前的句子分成多個詞語。分詞的方法有多種,但通過比較,本文采用jieba分詞的技術(shù)對試題進(jìn)行分詞。jieba分詞有三種模式:精確模式、全模式和搜索引擎模式[5]。但由于數(shù)學(xué)這一學(xué)科的特殊性,例如:‘平行四邊形這一數(shù)學(xué)名詞,它還可以分成‘平行和‘四邊形這兩個數(shù)學(xué)名詞,因此為了分詞的效果更加準(zhǔn)確,本文在分詞的時候選用了jieba分詞中的全模式進(jìn)行分詞,這樣所分得的數(shù)學(xué)名詞更加全面。
(三)實驗過程
分詞之后,將所有的詞與之前在制作知識圖譜時所得到的各章節(jié)的知識點進(jìn)行逐一匹配,當(dāng)有這一知識點出現(xiàn)時,就先匹配到包含這一知識點的章節(jié)中,然后再根據(jù)題目中的其他詞進(jìn)行精確匹配,如果沒有精確匹配的知識點,就直接對應(yīng)到這一節(jié)甚至是這一章的內(nèi)容。例如:一道題目是‘判斷0的平方根是0這一說法是否正確,在這道題目中我們通過jieba分詞之后所得到的結(jié)果是‘判斷 0 的 平方 平方根 方根 是 0 這 一 說法 是否 正確。通過這個我們可以對比之前所得到的圖譜中的數(shù)學(xué)知識,可以找到‘平方和‘平方根是數(shù)學(xué)知識,那么我們就能找到它所對應(yīng)的章節(jié)為第六章的6.1這一小節(jié)。
三、結(jié)語
本文主要是通過制作的知識圖譜讓學(xué)生更加清晰地看到每個章節(jié)所包含的知識點,同時在自己出錯的題目中可以找到對應(yīng)的知識點,便于補(bǔ)習(xí)自己所不擅長的章節(jié),同時也可以通過模糊匹配看到所包含這一知識點的相關(guān)章節(jié),可以進(jìn)行系統(tǒng)的學(xué)習(xí)。同時,本文獲取的知識點不是很全面,因此需要后續(xù)持續(xù)往這一知識圖譜中加入新的知識點;另外,本文對于各個知識點之間的關(guān)系沒有進(jìn)行統(tǒng)計,在今后的研究過程中可以將知識點之間的關(guān)系統(tǒng)計出來,以構(gòu)成一個完整的初中數(shù)學(xué)知識圖譜,方便學(xué)生的學(xué)習(xí)和查找知識點,且更系統(tǒng)地將整個初中數(shù)學(xué)架構(gòu)掌握起來。
參考文獻(xiàn):
[1]李新龍,劉巖,何麗云,劉保延,張艷宏.知識圖譜研究概況及其在中醫(yī)藥領(lǐng)域的應(yīng)用[J].中國中醫(yī)藥信息雜志,2017(7):129.
[2]朱游娟.初中數(shù)學(xué)問題的全知識圖譜設(shè)計與實現(xiàn)[D].電子科技大學(xué),2016.
[3]趙軍,劉康,何世柱,陳玉博.知識圖譜[M].北京:高等教育出版社,2018.
[4]郝培豪,高潔.基于Neo4j圖數(shù)據(jù)庫的警務(wù)安保知識圖譜可視化分析[J].研究與開發(fā),2018(4):8.
[5]涂銘,劉洋,劉樹春.python自然語言處理實戰(zhàn):核心技術(shù)與算法[M].北京:機(jī)械工業(yè)出版社,2018.