吳樹芳+劉暢+徐建民
〔摘要〕提出了一種基于術(shù)語間本體關(guān)聯(lián)度的文檔相關(guān)度計算方法,該方法利用樹狀本體結(jié)構(gòu)計算術(shù)語間基于本體的關(guān)聯(lián)關(guān)系,通過術(shù)語組間的本體關(guān)聯(lián)度得到兩組詞語的本體關(guān)聯(lián)關(guān)系,最后結(jié)合文檔標(biāo)引詞的權(quán)重計算兩個文檔的相關(guān)度。新方法從本體的角度將語義信息融入傳統(tǒng)向量空間模型,提高了文檔相關(guān)度計算的準(zhǔn)確性。實驗選取計算機領(lǐng)域本體作為實驗數(shù)據(jù),對新方法和傳統(tǒng)方法進行綜合對比評測,實驗結(jié)果驗證了新方法的有效性和合理性。
〔關(guān)鍵詞〕本體;術(shù)語關(guān)系;文檔相關(guān)度
文檔相似度或相關(guān)度的計算早已成為數(shù)據(jù)挖掘和信息提取領(lǐng)域中的基本問題,是文本處理的核心[1-3]。傳統(tǒng)的文檔相似度計算方法主要包括基于向量空間模型方法,基于集合運算模型方法[4],基于文檔結(jié)構(gòu)方法[5]和基于引文圖方法[6]等,其中以向量空間模型方法最為常見,后兩種方法偏重于研究文檔間結(jié)構(gòu)的相似程度。
4結(jié)語
輿情強度評測指標(biāo)體系對于高校輿情工作來說,具有預(yù)警、參考、統(tǒng)計3個方面的作用。首先,高??梢詫⒈倔w系的最終得分進行分段,在日常輿情監(jiān)測過程中,按照以上體系通過軟件進行輿情自動化分析,一旦發(fā)現(xiàn)輿情熱度指數(shù)達到相應(yīng)數(shù)值就啟動藍色、黃色、橙色、紅色預(yù)警,并隨之啟動相應(yīng)的應(yīng)急預(yù)案。其次,高校可以通過分析該體系的每一項指標(biāo)得分和走勢,根據(jù)第二部分提出的建議予以針對性的應(yīng)對,以提高輿情應(yīng)對的及時性和科學(xué)性。最后,高校還可以通過該體系定期統(tǒng)計涉及本校的輿情走勢,從中發(fā)現(xiàn)規(guī)律,增強輿情應(yīng)對的預(yù)見性。當(dāng)然,本研究也有很多不足,如評測指標(biāo)的確立,以及指標(biāo)分值的設(shè)置都有值得商榷的地方,如隨著信息技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,新興媒介層出不窮,它們對于輿情熱度的影響還尚待研究;此外,媒介激烈競爭造成不同類型媒介影響力的此消彼長,需要高校經(jīng)常更新相關(guān)指標(biāo)權(quán)重數(shù)據(jù),才能做到盡可能準(zhǔn)確。這些問題都有待進一步研究加以改善。
參考文獻
[1]張元龍.關(guān)于“輿情”及相關(guān)概念的界定與辨析[J].浙江學(xué)刊,2009,(3):183.
[2]吳紹忠、李淑華.互聯(lián)網(wǎng)絡(luò)輿情預(yù)警機制研究[J].中國人民公安大學(xué)學(xué)報:自然科學(xué)版,2008,(3):38-42.
[3]戴媛,姚飛.基于網(wǎng)絡(luò)輿情安全的信息挖掘及評估指標(biāo)體系研究[J].情報理論與實踐,2008,(6):873-876.
[4]謝海光,陳中潤.互聯(lián)網(wǎng)內(nèi)容及輿情深度分析模式[J].中國青年政治學(xué)院學(xué)報,2006,(3):95-100.
[5]錢愛兵.基于主題的網(wǎng)絡(luò)輿情分析模型及其實現(xiàn)[J].現(xiàn)代圖書情報技術(shù),2008,(4):49-55.
[6]王青,成穎,巢乃鵬.網(wǎng)絡(luò)輿情監(jiān)測及預(yù)警指標(biāo)體系構(gòu)建研究[J].圖書情報工作,2011,(4):55-56.
[7]何紹華,方清華.信息傳遞中的信息損失認知與技術(shù)分析[J].情報理論與實踐,2006,(6):764-765.
[8]張一文,齊佳音,方濱興,等.非常規(guī)突發(fā)事件網(wǎng)絡(luò)輿情指標(biāo)體系建立初探[J].北京郵電大學(xué)學(xué)報,2010,(4):10.
[9]梁睴,熊立,王國華.一種群決策中確定專家判斷可信度的改進方法[J].系統(tǒng)工程,2004,(6):91-94.
[10]薛耀文,楊根科.算術(shù)平均和幾何平均在群組決策中獻比較研究[J].太原重型機械學(xué)院學(xué)報,1994,(1):91-96.
[11]查先進.信息分析與預(yù)測[M].武漢:武漢大學(xué)出版社,2000:187-192.
(本文責(zé)任編輯:孫國雷)endprint
〔摘要〕提出了一種基于術(shù)語間本體關(guān)聯(lián)度的文檔相關(guān)度計算方法,該方法利用樹狀本體結(jié)構(gòu)計算術(shù)語間基于本體的關(guān)聯(lián)關(guān)系,通過術(shù)語組間的本體關(guān)聯(lián)度得到兩組詞語的本體關(guān)聯(lián)關(guān)系,最后結(jié)合文檔標(biāo)引詞的權(quán)重計算兩個文檔的相關(guān)度。新方法從本體的角度將語義信息融入傳統(tǒng)向量空間模型,提高了文檔相關(guān)度計算的準(zhǔn)確性。實驗選取計算機領(lǐng)域本體作為實驗數(shù)據(jù),對新方法和傳統(tǒng)方法進行綜合對比評測,實驗結(jié)果驗證了新方法的有效性和合理性。
〔關(guān)鍵詞〕本體;術(shù)語關(guān)系;文檔相關(guān)度
文檔相似度或相關(guān)度的計算早已成為數(shù)據(jù)挖掘和信息提取領(lǐng)域中的基本問題,是文本處理的核心[1-3]。傳統(tǒng)的文檔相似度計算方法主要包括基于向量空間模型方法,基于集合運算模型方法[4],基于文檔結(jié)構(gòu)方法[5]和基于引文圖方法[6]等,其中以向量空間模型方法最為常見,后兩種方法偏重于研究文檔間結(jié)構(gòu)的相似程度。
4結(jié)語
輿情強度評測指標(biāo)體系對于高校輿情工作來說,具有預(yù)警、參考、統(tǒng)計3個方面的作用。首先,高校可以將本體系的最終得分進行分段,在日常輿情監(jiān)測過程中,按照以上體系通過軟件進行輿情自動化分析,一旦發(fā)現(xiàn)輿情熱度指數(shù)達到相應(yīng)數(shù)值就啟動藍色、黃色、橙色、紅色預(yù)警,并隨之啟動相應(yīng)的應(yīng)急預(yù)案。其次,高校可以通過分析該體系的每一項指標(biāo)得分和走勢,根據(jù)第二部分提出的建議予以針對性的應(yīng)對,以提高輿情應(yīng)對的及時性和科學(xué)性。最后,高校還可以通過該體系定期統(tǒng)計涉及本校的輿情走勢,從中發(fā)現(xiàn)規(guī)律,增強輿情應(yīng)對的預(yù)見性。當(dāng)然,本研究也有很多不足,如評測指標(biāo)的確立,以及指標(biāo)分值的設(shè)置都有值得商榷的地方,如隨著信息技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,新興媒介層出不窮,它們對于輿情熱度的影響還尚待研究;此外,媒介激烈競爭造成不同類型媒介影響力的此消彼長,需要高校經(jīng)常更新相關(guān)指標(biāo)權(quán)重數(shù)據(jù),才能做到盡可能準(zhǔn)確。這些問題都有待進一步研究加以改善。
參考文獻
[1]張元龍.關(guān)于“輿情”及相關(guān)概念的界定與辨析[J].浙江學(xué)刊,2009,(3):183.
[2]吳紹忠、李淑華.互聯(lián)網(wǎng)絡(luò)輿情預(yù)警機制研究[J].中國人民公安大學(xué)學(xué)報:自然科學(xué)版,2008,(3):38-42.
[3]戴媛,姚飛.基于網(wǎng)絡(luò)輿情安全的信息挖掘及評估指標(biāo)體系研究[J].情報理論與實踐,2008,(6):873-876.
[4]謝海光,陳中潤.互聯(lián)網(wǎng)內(nèi)容及輿情深度分析模式[J].中國青年政治學(xué)院學(xué)報,2006,(3):95-100.
[5]錢愛兵.基于主題的網(wǎng)絡(luò)輿情分析模型及其實現(xiàn)[J].現(xiàn)代圖書情報技術(shù),2008,(4):49-55.
[6]王青,成穎,巢乃鵬.網(wǎng)絡(luò)輿情監(jiān)測及預(yù)警指標(biāo)體系構(gòu)建研究[J].圖書情報工作,2011,(4):55-56.
[7]何紹華,方清華.信息傳遞中的信息損失認知與技術(shù)分析[J].情報理論與實踐,2006,(6):764-765.
[8]張一文,齊佳音,方濱興,等.非常規(guī)突發(fā)事件網(wǎng)絡(luò)輿情指標(biāo)體系建立初探[J].北京郵電大學(xué)學(xué)報,2010,(4):10.
[9]梁睴,熊立,王國華.一種群決策中確定專家判斷可信度的改進方法[J].系統(tǒng)工程,2004,(6):91-94.
[10]薛耀文,楊根科.算術(shù)平均和幾何平均在群組決策中獻比較研究[J].太原重型機械學(xué)院學(xué)報,1994,(1):91-96.
[11]查先進.信息分析與預(yù)測[M].武漢:武漢大學(xué)出版社,2000:187-192.
(本文責(zé)任編輯:孫國雷)endprint
〔摘要〕提出了一種基于術(shù)語間本體關(guān)聯(lián)度的文檔相關(guān)度計算方法,該方法利用樹狀本體結(jié)構(gòu)計算術(shù)語間基于本體的關(guān)聯(lián)關(guān)系,通過術(shù)語組間的本體關(guān)聯(lián)度得到兩組詞語的本體關(guān)聯(lián)關(guān)系,最后結(jié)合文檔標(biāo)引詞的權(quán)重計算兩個文檔的相關(guān)度。新方法從本體的角度將語義信息融入傳統(tǒng)向量空間模型,提高了文檔相關(guān)度計算的準(zhǔn)確性。實驗選取計算機領(lǐng)域本體作為實驗數(shù)據(jù),對新方法和傳統(tǒng)方法進行綜合對比評測,實驗結(jié)果驗證了新方法的有效性和合理性。
〔關(guān)鍵詞〕本體;術(shù)語關(guān)系;文檔相關(guān)度
文檔相似度或相關(guān)度的計算早已成為數(shù)據(jù)挖掘和信息提取領(lǐng)域中的基本問題,是文本處理的核心[1-3]。傳統(tǒng)的文檔相似度計算方法主要包括基于向量空間模型方法,基于集合運算模型方法[4],基于文檔結(jié)構(gòu)方法[5]和基于引文圖方法[6]等,其中以向量空間模型方法最為常見,后兩種方法偏重于研究文檔間結(jié)構(gòu)的相似程度。
4結(jié)語
輿情強度評測指標(biāo)體系對于高校輿情工作來說,具有預(yù)警、參考、統(tǒng)計3個方面的作用。首先,高??梢詫⒈倔w系的最終得分進行分段,在日常輿情監(jiān)測過程中,按照以上體系通過軟件進行輿情自動化分析,一旦發(fā)現(xiàn)輿情熱度指數(shù)達到相應(yīng)數(shù)值就啟動藍色、黃色、橙色、紅色預(yù)警,并隨之啟動相應(yīng)的應(yīng)急預(yù)案。其次,高??梢酝ㄟ^分析該體系的每一項指標(biāo)得分和走勢,根據(jù)第二部分提出的建議予以針對性的應(yīng)對,以提高輿情應(yīng)對的及時性和科學(xué)性。最后,高校還可以通過該體系定期統(tǒng)計涉及本校的輿情走勢,從中發(fā)現(xiàn)規(guī)律,增強輿情應(yīng)對的預(yù)見性。當(dāng)然,本研究也有很多不足,如評測指標(biāo)的確立,以及指標(biāo)分值的設(shè)置都有值得商榷的地方,如隨著信息技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,新興媒介層出不窮,它們對于輿情熱度的影響還尚待研究;此外,媒介激烈競爭造成不同類型媒介影響力的此消彼長,需要高校經(jīng)常更新相關(guān)指標(biāo)權(quán)重數(shù)據(jù),才能做到盡可能準(zhǔn)確。這些問題都有待進一步研究加以改善。
參考文獻
[1]張元龍.關(guān)于“輿情”及相關(guān)概念的界定與辨析[J].浙江學(xué)刊,2009,(3):183.
[2]吳紹忠、李淑華.互聯(lián)網(wǎng)絡(luò)輿情預(yù)警機制研究[J].中國人民公安大學(xué)學(xué)報:自然科學(xué)版,2008,(3):38-42.
[3]戴媛,姚飛.基于網(wǎng)絡(luò)輿情安全的信息挖掘及評估指標(biāo)體系研究[J].情報理論與實踐,2008,(6):873-876.
[4]謝海光,陳中潤.互聯(lián)網(wǎng)內(nèi)容及輿情深度分析模式[J].中國青年政治學(xué)院學(xué)報,2006,(3):95-100.
[5]錢愛兵.基于主題的網(wǎng)絡(luò)輿情分析模型及其實現(xiàn)[J].現(xiàn)代圖書情報技術(shù),2008,(4):49-55.
[6]王青,成穎,巢乃鵬.網(wǎng)絡(luò)輿情監(jiān)測及預(yù)警指標(biāo)體系構(gòu)建研究[J].圖書情報工作,2011,(4):55-56.
[7]何紹華,方清華.信息傳遞中的信息損失認知與技術(shù)分析[J].情報理論與實踐,2006,(6):764-765.
[8]張一文,齊佳音,方濱興,等.非常規(guī)突發(fā)事件網(wǎng)絡(luò)輿情指標(biāo)體系建立初探[J].北京郵電大學(xué)學(xué)報,2010,(4):10.
[9]梁睴,熊立,王國華.一種群決策中確定專家判斷可信度的改進方法[J].系統(tǒng)工程,2004,(6):91-94.
[10]薛耀文,楊根科.算術(shù)平均和幾何平均在群組決策中獻比較研究[J].太原重型機械學(xué)院學(xué)報,1994,(1):91-96.
[11]查先進.信息分析與預(yù)測[M].武漢:武漢大學(xué)出版社,2000:187-192.
(本文責(zé)任編輯:孫國雷)endprint