• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      科研重復(fù)率信息整合平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)

      2020-03-10 20:12:19咸悅梁瑋琪
      科學(xué)與財(cái)富 2020年33期
      關(guān)鍵詞:文本挖掘科研項(xiàng)目

      咸悅 梁瑋琪

      摘 要:本文結(jié)合進(jìn)行項(xiàng)目查重現(xiàn)有方法研究一種準(zhǔn)確、高效的方式。總結(jié)了科技項(xiàng)目查重的一般過(guò)程,將其概括為文本預(yù)處理、特征提取、模型構(gòu)建、相似度判別和專家審核。采用資源采集技術(shù),文本數(shù)據(jù)庫(kù)加工技術(shù),文本數(shù)據(jù)庫(kù)技術(shù), 數(shù)字資源版權(quán)保護(hù)技術(shù), 知識(shí)挖掘技術(shù), 自然語(yǔ)言處理技術(shù)、快速比對(duì)技術(shù)等,從多方面進(jìn)行數(shù)據(jù)采集,通過(guò)文本預(yù)處理、特征提取以及模型構(gòu)建及相似度判別,從而為查重網(wǎng)站信息整合平臺(tái)做出有力的數(shù)據(jù)支撐,為查重體系提供必要的參考。

      關(guān)鍵詞:科研項(xiàng)目;文本挖掘;精準(zhǔn)對(duì)比

      引言:

      我國(guó)近年來(lái)不斷加大科研投入的規(guī)模和強(qiáng)度,科研項(xiàng)目的數(shù)量和經(jīng)費(fèi)規(guī)模均得到顯著的提升,形成了多個(gè)層次的國(guó)家科技計(jì)劃資助體系。然而,項(xiàng)目多頭申報(bào)、重復(fù)立項(xiàng)已成為科研項(xiàng)目管理領(lǐng)域的突出問(wèn)題之一,尤其是跨科技計(jì)劃的重復(fù)立項(xiàng)問(wèn)題。該問(wèn)題不僅會(huì)造成國(guó)家科技資源的浪費(fèi),而且也會(huì)導(dǎo)致惡性的科研競(jìng)爭(zhēng)環(huán)境,對(duì)科技創(chuàng)新發(fā)展的危害極大。因此,如何建立有效、可行的項(xiàng)目查重機(jī)制已經(jīng)成為科技計(jì)劃管理部門的重要任務(wù)之一。

      教育一直是整個(gè)社會(huì)的熱點(diǎn)問(wèn)題和關(guān)鍵問(wèn)題。但現(xiàn)在隨著互聯(lián)網(wǎng)的廣泛應(yīng)用“抄襲借鑒”形成了一種風(fēng)氣,教育部在《關(guān)于切實(shí)加強(qiáng)和改進(jìn)高等學(xué)校學(xué)風(fēng)建設(shè)的實(shí)施意見(jiàn)》中指出:“學(xué)風(fēng)是大學(xué)精神的集中體現(xiàn),是教書育人的本質(zhì)要求,是高等學(xué)校的立校之本、發(fā)展之魂?!?誠(chéng)信教育,是人類文化的重要組成部分,是弘揚(yáng)人文精神的重要形式,在社會(huì)主義先進(jìn)文化建設(shè)中發(fā)揮著不可替代的作用,要求我們大力弘揚(yáng)愛(ài)國(guó)主義、集體主義、社會(huì)主義思想,以增強(qiáng)誠(chéng)信意識(shí)為重點(diǎn),加強(qiáng)社會(huì)公德、職業(yè)道德、家庭美德、個(gè)人品德建設(shè)。讓高校學(xué)生認(rèn)識(shí)到誠(chéng)信的重要性,將有助于學(xué)生樹立正確的學(xué)習(xí)目的和學(xué)習(xí)態(tài)度,并制定合理的學(xué)習(xí)計(jì)劃,并通過(guò)他們的努力實(shí)現(xiàn)自己具體的奮斗目標(biāo)。論文查重需要強(qiáng)大的技術(shù)作為支撐,包括資源采集技術(shù),文本數(shù)據(jù)庫(kù)加工技術(shù),文本數(shù)據(jù)庫(kù)技術(shù), 數(shù)字資源版權(quán)保護(hù)技術(shù), 知識(shí)挖掘技術(shù), 自然語(yǔ)言處理技術(shù)、快速比對(duì)技術(shù)等。因此,本文是針對(duì)于科研項(xiàng)目設(shè)計(jì)的查重整合平臺(tái)。

      1.概述

      為推動(dòng)科技創(chuàng)新發(fā)展和提高科技競(jìng)爭(zhēng)力,科技項(xiàng)目查重已成為科技管理領(lǐng)域常見(jiàn)的詞匯,科技項(xiàng)目查重一般是指從已有的項(xiàng)目數(shù)據(jù)中通過(guò)文本挖掘和綜合判斷,確認(rèn)是否存在與待查項(xiàng)目的研究?jī)?nèi)容相同或高度相似的項(xiàng)目的過(guò)程。已有的項(xiàng)目數(shù)據(jù)包括通過(guò)正式立項(xiàng)的項(xiàng)目信息如項(xiàng)目名稱、關(guān)鍵詞、摘要和項(xiàng)目申報(bào)書等,也包括項(xiàng)目的關(guān)聯(lián)信息如學(xué)術(shù)論文、科技報(bào)告和科技成果等。此外,項(xiàng)目承擔(dān)人和承擔(dān)單位等信息也能提供一定的線索?;谖谋就诰虻姆椒茏詣?dòng)的計(jì)算項(xiàng)目的相似性,但其準(zhǔn)確性較差,可用于快速排除大量的無(wú)關(guān)項(xiàng)目。項(xiàng)目的重復(fù)性判斷是一個(gè)復(fù)雜的過(guò)程,需要專家的綜合判斷能力甄別出重復(fù)的項(xiàng)目,但需要耗費(fèi)大量的人力。

      結(jié)合上述方法進(jìn)行項(xiàng)目查重才是一種準(zhǔn)確、高效的方式??萍柬?xiàng)目查重的一般過(guò)程,將其概括為文本預(yù)處理、特征提取、模型構(gòu)建、相似度判別和專家審核。 采用資源采集技術(shù),文本數(shù)據(jù)庫(kù)加工技術(shù),文本數(shù)據(jù)庫(kù)技術(shù), 數(shù)字資源版權(quán)保護(hù)技術(shù), 知識(shí)挖掘技術(shù), 自然語(yǔ)言處理技術(shù)、快速比對(duì)技術(shù)等。在海量的全文數(shù)據(jù)的基礎(chǔ)上實(shí)現(xiàn)快速準(zhǔn)確的檢測(cè),上述技術(shù)是基本的保證。另外,檢測(cè)比對(duì)庫(kù)里需要收錄期刊、學(xué)位論文、會(huì)議論文、報(bào)紙、年鑒、工具書、專利、外文文獻(xiàn)、學(xué)術(shù)文獻(xiàn)引文等與科學(xué)研究、學(xué)習(xí)相關(guān)的主要資源,才可以支撐起一個(gè)論文查重檢測(cè)系統(tǒng)。

      2.平臺(tái)搭建

      本文所設(shè)計(jì)一款基于HTML的查重網(wǎng)站信息整合平臺(tái)進(jìn)行對(duì)外開放,主要針對(duì)于當(dāng)代高校師生,隨著互聯(lián)網(wǎng)的普及與此同時(shí)隨著網(wǎng)絡(luò)成為新時(shí)代發(fā)展趨勢(shì)。本著端正學(xué)風(fēng)的宗旨,本項(xiàng)目提出查重網(wǎng)站信息整合平臺(tái)要求學(xué)生要堅(jiān)持“誠(chéng)信立人”的原則,養(yǎng)成“嚴(yán)謹(jǐn)為學(xué)”的態(tài)度,促進(jìn)學(xué)術(shù)的健康、良性發(fā)展保護(hù)個(gè)人知識(shí)產(chǎn)權(quán)。

      1、科技項(xiàng)目查重信息整合平臺(tái)的設(shè)計(jì):

      平臺(tái)將從已有的科技項(xiàng)目大數(shù)據(jù)中通過(guò)文本挖掘和綜合判斷,確認(rèn)是否存在與待查項(xiàng)目的研究?jī)?nèi)容相同或高度相似的項(xiàng)目,也包括項(xiàng)目的關(guān)聯(lián)信息如學(xué)術(shù)論文、科技報(bào)告和科技成果等。此外,項(xiàng)目承擔(dān)人和承擔(dān)單位等信息也能提供一定的線索,因此科技項(xiàng)目查重的一般過(guò)程將其概括為文本預(yù)處理、特征提取、模型構(gòu)建、相似度判別和模擬專家審核;

      2、科技項(xiàng)目比對(duì)庫(kù):

      科技項(xiàng)目查重信息整合平臺(tái)要建立一套科技項(xiàng)目比對(duì)庫(kù),包含近年來(lái)已有的科研項(xiàng)目導(dǎo)入;

      3、科技項(xiàng)目比對(duì)文檔:

      通常是網(wǎng)頁(yè)在線格式或PDF格式,報(bào)告上會(huì)體現(xiàn)與已有的科研項(xiàng)目相似的比例、重復(fù)的內(nèi)容、重復(fù)內(nèi)容的來(lái)源等。

      3.處理過(guò)程

      論文查重系統(tǒng)看起來(lái)比較簡(jiǎn)單,其實(shí)需要強(qiáng)大的技術(shù)作為支撐,包括資源采集技術(shù),文本數(shù)據(jù)庫(kù)加工技術(shù),文本數(shù)據(jù)庫(kù)技術(shù), 數(shù)字資源版權(quán)保護(hù)技術(shù), 知識(shí)挖掘技術(shù), 自然語(yǔ)言處理技術(shù)、快速比對(duì)技術(shù)等。

      1、預(yù)處理:

      預(yù)處理是將科技項(xiàng)目的相關(guān)大數(shù)據(jù)信息處理為指定的規(guī)范格式,并對(duì)文本信息確定處理單元及進(jìn)行分詞或分句、去停用詞等。

      2、特征提取:

      特征提取是從預(yù)處理后的數(shù)據(jù)中挖掘出能全面/部分描述項(xiàng)目?jī)?nèi)容且區(qū)別于其他項(xiàng)目的特征向量,一般由特征詞和權(quán)重組成,采用基于詞頻或 TFIDF 值的方法計(jì)算其權(quán)重,并在大數(shù)據(jù)挖掘和文本分析領(lǐng)域應(yīng)用基于 TextRank 和主題模型的方法。

      3、模型構(gòu)建:

      模型構(gòu)建是按照數(shù)據(jù)規(guī)劃方式對(duì)特征向量進(jìn)行整合,從而建立能準(zhǔn)確、全面描述項(xiàng)目?jī)?nèi)容的模型。

      4、相似度判別:

      相似度判別是基于項(xiàng)目表示模型設(shè)計(jì)相似度判別函數(shù),從已有項(xiàng)目的數(shù)據(jù)庫(kù)中發(fā)現(xiàn)疑似項(xiàng)目的過(guò)程。

      5、模擬專家審核:

      重復(fù)對(duì)疑似項(xiàng)目進(jìn)行二次數(shù)據(jù)綜合分析和判斷,確定待查項(xiàng)目是否為重復(fù)項(xiàng)目并提供相關(guān)證據(jù)的過(guò)程。

      4.結(jié)論

      綜上所述,本文所提出的基于HTML的查重網(wǎng)站信息整合平臺(tái)能夠從多方面進(jìn)行數(shù)據(jù)采集,通過(guò)文本預(yù)處理、特征提取以及模型構(gòu)建及相似度判別,從而為查重網(wǎng)站信息整合平臺(tái)做出有力的數(shù)據(jù)支撐,為查重體系提供必要的參考。

      參考文獻(xiàn):

      [1]李善青,邢曉昭,杜圣梅.科技項(xiàng)目查重方法研究綜述[J].科技管理研究. 2018(06)

      *基金項(xiàng)目:本文為吉林農(nóng)業(yè)科技學(xué)院自然科學(xué)類科研項(xiàng)目,項(xiàng)目編號(hào)吉農(nóng)院合字第[校20190693]號(hào)。

      (吉林農(nóng)業(yè)科技學(xué)院? 吉林? 132000)

      猜你喜歡
      文本挖掘科研項(xiàng)目
      我校橫向科研項(xiàng)目再創(chuàng)佳績(jī)
      圍繞科研項(xiàng)目建立定密管理框架的探討
      航天科研項(xiàng)目評(píng)審工作的思考與探索實(shí)踐
      數(shù)據(jù)挖掘技術(shù)在電站設(shè)備故障分析中的應(yīng)用
      基于LDA模型的95598熱點(diǎn)業(yè)務(wù)工單挖掘分析
      文本數(shù)據(jù)挖掘在電子商務(wù)網(wǎng)站個(gè)性化推薦中的應(yīng)用
      商(2016年34期)2016-11-24 16:28:51
      從《遠(yuǎn)程教育》35年載文看遠(yuǎn)程教育研究趨勢(shì)
      慧眼識(shí)璞玉,妙手煉渾金
      申請(qǐng)科研項(xiàng)目,不應(yīng)以職稱論高下
      公民與法治(2016年4期)2016-05-17 04:09:24
      文本觀點(diǎn)挖掘和情感分析的研究
      临清市| 乌鲁木齐市| 章丘市| 宾阳县| 香河县| 类乌齐县| 云浮市| 车致| 天津市| 容城县| 石狮市| 河北省| 漠河县| 师宗县| 张掖市| 扎鲁特旗| 景泰县| 社会| 德安县| 庆云县| 瑞金市| 万全县| 宜川县| 祁阳县| 深圳市| 大渡口区| 克东县| 泾源县| 高唐县| 永宁县| 仁布县| 广平县| 张家口市| 洛南县| 交口县| 敖汉旗| 阿拉善右旗| 新平| 南阳市| 镇沅| 栾城县|