黃東平 何山
【摘 要】學(xué)術(shù)評(píng)估乏力導(dǎo)致學(xué)術(shù)不端事件頻頻發(fā)生,為此產(chǎn)生了各種各樣的學(xué)術(shù)不端行為檢測(cè)系統(tǒng)。雖然檢測(cè)系統(tǒng)快速、智能、功能強(qiáng)大,客觀上對(duì)“學(xué)術(shù)不端行為”起到了警示和震懾作用,但在實(shí)踐中發(fā)現(xiàn)其仍然存在著一些問題,對(duì)此提出了一些解決方法,并建議應(yīng)結(jié)合專家意見合理看待、理性使用檢測(cè)結(jié)果,加強(qiáng)宣傳教育,預(yù)防為主,建立健全相應(yīng)的監(jiān)督體制和誠(chéng)信檔案。
【關(guān)鍵詞】學(xué)術(shù)不端;檢測(cè)系統(tǒng);TMLC2
中圖分類號(hào): G643.8文獻(xiàn)標(biāo)識(shí)碼: A文章編號(hào): 2095-2457(2019)36-0151-002
DOI:10.19694/j.cnki.issn2095-2457.2019.36.069
The Use and Suggestion of Academic Misconduct Detection System
HUANG Dong-ping HE Shan
(South China University of Technology Library, Guangzhou Guangdong 510641, China)
【Abstract】Weak academic assessment leads to lots of academic misconduct, and a wide variety of academic misconduct detection system appear to solve these problems. Although these detection systems are fast, intelligent, powerful, frightening the “academic misconduct”, but we find that there are still some problems with them in practice , we find a number of solutions, and suggest we should have a reasonable view, rational use of the test results combining expert advices, strengthen publicity and education, prevention, establish and improve the supervision system and the integrity of files.
【Key words】Academic misconduct; Detecting system; TMLC2
0 引言
“汪暉事件”、“唐駿事件”、 “李連生事件”等頻頻發(fā)生的學(xué)術(shù)不端事件背后反映出學(xué)術(shù)評(píng)估乏力[1],為了遏制學(xué)術(shù)不端行為的產(chǎn)生,營(yíng)造良好的學(xué)術(shù)氛圍。各種各樣的學(xué)術(shù)不端行為檢測(cè)系統(tǒng)陸續(xù)產(chǎn)生:CNKI學(xué)術(shù)不端檢測(cè)系統(tǒng)、萬(wàn)方論文相似性檢測(cè)系統(tǒng)、維普通達(dá)論文引用檢測(cè)系統(tǒng)、ROST反剽竊系統(tǒng)、Turn it in系統(tǒng)、CrossCheck系統(tǒng)、SafeAssign系統(tǒng)、PERK系統(tǒng)等[2]。國(guó)內(nèi)機(jī)構(gòu)目前用得較多的是CNKI學(xué)術(shù)不端檢測(cè)系統(tǒng)。
1 CNKI學(xué)術(shù)不端檢測(cè)系統(tǒng)簡(jiǎn)介
CNKI學(xué)術(shù)不端檢測(cè)系統(tǒng)是由中國(guó)學(xué)術(shù)期刊電子雜志社與清華同方知網(wǎng)共同研制的[3],2006年開始立項(xiàng)研發(fā),主要包括以下7個(gè)子系統(tǒng):科技期刊學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)(AMLC2)、社科期刊學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)(SMLC2)、學(xué)位論文學(xué)術(shù)不端行為檢測(cè)系統(tǒng)(TMLC2)、大學(xué)生論文抄襲檢測(cè)系統(tǒng)、中學(xué)生作文檢測(cè)系統(tǒng)、英文檢測(cè)系統(tǒng)、中英對(duì)照檢測(cè)系統(tǒng)。而學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)VIP版主要是對(duì)針對(duì)博碩士畢業(yè)論文和科研論文的檢測(cè),包括AMLC2、SMLC2、TMLC2等三個(gè)子系統(tǒng)。
該系統(tǒng)采用CNKI自主研發(fā)的自適應(yīng)多階指紋特征檢測(cè)技術(shù)[3]。算法的最小指紋粒度為句子,即只要被檢論文與樣本庫(kù)中的文獻(xiàn)存在一個(gè)句子相同就可以被系統(tǒng)發(fā)現(xiàn)。支持超長(zhǎng)篇幅文獻(xiàn),改寫、組合等變形文獻(xiàn),句子、段落等各層級(jí)的檢測(cè)。
自2008年底開通以來(lái),已被全國(guó)各高校、科研機(jī)構(gòu)、出版單位廣泛使用。截至目前用戶數(shù)量已達(dá)5000家,累計(jì)檢測(cè)70萬(wàn)篇論文[3]。用于畢業(yè)論文檢測(cè)、項(xiàng)目立項(xiàng)、驗(yàn)收、報(bào)告審查,期刊審稿等。檢測(cè)功能強(qiáng)大、智能、快速,絕大部分結(jié)果客觀正確。
2 檢測(cè)系統(tǒng)存在的問題及改進(jìn)建議
本館受本校研究生院委托對(duì)本校博碩士學(xué)位論文使用TMLC2系統(tǒng)進(jìn)行檢測(cè),結(jié)合實(shí)際過程中的使用經(jīng)驗(yàn),參考學(xué)生、網(wǎng)友意見和一些文獻(xiàn)的信息,發(fā)現(xiàn)檢測(cè)系統(tǒng)主要存在以下問題:
(1)對(duì)于“改寫型”論文反抄襲能力不足。有些學(xué)生把抄襲的文字或調(diào)換句子順序[4];或主動(dòng)變被動(dòng)、被動(dòng)變主動(dòng);或增加一些擴(kuò)充性解釋;或長(zhǎng)句變短句、短句變長(zhǎng)句等等。對(duì)于這類論文系統(tǒng)并不能很好地檢測(cè)出來(lái)。我們只能期待系統(tǒng)的檢測(cè)算法能夠?qū)⒅讣y粒度從句子變?yōu)楦?xì)的語(yǔ)法單位或者采用模糊比對(duì)算法[5],甚至也像人一樣根據(jù)語(yǔ)義去判定抄襲與否。
(2)對(duì)于參考英文等外文文獻(xiàn)的論文反抄襲能力不足?;ヂ?lián)網(wǎng)上流行一種反反抄襲的方法“google新用”[4]:先把自己的論文利用google在線翻譯的方法先翻譯成英文,再將翻譯成的英文再用google翻譯成中文,然后再對(duì)其中的少量病句錯(cuò)詞稍加修改即可,這樣每句話跟原來(lái)的就不一樣了,或者英文水平較好的學(xué)生將來(lái)自不同外文文章的資料按論文框架整合在一起然后翻譯成中文。甚至一些學(xué)生將外文文獻(xiàn)直接翻譯成中文然后照搬進(jìn)論文中,從而達(dá)到反反抄襲的目的。無(wú)論是“google新用”還是“翻譯法”都告訴我們,檢測(cè)系統(tǒng)還不能檢測(cè)這類跨語(yǔ)言的抄襲。在未來(lái)或許可以開發(fā)出按語(yǔ)義的檢測(cè)系統(tǒng),用于彌補(bǔ)當(dāng)今只是針對(duì)文字的檢測(cè)系統(tǒng)的不足。
(3)對(duì)于參考書籍等紙質(zhì)文獻(xiàn)的論文反抄襲能力不足。cnki檢測(cè)系統(tǒng)目前比對(duì)范圍是:中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)、中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù)、中國(guó)優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫(kù)、中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù)、中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù)、中國(guó)專利全文數(shù)據(jù)庫(kù)、互聯(lián)網(wǎng)資源、英文數(shù)據(jù)庫(kù)(涵蓋期刊、博碩、會(huì)議的英文數(shù)據(jù)以及德國(guó)Springer、英國(guó)Taylor&Francis 期刊數(shù)據(jù)庫(kù)等)、港澳臺(tái)學(xué)術(shù)文獻(xiàn)庫(kù)、優(yōu)先出版文獻(xiàn)庫(kù)、互聯(lián)網(wǎng)文檔資源、個(gè)人比對(duì)庫(kù)。未含任何紙質(zhì)圖書。故而對(duì)于抄襲紙質(zhì)圖書的論文無(wú)法檢測(cè)。在未來(lái)可以將對(duì)比庫(kù)擴(kuò)充,將紙質(zhì)圖書文獻(xiàn)包含進(jìn)來(lái),雖然可能因此導(dǎo)致檢測(cè)時(shí)間增長(zhǎng),但卻可以大大提高檢測(cè)系統(tǒng)反抄襲的能力。
(4)對(duì)于英文等外文書寫的論文反抄襲能力不足。英文等外文檢測(cè)樣本庫(kù)太少甚至沒有包含某些外文文獻(xiàn)的數(shù)據(jù)庫(kù)。目前TMLC2系統(tǒng)只包含涵蓋期刊、博碩、會(huì)議的英文數(shù)據(jù)以及德國(guó)Springer、英國(guó)Taylor&Francis 期刊數(shù)據(jù)庫(kù)等少量數(shù)據(jù)庫(kù)。這就導(dǎo)致對(duì)英文論文檢測(cè)能力非常有限而對(duì)日文、俄文、法文、德文等文字書寫的論文毫無(wú)檢測(cè)能力。雖然目前國(guó)內(nèi)高校畢業(yè)生論文一般都用中文書寫,但是也有部分學(xué)生如外國(guó)語(yǔ)學(xué)院的學(xué)生、留學(xué)生用英文寫論文,這就會(huì)導(dǎo)致這些學(xué)生的重復(fù)率比較低,反抄襲的能力就大大下降了。
(5)對(duì)于理工科學(xué)生的論文反抄襲能力不足。理科工學(xué)生的論文一般是要進(jìn)行一些實(shí)驗(yàn)或編寫一些軟件[4]。如果他們把實(shí)驗(yàn)的數(shù)據(jù)改一改,實(shí)驗(yàn)步驟稍加變通,這樣實(shí)驗(yàn)的結(jié)果,圖表就會(huì)不一樣了。還有編寫軟件,可以根據(jù)自己的框架需要,上網(wǎng)下載一些源代碼,然后根據(jù)需要修改一下,放進(jìn)自己的框架里,這樣軟件就設(shè)計(jì)完了,論文也大功告成了。而目前的檢測(cè)系統(tǒng)只根據(jù)文字進(jìn)行檢測(cè),是無(wú)法對(duì)這類論文進(jìn)行反抄襲的。
(6)對(duì)于公式占比較大篇幅的論文可能存在文字復(fù)制比過高的情況。數(shù)學(xué)類專業(yè)的論文中可能有較大篇幅的公式及公式推導(dǎo),而這類公式推導(dǎo)如果在樣本庫(kù)的文獻(xiàn)里也曾出現(xiàn)過,系統(tǒng)將其斷定為抄襲似乎有些不合理了,這時(shí)需要評(píng)審專家認(rèn)真地查看、綜合地考慮檢測(cè)報(bào)告。
(7)不能很好地區(qū)分同名不同人的情況[6]。即如何斷定參考的文獻(xiàn)是作者本人的,如果僅僅是同個(gè)作者姓名斷定,有可能出現(xiàn)不是作者本人的文獻(xiàn)當(dāng)作作者本人的文獻(xiàn)處理了。這樣導(dǎo)致去除本人已發(fā)表文獻(xiàn)復(fù)制比過低,結(jié)果不準(zhǔn)確。
(8)只顯示兩篇論文存在抄襲現(xiàn)象,不能斷定誰(shuí)抄誰(shuí)的。在高校里導(dǎo)師或團(tuán)隊(duì)的研究是延續(xù)的,同一團(tuán)隊(duì)的人員的學(xué)術(shù)研究成果是共有的,有可能低年級(jí)的學(xué)生將研究成果發(fā)表了,而即將畢業(yè)的高年級(jí)的學(xué)生的畢業(yè)論文又將研究成果放進(jìn)論文,這就會(huì)導(dǎo)致是師兄師姐抄襲師弟師妹的論文的情況,甚至導(dǎo)師抄襲學(xué)生的情況。這對(duì)于即將畢業(yè)的學(xué)生來(lái)說(shuō)是很不合理的。
(9)有時(shí)會(huì)出現(xiàn)論文上傳不了或讀取不了。一般出現(xiàn)這種問題的論文可能含有比較多的公式、特殊符號(hào)、圖片,這時(shí)一般是把論文轉(zhuǎn)換為07版的word文件或者pdf文件即可。
(10)上傳不了文件比較大的論文。曾經(jīng)碰到過超過100M的文件上傳不了的情況,這時(shí)可以將文件格式轉(zhuǎn)為pdf文件,壓縮文件的大小。
(11)系統(tǒng)批量導(dǎo)出的檢測(cè)結(jié)果的信息不夠全面,目前只含有檢測(cè)結(jié)果、重合字?jǐn)?shù)、去除引用、去除本人、總字?jǐn)?shù)等字段。如若能夠?qū)С龈娴男畔?,將可以減輕工作人員的負(fù)擔(dān)。
3 工作建議
鑒于學(xué)術(shù)不端檢測(cè)系統(tǒng)并非萬(wàn)能的,同時(shí)該系統(tǒng)的使用又關(guān)系到畢業(yè)生、科技工作者的切身利益,關(guān)系到黨和國(guó)家科技事業(yè)的發(fā)展,故而在實(shí)際工作中,應(yīng)該慎重地、合理地使用該系統(tǒng),注意好以下幾點(diǎn):
(1)正確地看待引用和抄襲[5]。對(duì)于高校里的研究生等青年學(xué)生來(lái)說(shuō),他們從事研究的時(shí)間尚短,撰寫論文的經(jīng)驗(yàn)尚淺,適當(dāng)?shù)匾们叭说难芯砍晒潜匾暮捅匦璧模绕涫钱?dāng)他們撰寫以評(píng)論、綜述為主的論文時(shí)。他們的性質(zhì)與故意抄襲有著本質(zhì)的區(qū)別,我們應(yīng)該正確地區(qū)分和看待。
(2)判定論文是否抄襲時(shí),不應(yīng)只根據(jù)報(bào)告中的復(fù)制比判斷,而應(yīng)該是評(píng)審專家參考檢測(cè)報(bào)告,根據(jù)報(bào)告中所列舉的被抄襲的期刊名、作者名、文章名去綜合考慮。因?yàn)橛锌赡苁峭瑐€(gè)團(tuán)隊(duì)或同個(gè)導(dǎo)師的文章。
(3)無(wú)須追求過低的復(fù)制比。復(fù)制比的高低與論文質(zhì)量的好壞、創(chuàng)新性的強(qiáng)弱沒有必然的聯(lián)系。復(fù)制比低、重復(fù)字?jǐn)?shù)少只能說(shuō)明該論文抄襲的嫌疑比較低,原創(chuàng)性的可能性比較大,但并不表明這是篇好論文。一篇復(fù)制比為零的論文也可能是經(jīng)過“巧改”、“翻譯”、“google新用”等手段“整容”而成的。而且我們的研究一般是站在前人的、巨人的肩膀上進(jìn)行的,需要引用前人的研究成果。故而無(wú)須追求過低的復(fù)制比,過少的重復(fù)字?jǐn)?shù),我們應(yīng)該正確地看待、理性地使用檢測(cè)報(bào)告的結(jié)果。
(4)確定合理的合格標(biāo)準(zhǔn)。首先對(duì)于博士和碩士應(yīng)該采用不同的標(biāo)準(zhǔn)[5],碩士因其做研究的時(shí)間比較短,故而標(biāo)準(zhǔn)應(yīng)該寬些,博士應(yīng)該嚴(yán)些;另一方面因?yàn)椴┦空撐淖謹(jǐn)?shù)10萬(wàn)字左右,碩士3至5萬(wàn)字,所以看檢測(cè)結(jié)果時(shí)博士應(yīng)該重點(diǎn)看重復(fù)的字?jǐn)?shù),而碩士應(yīng)該重點(diǎn)看文字復(fù)制比。其次對(duì)于不同的學(xué)院專業(yè)應(yīng)該采用適宜該學(xué)院專業(yè)的標(biāo)準(zhǔn),理工科專業(yè)可以稍微嚴(yán)些,而像法學(xué)專業(yè)類的文科專業(yè),應(yīng)該寬些,畢竟某些法律條文不得不引用,而且這些引用的法律條文也一個(gè)字也不能修改。再次,以最新研究成果為主的論文應(yīng)該嚴(yán)些;以實(shí)用型應(yīng)用性技術(shù)為主的論文應(yīng)該寬些;以評(píng)論、綜述為主的論文應(yīng)該寬些,且要求有適當(dāng)?shù)囊摹?/p>
(5)檢測(cè)系統(tǒng)不能解決所有問題,要從制度和監(jiān)管上加以約束和懲治。[5]
4 結(jié)束語(yǔ)
通過以上分析,我們知道檢測(cè)系統(tǒng)對(duì)學(xué)術(shù)不端行為起到了震懾作用,但是由于系統(tǒng)推出不久,仍然存在著一些不足,同時(shí)也面臨著一些精心抄襲、造假的論文的挑戰(zhàn),我們?cè)谄诖到y(tǒng)進(jìn)一步改善的同時(shí),也必須從制度上加強(qiáng)監(jiān)管和約束,綜合檢測(cè)報(bào)告和評(píng)審專家意見鑒別論文是否存在抄襲行為,并通過宣傳教育的手段,引導(dǎo)師生和科技工作者加強(qiáng)學(xué)術(shù)道德修養(yǎng),設(shè)立學(xué)術(shù)道德必修課,建立學(xué)術(shù)道德誠(chéng)信檔案[5],健全獎(jiǎng)懲體制,從源頭上防止學(xué)術(shù)不端行為的產(chǎn)生,營(yíng)造良好的學(xué)術(shù)氛圍。
【參考文獻(xiàn)】
[1]盤點(diǎn)2010年學(xué)術(shù)造假事件:唐駿張悟本等上榜[EB/OL].[2013-7-4].http://news.qq.com/a/20101224/001355.htm.
[2]張旻浩,高國(guó)龍,錢俊龍.國(guó)內(nèi)外學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)平臺(tái)的比較研究.中國(guó)科技期刊研究,2011,22(4):514-521.
[3]CNKI科研誠(chéng)信管理系統(tǒng)研究中心[EB/OL].[2013-7-4].http://check.cnki.net/Article/about/2009/06/59.html.
[4]“反抄襲”軟件遭遇大學(xué)生“反反抄襲”[EB/OL].[2013-7-4].http://www.cnbeta.com/articles/103798.htm.
[5]顏峻,候風(fēng)華,黃莉,徐勝.防范學(xué)術(shù)不端“凈化高校學(xué)風(fēng)”——使用“學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)”的體會(huì).編輯學(xué)報(bào),2010,12:8-10.
[6]胡朝明.學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)的使用與建議.圖書館工作與研究,2012,4:33-35.