可以知道網(wǎng)絡(luò)論文的檢測(cè)系統(tǒng)。通過(guò)網(wǎng)絡(luò)檢索的重量測(cè)定系統(tǒng)識(shí)別論文的主體進(jìn)行檢查的方法。通過(guò)系統(tǒng)的動(dòng)作和計(jì)算,以“復(fù)制比”或“類(lèi)似比”的直觀形式顯示檢查結(jié)果。目前,網(wǎng)絡(luò)復(fù)查系統(tǒng)知道不能完全替代人工比較,還存在很多檢查盲點(diǎn)。現(xiàn)在,筆者在怎樣使用過(guò)程中發(fā)現(xiàn)的問(wèn)題,列舉了以下心得。復(fù)制句子或文字拷貝太高。在生物醫(yī)學(xué)領(lǐng)域的論文中,很多研究方法和臨床診療方案相似。另外,論文的形式基本上是固定的。句子比較簡(jiǎn)單通用。例如,使用SPSS統(tǒng)計(jì)軟件分析數(shù)據(jù),計(jì)量資料用X±S表示。
的同一方向的研究與經(jīng)常查詢(xún)的文獻(xiàn)相同,采用的技術(shù)和方法一致,在術(shù)語(yǔ)的應(yīng)用和語(yǔ)言的表達(dá)上也容易發(fā)生重復(fù)。同一作者在前期研究的基礎(chǔ)上繼續(xù)深入,后期文章中前文的文字、研究方法、研究?jī)x器、使用的材料、統(tǒng)計(jì)學(xué)的分析等很多文字的說(shuō)明與前文一致。中醫(yī)藥類(lèi)論文經(jīng)常引用經(jīng)典語(yǔ)句,檢查系統(tǒng)還無(wú)法識(shí)別這些語(yǔ)句來(lái)自經(jīng)典著作。因此,醫(yī)學(xué)類(lèi)文章容易出現(xiàn)文字重復(fù),導(dǎo)致文字復(fù)制率高。雖然論文整體的文字拷貝太高,但核心內(nèi)容幾乎沒(méi)有重復(fù)。利用這些系統(tǒng)檢查醫(yī)學(xué)論文的話(huà),有可能出現(xiàn)檢查結(jié)果的“假陽(yáng)性”。檢查系統(tǒng)明確控制了抄襲、抄襲,但對(duì)文化發(fā)展造成了負(fù)面影響。
根據(jù)《著作權(quán)法》的作者有引用的權(quán)利,系統(tǒng)無(wú)法保障。這種情況應(yīng)該以同行評(píng)議的方式進(jìn)行補(bǔ)充評(píng)議。
2、檢查系統(tǒng)收錄了文獻(xiàn)完整性問(wèn)題。CNKI、萬(wàn)方、普數(shù)據(jù)庫(kù)與國(guó)內(nèi)很多雜志合作,但是3個(gè)數(shù)據(jù)庫(kù)里收錄的雜志完全不一致。各所收論文存在差異,知識(shí)網(wǎng)檢重檢查系統(tǒng)的結(jié)果存在差異。如果復(fù)制到
庫(kù)之前的文獻(xiàn),則無(wú)法驗(yàn)證數(shù)據(jù)庫(kù)。另外,CNKI、萬(wàn)方的數(shù)據(jù)分別與一部分科技期刊編輯部簽訂了壟斷合作協(xié)定,意味著該刊物的所有文獻(xiàn)只能在各自的數(shù)據(jù)庫(kù)中檢索,其他數(shù)據(jù)庫(kù)的統(tǒng)計(jì)源文獻(xiàn)缺失。另外,現(xiàn)在的檢查系統(tǒng)在圖書(shū)的收錄中有很大的空閑。如果論文的復(fù)印件是圖書(shū)的內(nèi)容,就不能檢測(cè)出已有的系統(tǒng)。
3、檢測(cè)技術(shù)問(wèn)題的每個(gè)檢測(cè)系統(tǒng)在操作方案、背景數(shù)據(jù)庫(kù)、算法特征(論文重要意義段的識(shí)別、字段識(shí)別、近義義同義識(shí)別)等方面存在差異,這些由于技術(shù)差異,不同的檢測(cè)系統(tǒng)具有相同的理論在對(duì)語(yǔ)句進(jìn)行檢測(cè)的情況下,可以得到不同的結(jié)論結(jié)果,時(shí)差很大。復(fù)制粘貼者對(duì)檢查系統(tǒng)的檢測(cè)原理研究“反復(fù)制粘貼”的方法,將文章變成文字游戲,根據(jù)語(yǔ)句順序的調(diào)整、同義詞的替換、語(yǔ)句表達(dá)方式的變動(dòng),避免對(duì)系統(tǒng)的檢查。此外,也有人將外語(yǔ)文獻(xiàn)翻譯成中文發(fā)表,或?qū)⒆约旱闹形脑宸g成英語(yǔ)投稿。
網(wǎng)絡(luò)檢索重檢系統(tǒng)在技術(shù)上只能檢測(cè)“文字”,由于無(wú)法檢測(cè)“思想”,無(wú)法防止“文字”的剽竊,無(wú)法防止“思想”的剽竊缺陷。這個(gè)時(shí)候需要在同行的評(píng)議中進(jìn)行補(bǔ)充評(píng)議。4、文字識(shí)別誤差對(duì)于同一篇論文,如果使用Word版和PDF版進(jìn)行檢查,論文的重復(fù)率就會(huì)明顯不同。這主要是由于兩者的文字識(shí)別率不同而引起的。
可以同時(shí)在檢測(cè)報(bào)告中發(fā)生亂碼,這是由于所提出的PDF論文或數(shù)據(jù)庫(kù)中的論文的字符轉(zhuǎn)換錯(cuò)誤造成的。5、旋轉(zhuǎn)頁(yè)面顯示錯(cuò)誤文字處理的兩篇論文共同使用一頁(yè)或同一篇論文的版式切換到下一頁(yè)時(shí),測(cè)量結(jié)果顯示,被測(cè)論文與自身重復(fù)或誤作同一個(gè)文字的兩個(gè)錯(cuò)誤,直接復(fù)制比較高進(jìn)行人工鑒別。
、必須提高和突破外語(yǔ)論文的檢測(cè)水平?,F(xiàn)在發(fā)現(xiàn)外國(guó)語(yǔ)論文檢查結(jié)果的復(fù)制品相對(duì)較低。這與檢測(cè)系統(tǒng)收錄外語(yǔ)文獻(xiàn)的底部數(shù)據(jù)不足、范圍受到限制有關(guān),低復(fù)制比無(wú)法反映論文的真實(shí)品質(zhì)。7、檢查報(bào)告的閱讀、解釋是檢查系統(tǒng)還不完善,檢查報(bào)告可能有其他問(wèn)題。①有些外語(yǔ)會(huì)議論文沒(méi)有引用作者,所以不能排除與作者提出的期刊論文重復(fù)的部分。但是,也有未被參考文獻(xiàn)所識(shí)別的。(3)無(wú)法自動(dòng)識(shí)別外語(yǔ)名稱(chēng)。例如,XiaoYongSUNVSXiao-YongSun;(4)文字識(shí)別錯(cuò)誤。筆者檢測(cè)過(guò)一篇論文。根據(jù)測(cè)定報(bào)告書(shū),“本人學(xué)位論文會(huì)議論文的復(fù)印比除外”占43.4%,“一篇的最大文字復(fù)印比”占18.4%。
后,與原文相比,檢索字符數(shù)為376個(gè)字,與從原文轉(zhuǎn)換為文本的4001個(gè)字大不相同,因此被認(rèn)為檢測(cè)系統(tǒng)字符的轉(zhuǎn)換有誤。咨詢(xún)的技術(shù)人員說(shuō)明,由于收錄數(shù)據(jù)的加工問(wèn)題,系統(tǒng)無(wú)法讀取原文。
后,該論文以PDF形式上傳檢查原文,“本人學(xué)位論文會(huì)議的論文復(fù)制比除外”為0.9%,“一篇最大文字復(fù)制比”為0.9%??偨Y(jié):以上7點(diǎn)是本人網(wǎng)絡(luò)檢索重檢系統(tǒng)的使用經(jīng)驗(yàn)。
篇論文的剽竊在學(xué)術(shù)上是不好的形式,在確認(rèn)中文論文內(nèi)容的重復(fù)情況上具有重要的實(shí)用價(jià)值,對(duì)一些學(xué)術(shù)上的不毛之地也感到震驚。本研究對(duì)山東省部分高校4年9000多的職稱(chēng)評(píng)價(jià)論文的檢查結(jié)果進(jìn)行統(tǒng)計(jì)分析,部分反映了山東省目前高校學(xué)術(shù)論文學(xué)術(shù)上存在的不良狀況。在網(wǎng)上復(fù)查系統(tǒng)本身就有問(wèn)題。這需要檢查員以高度的責(zé)任感仔細(xì)解讀檢查報(bào)告,慎重地拿出檢查結(jié)果。
同時(shí)指出檢查報(bào)告的使用機(jī)構(gòu)應(yīng)合理使用報(bào)告結(jié)果,必要時(shí)應(yīng)進(jìn)行人工學(xué)術(shù)鑒定,不能只關(guān)注測(cè)定報(bào)告的數(shù)據(jù)。因?yàn)楹芏嗾撐牡闹亓繖z查系統(tǒng)沒(méi)有對(duì)外開(kāi)放,所以去調(diào)查一下學(xué)生的重量吧。