把「咪」換成 「貓」,就可能騙過查重軟體么?
原文作者:Felicity Prentice
最近發表在International Journal for Educational Integrity上的一項探索性研究對學生的論文(特別是需要使用標準醫學術語的論文)進行了分析,這些論文的特點是均不符合語言規範且難以理解。該研究表明,使用與上下文不符的同義詞取代專業術語的論文。更容易指向作者使用了在線改寫工具而非語言翻譯工具。
圖片來源: Jason Leung, Unsplash.com
抄襲早已不是新鮮事了,但科技的發展為抄襲提供了各種新的機會;過去的抄襲往往是直接從其他來源進行複製粘貼,現在則發展為學生直接求助他人完成所有的作業來當作是自己的成果。當然,技術也為我們提供了識別潛在抄襲和剽竊的機會。Turnitin等文本匹配軟體可以生成相似性報告,即使文本中沒有提到原始來源,我們也能據此找到原始來源。然而,現在又產生了一個能蒙蔽這類辭彙匹配軟體的最新技術——在線改寫工具。
最近,在健康科學課程中,我們遇到了來自學生的形形色色的論文,這些論文會夾雜一些不符合語言習慣的表達,有些極端糟糕的論文甚至出現了令人幾乎難以理解的表述。由於這些學生中有許多人的母語並非英語,因此我們推測他們是先用母語完成論文撰寫,然後再使用在線語言翻譯工具將其轉換為英語。
然而,事實遠非如此簡單。我們偶然發現了一種免費的在線英英改寫工具。很顯然,學生們從其他來源獲取了文本內容,並通過能自動替換同義詞的軟體將其進行「喬裝」,從而隱藏了這些文本與原始來源的相似性。
例如,以下句子:
一天,當Dou外出散步時,他感到頭昏眼花,隨後便失去意識,倒在了地上。
One day while Doug was out walking, he felt lightheaded and then lost consciousness and fell to the ground.
經過在線改寫工具的改造,可能會變成:
一個恆星日,Doug外出散步,他感到頭昏眼花,隨後便失去知覺,摔得粉碎。
One sidereal day, while Dougwas out walk, he felt lightheaded and then lost knowingness and downslope to the pulverization.
不管怎麼說,學生們使用語言翻譯軟體將自己所寫的內容進行轉換,這至少表明撰寫內容的工作是其自身智慧的成果。但使用改寫工具則是另一種情況,表明他們想要隱藏內容的原始來源。
有兩篇文章讓我印象深刻。其中一篇文章中描述到計算機軸向斷層掃描(CAT)是從各個不同角度(原文中angels拼寫錯誤,正確應為angles)獲得的X線圖像。而在另一篇文章中,則將CAT掃描圖像描述為從各個不同的祝福信使(blessed messengers,angels的同義詞)中獲取的圖像。很明顯,第一篇文章是第二篇文章的原始來源,而第二篇文章是作者使用改寫工具處理得出的。
缺乏學科專業術語是抄襲的標誌
於是我們不禁要問,是否可以確定出一些標誌來區分文本是進行過了語言翻譯工具的處理,還是經過了英英同義詞替換工具的加工?
為了探索這一點,我們選擇了一個包含大量醫學術語的文本語料庫。整個醫療保健領域均要求使用標準的醫學術語來減少歧義並促進清晰的溝通。學生必須對這些術語了如指掌,在使用這些術語時不應做改動,並且不用同義詞進行替代。我們用谷歌翻譯將該文本字面翻譯成EAL(English as an Additional Language)學生所熟悉的六種語言;並用六種免費在線改寫工具將其進行改寫。
結果顯示,在文本所包含的21個標準醫學術語中,改寫工具生成並替代產生了73個同義詞,而谷歌翻譯只產生了7個替代術語。 例如,對於術語「醫院」,改寫工具生成了以下同義詞:治療機構,醫生機構,治療中心,修復辦公室和療養院。而谷歌翻譯並沒有產生替代文本。
這項研究結果表明,雖然在線改寫工具可能會使Turnitin等文本匹配軟體無法查重,但是其生成的語言有時很難理解。更具體地說,當出現使用與上下文不符的同義詞取代學科專業術語的情況時,更大程度上意味著作者使用了在線改寫工具,而非語言翻譯工具。
International Journal for Educational Integrity
在向學術期刊投稿的過程中,除了要注意語言文字的處理,投稿中的圖像編輯也需要格外謹慎,以免被誤判為圖像作假。
歡迎移步今日的第二條推送,了解投稿時應該注意的7個圖片編輯要點,幫您避免被誤判的風險。
International Journal for Educational Integrity
掃描二維碼
訪問期刊主頁
The IJEI is an international refereed journal where research on educational integrity is disseminated in an accessible and cost-effective format. The journal challenges readers to consider the changing nature of education in a globalised environment, and the impact that conceptions of educational integrity have on issues of pedagogy, academic standards, intercultural understanding and equity.
Articles of interest to the IJEI readership may include but are not limited to the following areas as they relate to educational integrity: plagiarism, cheating, academic integrity, honour codes, teaching and learning, institutional integrity and student motivation. Submissions may include original research (including practitioner research), theoretical discussions and review papers.
※第二屆亞太血管生物學國際會議
※基因療法對大多數人無效,用生命換來的進步為何成了缺陷?
TAG:科研圈 |