AI生成百篇假論文,H指數排名飆升到第6!
林墨 新智元 今天
新智元推薦
來源:林墨(ID:linmo_wx)
編輯:克雷格
【新智元導讀】署名「IKE ANTKARE」的論文有102篇,讓IKE ANTKARE在谷歌學術中的h指數一下飆升到了94,成為計算機科學領域科學家H指數排名第6的學者。實際上,這些是格勒諾布爾大學的CYRIL LABBE教授利用MIT研究人員發明的SCIgen自動生成的。
谷歌學術、百度學術等學術搜索引擎以收錄範圍廣泛、免費訪問等優勢逐漸搶佔了學術文獻全文的入口,這一點讓web of science和Scopus等資料庫商緊張不已。
收錄範圍廣便能夠建立更龐大的引文網路,因此,谷歌學術、百度學術等學術搜索引擎收錄的文獻的被引次數更高,所以,一些學者在委託圖書館出具引文報告時,希望以谷歌學術的被引次數為依據,作為自己論文影響力的佐證。
但是,學術搜索引擎中隨意的數據給造假提供了極大的空間。
辛辛苦苦幾十年,不如一鍵生成?
格勒諾布爾大學的CYRIL LABBE教授利用MIT研究人員發明的SCIgen,以「IKE ANTKARE」作為作者名(注意哦,作者並非真實存在),自動生成了102篇科研論文,讓IKE ANTKARE在谷歌學術中的h指數一下飆升到了94,成為計算機科學領域科學家H指數排名第6的學者。
下圖顯示了該研究中使用的工具SCIgen,只要在SCIgen網頁上的作者欄中輸入作者名,程序就可以自動生成一篇擁有完整結構的computer science論文,包括Titles, authors, sections, bibliography, graphs, figures等等。
註:SCIgen 論文生成器
請看用SCIgen 論文生成器自動生成了一篇我的論文,是不是挺嚇人?
註:SCIgen 論文生成器自動生成的論文
如何讓谷歌學術收錄自動生成的論文?
要想獲得谷歌學術中的 h 指數值,首先得讓谷歌收錄你的論文。CYRIL LABBE用與上文所說的方法,利用SCIgen生成了100篇論文,每篇論文都對所有的100篇論文進行引用,然後生成該論文的html頁面,html頁面包含論文標題、摘要及PDF全文鏈接等信息。
註:圖片來源於參考文獻中的論文(偽造論文的引用關係)
為了讓谷歌學術能夠對這100篇論文進行索引,CYRIL LABBE在這100篇偽造論文的參考文獻中加入了1篇真實的已被谷歌學術索引的論文,然後將這100篇論文上傳到網上。不久,IKE ANTKARE的h指數就已經飆升到了94,甚至高於愛因斯坦的h指數84。
你可能引用了虛假論文
目前,谷歌學術已經對這批論文進行了處理,但是在百度學術中,仍能看到這些用軟體生成的論文及其被引頻次。
註:你可能引用了百度學術中的虛假論文
從這個案例中我們可以看到,數據隨意的學術搜索引擎,很容易被人為操縱,因此不宜使用其引文數據作為學術評價的數據源。
參考文獻:
LABBé, C. (2018). One of the great stars in the scientific firmament. ISSI NEWSLETTER, 6(2), 48-52.
(本文授權轉載自:林墨)
【加入社群】
新智元 AI 技術 + 產業社群招募中,歡迎對 AI 技術 + 產業落地感興趣的同學,加小助手微信號: aiera2015_3 入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名 - 公司 - 職位;專業群審核較嚴,敬請諒解)。
![](https://pic.pimg.tw/zzuyanan/1488615166-1259157397.png)
![](https://pic.pimg.tw/zzuyanan/1482887990-2595557020.jpg)
※來看一場 AI 重建的 3D 全息世界盃比賽!
※「換臉AI升級版」面部表情、身體動作、視線方向都能實時遷移
TAG:新智元 |