當前位置:
首頁 > 新聞 > 鑒黃師要下崗了!日本學者用AI識別「隱晦小黃文」

鑒黃師要下崗了!日本學者用AI識別「隱晦小黃文」

AI不僅可以在圍棋盤上打敗人類,還可以……智能識別小黃文。

5月23日到5月26日,在中國棋手們努力迎戰阿爾法狗的同時,日本也舉辦了第31屆全國人工智慧大會。在這次大會上,立命館大學情報理工學科的三名研究人員發布了一篇關於AI識別小黃文的論文。

論文的主要內容是,如何利用AI來識別那些「使用隱喻手法」來表現「少兒不宜」的文章。也就是說,即使作者只是在小說里遮遮掩掩地進行了某些暗示,也會被AI給揪出來

研究人員為什麼要做這種奇怪的研究我們不得而知,但使用的研究樣本對同人文化、腐文化非常不友好,在日本國內也引發了激烈的爭論。

論文截圖

爭論的原因之一是,這篇對全年齡段讀者公開發表的論文,引用了網站分級為R18的小說內容,而且還沒有提前取得網站和小說作者的同意。

論文使用了pixiv網站上,2016年十月R18分類下人氣最高的10篇BL同人小說。論文將這些小說作為研究樣本,在「小說里有不健康內容」的前提下,來說明「AI如何識別出通過隱喻手段表達的不健康內容」。

為了說明AI的識別方法,論文里引用了不少「少兒不宜」的內容。論文作者在引用前沒有取得作者或pixiv網站的授權,還私自公布了小說的題目、作者和URL地址。

pixiv是一家日本同人插畫和小說網站,對內容有嚴格的分級制度,它有一個中文名字「插畫交流網站」(而且還支持新浪微博登陸)。pixiv上分類為R18的內容只有年齡設置在18歲以上的註冊用戶才能查看。

這篇論文公開發表後,所有年齡段的人都可以看到被引用的少兒不宜內容,也都可以通過論文中的URL地址找到被引用的R18小說。一些小說作者只能將被引用的小說刪除或設成不公開狀態。

論文中給出的小說作者和URL地址

除了會被小朋友看見,在未經網站和作者允許的情況下,使用這些小說作為研究對象在日本還存在版權問題。

被引用的小說在pixiv網站上只有註冊用戶能夠查看,並且不對18歲以下用戶公開。這樣的內容是否可以被判定為「網路公開內容」加以引用和公開發表,在日本法律界還沒有定論。

日本網友們的另一個爭論點是,把這些有分級的小說劃為不健康內容真的合適嗎?

被引用的小說在pixiv網站已經被分級在R18類型下,未成年人不能閱讀。研究中依然將這些小說歸為「內容不健康文章」,還公布了小說作者和URL地址,一些日本網友認為這是對小說作者的誹謗,有違研究倫理。

這篇論文5月24日在大會上發表,5月25日,pixiv就公開表示:

我們已經要求發表論文者所在學校對這件事加以調查和解決,也希望大家以後能夠繼續安心使用P站。

機器的日文翻譯大家隨便看看就好

學校方面則表示正在著手調查這件事。這篇論文在此之前已經在日本人工智慧學會的網站上發布,不過目前已經被隱藏。論文作者之一、立命館大學助理教授山西良典在接受日本媒體採訪時表示,論文確實存在一些問題,之後是否會繼續發表還有待研究。

雖然這項利用AI判斷隱晦小黃文的研究存在問題,但用AI來識別網路內容的研究方向實在讓人不寒而慄。如果將來AI真的開始監督網上發布的內容,我們在網上說話的時候是不是要更小聲了呢?

感到背後的寒意了嗎?Big AI is watching you.


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 pingwest中文網 的精彩文章:

秀花式廣告的《奇葩說》團隊,又把植入做到了公眾號
美國UPS與順豐成立合資快遞公司

TAG:pingwest中文網 |

您可能感興趣

AI鑒黃師上線,一日鑒圖數億張,還能識別方言!又一職業或要涼涼了?
文字識別OCR
搶保安小哥飯碗?車牌識別用上了AI學習
戴笠如何用自己的方法識別日本女間諜?
盧偉冰曝光Redmi新旗艦:將採用屏下指紋識別
阿里雲將訓練 ET 大腦,用於 AI 養豬;餓了么上線騎手人臉識別功能 | AI 掘金晚報
蘋果要用屏幕指紋識別?vivo用戶:我早用了
李飛飛團隊CVPR論文:讓AI識別語義空間關係
用AI識別「問題女性」的他回應一切
台「駐外館處」要把臉書識別文字改為「TAIWAN」國台辦回應
密歇根大學研究者致力於用AI實時識別驗證ID證件
HLA-DRβ1氨基酸基序有助於識別JIA患者的葡萄膜炎
劍橋大學研究人員推出VR應用,可用於識別癌症腫瘤
搶保安小哥的飯碗?車牌識別都用上了AI學習
MIUI固件泄露小米7將採用劉海屏造型:紅外人臉識別
MIUI固件泄露小米7將用劉海屏造型:紅外人臉識別
張學友演唱會喜提「五殺」 AI人臉識別技術立大功:逃犯剋星了解一下!
「ABCDE法」——自我識別黑痣的良性與惡性
U盤內的APK文件無法識別?
遞歸皮層網路RCN識別文本CAPTCHAS的Science論文基礎知識和譯文