AI假新聞滿天飛,打假神器GROVER幫你看清一切
最近AI換臉術與AI假新聞疊加在一起,造成了不少烏龍事件,比如最近美國的議長南希·佩洛西就的一段醉酒視頻就在Facebook上流傳甚廣,視頻中的議長明顯是狀態暈沉,醉意十足,不過這後來被證明是一段是由deepfake生成的假視頻。
後來Facebook創始人馬克.扎克伯格的一段視頻也開始瘋傳,在其中小扎說「讓我們快速地想像一下,一個人手握偷竊來的數十億人的隱私信息,他們的所有秘密、生活和未來等等 」,不過這也是deepfake的傑作。
無獨有偶,一名叫做Katie Jones的女政治家,似乎正在美國政壇冉冉升起,她在頂級智庫工作,擁有由一批專家和權威人士組成的關係網。她與一名助理國務卿、一名參議員的高級助理以及經濟學家 Paul Winfree 都有聯繫,而且搜索引擎上也能查到相應的新聞報道,不過這位女士其實並不存在,對此美聯社已經作出確認,其面部信息是合成的,其相關新聞都是AI捉刀寫的。
打假神器 GROVER 橫空出世
在OpenAI 推出文本生成模型 GPT-2 後,其文稿所中流暢自然的文筆引發各界廣泛的關注,尤其是最近《權力的遊戲》爛尾,硬核程序員用GPT-2重寫了比電視劇更好的結局,這也讓GPT-2演算法名聲大噪,不過由於這個模型內置 15 億個參數(你沒看錯15億個),其算力門檻讓我們這些普通玩家望而卻步。不過一種簡化的GP2-2-SIMPLE模型已經在 GITHUB 上開源,有機會筆者也會向讀者們分享一下這個項目的使用心得。
那麼面對這些假新聞包裝出來的假人、假事,華盛頓大學和艾倫人工智慧研究所的研究者提出了一種名為Grover 的鑒定模型,這個模型本身並沒有什麼特別值得一提的創新,其思路就是把AI寫的文章與人工寫的文章分為兩組,餵給GPU進行模型訓練。論文中最重要的一段如下:「Training Grover-Mega is relatively inexpensive: at a cost of $0.30 per TPU v3 core-hour and two weeks of training, the total cost is $25k」也就是人家為了訓練Grover花了20萬人民幣。所以這又是一次算力上的碾壓。
不過雖然Grover的作者並沒有開源模型,不過讀者還是可以通過他們提供的網頁,來感受Grover的強大,
在GENERATE的標籤下,隨便輸入一個標題,點擊generate,一會AI就能給你一篇完整的文章,我輸入的標題是why china will win the trade war而且寫的有理,有據,甚至比很多大V的觀點更有見識。所以打假能手,本身也是個造假能手,大家也可以去感受一下。
地址:
https://grover.allenai.org/
GENERAT旁邊的標籤DETECT則可以發現假新聞。隨便把我們剛剛讓GROVER寫的假新聞拷進去,點擊「DETECT FAKE NEW"就能得到結果
GROVER的打假原理
由於Grover是使用典型深度學習模型,開發者也並不能了解其工作的具體機制,其原文是這麼說的「Why does Grover perform best at detecting its own fake news? We hypothesize that the reason may be due in part to exposure bias」.也就是本文的作者認為Grover是通過檢測exposure bias來預測文章是否是由AI生成。
其實到底是不是exposure bias並不重要,我們上次說的VP-VAE-2當中VP其實就是一種壓縮演算法,而每種機器學習演算法中幾乎都存在池化或者非全鏈接層,以此來減低計算量,這樣的存在也就給AI賦予了風格,而Grover其實就是通過海量的訓練,來感知AI的風格(style)並以此給出自己的預測概率。
參考閱讀:
(*本文為 AI科技大本營轉載文章,轉載請聯繫原作者)
※美亞Kindle排名第一的Python 3入門書,火遍了整個編程圈
※英特爾蠶食AMD和NVIDIA?
TAG:AI科技大本營 |