總統踹門、女神下海,AI 帶來了多少以假亂真的可能?
最近,一段以「神奇女俠」扮演者蓋爾·加朵為「主角」的色情短片在網路上開始流傳。
女神下海是所有宅男的夢想,大多數人只能心裡想想,但有的技術宅卻靠自己的雙手解決了這個問題。最近,一段以「神奇女俠」扮演者蓋爾·加朵為「主角」的色情短片在網路上開始流傳,仔細看就會發現,蓋爾·加朵的臉只是被「換」到了別人身上,視頻的主角並不是女神本人。
這段視頻出自國外 Reddit 論壇,作者是一位叫 deepfakes 的網友,除了「神奇女俠」蓋爾·加朵,他的作品還有很多,艾瑪·沃特森(赫敏)、麥茜·威廉姆斯(二丫)、斯嘉麗·約翰遜(黑寡婦)均在其中,這些視頻都是用 AI 技術輔助合成的。
這不是尖端技術,用開源項目就可以實現
沒有人可以百分百模仿別人的臉,即使是日本成人電影中的波多野結衣、東尼大木,也只是某個角度和明星相似,再加上網友的惡搞,才在網上流行起來。這次「移花接木」的蓋爾·加朵視頻不是模仿秀,也不是複雜的 CG 技術,只是靠現有的 AI 開源項目,用機器學習進行大量訓練,然後合成了色情短片。
deepfakes 不是專業的研究人員,只是對機器學習感興趣,他所用的技術全部基於 TensorFlow、Keras 等開源軟體。deepfakes 用 Google 圖片搜索、公開的圖庫和 YouTube 視頻搜集了大量圖像,然後用這些素材訓練深度學習網路。經過反覆的訓練,系統就可以識別出蓋爾·加朵的正確圖像,演算法會自動將其他圖像變得和訓練對象更相似。
deepfakes 在 Reddit 中提到,他使用的演算法和前段時間英偉達用來改變天氣的技術類似。英偉達使用的是生成式對抗網路(GAN),這種模型擅長處理視覺數據,所生成的圖像更銳利、清晰。英偉達用這個技術可以將晴天的視頻轉換成雨天,以此來欺騙視覺。
有 AI 行業的研究人員表示,這已經不再是尖端技術,用消費級顯卡處理這種效果只需要幾個小時。
如何讓女神的細節更完美?
仔細看這段視頻,會發現蓋爾·加朵的臉並不是和身體完美貼合,偶爾還是會有錯位、失真的現象,有時候聲音和口型也對不上。考慮到只是一個程序員的個人作品,能達到這樣的程度已經很讓人震撼。
機器學習需要大量素材來訓練,即使是選擇名人作為訓練對象,在面部表情上也無法做到盡善盡美,Face2Face 可以解決這些細節問題。利用面部追蹤技術,可以將真人的面部細節複製到已有的視頻中,利用它可以製造大量具有表情細節的視頻素材。
如果我們再多一點「野心」,口型對應的問題可以解決嗎?答案是肯定的。
華盛頓大學的研究人員開發出一種新的演算法,可以將人說話的聲音轉化為對應嘴型,然後將其移植到一個現有的視頻素材中,生成一段全新的視頻,視頻中人說話時嘴唇的動作幾乎和聲音完美對應。
研究人員使用的素材是奧巴馬,因為深度學習的演算法需要有大量數據做支撐,而他的視頻在網上有較多的素材,機器學習會更容易實現。據研究人員透露,整個學習過程需要用 17 個小時的視頻作為訓練素材。從技術上講,完全可以把任何人的聲音安插到其他人的臉上。
(視頻連接??http://t.cn/RKToMLG)
視頻中左邊是原版的視頻。右邊是經過演算法合成的新視頻,用的還是左邊視頻中的聲音,但圖像是全新生成的。
口型的問題解決了,這樣我們會得到一個由蓋爾·加朵的臉、色情女星的身體和聲音組成的視頻,並且口型和聲音能夠同步。當然,熟悉蓋爾·加朵的人肯定會察覺到異樣,畢竟聲音和人不對應。
既然圖像可以創造,那麼聲音呢?
在 2016 年 Adobe Max 大會上,開發人員展示了一款代號為 Project VoCo 的軟體。它和之前的音頻編輯軟體不同,你可以在一段聲音里直接插入和改動某幾個單詞。理論上只要有約 20 分鐘的錄音,Project VoCo 就可以理解一個人聲音的構成並進行複製。也就是說利用它可以生成一段你從未說過,但確實是你聲音的話。
像 Photoshop 一樣編輯聲音的技術並不是空想,一個叫 Descript(https://www.descript.com/)的音頻編輯軟體已經正式推出。將聲音轉化為文字後,你可以通過編輯文本來對音頻進行剪切、複製、粘貼、刪除和插入等操作。當然,可編輯的音頻數量要基於素材的豐富度。
Descript 和 Project VoCo 一樣,能基於已有聲音素材進行編輯,要重新創造一段話還是很難。想要在色情片中聽到完美的聲音還原,還要考慮語氣、情緒等因素影響,不然做出的視頻只能是鬼畜效果。
用 Face2Face 製造有面部表情的視頻素材,用音頻編輯軟體生成聲音素材,然後用 deepfakes 的機器學習系統換臉,並用華盛頓大學研究人員的技術讓聲音和口型對應。這樣,聲音、圖像、表情、口型問題都解決了。
技術難度並不是唯一限制
用技術來還原人物形象的做法在電影中已經出現很多次。《速度與激情 7》中用 CG 技術還原了已經去世的保羅·沃克,《星球大戰外傳:俠盜一號》中還原了彼得·庫欣。這些 CG 技術難度很大,成本也高,AI 技術、機器學習的普及讓製造假視頻變得簡單起來。
前幾年網上流行過一段奧巴馬踹門的視頻,後來被證明是通過剪輯合成的。如果這些場景放到今天用 AI 來實現,恐怕微商們不需要 20 萬也可以和前美國總統合影了。
難度並不是新技術推行的唯一限制,我們更應該考慮的是這些技術被濫用之後,引發的道德、倫理、版權等問題。直播、短視頻等平台生產出大量內容,手機的面部識別功能也開始普及,如果這些數據被人惡意利用,造成對個人、社會的影響是無法估量的。
AI 可以造出女神,也可以造出魔鬼。
頭圖來源:
DeviantArt(http://t.cn/RT6XG69)
編輯:Rubberso
本文由極客公園原創
轉載聯繫 zhuanzai@geekpark.net
※蔚來 ES8 首秀:不只是一輛電動汽車,而是對車的重新定義
※你永遠也想不到一群創客會用 AI 做出些什麼
※三分鐘看懂蔚來 ES8 首秀:李斌要賣給你的不只是一輛電動汽車
※超逼真的 3D 人體解剖模型;AlphaGo 上線教學工具教人下棋;蔚來 ES8 首秀
※蘋果獲可聽、講「耳語」 新專利,這能拯救 Siri 尷尬的使用率嗎?
TAG:極客公園 |