眼見不為實:AI人工智慧技術現在能自動生成帶視頻的假新聞了
今年早些時候某著名視頻網站上有人放出了一段看上去像是法國著名音樂人弗朗索瓦絲·哈蒂Fran?oise Hardy的視頻。在這個視頻中她被畫面外的人問了個問題是關於為什麼川普要指使白宮發言人肖恩·斯賓塞讓他在總統就職典禮的觀禮人數問題上撒謊。一開始哈蒂還爭辯了幾句接下來她表示斯賓塞先生「提出了另外一種事實」。
這段名為《另一張面孔 v1.1》的視頻是德國藝術家馬里奧·克林格曼搞出來的一個藝術作品。在這個作品中哈蒂的數字化幻象口中說出的是康威回答NBC記者提問的話語。整個視頻模模糊糊搖擺不定任何一個正常的視覺特效工作室都能做的比這個好得多。
但克林格曼並不是拿什麼編輯軟體自己瞎搞出這段視頻的。相反他在自己家的電腦上使用了一種叫生成式對抗網路generative adversarial networkGAN的機器學習演算法並「喂」了大量哈蒂年輕時期的MTV視頻給這個程序讓電腦花了幾天時間自動弄出了這麼一個東西出來。
克林格曼本人非常熱衷於使用機器學習調教出一堆軟體來幫他做這種「創意生產」。雖然他現在弄出來的作品多多少少有點……扭曲比如這樣
或者這樣
克林格曼的實驗預示著真實與謊言的永恆戰鬥又開闢了一塊新的戰場。因為所謂「假新聞」的散播在某些領域裡白字黑字已經不足為憑了但照片和錄音還是保持著它們固有的可靠性。然而現在以GAN為代表的機器學習技術正在不斷動搖著這個可靠性。
音頻很容易偽造。通常情況下計算機將許多預先錄好的短小語音片段連接起來生成一句完整的語音。包括Siri在內的各種虛擬語音助手都是這麼做的。但是這樣生成的數碼語音其合成質量受到預先存儲的語音片段的限制只有說特定的句子時才會顯得非常逼真。
生成式語音的機制則頗為不同。使用神經網路學習源語音中的統計特徵並在給定的任意內容上重構這些特徵這種對語音的模擬不再是以秒為單位而是以毫秒級的速度進行模擬。比如你想要讓特朗普或者任何一個公眾人物說什麼話你先拿大量此人的語音信息輸入到一個深度學習演算法中進行訓練最後只要告訴這個已經訓練完的程序你想讓這個人說什麼即可。
去年至今Google 在英國的 DeepMind百度在矽谷的深度學習研究院以及蒙特利爾學習演算法研究所MILA等各種機構都發布了擬真度超高的文本生成語音演算法。目前這些演算法所需要的計算機運算能力只有大型技術企業能擁有但這種情況並不會持續太久。
生成圖像則難得多。「生成式對抗網路」的機器學習方式是在2014年由伊恩·古德費洛Ian Goodfellow提出的當時他是在深度學習之父約書亞·本吉奧Yoshua Bengio手下讀博的學生。古德費洛發現雖然深度學習能讓機器很好地辨別各種類型的數據例如區分一張貓照片和一張狗照片但讓軟體按照這個去生成貓或者狗的照片則根本一塌糊塗。對電腦來說就算從資料庫里學習了大量的訓練圖片要生成一張有意義的照片也是困難重重
於是古德費洛採用了另外一個類似的概念博弈。他不再嘗試讓計算機一蹴而就直接生成什麼有用的東西而是用另一個agent[3] ——一個對抗者——對[4] 生成器的輸出進行評判按照和訓練數據集[5] 中已有的真實照片的相似度給出具體的評分[6] 來自數據集還是來自生成器的判斷。生成器[7] 根據辨別器[8] 的反饋不斷進行修正逐步生成越來越像真實的圖像。
如今GAN演算法可以從一句描述指令生成出郵票大小的鳥類圖片。告訴演算法「這鳥是白色的頭和翅膀上有一些黑色鳥嘴長是橘色的」機器就會生成對應的圖片。雖然輸出的圖片現在還不能算很完美但粗看起來還是非常逼真的。
雖然郵票大小的鳥類圖片還並不足以公眾對日常照片的真實性產生恐慌但技術發展的速度是常人難以想像的。在過去的5年里類似的深度學習演算法在給照片進行分類時的錯誤率已經從25%下降到只有幾個百分點。圖像生成的演算法預計也會經歷類似的過程。
古德費洛現在就職於 Google BrainGoogle 內部的人工智慧研究部門。他預測在三年內可能就會出現幾乎可以以假亂真的AI生成視頻。也許其他專家預期的時間會比他的長但業內基本認為這只是一個時間問題。「我們認為人工智慧將永遠改變我們對於哪些證據是可以信任的看法」古德費洛表示。
雖然科技驅動了新型的偽造技術科技也同樣提供了破解偽裝的辦法。一種核實的辦法是要求所有記錄數據都應包括生成時的元數據包括了錄製的時間、地點和錄製設備等。這類數據使人們得以區分出一張虛假的照片例如照片上的內容和拍攝現場的時間不符等等。
另一個獨特的例子來自英偉達Nvidia——它生產的晶元是許多人工智慧設備的核心。在2014年英偉達利用自己的晶元來分析阿波羅11號在登月時拍攝的照片。在模擬了整個場景的光線反射情況之後英偉達的研究人員證明了巴茲·奧爾德林Buzz Aldrin太空服上那些奇怪的亮點確實是在月球上反射了陽光形成的——而不是像某些蠢蛋認為的是什麼好萊塢電影攝影棚里留下的作假證據。
國際特赦組織已經在採用類似的做法了。他們的「證據實驗室」需要核實一些聲稱可作為證據的視頻和照片因此他們使用 Google 地球之類的軟體來檢查照片或視頻拍攝地點附近的自然環境背景看是不是和證據中聲稱的一致他們還是用 Wolfram Alpha 之類的搜索引擎多方查詢記錄上的天氣情況與證據中顯示的進行對比。他們現在已經能區分出把老視頻重新包裝自稱是新的證據的行為但他們也將面對由程序生成的偽造視頻。密碼學也能成為對抗偽造的有力武器可以通過確認文件的特殊數字簽名來判斷文件是否是來自於可信任的機構或是否來自最初生成視頻的設備。
有些人早已明白媒體文件作為證據的脆弱性。「儘管對照片真實性的推測能賦予照片以可靠性但拿著設備的人的個人喜好、有沒有受到誘惑等情況呢攝影師的工作和其他陰暗的商業活動沒什麼不同它往往也是在真相和藝術之間徘徊。」蘇珊·桑塔格在她的《論攝影》中就這樣寫道。人工智慧生成媒體文件這種做法則在這方面走得更遠——反正你們之後也要按自己的意思改的不如直接跳過要在真實世界裡扛著鏡頭或錄音筆的這些「無聊」行為吧
來源:數據與演算法之美
像機構一樣去交易
職業交易的理論基礎與體系
趨勢跟蹤之順勢而為
如何分散持倉,降低賬戶回撤
特殊K線,轉折K線,K線組合,經典形態
如何趨勢跟蹤避免順勢而為成為「馬後炮」……
2017年7月28日—30日 上海
點擊展開全文
※麥肯錫報告:如果再不轉型人工智慧,這些行業將被越甩越遠
※數學,或是江湖——高次方程傳奇
※上海財經大學 期貨量化系統課程
※解析深度學習的局限性與未來,谷歌Keras之父「連發兩文」發人深省
※清華大學教授朱小燕:人機協同最重要 避免冬天就要快速落地
TAG:大數據實驗室 |
※自動駕駛技術終迎重大突破,眼擎科技讓汽車具有PK人眼的視覺能力
※能做詩能炒菜能自動「剁手」 AI大咖:人工智慧更渴望被人理解
※佳能首支AI閃光燈,自動跳閃更智能
※銳馳機器人專註自動化:工業手臂和智能生產線亮相CITE
※未來路徑?盤點自動駕駛技術正在催生的五大技術創新
※熟悉又陌生的GPS,其實是自動駕駛中的「危險」技術
※從VR到自動駕駛汽車,這裡是電影已成功預測的技術創新
※谷歌AI又有新技能:不用綠幕特效 自動更換視頻背景
※LiDAR技術能否成就自動駕駛的高可靠性
※Edge瀏覽器更新,能阻止自動播放視頻
※人工智慧正在成為機器人流程自動化智能應用的核心
※汽車智能化與自動駕駛重塑產業價值:傳統技術如何與新技術融合
※致命事故的發生表明自動駕駛技術尚未發展成熟
※新技術:人工智慧能自動響應網路攻擊
※剛找到的視頻資源沒字幕?用它一鍵自動生成!
※實體營銷:如何打造引流產品的,實現自動拓客
※掃地機器人哪個牌子好?智能技術引爆自動清潔新時代
※華麗轉身再獲新生?體驗大陸集團深耕自動駕駛生態圈的最新技術與產品
※谷歌發布小型智能相機,通過人工智慧及演算法識別可能需要的圖像自動拍攝
※自動駕駛,智能與人腦的碰撞,未來將是智能的時代嗎