研究人員探索由語義布局合成的攝影圖像
通過使用真實的照片,我們能走多遠才能達到虛構的場景?更確切地說我們能在渲染視頻遊戲中做些什麼呢?這些問題是陳啟鋒和弗拉德倫·科爾頓研究工作的重點。他們的工作在這個月吸引了新科學家和其他網站的興趣,探索他們的方法,這是創造夢幻世界的數字。
事實上一段視頻的注釋說,這是一種用數字方法繪製新圖像的方法,它從一個標記的布局開始。例如部分被標記為樹木或汽車。該中心可能被標記為道路。
在數字趨勢中Luke Dormehl將他們的工作描述為人工智慧,可以創造出逼真的谷歌街景照片,這些都是虛假的街景。
關鍵是人工智慧《新科學家》(New Scientist)的馬特·雷諾茲(Matt Reynolds)表示,來自斯坦福大學(Stanford)和英特爾(Intel)的陳啟鋒(音譯)的人工智慧「從粗糙的布局中工作,告訴它應該在圖像的每個部分都有什麼內容。」人工智慧利用這種布局來生成一個全新的圖像。
雷諾茲說人工智慧在德國街道上拍攝了3000張圖片。數字趨勢討論了他們使用「級聯精細化網路」的方法,這種網路是一種神經網路,旨在以一種一致的結構來合成高清圖像。像普通的神經網路一樣,級聯細化網路具有多個層,它使用它來一次生成一個層。
CC0 Public Domain
Engadget的高級編輯羅伯托·鮑德溫(Roberto Baldwin)說,在一些人的幫助下,它可以製作出稍微模糊的虛構場景。為了創造出一個人類需要告訴人工智慧系統的圖像。在這裡放一輛車,在那裡建一座建築,在那裡放一棵樹。它是由數字繪製的,系統根據輸入產生一個完全獨特的場景。
雷諾茲說從根本上說,你得到的是一個虛構的街道,它是由一個充滿想像力的神經網路生成的,它把它的真實街道的記憶拼接在一起,它是被訓練的。
陳游標的人工智慧還不足以創造出逼真的場景。然而它可以被用來創建視頻遊戲和虛擬現實世界,在不久的將來不是所有的東西都需要看起來完美。它的創造者認為它最終可以被用來創造逼真的視頻遊戲世界。
接下來是什麼?研究人員詳細介紹了他們在arXiv上的「圖像合成與級聯精細網路」的工作。他們將他們的方法描述為對語義布局進行了條件的合成。使用「輸入布局」,他們實現了一個渲染引擎。結果是相應的攝影圖像。
作者指出了他們工作的特殊之處,照片圖像可以由一個具有適當結構的單一前饋網路合成,並通過直接回歸目標來進行端到端的訓練。他們在論文中說:要實現完美的光性,還需要做些令人興奮的工作。」如果達到這樣的現實主義水平,我們相信這是可能的,計算機圖形合成的替代路線將會開放。
參考:techxplore
編譯:完美的球
審校:博科園
※為什麼人眼看到日食比照相機好?
※大型近地小行星將於今年9月飛掠地球
※旅行者號任務40年了:與首席科學家埃德·斯通進行了問答
※10的100次方年後:最後一個黑洞將消失
※野生理論認為重金屬來自於寄生的黑洞
TAG:博科園 |
※美圖聯合中科院提出無監督類腦智能方法:可實現視頻語義理解
※密歇根大學聯合谷歌大腦提出,通過「推斷語義布局」實現「文本到圖像合成」
※「基於結構關係和語義建模的視頻廣告植入技術及應用」項目通過科技成果評價
※港中文-商湯聯合論文:自監督語義分割的混合與匹配調節
※主打語義高精地圖,深動科技提供10厘米級「成圖」和「用圖」解決方案
※廣告設計中的「圖形語義」!
※谷歌 AI:語義文本相似度研究進展
※通用句子語義編碼器,谷歌在語義文本相似性上的探索
※微軟亞研院提出用於語義分割的結構化知識蒸餾
※王爾玉:語言與語義識別的技術發展與趨勢
※農業語義分割的數據合成方法:辣椒數據集
※圖像語義分割的那些事
※智能音箱語音識別和語義理解體驗報告
※前沿 | 通用句子語義編碼器,谷歌在語義文本相似性上的探索
※曠視科技提出ExFuse——優化解決語義分割特徵融合問題
※「計算機視覺必讀乾貨」圖像分類、檢測,語義分割等方法梳理
※前沿|通用句子語義編碼器,谷歌在語義文本相似性上的探索
※圖像語義分割的工作原理和CNN架構變遷
※語義分析或成視頻監控智能分析突破口
※語義圖形!讓設計作品「能說會道」