當前位置:
首頁 > 科技 > 研究人員探索由語義布局合成的攝影圖像

研究人員探索由語義布局合成的攝影圖像

通過使用真實的照片,我們能走多遠才能達到虛構的場景?更確切地說我們能在渲染視頻遊戲中做些什麼呢?這些問題是陳啟鋒和弗拉德倫·科爾頓研究工作的重點。他們的工作在這個月吸引了新科學家和其他網站的興趣,探索他們的方法,這是創造夢幻世界的數字。

事實上一段視頻的注釋說,這是一種用數字方法繪製新圖像的方法,它從一個標記的布局開始。例如部分被標記為樹木或汽車。該中心可能被標記為道路。

在數字趨勢中Luke Dormehl將他們的工作描述為人工智慧,可以創造出逼真的谷歌街景照片,這些都是虛假的街景。

關鍵是人工智慧《新科學家》(New Scientist)的馬特·雷諾茲(Matt Reynolds)表示,來自斯坦福大學(Stanford)和英特爾(Intel)的陳啟鋒(音譯)的人工智慧「從粗糙的布局中工作,告訴它應該在圖像的每個部分都有什麼內容。」人工智慧利用這種布局來生成一個全新的圖像。

雷諾茲說人工智慧在德國街道上拍攝了3000張圖片。數字趨勢討論了他們使用「級聯精細化網路」的方法,這種網路是一種神經網路,旨在以一種一致的結構來合成高清圖像。像普通的神經網路一樣,級聯細化網路具有多個層,它使用它來一次生成一個層。

研究人員探索由語義布局合成的攝影圖像

CC0 Public Domain

Engadget的高級編輯羅伯托·鮑德溫(Roberto Baldwin)說,在一些人的幫助下,它可以製作出稍微模糊的虛構場景。為了創造出一個人類需要告訴人工智慧系統的圖像。在這裡放一輛車,在那裡建一座建築,在那裡放一棵樹。它是由數字繪製的,系統根據輸入產生一個完全獨特的場景。

雷諾茲說從根本上說,你得到的是一個虛構的街道,它是由一個充滿想像力的神經網路生成的,它把它的真實街道的記憶拼接在一起,它是被訓練的。

陳游標的人工智慧還不足以創造出逼真的場景。然而它可以被用來創建視頻遊戲和虛擬現實世界,在不久的將來不是所有的東西都需要看起來完美。它的創造者認為它最終可以被用來創造逼真的視頻遊戲世界。

接下來是什麼?研究人員詳細介紹了他們在arXiv上的「圖像合成與級聯精細網路」的工作。他們將他們的方法描述為對語義布局進行了條件的合成。使用「輸入布局」,他們實現了一個渲染引擎。結果是相應的攝影圖像。

作者指出了他們工作的特殊之處,照片圖像可以由一個具有適當結構的單一前饋網路合成,並通過直接回歸目標來進行端到端的訓練。他們在論文中說:要實現完美的光性,還需要做些令人興奮的工作。」如果達到這樣的現實主義水平,我們相信這是可能的,計算機圖形合成的替代路線將會開放。

參考:techxplore

編譯:完美的球

審校:博科園

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 博科園 的精彩文章:

為什麼人眼看到日食比照相機好?
大型近地小行星將於今年9月飛掠地球
旅行者號任務40年了:與首席科學家埃德·斯通進行了問答
10的100次方年後:最後一個黑洞將消失
野生理論認為重金屬來自於寄生的黑洞

TAG:博科園 |

您可能感興趣

美圖聯合中科院提出無監督類腦智能方法:可實現視頻語義理解
密歇根大學聯合谷歌大腦提出,通過「推斷語義布局」實現「文本到圖像合成」
「基於結構關係和語義建模的視頻廣告植入技術及應用」項目通過科技成果評價
港中文-商湯聯合論文:自監督語義分割的混合與匹配調節
主打語義高精地圖,深動科技提供10厘米級「成圖」和「用圖」解決方案
廣告設計中的「圖形語義」!
谷歌 AI:語義文本相似度研究進展
通用句子語義編碼器,谷歌在語義文本相似性上的探索
微軟亞研院提出用於語義分割的結構化知識蒸餾
王爾玉:語言與語義識別的技術發展與趨勢
農業語義分割的數據合成方法:辣椒數據集
圖像語義分割的那些事
智能音箱語音識別和語義理解體驗報告
前沿 | 通用句子語義編碼器,谷歌在語義文本相似性上的探索
曠視科技提出ExFuse——優化解決語義分割特徵融合問題
「計算機視覺必讀乾貨」圖像分類、檢測,語義分割等方法梳理
前沿|通用句子語義編碼器,谷歌在語義文本相似性上的探索
圖像語義分割的工作原理和CNN架構變遷
語義分析或成視頻監控智能分析突破口
語義圖形!讓設計作品「能說會道」