研究人員探索由語義布局合成的攝影圖像

科技 08-21

通過使用真實的照片，我們能走多遠才能達到虛構的場景？更確切地說我們能在渲染視頻遊戲中做些什麼呢？這些問題是陳啟鋒和弗拉德倫·科爾頓研究工作的重點。他們的工作在這個月吸引了新科學家和其他網站的興趣，探索他們的方法，這是創造夢幻世界的數字。

事實上一段視頻的注釋說，這是一種用數字方法繪製新圖像的方法，它從一個標記的布局開始。例如部分被標記為樹木或汽車。該中心可能被標記為道路。

在數字趨勢中Luke Dormehl將他們的工作描述為人工智慧，可以創造出逼真的谷歌街景照片，這些都是虛假的街景。

關鍵是人工智慧《新科學家》(New Scientist)的馬特·雷諾茲(Matt Reynolds)表示，來自斯坦福大學(Stanford)和英特爾(Intel)的陳啟鋒(音譯)的人工智慧「從粗糙的布局中工作，告訴它應該在圖像的每個部分都有什麼內容。」人工智慧利用這種布局來生成一個全新的圖像。

雷諾茲說人工智慧在德國街道上拍攝了3000張圖片。數字趨勢討論了他們使用「級聯精細化網路」的方法，這種網路是一種神經網路，旨在以一種一致的結構來合成高清圖像。像普通的神經網路一樣，級聯細化網路具有多個層，它使用它來一次生成一個層。

研究人員探索由語義布局合成的攝影圖像

CC0 Public Domain

Engadget的高級編輯羅伯托·鮑德溫(Roberto Baldwin)說，在一些人的幫助下，它可以製作出稍微模糊的虛構場景。為了創造出一個人類需要告訴人工智慧系統的圖像。在這裡放一輛車，在那裡建一座建築，在那裡放一棵樹。它是由數字繪製的，系統根據輸入產生一個完全獨特的場景。

雷諾茲說從根本上說，你得到的是一個虛構的街道，它是由一個充滿想像力的神經網路生成的，它把它的真實街道的記憶拼接在一起，它是被訓練的。

陳游標的人工智慧還不足以創造出逼真的場景。然而它可以被用來創建視頻遊戲和虛擬現實世界，在不久的將來不是所有的東西都需要看起來完美。它的創造者認為它最終可以被用來創造逼真的視頻遊戲世界。

接下來是什麼?研究人員詳細介紹了他們在arXiv上的「圖像合成與級聯精細網路」的工作。他們將他們的方法描述為對語義布局進行了條件的合成。使用「輸入布局」，他們實現了一個渲染引擎。結果是相應的攝影圖像。

作者指出了他們工作的特殊之處，照片圖像可以由一個具有適當結構的單一前饋網路合成，並通過直接回歸目標來進行端到端的訓練。他們在論文中說：要實現完美的光性，還需要做些令人興奮的工作。」如果達到這樣的現實主義水平，我們相信這是可能的，計算機圖形合成的替代路線將會開放。

參考：techxplore
編譯：完美的球
審校：博科園

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 博科園 的精彩文章:

您可能感興趣