微軟人工智慧繪圖機器人誕生,輸入文字既能生成圖片
人工智慧的飛速發展,已經給人類的很多工作領域帶來了替代的威脅。不過,在大多數人的認識中,諸如文學、藝術、音樂等需要靈感、創意的領域,似乎很難被AI所替代。
但這一認識正在被AI機器人所打破。
繼推出可寫詩的機器人小冰後,近日,微軟又推出一項新的人工智慧技術——繪圖機器人。
近日微軟對外宣稱正計劃推出一項新的人工智慧技術——繪圖機器人(drawing bot)。使用者僅需說出想要繪製物體的名稱,機器人便可進行相關素材的匹配,也就是說,該機器人能夠根據對事物文本的描述,創造出圖像,並且還能自行添加文本中沒有描述的細節,展現人工智慧的想像力。
上圖是一個素材循序漸進的生成過程,根據鳥類體色、翅膀、短嘴等描述,drawing bot逐步將想像變成了實用性很高的草圖。其原理是通過數千張配對照片和文本字幕的數據集訓練,實現文字理解與相關圖像匹配功能。
據悉,繪圖機器人不僅能夠對指令進行識別,也會結合圖像中存在的細節進行想像,如上圖在進行香蕉和獼猴桃素材匹配後,drawing bot額外融入了水果攤位元素。
研究人員表示,無論是普通的田園風光,還是荒誕的圖像,比如漂浮的雙層巴士,這個機器人都能夠畫出來。
微軟在華盛頓雷德蒙德地區研究實驗室深度學習科技中心的主要研究人員何曉東稱:「如果你用必應網頁搜索『鳥』,會出來一張鳥的圖片。但是這個繪畫機器人,會從頭開始一點點的給你畫出一張鳥的圖片。這隻鳥可能並不存在真實世界中,只是電腦對鳥的一種想像。」
微軟表示,研究人員用了許多套圖像和標題的數據組來訓練機器人,使它學會怎樣將文字與圖像匹配。比如說,機器人在學習畫鳥的時候,當標題顯示「鳥」,它就學會了鳥的圖片是什麼樣的。何曉冬說:「這是我們相信機器可以學習的根本原因。」
特別有趣的是,多虧了那些訓練數據,繪畫機器人擁有一點基本的常識和想像,在沒有提供具體細節時也會填補空白,以鳥為例子,機器人常常會畫出一隻站在樹枝上的鳥,即使文本中並沒有提到這個細節,那是因為最初給它輸入了圖像大部分都是這樣。
這款繪畫機器人的技術是由兩部分機械學習模型組成,一個是從文本描述中生成圖像,另一個是根據文本描述來判斷所生成的圖像的真實性。兩相結合,創造出更高質量的圖像。根據最近的研究論文顯示,這款新機器人與以前的技術相比,在圖像質量上提升了近三倍。
微軟認為,未來該工具能夠很好的擔當起畫家、室內設計師草圖助手一職,隨著更多的計算能力的成熟,甚至可以生成動畫電影劇本,對於那些筆頭功夫不強又有繪圖興趣的用戶來說,drawing bot將是個絕佳的幫手。不過遺憾的是,目前微軟認為該技術還有完善的空間,所以並未將其上線。
TAG:IT大家談 |