當前位置:
首頁 > 最新 > 從魯班的視覺引擎談起

從魯班的視覺引擎談起

最近雲棲社區更新了一篇星瞳關於《魯班視覺引擎》的介紹文章。

視覺引擎的目標是可控視覺內容設計和生成,讓 AI 做設計,使數字內容製造變得高質、 高效、普惠、低成本; 終極目標是「所想,即所見」 ,目前主要探索的應用:圖像設計與生成、 視頻編輯與生成、 圖形建模與生成

部分內容引自星瞳的ppt。

本文從3個方面談談智能設計與視頻廣告的結合:

1 魯班的圖像設計與生成

2 智能設計局限與突破

3 智能設計的4個方向

3.1 應用設計大數據「複製」設計

3.2 特定風格的演算法驅動型設計

3.3 基於圖像的智能排版引擎

3.4 基於pix2pix的生成設計

1 魯班的圖像設計與生成

魯班目前的圖像設計與生成,主要是 banner 類的圖,核心是素材搭配求得最優組合。把 banner 拆解成背景、主體、裝飾等,檢索,然後組合。按圖層拆解設計圖,結構化設計數據,然後檢索「庫存」,按照輸入的布局組裝檢索到的素材,評估及優化素材組裝後的效果,直至最終生成最優的素材組裝結果。

引自星瞳的ppt

A 輸入(顯式輸入):

圖片:商品主圖

文案:化妝會場5折起……

風格:運動

構圖:左右

配色:黃綠

大小:1125*352

B 特徵化:

image

text

style=sport

layout=LTRI

color=YG

size=3:1

C 規劃:

16*16的特徵圖

D 行動:

256*256

E 調優:

1125*352

F 可視化

2 局限與突破

應用設計大數據,「複製」設計。首先需要準備大量的打好標籤的素材,設計結果取決於素材庫的「庫存」質量。設計過程被簡化為組合素材的過程。所以對應的人類設計師水平是「 P5 」 ?設計是極富創意的過程,除了解決問題,利用設計可以使用的元素,創意性地提出解決方案,是高水平設計的價值所在。所以,魯班也在嘗試像素級生成以及根據主題生成文案,讓 AI 更具有創造力。這方面的探索追求的是設計的從0到1。

3 智能設計的4個方向

這裡 mixlab 總結下智能設計目前的實現方式。

3.1 應用設計大數據,「複製」設計

3.2 特定風格的演算法驅動型設計

GIF

3.3 基於圖像的智能排版引擎

微軟研究院發的一篇論文,專註於雜誌風格封面的版式設計,是基於圖像的 saliceny map 做的自適應布局方案。Mixlab 在去年也專門更新了一篇文章介紹。

3.4 基於pix2pix的生成設計

只要是圖片與圖片之間的轉換,我們都可以嘗試 pix2pix 來生成試試。在《Pix2Pix與人工智慧做設計》這篇文章, mixlab 介紹了 pix2pix 的一些探索應用:

預測影片的下一幀,我們是不是可以把一張圖片變成 GIF 圖;去除馬賽克,隨意放大 BMP 圖片,再也不擔心精度不夠了;通過手繪生成名畫,比谷歌的 auto draw 先進了點,當然還有各種通過手繪生成的東西,比如貓、袋子、鞋子、人物肖像畫;去除圖片的背景,類似於摳圖,也可以採用 pix2pix 的方法進行;生成配色方案,把配色當成圖片,進行圖片的生成,產生新的配色方案;從側臉預測正臉,這樣以後只要隨便拍一張照片,都可以在三維空間中實時建模出來;

本文同時在知乎專欄:《人工智慧+設計修鍊指南》發表。

*


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 科技Mix設計Lab 的精彩文章:

設計師/產品經理是否需要懂技術?
TensorFlow.js、遷移學習與AI產品創新之道

TAG:科技Mix設計Lab |