利用機器學習為廣告生成有說服力的面孔
編譯:chux
出品:ATYUN訂閱號
匹茲堡大學的研究人員最近開發了一種條件變化的自動編碼器,可以為廣告製作獨特的面孔。他們的研究基於他們以前的工作,探索了更好地理解廣告的自動化方法。
「在我們過去的項目中,我們想看看機器是否可以解讀廣告中發現的複雜的視覺修辭,」進行這項研究的研究人員之一Christopher Thomas表示,「廣告包含雙關語,隱喻和其他有說服力的修辭設備,這些設備很難讓機器理解。在本文中,我們不僅想了解廣告,還想了解這些有說服力的內容是否可以由計算機自動生成。」
廣告業的主要任務是使用有說服力的語言和圖像來宣傳產品或傳達想法。面孔是廣告的一個關鍵方面,通常根據所宣傳的產品和傳達的信息進行不同的描繪。
Thomas與Adriana Kovashka合作,利用機器學習來產生有說服力的面孔,適用於不同類型的廣告。他們使用條件變化的自動編碼器,或「生成模型」,機器學習模型學習生成類似於它訓練的合成數據。
廣告中的面孔被轉換成17個不同的類別。
「在計算機視覺中,自動編碼器通過拍攝圖像並學習將圖像表示為幾個數字來工作,然後,模型的第二部分,即解碼器,學會從中獲取這些數字並從中再現原始圖像。你幾乎可以將其視為一種壓縮形式,其中大圖像由幾個數字表示。」
當這種類型的機器學習模型在足夠大的數據集上訓練時,它開始表示數字內的語義方面。例如,在Thomas和Kovashka開發的模型中,一個數字將控制面部的形狀,另一個數字將控制皮膚的陰影,以及其他語義特徵。
但是,如果研究人員希望模型能夠捕捉到一個人是否戴著眼鏡,但是訓練數據集中沒有足夠的帶眼鏡的人的照片,那麼在重建圖像時這個屬性就會丟失。因此,他們開發了一個條件自動編碼器,這意味著他們可以將其他數字添加到它沒有單獨獲取的模型中,代表可能與特定廣告相關的語義特徵。
「這很酷的部分是,一旦我們訓練模型代表100個數字的面孔,如果我們改變其中一些數字並解碼它們,我們就可以改變面貌,」Thomas表示,「因此,我們可以改變現有的面部,使它們看起來相同,但具有不同的屬性,例如眼鏡,微笑或不微笑等等,只需改變我們的模型用來表示它們的一些數字。」
訓練計算機視覺的生成模型可能是一項具有挑戰性的任務,需要大型圖像數據集,並且在對諸如廣告等非常多樣化的數據進行培訓時經常會失敗。Thomas和Kovashka通過使用需要較少數據的自動編碼器來克服這些限制,並且可以應對廣告中發現的相當大的差異。
Thomas指出,「儘管如此,因為沒有足夠的數據,它並不總能捕捉我們想要的概念,因此,我們故意將語義注入其表示中,從而顯著改善了結果。」
他們的調查結果表明,未來廣告客戶將能夠製作針對個人客戶量身定製的定製廣告。例如,他們可以生成具有與觀看者的面部特徵匹配的面部特徵的面部,以便他們與主體識別更多。
「這種自動,細粒度的廣告定製可能對在線廣告商產生巨大影響,」Thomas說,「此外,不希望為其廣告投放額外模型或進行手動編輯的廣告客戶,可能能夠將現有面孔從其他廣告轉換為適合其廣告類型的面孔。」
研究人員現在正在探索如何改進生成的圖像,使其與使用大量數據生成的圖像質量相匹配。要做到這一點,他們需要設計其他生成模型,這些模型在高度變化和有限的數據訓練時更具魯棒性。
Thomas表示,「另一種可能的研究方向是生成除了面孔之外的其他物品,甚至生成有意義且有趣的整個廣告,這需要開發新的技術,用於在生成框架中對修辭結構進行建模,並結合文本理解和生成。」
※賽靈思公司收購深鑒科技 提高機器學習解決方案水平
※SNUG 2018熱點之:機器學習終於來了!
TAG:機器學習 |