當前位置:
首頁 > 知識 > EMNLP最佳長論文作者獨家解讀:別讓機器學習放大性別偏見,其實男人也喜歡購物!

EMNLP最佳長論文作者獨家解讀:別讓機器學習放大性別偏見,其實男人也喜歡購物!

viacheatsheet

近日,自然語言處理領域頂級國際會議 EMNLP 于丹麥哥本哈根舉行。EMNLP是自然語言處理三大頂級會議(ACL, EMNLP, NAACL)之一,已經於前段時間公布了錄用論文及最佳論文名單。詳情可參見雷鋒網AI科技評論此前文章:

萬字長文,深度解讀11篇 EMNLP 2017 被錄用論文

EMNLP 2017 最佳論文揭曉,「男人也愛逛商場」獲最佳長論文

其中,弗吉尼亞大學趙潔玉、王天露、Vincente Ordonez、張凱崴及華盛頓大學的 Mark Yatskar 憑藉「Men Also Like Shopping: Reducing Gender Bias Amplification using Corpus-level Constraints」摘得最佳長論文。雷鋒網AI科技評論邀請了第一作者趙潔玉對此論文做了獨家解讀。

原文地址:https://arxiv.org/abs/1707.09457

概要

包含語言的視覺識別的任務,例如圖片標題標註,視覺問答系統以及視覺語義角色標註任務已經成為從圖片中獲取信息的不同途徑。這些任務通常依賴於大量的數據集、結構化的預測方法以及深度學習提取圖片及語言中的豐富信息並以此解決這類問題。其中結構化的預測方法允許機器學習模型用標註之間的關係來提升預測的準確度。例如視覺語義角色標註任務(vSRL),需要對給定圖片中所展示的動詞以及與該動詞相關的幾個角色(工具,地點等)值進行預測。例如在圖1中,考慮到鏟子是一種常見的烹飪工具,結構化的預測模型會有很高的幾率將「tool」預測為「spatula」。

圖1

儘管結構化的預測方法可以為我們提供較好的預測結果,但是這類方法會學習到數據集中存在的偏差 (bias)。如果不對模型進行修改限定,此類模型會做出具有偏見的預測。例如在上圖中,模型從數據集中學習到女性與做飯之間的聯繫,即便給定一張描述男性做飯的圖片(1.4),模型仍然會預測其為女性。這種將女性與做飯之間聯繫更緊密的情況,反映了一種社會成見,對不同的性別均有不良的影響。

在本文中,我們針對男女兩個性別進行研究,通過實驗發現,模型不僅會學習到數據集中的偏差,並且會放大該偏差。我們提出了RBA演算法用於解決被放大的偏差,並且驗證了我們的演算法可以有效的減少放大的bias同時幾乎保持了原有的模型性能。


模型對偏差的放大

我們針對以下兩個任務進行研究:基於imSitu數據集的視覺語義角色標註(vSRL)任務以及基於COCO數據集的多標籤物體識別(MLC)任務。本文中將以vSRL(如上圖1)為例進行解釋。該任務的目標在於預測所給定圖片中的動詞,以及圖片中的其它角色。

在研究模型放大偏差的過程中,我們定義了測量集合以及屬性集合。前者包含了所能預測的動詞,比如cooking,washing等;後者則是一些人口特徵,例如性別,年齡等。我們定義針對某動詞的性別比例,該比例取值[0,1],越接近於1,表明該動詞越傾向於男性。

我們也定義了如何計算放大的bias。例如在訓練集中,cooking的性別比例為33%,偏向於女性,但是在預測結果中,該比例變成了16%,表明這種bias被放大了17%。實驗結果如下圖2所示:不同的動詞對不同的性別表現出不同的偏見程度。例如上文所提到的cooking更傾向於女性,此外「購物」,「洗衣」等都更偏向於女性;「駕駛」,「射擊」以及「指導」則更偏向於男性。分析結果表明在vSRL任務中,所有動詞平均放大的bias率為5%,在MLC任務中,該值為3%。

圖2

對模型的修訂

驗證了模型對bias的放大作用後,我們提出了RBA演算法對模型進行修訂以減少所放大的偏差。我們先從訓練集中獲取每個動詞的性別比例作為參考標準,並以此限制預測的結果,即每個動詞預測的性別比例應當在相應參考標準的特定範圍內。通過引入這些限制條件,我們將原有的模型變成一種具有限制的預測模型。

我們提出利用拉格朗日鬆弛方法對此類模型求解,該方法的優點在於我們可以利用原有的預測方法而不必重新構造演算法訓練模型,並且在所有限制條件均滿足的情況下,該演算法可以保證達到最優解。具體來說,我們對每一個限制條件設置了一個拉格朗日運算元,循環地根據當前的預測結果更新所有的運算元,根據這些新的拉格朗日運算元來更新預測演算法所利用的因子值,從而可以得到新的預測結果。當所有的限制條件均滿足或者已經循環了足夠多的次數後,演算法停止。

實驗結果(圖3)表明我們的演算法可以有效的減少放大的偏見,並且不失原有模型的準確度。具體來說,在vSRL中,我們減少了40.5%的平均放大bias值,在MLC任務中,該值為47.5%。在準確度上,兩個模型幾乎保留了原有的準確度,應用演算法前後只有0.1%的差距。

Bias on vSRL without RBA                                                      Bias on vSRL with RBA

圖3 演算法在vSRL數據集上的結果

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

未經法律允許使用用戶數據,西班牙監管組織向Facebook處以百萬罰款
縮小門店、打造智慧供應鏈,沃爾瑪準備這樣迎接新零售時代
谷歌反擊,針對歐盟反壟斷罰款提起上訴
為什麼NLP 初創公司值得投資?驀然認知憑什麼是AI 初創最具有投資價值的公司——來自驀然認知合伙人Claire的感受
國科大人工智慧技術學院揭牌,第一批研究生正式入學

TAG:雷鋒網 |