當前位置:
首頁 > 新聞 > Adobe提出新方法,可將隨機梯度下降用作近似貝葉斯推理

Adobe提出新方法,可將隨機梯度下降用作近似貝葉斯推理

哥倫比亞大學和 Adobe 的三位研究者近日在 arXiv 上的一篇論文《用作近似貝葉斯推理的隨機梯度下降(Stochastic Gradient Descent as Approximate Bayesian Inference)》提出了一種可將隨機梯度下降用作近似貝葉斯推理的新方法。該論文共做出了 5 項貢獻。在 Reddit 上有人對此研究評論說:「隨機梯度下降總是比你想像的更強大。」機器之心對本論文進行了摘要介紹。

Adobe提出新方法,可將隨機梯度下降用作近似貝葉斯推理

具有恆定的學習率的隨機梯度下降(constant SGD)可以模擬具有靜態分布的馬爾可夫鏈。基於這個觀點,我們得到了一些新結果。(1) 我們表明 constant SGD 可以被用作近似貝葉斯後驗推理演算法(approximate Bayesian posterior inference algorithm)。具體而言,我們表明可以如何調整 constant SGD 的調優參數來最好地匹配一個後驗的靜態分布,以最小化這兩個分布之間的 Kullback-Leibler 散度。(2) 我們表明 constant SGD 能產生一個新的變分 EM 演算法,該演算法可以在複雜的概率模型中對參數進行優化。(3) 我們還提出了用於採樣的帶有動量的 SGD(SGD with momentum),並且給出了相應地調整阻尼係數的方法。(4) 我們分析了 MCMC 演算法。對於 Langevin Dynamics 和 Stochastic Gradient Fisher Scoring,我們量化了其由於有限學習率而導致的近似誤差。最後 (5),我們使用這個隨機過程的觀點簡要地證明了為什麼 Polyak 平均是最優的。基於這一思想,我們提出了一種可擴展的近似 MCMC 演算法——平均隨機梯度採樣器(Averaged Stochastic Gradient Sampler)。

Adobe提出新方法,可將隨機梯度下降用作近似貝葉斯推理

圖 1:後驗分布 f (θ) ∝ exp {?NL (θ)} (藍色)與 SGD 的迭代的靜態採樣分布 q(θ)(青色)或基於再參數化梯度的黑箱變分推理(BBVI:black box variational inference)。行:(上)線性回歸,(下)logistic 回歸,在第 6 節討論。列:(左)full-rank preconditioned constant SGD,(中)constant SGD,(右)BBVI。我們給出了在該後驗的最小和最大主成分上的投射。這幅圖還給出了在 Ornstein-Uhlenbeck 過程(Eq. 13)中該後驗的經驗協方差( 3 標準差)(黑色)、樣本的協方差(黃色)和它們的預測(紅色)

Adobe提出新方法,可將隨機梯度下降用作近似貝葉斯推理

圖 2:隨機梯度下降迭代的經驗協方差和預測協方差,其中預測基於 Eq.13。我們在葡萄酒質量數據集上使用了線性回歸,詳見 6.1 節。

Adobe提出新方法,可將隨機梯度下降用作近似貝葉斯推理

演算法 1:迭代平均隨機梯度下降採樣器(IASG)

Adobe提出新方法,可將隨機梯度下降用作近似貝葉斯推理

圖 3:在線性回歸上的迭代平均(iterate averaging),其中我們生成類似於模型生成的人造數據。(a) 給出了該 SGD 迭代的經驗協方差,而 (c) 給出了帶有最優的時間窗口選擇的平均迭代。其結果得到的協方差非常類似於 (b) 中的真實後驗協方差。這表明迭代平均有可能得到後驗採樣。

Adobe提出新方法,可將隨機梯度下降用作近似貝葉斯推理

圖 4:IASG(頂行)、SGLD(中行)和 NUTS(底行)在線性回歸上的收斂速度比較。該圖分別給出了最小(黃色)和最大(藍色)的後驗邊界方差作為迭代的函數,其以通過數據的次數作為度量。誤差柱表示一個標準差。紅色實線表示 ground truth。左圖是以後驗最大值初始化的,而右圖是隨機初始化的。

Adobe提出新方法,可將隨機梯度下降用作近似貝葉斯推理

圖 5:用不同的方法所估計的後驗協方差,參見圖 4。頂行是用後驗最大值對採樣器進行初始化所得到的結果。底行是隨機初始化的結果。對於 MAP 初始化,所有的採樣器都可以找到對後驗的一個良好估計。當隨機初始化時,IASG 的表現優於 NUTS 和 SGLD。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

商湯科技獲賽領資本6000萬美元投資,將加速商業化布局
神經網路:從基本概念到新的可能性
UC Berkeley教授:還原論遠不是通向人工智慧的坦途
FB宣布開源Caffe2:可在手機與樹莓派上訓練和部署模型
陸奇宣布自動駕駛Apollo計劃,一圖看懂百度智能汽車的發展

TAG:機器之心 |

您可能感興趣

「充分利用你的Azure」將Azure用作雲計算平台
安全預警:PowerPoint被用作攻擊媒介來下載惡意軟體
蘋果對 App Store 中國區下架 VPN 應用作出回應
Kopin發布新型LCD顯示器,將專門用作AR顯示屏
都是套路:WannaCry病毒界面被詐騙者用作新的釣魚手段
Intel 處理器現安全漏洞:可被黑客用作後門
watchOS 4教程:將蘋果手錶用作手電筒
BAPE秋冬季童裝釋出,Tinker手稿用作慈善拍賣,白山再推新版NMD R2,NB全新旗艦跑鞋亮相!
M2經常被用作飛機上的遙控式固定武器或空用機槍
王俊凱《VogueMe》封面大片曝光 用作品表達最真實的自我
DNF:這些傳說裝備已是白菜價,用作散搭仍然強力
世界上已知最強的化學爆炸物,可用作氫彈的綠色扳機
插畫師SOOVIN筆下的崔雪莉,眼神靈動,好想用作頭像
辣椒最初被當作花卉進行種植,後來逐漸用作調味料
古代高考最常見的作弊方法 蠟燭都曾被用作夾帶
銀魂里可以直接用作表情包的截圖
Chem封面:模板導向生長MOF及其衍生物用作高效電解水的電極材料
印度購買了強大的法國陣風戰鬥機:用作艦載機實力如何?
美商業公司推進研發可用作高超聲速飛行試驗台的GO1空射型火箭