DeepMind最新深度學習研究：超參選擇利器-引入基於群體的訓練

最新 02-27

【導讀】機器學習的訓練和優化是現代深度學習模型中最具有挑戰性的方面，本文首先介紹了常用的深度學習超參數優化方法：隨機搜索和手動優化，然後引入DeepMind關於深度學習模型超參數優化的最新研究進展：基於群體的訓練（population based training）, 它能夠在更短的時間和更低的計算資源佔用的情況下找到好的超參. 相信會被引入到更多的深度學習框架中，文末附有paper地址和GitHub地址，感興趣的朋友可以詳細了解一下。

What』s New in Deep Learning Research: Introducing Population Based Training

深度學習研究的新進展：基於群體的訓練

深度學習模型的訓練和優化是任何現代機器智能（MI）解決方案中最具挑戰性的方面。在許多情況下，數據科學家能夠迅速為特定問題找到正確的演算法集，然後要花費若干月找到模型的最優解。最近，DeepMind發表了一篇新的研究論文，其中提出了一種新的方法，用於訓練和優化深度學習模型——稱為基於群體的訓練（population based training）。

傳統深度學習模型的優化致力於：在避免急劇改變模型的核心組件的前提下最大限度地減少測試誤差。深度學習優化中最重要的方法之一是調整與模型本身正交的元素。深度學習理論通常將這些元素稱為超參數。通常，深度學習程序中的超參數包括諸如隱藏單元的數量、可以調整學習速率等要素以提高特定模型的性能等。

優化超參數是在深度學習功能的性能與其成本之間找到平衡的博弈。諸如隨機梯度下降及其變種演算法已成為深度學習優化的核心，但在大規模場景中應用時仍面臨重大挑戰。通常，深度學習超參數優化有兩種主要方法：隨機搜索和手動優化。在隨機搜索場景中，採用不同超參數的模型將各自獨立並行訓練，訓練結束時選擇性能最高的那個模型。通常情況下，這意味著只有小部分模型是拿著較好的超參數去訓練的，而其餘模型的超參數是有問題的結果而然不好，甚至可以說是在浪費計算資源, 如下圖所示。