神經網路碰上高斯過程，DeepMind連發兩篇論文開啟深度學習新方向

新聞 07-06

選自arXiv

機器之心編譯

參與：思源、曉坤

神經網路目前是最強大的函數近似器，而高斯過程是另一種非常強大的近似方法。DeepMind 剛剛提出了兩篇結合高斯過程與神經網路的研究，這種模型能獲得神經網路訓練上的高效性，與高斯過程在推斷時的靈活性。DeepMind 分別稱這兩種模型為神經過程與條件神經過程，它們通過神經網路學習逼近隨機過程，並能處理監督學習問題。

函數近似是機器學習眾多問題的核心，而過去深度神經網路憑藉其「萬能近似」的屬性在函數近似方面無與倫比。在高級層面，神經網路可以構成黑箱函數近似器，它會學習如何根據大量訓練數據點來參數化單個函數。

除了使用神經網路這種參數化的方法逼近一個函數，我們還可以根據隨機過程執行推斷以進行函數回歸。隨機過程會從概率的角度選擇目標函數的可能分布，因而也能通過樣本採樣逼近真實的目標函數，隨機過程在強化學習與超參數搜索方面比較常用。隨機過程中最常見的實例就是高斯過程（GP），這種模型與神經網路有著互補的屬性：高斯過程不需要昂貴的訓練階段，並且可以直接根據一些觀察值對潛在的真實函數進行推斷，這使得這種方法在測試階段有非常靈活的屬性。

但是高斯過程也有著很多局限性，首先 GP 在計算上是非常昂貴的。在原始方程中，計算複雜度隨數據點的數量增加成立方地增加，即使在當前最優的近似方法中，那也是成平方地增加。此外，可用的核函數通常在函數形式上受到很大的限制，並且需要額外的優化過程來確定最合適的核函數，其可以看作高斯過程的超參數。

而最近 DeepMind 連發兩篇論文探討結合神經網路與高斯過程的方法，他們首先在論文《Neural Processes》中探討了使用神經網路學習逼近隨機過程的方法，隨後又在論文《Conditional Neural Processes》討論了結合神經網路與高斯過程解決監督學習問題的端到端的方法。

在論文《Neural Processes》中，DeepMind 介紹了基於神經網路的形式化方法，以學習隨機過程的近似，他們將這種方法稱之為神經過程（NP）。NP 能展示 GP 的一些基本屬性，即學習目標函數的一個分布以逼近真實函數，NP 能根據上下文觀察值估計其預測的不確定性，並將一些工作負載從訓練轉移到測試的過程中，這使得模型擁有更高的靈活性。更重要的是，NP 以高效計算的方式生成預測。給定 n 個上下文點和 m 個目標點，使用已訓練 NP 進行推斷對應著深度網路中的前向傳播過程，它的時間複雜度為 O(n+m) 而不是經典高斯過程所需要的 O((n+m)^3)。此外，模型可以直接通過數據學習隱式的核函數，從而克服很多函數設計上的限制。

在論文《Conditional Neural Processes》中，DeepMind 提出了一族模型，可用於解決監督學習問題，並提供了端到端的訓練方法，其結合了神經網路和類似高斯過程的特徵。DeepMind 稱這族神經網路為條件神經過程（CNP），以表明它們在給定一系列觀察數據時定義函數的條件分布。CNP 對觀察數據的依賴由一個神經網路參數化，其在輸入的置換排列下保持不變。該架構的測試時間複雜度為 O(n+m)，其中 n、m 分別是觀察樣本數和目標數。

論文：Neural Processes