深度學習為什麼需要工業化標準

最新 02-17

【導讀】近日，深度學習作者Carlos E. Perez發表一篇博客，討論了深度學習的工業化標準問題。我們知道，深度學習是當前AI領域的一個利器，其標準也不能照搬AI中的一般化標準。本文分別從互操作性、過程標準化、與人兼容性、倫理和對人類的益處幾個方面討論當前深度學習工業化標準，使深度學習不止存在於實驗室之中，而且被工業界及其他的人所用。

Why Deep Learning Needs Standards for Industrialization

最近，我在思考一個問題：「我們應該如何定義AI的標準呢？」我主要關注於AI中深度學習這一領域。深度學習是人工智慧中非常關鍵的部分。

AI這一術語起源非常久遠，在半個世紀前就已經被提出了：

事實上，理解人類思維的想法甚至可以追溯到更早：

我們可以追溯到十六世紀的笛卡爾，甚至追溯到公元前322年的亞里士多德。

西方文明在理解人類大腦的工作方式方面已經積累了大量的知識。GOFAI近十年來的工作實際上是希望通過自頂向下的方式構建邏輯，以達到實現直覺與本能的目的。

現代計算之父——圖靈，已經預料到了大腦的計算方式。在他逝世的14年之後，人們發現了他在未發表的論文中，構想了連接架構。在今天，這些架構更為人熟知的名字是深度學習：

http://www.cs.virginia.edu/~robins/Alan_Turing%27s_Forgotten_Ideas.pdf

因而，我想尋找的AI標準的問題，指的並不是所有被打上AI標籤的方法的標準，而是希望找到深度學習的標準。

首先，問題是：「為什麼我們需要標準？」標準是與互操作性（interoperability）相關的。所以在深度學習的語境中，什麼是互操作性的意義，以及我們如何能得到更大的互操作性？自2012 年開始，深度學習的技術棧已經變得越來越引人注目了。

▌互操作性（Interoperability）

這是一個關於2018年深度學習技術棧的簡單的畫像：

其中並沒有包括其他的必要要求，例如通用的數據工程和大數據技術；也沒有包括整套應用解決方案中的某些部分，例如可視化層和激活學習層等。另外，深度學習具有廣泛的前景，仍然在快速發展著。

從上圖中，我們可以看出，許多已有的標準已經被考慮進來，並且可以被利用，所以人們已經有了一個相當大的啟動平台去探索深度學習的標準化問題，而不需要依賴於AI中的其他領域。

互操作性標準不止對於全球社區特別重要，而且對於任何組織和國家同樣特別重要。為了提高開發可擴展性，需要互操作性來最大化提高開發組件的可重用性。對於個人組織有一個重要問題：「對於獨立的技術，我們該怎麼劃分界限？這是一個常見的問題」

相對獨立的技術中，我們需要通用的術語。而在深度學習這個快速發展的領域中，我們卻只有深度學習本體論：

Source: https://deeplearningplaybook.com

快速的獲取研究的最新進展，並且將其應用於生產之中是非常有必要的。如果研究中使用的術語比較新的話，這將沒有什麼幫助。

▌過程標準化（Process Standardization）

我們也可以討論下在技術層面之上的標準。將工業處理的觀點應用於新的基於深度學習的系統。在2017年， Tianyu Gu, Brendan Dolan-Gavitt 和SiddharthGarg發表了一篇論文，「BadNets:Identifying Vulnerabilities in the Machine Learning Model Supply Chain」，為我們提供了一個很好的出發點，去討論在訓練深度學習系統中用到的數據質量。也許生物製造生產控制的想法（biotechnology manufacturing controls）會為我們提供更好的洞察力，或許這正是我們需要考慮的。

關注於處理控制也會帶來一些問題，到底我們需要什麼樣的標準化才能充分考慮安全、性能、隱藏、正確、傾向、甚至隱私這些點。事實上，對於我們如何處理數據以及數據起源的問題，有很多可以討論的。對於像深度學習這類方法來說，更為重要的是，他可以通過訓練，直接從數據中學習到他的行為。

我們需要對深度學習實踐進行標準化，不只是團隊協作，而且還要能夠對具有創意的解決方案進行單獨開發，並將其集成到更大規模的處理之中。在傳統軟體開發之中，我們有許多成熟的框架，已經發展了很長時間。我們可以整合併加強那些不同的工具，如IDEs，代碼檢查，測試框架，連續整合，概述，性能監控等等。深度學習採用了新的要求，所以我們需要去理解這些到底是什麼，並且將需要的工具種類標準化出來。

▌兼容性（Human Compatibility）

回顧下當前自動化領域的標準是非常有幫助的。從中，我們可以學到自動化社區（Society of Automation Engineering，SAE）。SAE的國際化標準，定義了六級自動化水平（SAE J3016）。這對於自動駕駛以外的領域評估自動化級別是非常有用的。一般的規定如下：

沒有任何自動化技術。

用戶需要知道每一個自動化任務的開始與完成。用戶可以在發現錯誤時撤銷一個任務，用戶對於任務的正確執行是有責任的。

用戶知道複合任務的開始與完成。用戶對任務的正確性不負有責任。例如預定旅店、汽車、飛機。用戶並不關心預定的順序，然而錯誤將需要更多的人工參與修復。聯合航空客戶有償安置就是個補救措施失敗的例子。

只在異常發生時提醒用戶，並在異常情況下，需要用戶執行某些操作。例如系統連續監控網路的安全性。從業者根據事件的嚴重程度採取行動。

用戶負責定義自動化的最終指標，但整個過程的執行，異常情況的處理都由自動化完成。

這是一個最終狀態，人們不再需要參與到過程之中，當然這也可能不是最終水平，因為它並不假設自動化可以對其自身進行優化。

這種自動化不需要人工參與，並且隨著時間的推移可以自我改善。這個水平超出了SAE的要求，但在某些高性能的競爭環境中可能是必不可少的例如Robocar比賽和股票交易。

▌倫理和人類利益（Ethics and Benefit to Humanity）

然而，最終，任何形式的AI標準化都應該以我們如何引導AI（或AGI開發者）為人類利益最大化為前提。如果我們的標準化導致了更先進的自主武器或更先進的方式來預測人類行為，進而操縱人類行為，那將不會對我們有任何益處。

人工智慧標準化的挑戰將涉及很多層面，但是，它最終應該以加速人類發展的目的前進。

▌總結（Summary）

為了使深度學習的發展達到可預測、可靠、高效的程度需要將其標準化，標準化的目的是最大限度地提高各獨立方的參與度，這是令各方加速發展的協調機制。深度學習不止應該存在於實驗室之中，而且應該被工業界及其他的大多數人所用。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自專知的精彩文章:

※追本溯源：5種受生物啟發的人工智慧方法
※人人都能讀懂卷積神經網路：Convolutional Networks for everyone

TAG:專知 |