清華朱軍教授：機器學習未來的幾大挑戰與目前進展

新聞 10-29

時至今日，我們已經看到由機器學習演算法支撐的非常準確的機器視覺、聽覺和語音交互被應用各種產品和服務中，進而帶來了AI在商業應用方面的爆炸式增長。但機器學習仍在向前發展，其尚有很大潛力等待我們挖掘，但前提是我們能夠清楚了解到目前機器學習所面臨的挑戰。

在於10月27日由《麻省理工科技評論》、DeepTech 深科技聯合主辦，梅賽德斯-賓士特別呈現的「全球科技青年論壇」上，《麻省理工科技評論》「35歲以下科技創新 35 人」（Innovators Under 35 Reunion）獲得者、」清華大學計算機系教授朱軍教授分享了其對於機器學習未來發展的挑戰的看法。

他認為，人們現在要處理很多數據，而這些數據很顯然是超過人能處理的範圍，所以需要計算機，需要更加智能的能夠從數據中不斷學習、總結經驗，不斷提高性能的演算法，但是，包括不確定因素、系統風險以及對數據的利用不夠充分等問題正橫亘在我們面前，有待人員共同解決。

圖丨朱軍（來源：DT君）

以下為朱軍教授的演講（經過基於願意的刪改）：

在信息時代，有很多的場景的痛點可以用計算機解決，這背後很多技術都是相通的，所以，現在很多的應用領域大家都在用機器學習，更廣義來說是人工智慧。

現在，機器學習或者人工智慧有非常顯著的進展，像大家關注的深度學習，包括圖像、語音甚至自然語言的處理等等任務上都表現得非常優秀。

最近還有一些進展可以用強化學習或者決策的方法做博弈和對抗，這都是現在機器學習一些典型的進展。當時我在 CMU 做兼職教授的時候，有一次我們的系主任講了一個觀點，他說，未來機器學習會像現在的基礎學科，一樣成為大家的必修課。

但我覺得這個觀點是對的，我們要處理很多數據，而這些數據很顯然是超過人能處理的範圍，所以我們需要計算機，需要更加智能的能夠從數據中不斷學習、總結經驗，不斷提高性能的演算法。

今天我主要想和大家分享，機器學習發展到今天，在很多應用的情況下我們還應該思考什麼樣的問題，或是未來的機器學習應該解決什麼問題。

首先面臨的一個挑戰，我們稱為不確定的因素。在建一個人工智慧系統的時候需要對這些不確定的因素進行建模、學習、推理，甚至最終決策。

另外一個挑戰在於，現在人工智慧的解決方案或者人工智慧的系統還面臨著一些風險，可能從演算法的角度或者系統的角度。從演算法來看，對一個表現良好的深度神經網路可以在這個圖像上加一些雜訊，但這個雜訊帶來的後果是可以誤導神經網路的，並以一個非常高的執行度給出一個錯誤答案。

這些風險很難糾正，除非你有一些其他的信息或者人在中間幫助糾正。

圖丨朱軍（來源：DT君）

還有很多其他的展示，在系統級別上，比如在 351 晚會上展示人臉識別的系統或者無人駕駛車裡的激光雷達。如果大家想破壞它的話，實際有很多的途徑，這就給系統或者演算法的安全提出了新的挑戰。

還有對數據的利用。在數字世界裡，我們有大量的數據可能沒有標註或者有高雜訊的。對於這些數據如何利用？我們現有的方法或者已有的應用對這些數據的利用還存在很大的不足。

但我們還是有一些啟發，比如像 AlphaGo，其最新的版本實際可以通過模擬、模擬產生更多的數據幫我們指導這個演算法的訓練，這種想法是比較前沿比較先進的。但如果用到實際的系統里卻也面臨很多困難，一個平行的模擬系統可遠比圍棋的環境要複雜的多。

大家關注最近一些大的規劃，比如美國的 DAPPA 最近的規劃--AINext，類似於中國做的新一代人工智慧規劃。這裡面實際提出了下一波的人工智慧，就是第三波人工智慧。

從之前我們人工智慧系統用的技術來看，早期需要用大量手寫的知識的叫專家系統。現階段用的是大量基於機器學習或者機器統計學習，需要大量的數據來訓練。

下一階段是什麼，他們提出了「 contextual reasoning 」，可以做推理，有更強大的能力來支撐很多更複雜的任務。具體規劃里的 5 個任務，主要目的是希望不斷提高人工智慧系統處理問題的複雜程度還有可靠性。

以上為人工智慧或者機器學習領域面臨的挑戰和未來的願景，下面簡單看一下這方面的嘗試和進展。

圖丨朱軍（來源：DT君）

在不確定性的建模、推理和決策這些個問題里，我們有什麼樣的進展？

實際上，這在機器學習、人工智慧領域裡已經被研究很多年了，包括2011年拿到圖靈獎的 Judea Pearl 先生，實際上做了非常奠基性的工作。

在機器學習領域有一個專門的方向叫概率機器學習，它主要包括三個層次的工作：

第一層次，在建模和推理的基本理論框架上，怎麼能夠讓它做得更靈活，尤其是面向複雜問題的時候怎麼做友好的建模。

第二層次，做演算法，有了模型之後怎麼處理大規模的數據，這裡面的演算法包括隨機採樣的演算法，包括像深度學習里用隨機梯度。

第三層次，用大規模分散式的計算，分散式的平台來做概率計算。

第二個進展和魯棒性、可靠性有關，可能存在惡意攻擊或者數據里存在有缺陷的樣本情況下，怎麼保證系統能夠按照我們預設的目標來進行工作？實際最近有很多的進展和關注，包括去年 Google Brain 在NIPS國際會議上舉辦了第一次的國際比賽，實際上主要針對深度神經網路里的對抗、攻擊和防禦，今年在拉斯維加斯黑客大會上也有一個專門的競賽是關於 AI Security。

後面一個緊接的問題，現在很多系統只有輸入和輸出之間的影射關係，很難理解這個演算法或者系統到底怎麼工作。這裡面有一個很受關注的問題，叫可解釋的機器學習、可解釋的演算法、可解釋的系統。

這一塊有幾個層次的工作，一種可以用可視化的工具輔助理解這個方法，比如深度神經網路。另外在學習的過程中通過引導、訓練，能夠讓深度神經網路里的神經元變得更可解釋，和人的概念更接近，這實際可以引入一些知識或者語義的信息來幫助我們做。

最後一個問題——關於決策。決策實際上是一個更有挑戰的問題，特別是在不確定環境，或者不完全信息的情況下怎麼做決策。比如說用概率的方法來描述老虎機的問題，實際上典型的是一個有不確定信息的情況下怎麼做博弈。

在強化學習裡面，相關的包括模仿學習等等，最近有了很多進展，比如在《星際爭霸》、《刀塔》這種更複雜的場景下怎麼來做多智能體的合作和博弈。在國際上也有另外一個國際競賽，是一個實時的對戰遊戲，也是在未知的環境下怎麼做智能的決策。

我主要想和大家分享的就是，現在的人工智慧其實在實際環境中還面臨著一些挑戰，但好消息就是，通過長期探索，這個領域是不斷地在發展的，希望人工智慧將來會更好的來解決大家的問題。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

※MIT 研究人員新發現：利用石墨烯，製備各種非硅半導體材料
※矽谷「世紀騙局」終大結局，曾經的生物技術獨角獸被曝正式解散

TAG:DeepTech深科技 |