Jeff Dean 領銜,矽谷 AI Frontiers大會全程亮點回顧
機器之心原創
現場報道:Alex Chen,ChainnZ
2016 年 3 月,AlphaGo 橫空出世,舉世嘩然;2017 年 1 月,Master 再次橫掃人類旗手,卻已在大眾意料之中。在過去的 2016 年裡,以深度學習為首的機器學習技術引領的人工智慧熱潮迅速從學界和工業界擴散到了整個社會。大眾對人工智慧的不切實際的期待又達到了一個新的高度,彷彿只要使用深度學習一切就可以迎刃而解。
然而對於真正的從業者來說,每天面對的真實問題則是,深度學習技術能否對當下問題提供解決方案;如何讓深度學習與現有問題結合,真正幫助我們做出判斷,如何結和深度學習優化現有的系統等等這類直接和現實的問題。
2017 年 1 月 11-12 日首屆人工智慧前沿峰會(AI Frontiers)於美國加利福尼亞州「矽谷」中心聖克拉拉舉行。這次大會邀請來自谷歌、 臉書、微軟和亞馬遜等人工智慧前沿公司的頂級科學家,分享他們在人工智慧研究及應用上的最新成果;谷歌和亞馬遜團隊在第二天的分會場舉行了深度學習開發框架的實踐課程;人工智慧創業公司也在此這裡聚集,分享自己的產品和想法。
首屆人工智慧前沿峰會(AI Frontiers)陣容強大,與會者超過 1600 人,覆蓋 15 個國家地區,人工智慧巨頭公司專家工程師雲集;內容覆蓋人工智慧業界 6 大熱門主題,直切前沿:自動駕駛、語音人工助手、自然語言處理、計算機視覺、物聯網、和深度學習框架。
AI Frontiers 人工智慧前沿大會不僅為世界各地的人工智慧關注者提供了最尖端的人工智慧知識分享,也把人工智慧領域的巨頭公司研發高管、研究科學家及工程師聚攏在一起,提供非常難得地一個平台,讓大家面對面交流,分享了自己對人工智慧的最新認識。
機器之心作為本次大會首家華語媒體合作夥伴,對本次人工智慧前沿峰會(AI Frontiers)進行專題報道。
Jeff Dean Keynote: 深度學習研究趨勢與發展
大會第一天,大會主席胡峻玲博士致開幕辭後,谷歌大腦負責人 Jeff Dean 進行了 Keynote 演講。Jeff Dean 介紹了谷歌大腦團隊的研究進展和成果,這些研究在谷歌產品線的應用,以及團隊在開源工具方面的成果(谷歌博客於次日發布了相關內容的年度回顧)
「工欲善其事,必先利其器」: TensorFlow
開發 TensorFlow 的初衷關鍵詞:通用平台,最優質的,開放平台
關於機器學習系統的設計,Jeff Dean 給出了以下 5 條設計思路:
易於開發者表達其基於機器學習的想法和演算法
可縮放性:可在短時間內迅速地進行試驗,測試想法(並且實驗結果可以良好地直接規模化)
多平台兼容
易於進行重現及分享
易於產品化
基於以上設計思路,從 2015 年 11 月 TensorFlow 正式發布起,TensorFlow 逐漸得到發展和完善:
多語言支持
性能提升
開發體驗
近日發布的 TensorFlow1.0 版本將在保證向下兼容的前提下,提高開發者體驗,加強文檔撰寫、提供更多可以直接使用的庫以及可用於協助開發者進行開發的模型。
此外 Jeff Dean 特別在現場介紹了 TensorFlow 基於 XLA (Accelerated Linear Algebra) 的即時編譯(JIT Compilation )
深度學習於谷歌無所不在
基於 TensorFlow 或更早期的機器學習系統,谷歌成功地開發了大量的應用解決方案。
Jeff Dean 列舉了其中的一部分使用案例:
谷歌語音識別通過使用深度循環神經網路減低超過 30% 地錯誤率
照片搜索通過使用深度卷積神經網路自動升成照片標籤
從圖片中標出文字,並進行識別
使用深度學習檢測糖尿病性視網膜病變
機器學習在機器人上的應用
更好的自然語言理解
結合圖像與語言
更好的「翻譯」為「理解」鋪路
將參數分布於多個分布式參數伺服器上,數據+模型並行化:成功解決神經翻譯機的規模化問題
對於深度學習在谷歌未來的發展,Jeff Dean 談論了以下幾個方面:
更多地使用:遷移學習、Multi-task Learning 以及 Zero-Shot Learning
大多數的任務都為了這個任務從頭進行模型訓練,這樣在數據使用、計算資源以及人員使用上效率都非常低。
對於更大的模型,使用自動機器學習
深度學習改變計算機架構設計(TPU 等其他計算架構)
對減低精準度的容忍
增加常用的運算操作
無人駕駛
本次會議主辦方邀請到來自谷歌 Waymo,特斯拉和百度無人駕駛的專家同台討論。谷歌 Waymo 的技術經理賈兆寅分享了谷歌 Waymo 一步步的發展歷程。
Waymo 堅持 4 條做法:
1. 儘可能覆蓋更多
2. 創造簡單的目標代表(create simple object representations)
3. 不要去試著理解其他人在做什麼
4. 避免視覺處理(因為還不夠 robust 健壯)
來自特斯拉的機器學習負責人谷俊麗也分享了她對無人駕駛的展望和對機器學習的觀點。她認為交通工具的發展現在處於從數字化變成智能化的關鍵階段,我們已經看到了智能化的曙光。
談到感測器,谷俊麗表示輸入混合信號的技術還不成熟,不同感測器通常是分開計算。
接下來百度無人駕駛總監韓旭(Tony Han),首先他針對中國市場的特點表達了自己的看法,情況更多更複雜,但意義也非常重大,之後分享了關於百度無人駕駛的進展與測試視頻。
在討論環節中,主持人問嘉賓:「在深度學習中,計算能力越強數據越多效果往往越好,關於無人車計算能力的成本需要考慮嗎?」
兩位嘉賓展現了不一樣的看法。谷俊麗表示這應該不會成為一個問題,關鍵是對不同的數據採取不同的計算策略。如果這種計算策略得當,應該會有有效的解決方案。韓旭(Tony Han)則認為計算成本的問題遲早會解決,但目前我們無法忽視計算成本帶來的問題。
語音助理
微軟鄧力:歷經三代對話系統
來自微軟 AI 的首席科學家鄧力教授首先介紹了語音識別和字元識別的系統,是深度學習讓對話系統(Dialogue System) 不局限於一個狹窄的領域,然後嘉賓回顧了對話系統近 30 年的發展與沿革,該部分內容可參考文章 :http://venturebeat.com/2016/08/01/how-deep-reinforcement-learning-can-help-chatbots/。
之後鄧力教授介紹了三代聊天技術的不同特點:
第一代系統是基於符號規則/Template 的系統,專註與語法但應用範圍有限,所用的數據只是為了設計規則,不涉及學習。
第二代系統是數據驅動,淺層學習,數據在這裡是用來學習統計參數的工具。這種系統不利於及時與更新,同樣局限於一定範圍的應用。第二種方法參考文章:http://mi.eng.cam.ac.uk/~sjy/papers/ygtw13.pdf
第三代系統同樣為數據驅動,但結合了深度學習,使端到端的學習成為可能,不易解釋但應用範圍較廣。
最後鄧力認為用自然語言理解(Natural Language Understanding)來模擬 Long-span Dependency 對語義和語法連貫性識別,在 ASR 領域很有潛力。
百度展示語音實力,亞馬遜力推 Alexa
該部分的第二位嘉賓是百度矽谷人工智慧實驗室總監 Adam Coates,Adam 主要介紹了讓深度學習惠及 1 億人的想法 – 讓語音識別既多樣又快捷:同傳統的 ASR 方法相比,深度學習有很多優點,比如準確率高,利於擴大數據量等 ( Scaling )。
最後一位嘉賓是來自亞馬遜的資深首席科學家 Nikko Str?m。Nikko 以「Jeff Dean 也用我們的產品是個巨大的勝利」輕鬆開場。Nikko 之後回顧了 Alexa 中深度學習技術的發展,以及巨大的存儲與分布式訓練模式,Alexa 的喚醒原理以及語義理解過程,並且介紹了有韻律地閱讀內容。下一步 Alexa 的目標是更準確識別不同方向不同源頭的音源,或者在兩人對話過程中判斷識別出兩個人。
在之後的討論環節,各位嘉賓關於聊天機器人取代手機應用的看法進行了探討。
鄧力表示很多手機應用沒有被使用過,通過手機接入網站的比例也非常低,這就給聊天機器人留下來空間。Adam 則表示頂尖的應用程序還會被保留,因為較好的視覺反饋會很有吸引力。Nikko 提到這就是他們做 Alexa 的目的之一,用戶不需要下載,安裝和調試任何應用。
機器之心將在之後對本部分分享內容進行更加詳盡的重現報道。
谷歌大腦 Lukasz Kaiser:自然語音處理
大會第一天下午的第一位嘉賓是來自谷歌大腦高級研究科學家,NLP 專家 Lukasz Kaiser。Lukasz 分享了在多年實踐後,他對深度學習與 NLP 的看法和經驗。
首先,Lukasz 明確了 NLP 具體需要處理哪些問題,比如語音標記,解析,語言模型等。在面對不一樣大小且不斷變化的輸入輸出,RNN 可以很好的起到作用,一種 Encoder-Decoder ( Sequence-to-sequence) 的構架應運而生(此處我們之後會有詳細解讀,盡情關注)。
在這種高級的 Sequence-to-sequence 的 LSTM 框架下,Lukasz 又舉了具體例子來說明,各種場景均有應用且效果不錯。最後 Lukasz 也指出了這種方法的局限性:速度慢和需要大量數據。
機器之心將在之後對本部分分享內容進行更加詳盡的重現報道。
計算機視覺
下午的第一個論壇是關於計算機視覺,大會邀請到了 OpenCV 的創始人兼首席執行官 Gary Bradski,Bosch 的首席科學家任騮和谷歌計算機視覺負責人 Jay Yagnik。
Gary 主要分享了 OpenCV 3+的最新情況,OpenCV 3+ 將會支持硬體加速,更好的校正,將利用 DNN 和 Tiny-DNN 技術。
第二位嘉賓 Jay 主要介紹了機器理解的演進和未來,包括不同的應用場景如視頻理解,手寫識別等,以及深度學習在該領域的應用。
視覺部分最後一位嘉賓任騮主要介紹了感測器可意識的增強現實技術,該技術與機器學習配合可以讓我們更好的處理人機介面(HMI)問題。
麥肯錫自動化報告
之後登場的同樣是一位重量級嘉賓——來自 McKinsey 的 MGI 總監,高級合伙人 James Manyika。他分享了關於 AI 對就業及市場驅動因素的影響:技術和經濟會起到主導因素。對這份報告感興趣的讀者可以參考之前機器之心的相關報道。
物聯網: 人工智慧硬體不能遺忘的 4S 機遇
下面一組嘉賓是物聯網方面的專家,包括來自 Bosch 的數據科學負責人 Mohak Shah,來自 Intel 的深度學習架構師 Andres Rodriguez 以及來自中國的企業——文安科技創始人及首席執行官陶海。
來自 Bosch 的 Mohak 的講座主要在於深度學習與物聯網的結合。物聯網的影響範圍會越來越大,逐步滲透各個行業,但同時面臨很多挑戰,比如時間序列,不均一性,非同步性等。深度學習技術可以給物聯網領域帶來很多機會,比如它的多功能性,便於訓練與高度整合。
來自 Intel 的 Andres 完整地介紹了一個公司需要採用人工智慧解決方案的完整過程和可能遇到的問題。最後嘉賓也覆蓋了 Intel Nervana 的特性和應用領域。
物聯網的最後一位嘉賓是北京文安的陶海, 他主要分享了文安的產品和最新技術,通過深度學習和計算機視覺的結合,通過嵌入式 CV 硬體,GPU,VPU 和 FPGA 的加速產生的一系列智能產品。在提高了處理速度的同時,增加了設備性能,同時針對不同場景設計了不同的硬體,並在國內外都取得了良好地市場反饋。
在之後的討論環節,主持人首先問諸如 Bosch 這樣的大公司會自己建造自己的深度學習應用還是通過世面上已有的程序庫?Mohak 表示他既會關注需要的軟體包,也會自己嘗試解決問題,這個主要是根據問題本身決定。Andres 則說他們會利用一些開源的庫來實現自己的目的。陶海表示他們使用 Caffe 和 TensorFlow,這主要基於兩點考慮,分布式和支持豐富。下面一個問題是怎麼在設備端訓練數據?Andres 認為在設備端訓練會有優勢有劣勢。優勢是提高了性能,劣勢是收集的數據不穩定造成影響。
※機器之心獨家專訪:首度揭秘地平線語音戰略與研究
※Gigaom對話吳恩達:遷移學習是未來五年的重要研究方向
※OpenAI Universe加入GTA5,遊戲訓練人工智慧
TAG:機器之心 |
※Ignite大會:微軟和Red Hat強化SQL Server on Linux聯盟
※Evolving-Lifestyle大會,與小鵬汽車、Momenta暢聊汽車與AI的未來
※Facebook 開源新一代機器學習 GPU 伺服器 Big Basin;谷歌召開 Google Cloud Next 雲技術大會等
※Oculus Connect 4大會又有新亮點
※Facebook公布Oculus Connect 4大會正式日期
※阿里重啟網商大會:Made in Internet 時代到來
※99元ColorYoga瑜伽大會:花臂男神Will、Richard
※Oculus延長促銷期,透露Oculus Connect 4大會內容
※除了AndroidO GoogleI/O大會的東西基本無卵用
※Palo Alto Networks Ignite 2017大會的5大熱門發布
※TechCrunch Disrupt舊金山大會上都在談些什麼
※Elasticsearch創始人Shay Banon將參加雲棲大會 或將同阿里雲達成合作
※GMIS大會 Jessica Coon:《降臨》中的通用語法
※未來的搜索方式是這樣!Google I/O大會曝光新品「Google Lens」
※雖然你不大會用回Windows 10 S,但微軟為Surface Laptop提供了恢復
※Oculus Connect 4大會都發布了啥?
※Ignite大會:微軟發布Microsoft 365更多新版本
※《Fate/Grand Order》名古屋舉辦粉絲大會"FGO冬祭"
※iPhone UE4,AR遊戲《The Machines》 登蘋果大會演示舞台