Yinyin Liu演講:演變中的人工智慧,與模型俱進
全球機器智能峰會( GMIS 2017 ),是全球人工智慧產業信息服務平台機器之心舉辦的首屆大會,邀請來自美國、歐洲、加拿大及國內的眾多頂級專家參會演講。本次大會共計 47 位嘉賓、5 個Session、32 場演講、4 場圓桌論壇、1 場人機大戰,兼顧學界與產業、科技巨頭與創業公司,以專業化、全球化的視角為人工智慧從業者和愛好者奉上一場機器智能盛宴。
5 月 27 日,機器之心主辦的為期兩天的全球機器智能峰會(GMIS 2017)在北京 898 創新空間順利開幕。中國科學院自動化研究所複雜系統管理與控制國家重點實驗室主任王飛躍為本次大會做了開幕式致辭,他表示:「我個人的看法是再過幾年,我們90%的工作是人工智慧提供的,就像我們今天大部分工作是機器提供的一樣。我們的工作就是儘快讓我們的鞋底也像人一樣聰明,而不是鞋底比我們聰明,這就是人工智慧給我們提供工作的機會。我們知道人工智慧會給我們提供一個更美好的未來。」大會第一天重要嘉賓「LSTM 之父」Jürgen Schmidhuber、Citadel 首席人工智慧官鄧力、騰訊 AI Lab 副主任俞棟、英特爾 AIPG 數據科學部主任 Yinyin Liu、GE Transportation Digital Solutions CTO Wesly Mukai 等知名人工智慧專家參與峰會,並在主題演講、圓桌論壇等互動形式下,從科學家、企業家、技術專家的視角,解讀人工智慧的未來發展。
上午,英特爾人工智慧產品事業部數據科學主任 Yinyin Liu 發表了主題為《演變中的人工智慧:與模型俱進》的演講,她探討分享了如何用同一種模型為不同行業提供解決方案,以及如何讓各個行業的專家建議推動整個人工智慧生態系統的發展。以下是該演講的主要內容:
大家好,我是來自英特爾 Nervana 人工智慧事業部的 Yinyin Liu,現擔任數據科學主任一職。我非常容幸能來到這裡,看到AI研究人員和相關領域專家在這裡齊聚一堂。對於你們當中的一些人來說,當務之急是尋找有哪些 AI 解決方案能夠解決你們專業領域的問題。而另一些人可能好奇這些AI 模型如何推動整個生態系統的發展,並對模型在其他行業應用的效果持懷疑態度。
在英特爾 Nervana,我們的數據科學家會直接跟行業專家打交道,我們嘗試理解他們的真實應用場景,並試圖在 AI 演算法和他們的問題之間建立聯繫。這樣的一種迭代的方式,使我們能夠給出有效的方案。今天我想跟大家分享一下我們在這方面的一些實踐經驗。
AI 模型是一些將理論與實踐相結合取得的突破,AI 模型也在廣泛的領域內產生著影響。比如一個 AI 從業者的設計過程包括:滿足數據集需求、設計工作流程與訓練過程、設計在當下 AI 框架下的優化模式、並使用正確的計算設施。然後我們把相關領域專家引入這個過程中。所有這些要素組合在一起,決定了解決當前問題的重點難點是什麼,什麼樣的解決方案是行之有效的。
接下來我想跟大家來分享一下一些將 AI 模型用於不同行業的案例。
近期,深度學習是推動AI的發展的主要動力,這裡是一個大家都非常熟悉的模型(卷積神經網路)。這樣一個端到端的模型以圖片的原始像素數據為輸入,直接試圖學習如何預測圖片的標籤。在這個例子里,標籤是圖片里的人的名字。這樣的模型識別常見圖像的效果非常好,然而除了識別日常場景之外,它還能解決什麼其他領域的問題呢?
我們在精確農業領域做了些嘗試,AI 解決方案為行業帶來了革命性的改變。我們將行業中的難點縮減為幾個問題,其中一個是作物疾病檢測。這裡有兩張作物圖片,它們感染了不同的疾病。我們如何能將剛才展示的人臉識別模型轉化為一個疾病識別模型呢?我們用作物圖片替代人臉圖片,並用疾病名稱標籤替代人名標籤。然而在此類實際應用中的一個挑戰是有限的數據集。不像 ImageNet 數據集,我們的專業領域數據集並沒有上百萬張圖片可供訓練。因此我們使用了一種非常重要的深度學習的方法,遷移學習。我們用 ImageNet 資料庫訓練模型,訓練結束後,中間這些神經層能夠很好地抓取圖片中重要的特徵,然後我們將部分網路複製到一個新神經網路中,在頂層添加一些神經層,並針對特定領域的問題進行重訓練。在此過程中,原先已經訓練好的部分會得到微調。我們發現這是一個非常有用的工作流程,這樣的一種方法可以應用到很多不同的領域和資料庫當中。因此在我們的平台上,我們支持這種工作方式讓大家可以方便地應用遷移學習。
大家可能很好奇,這個模型經過了訓練去做特定工作,他們如何進行決策以確保將這個工作做好呢?我們在平台中引入了一些數據可視化工具,給定數據和模型,我們試圖將卷基層反轉,建立一個逆卷積過程,簡言之,我們希望建立一個「編碼-解碼」過程。用這個數據可視化模型,我們得到了中間這幅圖像,並且非常激動地發現,模型能夠正確抓取解決問題所需的信息。
在精確農業領域的另一個問題是作物產量預測。同樣的,應用遷移學習,我們把這個圖像識別模型轉化為圖象分割模型。我剛才給大家展示的的「編碼器-解碼器」結構,不僅適用於數據分析,也適用於圖像分割問題。當(攜帶攝像頭的)拖拉機走完整塊土地,你就能精確地知道這塊地的作物生長情況。
將圖像模型用於自動駕駛領域中,是一個更難的問題。人類駕駛員看到的是上面的圖片,計算機需要的是下面的信息。
當我們將圖象分割技術用於自動駕駛,我們需要將不止一種信息從背景中剝離出來。我們需要分割所有對駕駛有用的信息。這對於訓練數據的類型產生了新需求。我們需要將每一個像素都分到一個類別中,而這種數據是很難獲得的。 所以我們會制訂一些新的工具,讓人可以模擬這樣的環境來創造出所需的訓練數據。在 Intel Labs 我們也做了一些其他研究,有一項研究解除創造數據的過程對人工標註的依賴。比如在遊戲引擎中,你知道如何搭建一個虛擬世界,因此用它的結構,我們能生成需要分割的不同圖層。經過驗證,用這樣方法生成的圖像非常適合用於自動駕駛模型的訓練。
自動駕駛是非常具有挑戰性的問題,它需要適應不同的環境、應用於不同的情形,所以通常我們需要不斷訓練、優化和改善我們的模型。所以我們需要AI平台能進行持續的訓練、數據收集,並且持續把最新的模型投入應用。我們正努力在我們的平台上來建立這樣的閉環支持。
如剛剛所示,一個模型或一系列類似的模型可以應用於解決不同領域的不同問題。除了自動駕駛和精確農業,我們的團隊還和能源行業的專家合作,將圖像分割用於斷崖檢測,並在醫療影像領域將模型用於檢測腫瘤。
當我們處理序列的、時序的或觸覺信息時,循環神經網路非常適於學習數據的先後關係。最新的循環神經網路中還引入了 Schmidhuber 博士發明的 LSTM 結構。這種結構也能被用作構建「編碼器-解碼器」結構。這種序列到序列的映射方式被廣泛用於語音識別,事實上它可以接受非常多種不同的輸入輸出。在翻譯問題中,它把一個英語句子映射到一個法語句子。在問答問題中,它把一個問題映射到一個回答。在思考模型的應用場景時,來自金融行業的用戶向我們提出了這樣的一個問題。每天,金融行業從業者需要從海量數據中提煉出有用信息。通常情況下信息都太多了,沒人能夠通讀所有。因此我們就在思考能否進行語句主題分析或段落主題分析,讓用戶只需要關注和他的領域相關的信息。我們採用一種名為 skip-thought 的模型,它非常適用於表示句子。和單通道的「編碼器-解碼器」拓撲結構很類似,模型中一個編碼騎可以與兩個解碼器相連。我們只需要將連續的、非結構化的文本數據一句接一句地輸入模型,模型會根據語義結構為特定領域的語句創建最佳的表示方式。
基於句子的向量表示,我們可以繼續將句子映射到不同的話題中。這給了我們全新的利用文本信息的方式,能夠更好地將文本信息用於信息收集。
在圖中,每一個點代表了一句話,而每一種顏色代表了一個話題。作為用戶,你不再需要逐份pdf 瀏覽,你可以利用這個可視化工具並只關注與你相關的類別。
類似地,同一個序列模型可以被應用到不同的領域當中。
我剛才向大家展示了序列模型在自然語言領域被用於語句分析。我們也用循環神經網路與語音識別技術為汽車搭建了語音系統、為金融行業做時序分析,乃至進行基因組分析。
所有的這些模型都,都助力於推動整個AI生態的發展。
我們將這些技術和模型放到這些領域當中來解決我們面臨的實際問題,AI 在各領域的逐步滲透,最終反過來對 AI 領域本身產生了巨大影響,並讓其他的行業能夠向我們一樣理解、學習與應用 AI。
目前,大多數 AI的進展是由深度學習推動的,AI 專註於從大數據中提取信息、做出決策、預測未來並給出特定環境下的優化方案。
在我們的經驗里,我們以模型為起點,逐步上升到對特定數據服務以及特點工作流程的高層需求。我們將這些經驗融入英特爾 AI 平台的設計中,也將模型對更底層的計算的需求融入最新的硬體設計中。
在英特爾 Nervana,我們試圖提供一個端到端的 AI 平台,提供各種類型的晶元、開源庫、工具包,以及不同領域的解決方案。我們也在此展示包括 Crest 系列在內的各式英特爾產品。
我希望我的演講清楚地闡釋了我們在 AI 應用方面的實踐,我們把不同領域的問題以及不同行業的專家引入到過程中,將他們的意見和想法融入平台設計。我們也從中明確哪些問題亟待解決、哪些解決方案對其他人最有用,以及,我們共同期待建立一個什麼樣的未來。我們加入了 Partnership on AI,希望與 AI 社區以及其他合作夥伴一道,構建能夠更好地服務於社會的 AI 產品。
※實驗研究工作流程詳解:如何把你的機器學習想法變成現實
※瀏覽器最快的DNN執行框架WebDNN:從基本特性到性能測評
※《人工智慧與遊戲》發行初版:從三個方面概述遊戲人工智慧
※CMU試圖統一深度生成模型:搭建GAN和VAE之間的橋樑
※ACL 2017 傑出論文公布,國內五篇論文入選(附解讀)
TAG:機器之心 |
※一條紅線的演變,巴西藝術家 Rafael Dukenny!
※Swoosh的演變!Nike 全新聯名好玩又好看
※從拖鞋演變,adidas 推出全新鞋款 Adilette PK Sock Summer
※IDE output窗口的演變
※原來它一開始是用來打籃球的?Nike Air Force 1的歷史與演變!
※恐怖科幻小說演變而來,Naked&Famous詭異Frankenstein4牛仔褲
※極繁之美,倫敦 Annabel』s 奢華俱樂部的演變
※19春夏色彩演變/Colour Evolution
※字體設計《The Pictograms象形字》漢字演變與創意 英文版
※AJ迷必看系列!Air Jordan 4 「Bred」 五代鞋型歷史大演變!
※Hybris平台Web架構模式演變:前後端分離
※明星超模們在Coachella上演變裝秀,搶佔最佳C位的到底是誰?
※Burberry時尚品牌不同年代風衣設計的演變
※Rowhammer攻擊——危險攻擊的演變
※侏羅紀世界的演變 PlayStation社交帳戶遭到黑客攻擊
※Met Gala開場Gaga大演變裝秀,坎普風睫毛看著都戳人
※毒物/從巡航演變而來的Yamaha SCR950 scrambler 你能接受嗎?
※法國時裝演變史 Partie 2
※永恆Bulgari大事記:高級珠寶的風格演變
※簡說 Python 生態系統的 14 年演變