谷歌科研成果 2018 年年終總結(下篇)
雷鋒網 AI 科技評論按,2019 年 1 月 15 日,谷歌高級研究員 Jeff Dean 和谷歌人工智慧主管代表整個谷歌研究社區發布了 2018 年 AI 年度總結,本文是年度總結的下篇。本文主要總結了AutoML、TPUs、開源軟體與數據集和機器人學等技術和應用進行了總結,並對 2019 年進行了展望。雷鋒網 AI 科技評論編譯整理如下:
谷歌在 2018 年在下面這些方面也有所進展:
AutoML
AutoML 也被稱作「元學習」,主要通過機器學習方式讓機器學習的某些方面實現「自動化」。多年來我們一直在該領域進行研究,目標是開發出一個懂得借鑒過往積累的見解與能力,進而自動發現並解決新問題的系統。早期我們使用得最多的是強化學習,如今我們也將目光鎖定在了進化演算法上。去年,我們向大家展示了如何通過進化演算法為視覺任務自動發掘最先進的神經網路架構。此外,我們也探索了強化學習在神經網路架構檢索以外的更多作用,最後成功證明可用於下列問題的解決上:
1)自動生成圖像變換序列,提高各種圖像模型的準確性;
2)找到一種全新的符號優化表達形式,比起常用的優化規則效果更好。
我們在 AdaNet 的工作展示了如何創建一個學習效果有保障、使用上快速靈活的 AutoML 演算法。
打開今日頭條,查看更多圖片AdaNet 自適應地增強了神經網路的集成。它在每次迭代的過程中計算每個候選者的集合損失,再從中挑選最優秀的候選者進入下一輪迭代。
我們另外一項工作重點是自動發掘計算效率最高的神經網路架構,以便它們能在一些計算資源和推理時間有限的環境中(如行動電話、自動駕駛車輛等)運行。為此,我們證明只要在強化學習架構搜索的獎勵函數中把模型的準確率與推理時間進行結合,就能找到既滿足高度準確性又符合特定性能約束的模型。此外,我們還探索了如何通過 ML 來學習自動壓縮 ML 模型,以更少的調試參數和計算資源消耗的方式。
TPUs
Tensor Processing Units (TPUs) 是谷歌內部自主研發的 ML 硬體加速器,最開始的設計初衷就是為了用於大規模的訓練與推理上。TPUs 讓谷歌的許多研究得以實現突破,比如廣為人知的 BERT(前文提過),此外,通過開源的方式,它能讓世界各地的研究人員對谷歌的研究進行拓展並實現突破。最典型的例子,任何人都可以通過 Colab 免費在 TPUs 上對 BERT 進行微調,這裡要提一下 TensorFlow Research Cloud,它使數以千計的研究人員得以從大體量的免費雲 TPU 供給的計算能力中受惠。此外,我們還將多代 TPU 硬體作為商用雲 TPUs 對外出售,其中包括被稱作 Cloud TPU Pod 的 ML 超級計算機,這使大規模的 ML 訓練服務變得觸手可及。僅就谷歌內部而言,除了讓 ML 研究取得快速進步,TPUs 還推動了谷歌核心產品的重大改進,其中包括谷歌檢索、YouTube、Gmail、Google 智能助理和谷歌翻譯等。我們期待看到來自谷歌內部和其他地方的 ML 團隊可以通過 TPUs,以其前所未有的計算規模在 ML 領域取得更多突破。
單個 TPU v3 設備(左)與 TPU v3 Pod 的部分部件展示(右)。TPU v3 是谷歌最新一代的 Tensor Processing Unit(TPU)硬體。它以雲 TPU v3 的形式對外出售,採用液體冷卻技術以獲得最佳性能(計算機晶元 + 液體 = 太有意思了!),而完整的 TPU v3 Pod 將可以為全球最大的 ML 任務提供高達 100 petaflops 的計算能力。
開源軟體與數據集
發布開源軟體與創建全新的公共數據集,是我們為軟體工程研究社區做貢獻的最主要兩種方式。這方面我們最大的貢獻之一要屬 TensorFlow,這是一款發佈於 2015 年 11 月的 ML 計算系統,這些年來倍受歡迎。2018 年我們剛為 TensorFlow 慶祝完第 3 個生日,這期間 TensorFlow 已經被被下載超過 3000 萬次,且有超過 1700 名的貢獻者添加了 45 000 次的 commits。我們在 2018 年為 TensorFlow 更新了 8 個主要版本,增加了動態圖機制和分發策略等主要功能。在研發過程中,我們啟動了吸引社區注意力的公眾設計評審活動,通過組建特殊興趣小組留住貢獻者。隨著 TensorFlow Lite、TensorFlow.js 和 TensorFlow Probability 等產品的相繼推出,TensorFlow 生態系統也在 2018 年迎來了大幅增長。
我們很高興得知 TensorFlow 作為頂級機器學習和深度學習框架在 Github 上擁有強大的號召力。TensorFlow 團隊也一直致力於實現快速解決 Github 上存在的問題,為外部貢獻者提供更順暢的操作通道。根據谷歌學術檢索,我們已公開發表的論文持續為全世界的大部分機器學習和深度學習研究提供了有效支持。TensorFlow Lite 僅推出 1 年,便在全球超過 15 億的設備上獲得使用;成為 JavaScript 使用排名第一的 ML 框架;同時在對外放出的短短 9 個月內,已在 Github 獲得超過 2 百萬次的內容分發網路(CDN)點擊量、20.5 萬次下載量以及超過 1 萬次的星星點亮。
除了繼續耕耘現有的開源生態系統,2018 年我們還做了以下事情:
引入一個用於靈活、可再現強化學習的全新框架
https://ai.googleblog.com/2018/08/introducing-new-framework-for-flexible.html
引入一個可以快速習得數據集特徵的可視化工具(無需編寫任何代碼)
https://ai.googleblog.com/2018/09/the-what-if-tool-code-free-probing-of.html
增加一個涉及 learning-to-rank 演算法(以最大化整個列表效用的方式對項目列表進行排序的過程,適用於包括搜索引擎、推薦系統、機器翻譯、對話系統甚至是計算生物學等領域)的高級機器學習問題庫
http://ai.googleblog.com/2018/12/tf-ranking-scalable-tensorflow-library.html
發布一個快速、靈活的 AutoML 解決方案框架
發布一個通過 TensorFlow.js 執行瀏覽器實時 t-SNE 可視化工作的庫
增加用於處理電子醫療數據(會在本文醫療保障環節提到)的 FHIR 工具 & 軟體
針對完整 MNIST 數據集的 tSNE 嵌入實時演變過程。該數據集包含 60,000 個手寫數字圖像。現場演示請點擊:https://nicola17.github.io/tfjs-tsne-demo/
公共數據集是觸發靈感的絕佳來源,可帶領許多領域取得重大進步,因為公共數據集能夠為社區帶來有趣的數據和問題,並在許多任務的解決上形成有益的競爭氛圍。今年我們很高興能夠發布穀歌數據集檢索工具(Google Dataset Search),這是一款可以讓我們從各個網路渠道查找想要的公共數據集的全新工具。從數百萬的通用注釋圖像或視頻數據集、到用於語音識別的孟加拉人群源數據集、再到機器人手臂抓取數據集,這些年我們策劃並發布了多個嶄新數據集,即使在 2018 年,數據集的清單也還在不斷增加中。
通過 Crowdsource 軟體添加到 Open Images Extended 的圖片(源自印度 & 新加坡)
我們還發布了 Open Images V4,這是一個包含 15.4 M 基於 600 種類別多達 1.9 M 圖像的邊框數據以及 30.1 M 源自 19,794 種類別的人工驗證圖像級標籤的數據集。我們通過 crowdsource.google.com 為數據集添加了 5.5M 由世界各地數百萬用戶提供的生成注釋數據,有效豐富了數據集在人和場景方面的多樣性。我們還發布了具備視頻視聽註解功能的 Atomic Visual Actions (AVA) 數據集,可以有效提升機器理解視頻中人類的行為與語言的能力。此外,我們還官宣了最新的 YouTube-8M 挑戰賽和第二屆 YouTube-8M Large-Scale Video 理解挑戰賽與 Workshop。其他發布的數據集,如 HDR + Burst Photography 旨在為計算攝影領域的各種研究提供幫助;Google-Landmarks 是一個作用於地標識別的全新數據集。除了發布數據集,我們還探索了相關的一些新技術,比如 Fluid Annotation 可以讓我們快速創建可視化數據集,通過一種探索性的 ML 驅動介面實現更快的圖像注釋行為。
Fluid Annotation 基於 COCO dataset 圖像的可視化效果。圖片來源:gamene,原始圖片。
我們時不時還會給研究界樹立新挑戰,以便聚合大家一同來解決棘手的研究問題。一般來說,我們會通過發布新的數據集來達到這個目的,但也有例外的時候。比如今年,我們就圍繞包容性圖像挑戰賽制定了全新的挑戰,致力於創造免除偏見、更具魯棒性的模型;iNaturalist 2018 挑戰賽旨在讓計算機得以細緻區分物體的類別(如圖像中的植物種類);在 Kaggle 上發起的 "Quick, Draw!" Doodle Recognition 挑戰賽試圖為 QuickDraw 遊戲創建更好的分類器;還有 Conceptual Captions 作為大規模的圖像字幕數據集挑戰賽,旨在推動更好的圖像字幕模型研究。
機器人學
2018 年,我們在理解機器學習如何教機器人行動這個目標方面取得了重大進展,在教機器人掌握新事物的能力方面達到了新的里程碑(2018 年 CORL 的最佳系統論文)。我們還通過結合機器學習和基於採樣的方法(2018 年 ICRA的最佳服務機器人論文)以及研究機器人的幾何構造,在機器人運動學習方面取得了進展。我們在機器人通過自主觀察更好地感知世界結構這一能力上取得了很大的進步。我們第一次成功地在真正的機器人上在線訓練了深層強化學習模型,並且正在尋找新的理論方法,學習控制機器人的穩定方法。
人工智慧在其他領域的應用
2018 年,我們將深度學習應用於物理和生物科學的一系列問題中。使用深度學習,我們可以為科學家提供相當於數以百計的挖掘數據研究助理,從而提高他們的創造力和生產力。
我們關於神經元高精度自動重建的論文提出了一個新的模型,與以前的深度學習技術相比,它將連接體數據(connectomics data)自動解釋的準確性提高了一個數量級。
圖為我們的演算法正在跟蹤鳴禽大腦中的一個神經突觸
將機器學習應用於科學的其他一些示例有:
通過對恆星的光曲線數據進行挖掘,發現太陽系外的新行星
識別短 DNA 序列的起源或功能
自動檢測離焦顯微鏡圖像
用數字技術構建同一個細胞帶有污點的圖像
自動繪製肽鏈的質譜分析圖
在 Fiji(圖像 J)裡面,一個 TensorFlow 模型對顯微鏡細胞拼接圖像的聚焦質量進行了評估。邊界的色調錶示預測的焦點質量,邊界亮度表示預測的不確定性。
健康
在過去的幾年中,我們一直在將機器學習應用於健康領域,這一領域影響著我們每一個人,我們相信通過機器學習可以增強專業醫療人員的直覺和經驗,從而為醫療領域帶來巨大的改變。我們一般會與醫療保健組織合作,解決基礎研究問題(利用臨床專家的反饋使我們的結果更加可信),然後將結果發表在權威的同行評審的科學和臨床期刊上。一旦研究得到臨床和科學驗證,我們就進行用戶和 HCI 研究,以了解在現實的臨床環境中如何部署它。2018 年,我們將臨床任務預測也納入了計算機輔助診斷的領域。
在 2016 年底,我們發表的研究表明,在一項回顧性研究中,接受過糖尿病視網膜病變體征視網膜底圖像評估訓練的模型在這項任務中的表現比美國醫學委員會認證的眼科醫師略好。2018 年,我們能夠證明,通過讓視網膜專家對培訓圖像進行標記,並使用一個判定方案(在該方案中,多個視網膜專家聚集在一起,對每個眼底圖像進行一次單獨的集體評估),我們可以得出一個與視網膜專家相當的模型。後來,我們發表了一份評估報告,展示了眼科醫生如何利用這種機器學習模型,使他們做出比單獨做出比不使用機器學習時更準確的決定。我們已經在印度的 Aravind 眼科醫院和泰國衛生部附屬的 Rajavithi 醫院等 10 多個地點與我們 Alphabet 的同事合作,共同部署了這種糖尿病視網膜病變檢測系統。
左側是一張視網膜眼底圖像,被眼科專家評審小組評定為中度 DR(「MO」)。右上角是模型預測得分的圖示(「N」=無 DR,「MI」=輕度 DR,「MO」=中度 DR)。右下角是醫生在沒有幫助的情況下給出的一組分數。
我們還發表了一個機器學習模型的研究,這個模型可以通過視網膜圖像評估心血管病患病風險。這是一種新型的無創生物標記方法,它可以幫助臨床醫生更好地了解患者的健康狀況。
我們今年還繼續關注病理學,展示了如何使用機器學習改善前列腺癌的分級,通過深度學習來檢測轉移性乳腺癌,並開發了一個增強現實顯微鏡的原型,它可以通過將從計算機視覺模型中獲得的視覺信息實時疊加到顯微鏡學家的視野中,輔助病理學家和其他科學家的工作。
在過去的四年中,我們在利用電子健康記錄數據進行深度學習,從而做出臨床相關預測方面做了大量的研究工作。2018 年,我們與芝加哥大學醫學院、加州大學舊金山分校和斯坦福大學醫學院合作,並將研究成果發表在《自然數字醫學》雜誌上。我們的研究是關於如何將機器學習模型應用於未識別的電子病歷中,與當前的最佳臨床實踐相比,它可以對各種臨床相關任務做出更準確的預測。作為這項工作的一部分,我們開發了一些工具,使得在人物差異很大,底層 EHR 數據集也非常不同的情況下,創建這些模型變得更加容易。我們開發了快速醫療保健協作資源(Fast Healthcare Interoperability Resources (FHIR))標準相關的開源軟體,以幫助更容易和更標準化地處理醫療數據(請參閱此 Github 代碼庫)。最近,團隊與合作夥伴共同努力,在《Nature Biotechnology》上發表了同行評議論文。
在將機器學習應用於歷史收集的數據時,重要的是要了解過去經歷過人類結構偏差的人群,以及這些偏差是如何在數據中編碼的。機器學習提供了一個機會來檢測和解決偏見,並積極推進健康公平,這也正是我們正在努力推進的一個方面。
研究推廣
我們採用了許多不同的方式與外部研究團體互動,包括教師參與和學生支持。我們很榮幸接收數百名本科生、碩士和博士生作為實習生,並為北美、歐洲和中東地區的學生提供多年的博士獎學金。除了財政支持,每個獎學金獲得者都被指派一個或多個谷歌研究人員作為導師,我們召集所有的研究員參加一年一度的谷歌博士獎學金峰會,在那裡他們可以接觸到谷歌正在進行的最先進的研究,並有機會與谷歌的研究人員以及其他來自世界各地的博士生建立聯繫。可以查看視頻:https://youtu.be/7RcUokN_eCg。
Google AI 實習生服務是這項獎學金計劃的補充,它的形式是,讓想要學習進行深度學習研究的人花一年時間與 Google 的研究人員一起工作並接受指導。2018 年是這項服務的第三年,全球的谷歌員工都加入了不同的團隊,從事機器學習、感知、演算法和優化、語言理解、醫療保健等領域的研究。目前該項目第四年的申請已經結束,我們很期待看到研究人員在 2019 年將進行的研究。
每年,我們還通過我們的 Google Faculty Research Awards 計劃為一些研究項目的教員和學生提供支持。2018 年,我們還繼續在谷歌(Google)為特定領域的教職員工和學生舉辦研討會,包括在印度班加羅爾辦事處舉辦的人工智慧/機器學習研究與實踐研討會、在蘇黎世辦事處舉辦的演算法與優化研討會、在桑尼維爾舉辦的機器學習醫療保健應用研討會、在劍橋舉辦了關於公平與偏見的研討會。
我們認為,公開向對廣泛的研究群體作出貢獻是支持健康、高效的研究環境的關鍵部分。除了開放源代碼和發布數據集之外,我們的大部分研究成果都在頂級會議和期刊上公開發布,我們還積极參与各種不同學科範圍的會議組織和贊助。我們參與了 ICLR 2018、NAACL 2018、ICML 2018、CVPR 2018、NEURIPS 2018、ECCV 2018 和 EMNLP 2018。同時,2018 年穀歌還廣泛參與了 ASPLOS、HPCA、ICSE、IEEE Security & Privacy、OSDI、SIGCOMM 等會議。
新地方,新面孔
2018 年,我們很高興地迎來了許多具有不同背景的新人加入我們的研究機構。我們宣布成立在非洲的第一個人工智慧研究實驗室,它位於迦納共和國的首都阿克拉。我們擴大了在巴黎、東京和阿姆斯特丹的人工智慧實驗室規模,並在普林斯頓開設了一個研究實驗室。我們將繼續在全球各地的辦公室招聘人才,您可以了解更多有關加入我們的信息。
展望 2019 年
這篇博文只總結了 2018 年我們進行的研究的一小部分。回顧 2018 年,我們為我們所取得成就的廣度和深度感到興奮和自豪。2019 年,我們期待對谷歌的方向和產品產生更大的影響,也期待著對更廣泛的研究和工程界產生更大的影響!
via:https://ai.googleblog.com/2019/01/looking-back-at-googles-research.html
雷鋒網
※ARM CEO 專訪:小小的低功耗處理器和大大的夢想
※預告|大咖Live X 向衛東教授:基於網路的自動駕駛技術和應用前景
TAG:雷鋒網 |