Facebook 開源新一代機器學習 GPU 伺服器 Big Basin;谷歌召開 Google Cloud Next 雲技術大會等
各位周末好!對 AI 開發者來說,本周發生了不少大事值得關注,重點包括:Facebook 開源全新演算法庫 FAISS 和新一代機器學習 GPU 伺服器 Big Basin;谷歌召開 Google Cloud Next 雲技術大會,宣布收購 Kaggle,並發布視頻搜索 API;英偉達針對 AI 發布全新嵌入式開發組件 Jetson TX2;以及百度發布 PaddlePaddle 全新 API 大幅減少代碼冗餘等。下面我們將完整梳理本周內與開發者息息相關的 AI 大事件,並推薦幾個 AI 研習社編譯整理的開發者資源,祝大家周末愉快。
Facebook 開源聚類和相似性搜索庫 FAISS
雷鋒網消息,FAIR(Facebook 人工智慧實驗室)上周發表了一篇論文,提出一項針對聚類和相似性搜索的新演算法設計。新架構比此前最先進的演算法更快更高效,並使用 GPU 來獲得更高的內存帶寬和計算吞吐量。
基於此項研究,FAIR 近日在 Github 開源了一個名為 FAISS 的庫,相關文檔已陸續完成上傳,並於昨日更新了安裝文件。能進行聚類和相似性搜索的演算法已有不少,FAISS 對它們進行了優化,以便更高效地在 GPU 上運行。FAISS 整合的部分演算法有:
Fast K-Nearest Neighbour
QuickSelect
Warpselect
K-Means clustering
FAIR 表示,FAISS 有五大特性:
使用 C++ 編寫,有完整的 Python/numpy 封裝。
支持單個、多 GPU。
優異的可擴展性,通常情況下能支持最多 100 個維度。
基於 BLAS 和 CUDA。
比當前最先進的庫速度提高 8.5 倍。
詳情:http://www.leiphone.com/news/201703/lzEITGcs5Miuh8k5.html
GitHub:http://www.leiphone.com/news/201703/lzEITGcs5Miuh8k5.html
論文:https://arxiv.org/abs/1702.08734
谷歌開放大規模音頻數據集 AudioSet,助力 AI 音頻演算法研究
在 Google Cloud Next 雲技術大會之前,谷歌通過開發者博客公布了一個可以媲美圖像識別領域 ImageNet 的大型音頻資料庫 AudioSet。據稱,該資料庫包含了 632 個音頻類別以及 2084320 條人工標記的每段 10 秒長度的聲音剪輯片段(來自 YouTube 視頻),覆蓋範圍包括人聲、動物聲、各種樂器與音樂流派,以及日常生活環境的聲音等。總體量為:2100 萬標註視頻、5800 個小時的音頻,以及 527 種類型的標註聲音。
論文:https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/45857.pdf
詳情:https://research.google.com/audioset/
IBM 語音識別能力逼近人類水平
去年十月,微軟人工智慧與研究部門的一個研究者和工程師團隊報告他們的語音識別系統實現了和專業速錄員相當甚至更低的詞錯率(WER)——達到了 5.9%。本周 3 月 7 日,IBM 在官方博客發文稱人類的水平實際上應該是 5.1%,同時表示 IBM Watson 的詞錯率已經超越了之前微軟報告的最佳水平,達到了 5.5%。
詳情:http://www.leiphone.com/news/201703/bJaCYcArDJIenrAC.html
英偉達發布全新 Jetson TX2 嵌入式開發組件,強化 AI 智能運算
3月7日,英偉達發布了全新的嵌入式開發組件 Jetson TX2。據報道,這塊全新發布的開發板只有一塊信用卡大小,但提供了超過前代產品近兩倍的運算性能。按照公司高管的說法,之所以提供如此強勁的運算性能,就是為了助力開發者在深度神經網路等 AI 智能領域的研究。
詳情:http://www.leiphone.com/news/201703/MJ1rgDpXMzUENYtF.html
Google Cloud Next 雲技術大會
Google Cloud Next 雲技術大會於當地時間3月8日上午8:30在美國加州舊金山開幕(北京時間約為9日凌晨1點)。
大會上,谷歌宣布收購大數據競賽平台 Kaggle,但並未公布具體交易條款。報道稱,被收購後 Kaggle 將會保留獨立團隊和品牌,並接入谷歌雲服務,繼續舉辦大數據相關的競賽。
此外,谷歌還推出了全新視頻搜索 API :Video Intelligence API 。報道稱,Video Intelligence API 的主要功能是標註視頻中的物體和場景,即實現了自動化的視頻標記,從此開發者可以像搜圖片一樣輕鬆地搜索視頻中的內容。目前該 API 尚處 Private Beta 階段,並未完全公開。
收購 Kaggle 詳情:http://www.leiphone.com/news/201703/ZjpnddCoUDr3Eh8c.html
視頻搜索 API 詳情:https://cloud.google.com/video-intelligence/
Facebook 開源新一代機器學習 GPU 伺服器 Big Basin
繼 2015 年發布開源機器學習 GPU 伺服器 Big Sur 並將其成功應用之後,今天(3 月 9 日) Facebook 通過官方博客宣布 Big Sur 的升級版 —— Big Basin 已經研發成功,並在 Open Compute Project 開源。據稱,通過將內存從 12 GB 增加到 16 GB ,以及提高算數吞吐量(arithmetic throughput),Big Basin 可以處理的機器學習模型規模增加了 30%。
詳情:http://www.leiphone.com/news/201703/MJ1rgDpXMzUENYtF.html
百度發布 PaddlePaddle 新 API
3 月 9 日,百度宣布已完成 PaddlePaddle 新 API 的內測版本。PaddlePaddle 是百度研發的深度學習開源平台,於去年 9 月對公眾開放,稱得上是國內機器學習開源項目的領軍者。雷鋒網獲悉,該新 API 介面大幅精簡了 PaddlePaddle 的代碼量。下面百度官方公布的對比圖,左為舊 API 上的 CNN 程序,右為新 API。
如圖所示,新 API 的代碼非常簡潔。百度表示,這主要是由於三個方面的改進:
新的概念模型
提供「訓練、「測試」、「推理」等新的高級 API,並支持 Kubernetes 。
組合的 data bricks
此外,百度還開放了《使用 PaddlePaddle 進行深度學習》的使用手冊,其中有示例教程。
手冊下載地址:http://book.paddlepaddle.org/index.en.html
詳情:http://research.baidu.com/paddlepaddles-new-api-simplifies-deep-learning-programs/
大會預告:IBM InterConnect 2017
IBM InterConnect 2017 開發者大會將於 3 月 19-23 日在拉斯維加斯舉行。日前為了吸引更多的開發者參與,IBM 在官方博客中總結了此次會議對 Java 開發者而言的 6 大亮點:
1. Code Rally 編程拉力賽
2. DevZone 開發者社區
3. 微服務(Microservices)專題討論
4. Open Tech Summit 技術開放峰會
5. 基於 IBM WebSphere Liberty 和 MicroProfile 的敏捷開發
6. 基於 IBM WebSphere Liberty 和 Node.js 的本地雲微服務
詳情:https://www.ibm.com/blogs/cloud-computing/2017/03/java-developer-interconnect-2017/
開發者資源推薦
最近很火的《計算機科學的數學》是本什麼樣的書?
本文詳細介紹了《計算機科學的數學》這本書的來龍去脈,並推薦了其他一些相關資源,包括一個權威的機器學習入門書單和十大機器學習公開課等。
地址:http://www.leiphone.com/news/201703/1ywNOxhiSuX3pNJZ.html
數據科學入門難?老司機為你盤點 24 門精品課程
本文盤點了 24 個高品質的在線數據科學入門教程,原作者是一位自學成才的數據科學大牛,文中匯總的課程不但參考了在線慕課社區 Class Central 成千上萬的課程評分和評論數據,更是原作者的經驗之談,因此非常具有參考價值
地址:http://www.leiphone.com/news/201703/gCpBclh3rST2rHzc.html
盤點近年來引用最多的深度學習論文
原文來自滑鐵盧大學的博士研究生 Terry Taewoong Um,他搜集整理了 2012 年以來在深度學習領域被引用次數最多的一百多篇論文,值得深入研究。
地址:https://github.com/terryum/awesome-deep-learning-papers
雷鋒網相關閱讀:
Google Cloud Next 雲技術大會開幕;英偉達發布全新 Jetson TX2 嵌入式開發組件 | AI 開發者頭條
百度發布 PaddlePaddle 新 API;微軟更新 Linux 平台虛擬機 DSVM 等 | AI 開發者頭條
※三星80億美元正式收購哈曼,加碼汽車電子業務
※華為歐洲專利申請量超三星,升至第二,僅次于飛利浦
※百度的招聘廣告為何比小米差 人工智慧告訴你
TAG:雷鋒網 |
※谷歌通過TensorFlow Object Detection API開源其物體識別系統
※TensorFLow可應用於Android Things的物聯網;GitHub發布開源指南
※OpenAI開源機器人模擬軟體Roboschool
※Oracle 開源 Serverless Functions 平台 Fn
※常用的三大Java EE開源伺服器Apache Geronimo3、Tomcat8和JBoss7比較分析
※TensorFlow Agents日前開源,輕鬆在TensorFlow中構建並行強化學習演算法
※Facebook開源捕捉代碼缺陷的自家工具:OneWorld、Jupiter、AL
※開源 .net license tool, EasyLicense !
※XSS OR 開源,Hack with JavaScript
※Facebook開源Zstandard新型壓縮演算法代替Zlib 簡單使用
※支持Python!Facebook開源預測工具Prophet
※大規模Kafka集群的管理利器:LinkedIn最新開源的Cruise Control帶來了什麼?
※重磅!阿里巴巴正式開源全球化OpenMessaging和ApsaraCache項目
※從Facebook AI Research開源fastText談文本分類:詞向量模性、深度表徵等
※「TensorFlow的「移動為先」」谷歌開源移動設備視覺模型MobileNets
※愛開源的微軟是如何擊敗 Facebook、Google 成為 GitHub No.1 的?
※「深度學習測顏值」基於TensorFlow的開源項目FaceRank
※阿里巴巴積極擁抱開源 正式開源全球化OpenMessaging和ApsaraCache項目
※GitHub開發者呼籲Adobe將Flash開源