當前位置:
首頁 > 知識 > 谷歌開源物體檢測系統 API

谷歌開源物體檢測系統 API

AI 研習社按:近日,谷歌在其「谷歌開源」博客(Google Open Source )中發表一篇名為《Supercharge your Computer Vision models with the TensorFlow Object Detection API》的文章,文中指出雖然谷歌的物體檢測,圖像識別機器學習系統很先進,但仍面臨著很多挑戰,比如如何提高識別精度。為此,谷歌將其物體檢測系統代碼開源,希望更多愛好者參與進來,共同推動研究領域的發展。我們對原文做了不改動願意的整理和編譯:

在谷歌,有為計算機視覺開發的最靈活,最先進的機器學習(ML)系統,不僅可以用來改進產品和服務,還可以促進研究領域的進步。不過,在單個圖像中創建精確的ML模型使其能夠定位和識別多個對象仍然是該領域的一個核心挑戰,谷歌投入了大量的時間訓練和試驗這些系統。

圖中為其中的一個模型對圖片中對象的識別檢測效果

去年十月,谷歌內部的物體檢測系統已達到了最先進水平,並在COCO檢測挑戰賽中排名第一。此後,該系統為大量研究期刊提供了結果。在一些谷歌產品中也已投入使用,如NestCam。在Street View中,街道名稱,門牌號的檢測,和在Image Search中都運用了相似的理念思想。

今天很高興可以通過TensorFlow Object Detection API將代碼開源給更大的研究社區。這個代碼庫是建立在TensorFlow上端的開源框架,使其構建,訓練,展開物體檢測模型變得容易。設計這一系統目的是為支持當前最佳的模型,同時允許快速探索和研究。第一個版本包含:

一個可訓練的檢測模型的集合,包括:

帶有MobileNets的SSD(Single Shot Multibox Detector)

帶有Inception V2的SSD

帶有Resnet 101的R-FCN(Region-based Fully Convolutional Networks)

帶有Resnet 101的 Faster RCNN

帶有Inception Resnet v2的Faster RCNN

上述每一個模型的凍結權重(在COCO的數據集上訓練)可被運用進行推理。

一個Jupyter notebook 可通過我們的模型之一進行開箱推理

藉助谷歌雲實現便捷的本地訓練腳本以及分布式訓練和評估管道

SSD模型使用了輕量化的MobileNet,因此它可以輕而易舉地實時在移動設備運行。在贏得COCO挑戰賽中,谷歌使用了Fast RCNN模型,它需要更多的計算資源,同時結果也更為準確。

更多細節,請參看谷歌發表在CVPR 2017(https://arxiv.org/abs/1611.10012)的論文。

準備好開始了嗎?

這些代碼在計算機視覺應用中非常有用。谷歌希望這次開源能滿足一部分人所需。也同時也歡迎更多能為代碼庫做貢獻的人參與進來。現在,就可以下載代碼,使用Jupyter notebook對圖片中的物體進行識別。也可以使用Cloud ML訓練自己的識別器了。

代碼下載地址:

http://t.cn/RovTTCK

Jupyter notebook:

http://t.cn/RoUE5wj

Cloud ML:

http://t.cn/RowEjfZ

開發者專場 | 英偉達深度學習學院現場授課

學習形式:線下授課 + 交流答疑

時間:7 月 8 日

地點:深圳市福田區福華路大中華喜來登酒店

培訓價格:1999 元,前五十名報名者提供五折早鳥票,先到先得!

點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 唯物 的精彩文章:

如何實現模擬人類視覺注意力的循環神經網路?
一文詳解如何用 R 語言繪製熱圖
不用寫代碼就能實現深度學習?手把手教你用英偉達 DIGITS 解決圖像分類問題
深度學習先驅 Yoshua Bengio 解讀深度學習的關鍵突破點:無監督學習

TAG:唯物 |

您可能感興趣

NVIDIA推出RAPIDS開源GPU加速平台,瞄準數據分析和機器學習市場
CES熱點:開源管理系統 蘇寧智慧零售成生態體系構建源動力
IBM宣布正式開源POWER處理器ISA
C+環境下調用銳視開源測控軟體
NVIDIA PhysX物理技術封閉8年 如今終於開源了
封鎖8年:NVIDIA PhysX物理引擎全部開源
IBM聯手蘋果開發人工智慧服務;聯想新零售4月將推全新品牌;網易與谷歌合作發布開源UI自動化測試方案
IBM與NVIDIA攜手為數據科學家拓展開源機器學習工具
PHP7 JIT 相關開源項目
開源RISC-V架構正在改變IoT處理器的遊戲規則
NSA 官方開源反彙編工具 GHIDRA
AWS發布Neo-AI開源項目,可訓練跨平台的機器學習模型
超越OpenCV,史上最快人臉檢測系統開源
谷歌與索尼合作推出開源渲染管理器OpenCue
臉書開源體現AI平台AI Habitat
整合全部頂尖目標檢測演算法:FAIR開源Detectron
IBM推出開源工具幫AI抵禦對抗性樣本攻擊:DNN開發者的福音
滴滴開源自然語言理解模型訓練平台DELTA
中國移動持續推動ONAP開源項目技術研發與應用推廣
全球首款區塊鏈驅動的智能物聯網操作系統 HybridOS 即將開源