當前位置:
首頁 > 最新 > 我們常說的計算機視覺,究竟是什麼?

我們常說的計算機視覺,究竟是什麼?

HBO電視劇《矽谷》中曾出現過一個「不是熱狗」(Not Hot Dog)的應用。劇中主角們打造了一個人工智慧應用,該應用只能識別熱狗,其他的食物都被簡單粗暴地鑒定為「不是熱狗」。

GIF

如果你經常看人工智慧相關的文章,相信對「計算機視覺」一詞並不陌生。

作為人工智慧的一項關鍵能力,計算機視覺總是和人工智慧相伴出現。計算機視覺技術目前已有很多應用。

比如你手機相冊里的分類功能。手機根據相機拍攝的人物、物體、場景幫你分門別類。

正如我們用眼睛和大腦來感知世界,計算機視覺的目標之一,就是通過機器以類似的方式來「觀察」和處理圖像。計算機可以通過多種渠道「看到」我們無法感知到的世界。

計算機視覺並不簡單

HBO 電視劇《矽谷》中曾出現過一個「不是熱狗」(Not Hot Dog)的應用。劇中主角們打造了一個人工智慧應用,該應用只能識別熱狗,其他的食物都被簡單粗暴地鑒定為「不是熱狗」。

這個應用場景說明,構建一個真正實用的分類器絕非易事。

電視劇之外,片方還真的開發了這樣一個 App。「不是熱狗」應用的創作者表示,儘管他只花了一個周末,用一台配備一顆 GPU 的筆記本電腦就完成應用的開發,但卻花了大量時間去打磨用戶界面,又花了數周來改善應用的整體準確性。

通過機器學習實現對象識別的計算機視覺,本質上是訓練模型以便對圖像中的對象進行識別和分類,實現起來並不簡單。

GIF

它需要成千上萬的圖像作為訓練數據,開發人員也需要花費大量時間、精力和耐心去訓練模型。 「不是熱狗」應用表明,雖然計算機視覺技術具有巨大的潛力,但充分的訓練數據對於實現這一目標至關重要。

計算機視覺也會出錯

就像一個正在學習香蕉和方塊之間區別的小孩子一樣,經過大量數據訓練的分類器仍然會犯錯誤。

GIF

辨別不同物體是圖像分類器的基本能力。我們來看人工智慧公司 Clarifai 的分類器如何識別圖像。它取得了驚人的準確率:區分吉娃娃和鬆餅的準確率高達 95.8%。

但在識別圖像中其他種類物品時,卻表現不佳。 比如,在識別鴨子時,它不僅沒有識別出鴨子,還把鴨子周圍的水域識別為汽車!

同樣的,當測試人員向微軟的 CaptionBot AI 展示張牙舞爪的蟲子圖片時,它竟然將它識別為一隻狗。

識別出錯在一定程度上是數據量的問題。分類器擁有的訓練數據越多,識別的準確率就越高。所以,如果我們給這些分類器提供更多的鴨子和蟲子圖片,理論上它們應該能夠更好地正確識別圖像。

我們不得不承認,一個顯而易見的事實是:計算機視覺和人類視覺不是一回事。

GIF

Qualcomm一直在努力改善我們的人工智慧圖像分類能力。在 2015 年,我們在 ImageNet 圖像識別挑戰中拔得頭籌,該比賽重點測試了人工智慧的對象定位、對象檢測和場景分類等能力。

我們將繼續研究計算機視覺在自動駕駛、虛擬現實、增強現實和物聯網等各種領域的最新應用。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Qualcomm中國 的精彩文章:

Qualcomm參加商湯人工智慧峰會:攜手加速終端側AI普及
驍龍845拍照到底強在哪兒?

TAG:Qualcomm中國 |