我們常說的計算機視覺,究竟是什麼?
HBO電視劇《矽谷》中曾出現過一個「不是熱狗」(Not Hot Dog)的應用。劇中主角們打造了一個人工智慧應用,該應用只能識別熱狗,其他的食物都被簡單粗暴地鑒定為「不是熱狗」。
GIF
如果你經常看人工智慧相關的文章,相信對「計算機視覺」一詞並不陌生。
作為人工智慧的一項關鍵能力,計算機視覺總是和人工智慧相伴出現。計算機視覺技術目前已有很多應用。
比如你手機相冊里的分類功能。手機根據相機拍攝的人物、物體、場景幫你分門別類。
正如我們用眼睛和大腦來感知世界,計算機視覺的目標之一,就是通過機器以類似的方式來「觀察」和處理圖像。計算機可以通過多種渠道「看到」我們無法感知到的世界。
計算機視覺並不簡單
HBO 電視劇《矽谷》中曾出現過一個「不是熱狗」(Not Hot Dog)的應用。劇中主角們打造了一個人工智慧應用,該應用只能識別熱狗,其他的食物都被簡單粗暴地鑒定為「不是熱狗」。
這個應用場景說明,構建一個真正實用的分類器絕非易事。
電視劇之外,片方還真的開發了這樣一個 App。「不是熱狗」應用的創作者表示,儘管他只花了一個周末,用一台配備一顆 GPU 的筆記本電腦就完成應用的開發,但卻花了大量時間去打磨用戶界面,又花了數周來改善應用的整體準確性。
通過機器學習實現對象識別的計算機視覺,本質上是訓練模型以便對圖像中的對象進行識別和分類,實現起來並不簡單。
GIF
它需要成千上萬的圖像作為訓練數據,開發人員也需要花費大量時間、精力和耐心去訓練模型。 「不是熱狗」應用表明,雖然計算機視覺技術具有巨大的潛力,但充分的訓練數據對於實現這一目標至關重要。
計算機視覺也會出錯
就像一個正在學習香蕉和方塊之間區別的小孩子一樣,經過大量數據訓練的分類器仍然會犯錯誤。
GIF
辨別不同物體是圖像分類器的基本能力。我們來看人工智慧公司 Clarifai 的分類器如何識別圖像。它取得了驚人的準確率:區分吉娃娃和鬆餅的準確率高達 95.8%。
但在識別圖像中其他種類物品時,卻表現不佳。 比如,在識別鴨子時,它不僅沒有識別出鴨子,還把鴨子周圍的水域識別為汽車!
同樣的,當測試人員向微軟的 CaptionBot AI 展示張牙舞爪的蟲子圖片時,它竟然將它識別為一隻狗。
識別出錯在一定程度上是數據量的問題。分類器擁有的訓練數據越多,識別的準確率就越高。所以,如果我們給這些分類器提供更多的鴨子和蟲子圖片,理論上它們應該能夠更好地正確識別圖像。
我們不得不承認,一個顯而易見的事實是:計算機視覺和人類視覺不是一回事。
GIF
Qualcomm一直在努力改善我們的人工智慧圖像分類能力。在 2015 年,我們在 ImageNet 圖像識別挑戰中拔得頭籌,該比賽重點測試了人工智慧的對象定位、對象檢測和場景分類等能力。
我們將繼續研究計算機視覺在自動駕駛、虛擬現實、增強現實和物聯網等各種領域的最新應用。
※Qualcomm參加商湯人工智慧峰會:攜手加速終端側AI普及
※驍龍845拍照到底強在哪兒?
TAG:Qualcomm中國 |