「你是我的眼」,微軟計算機視覺 APP 讓盲人用手機看世界
導語:這款手機 APP 的名稱是「Seeing AI」,今日在美國 iOS 設備上推出。
本文作者:三川
雷鋒網(公眾號:雷鋒網)消息,微軟發布了一款基於計算機視覺技術的手機 APP 「Seeing AI」(「視覺 AI」) ,能為有視力缺陷的殘障人士描述周圍的世界。
安裝該 APP 之後,用戶若把手機攝像頭對準某人,它就會說出這個人是誰,以及他的情緒(表情)。把手機攝像頭對準某個物體,Seeing AI 會說出這是個什麼東西。這通過在手機本地運行的 AI 演算法實現。
GIF/1558K
Seeing AI 人臉識別示例:「戴著眼鏡的 28 歲女士,看起來很開心。」
去年三月的 Build 大會上,微軟展示了這款 APP 的原型。今天,它終於發布。美國 iOS 用戶已可免費下載。至於 Seeing AI 何時會登陸安卓、進入中國市場,雷鋒網尚沒收到任何消息。
核心功能
作為一款面向殘障人士的生活輔助軟體,微軟把 Seeing AI 設計為能滿足一系列不同的生活場景需求。比如上面提到的,進行面部識別,猜測對方的年齡和情緒。它還能通過掃描二維碼識別家居物品,讀取、識別文件,識別美元鈔票。識別鈔票的功能是一個實用性極強的功能。所有美元紙幣都是相同大小、同樣顏色。對部分殘障人士,區分不同面值的鈔票可能會十分困難,Seeing AI 這樣的 APP 則能解決該問題。
GIF/1826K
Seeing AI 文件識別示例
Seeing AI 的物體識別能力基於神經網路來實現,其基本原理與自動駕駛汽車、無人機並無不同。它最基本的功能在本地實現。這有兩個好處:
網路不穩定的情況下仍可使用;反饋速度更快。
但是,Seeing AI 的試驗性功能,比如描述整個周圍環境,以及識別手寫文字,則需要連接到雲端。
人性化設計
Seeing AI 的技術帶頭人 Saqib Shaikh,向媒體透露了一個很有意思的細節:
Seeing AI 能夠指示用戶如何上下左右移動手機攝像頭,以看清楚目標物體。 這是一個相當人性化的功能,尤其考慮到視力有缺陷的殘障用戶,讓它們拿手機攝像頭「對準」某個物體本身就存在相當的難度。很顯然,對於 Seeing AI 來講,雖然光學物體識別技術是根本,但若沒有這類人性化功能設計,它究竟有多少實用價值就變得十分模糊。
Saqib Shaikh
從 Saqib Shaikh 他自己的使用經歷來講(他是一名盲人),他最經常把 Seeing AI 用來識別符號和菜單。至於 Seeing AI 和其他同類 APP 之間的差異,他表示,最大的區別神經網路的運行速度:
「我們做到了在本地運行人臉識別,幾微秒的時間內你就能聽到結果。速度就是一切,我們試圖壓榨出在設備本地所能達到的極限。」
via the verge,雷鋒網編譯
雷鋒網原創文章,網站轉載請至雷鋒網官網申請授權。歡迎熱情討論,轉發分享~
※融資過億?死於高溫?這些都不是無人零售的真實面目
※奧迪首款L3自動駕駛量產車,背後是NVIDIA提供的計算力
※海康威視涉嫌抄襲,擁有1200項專利的安防龍頭怎麼想的?
※專訪科勝訊總裁 Saleel Awsare:智能語音交互為我們帶來的新機會
※他攻破了五角大樓,她是計算機安全教母,一波牛破天際的黑客8月要來北京
TAG:雷鋒網 |
※你是我的眼 能夠讓盲人使用的相機問世
※微軟推出人工智慧耳機,盲人也可以看世界!
※微軟推出盲人專用VR設備,你在逗我?
※你是我的眼——這款創意相機,能讓盲人更真實的感觸身邊世界
※眼盲不可怕,心盲才是真的絕望,這五部盲人電影帶你閉眼看世界
※他們是盲人,他們也可以看電影
※盲人也能用手機在黑暗中勾勒美好
※讓更多人「看見」這個世界 微軟為盲人開發的AI應用程序上線
※太美了,盲人藝術家的動畫作品,當心沉迷盯住看到手機沒電
※可以真實觸摸的VR科技,VR手套讓盲人第一次「看」藝術
※有了這項技術,盲人閉著眼睛也能看到世界
※我是盲人,我要看世界
※不是科幻!透過這扇暖心車窗,盲人也能「看到」整個世界
※這項技術,讓盲人朋友們也能「看」圖畫了
※猜不到吧?我是盲人,但我的工作是攝影師
※盲人也搞視覺藝術?是不是瞎搞,看這5個就知道!
※VR無結界盲人也能玩!微軟推盲人VR體感組件
※盲人怎麼就不能用顯示器了
※微軟盲人語音相機應用獲得MWC全球移動大獎
※專為盲人設計的相機,通過觸摸感受世界