當前位置:
首頁 > 科技 > 讓更多人「看見」這個世界 微軟為盲人開發的AI應用程序上線

讓更多人「看見」這個世界 微軟為盲人開發的AI應用程序上線

本文由騰訊數碼獨家發布

我的鄰居卡蒂娜是一位75歲的雕刻家,他在成年後的大部分時間裡都處於完全失明的狀態。但幸運的是,科技為她的生活設定了新的節奏。手持血糖監測器可以讀取她手臂上的一個貼片來隨時監控她的糖尿病,Google Home里一直播放著她喜歡的古典音樂,她在屏幕總是停留在iPhone導航上,上面有各種令人眼花繚亂的定點和滑動模塊。

有一天,她坐下來給我看她正在試用的一款新應用,名為Seeing AI。微軟於2017年7月為視力受損的人推出了這款應用程序,它使用該公司的視覺識別軟體(vision-recognition software)通過她的手機攝像頭講述世界。

我很想親自嘗試一下這款軟體的使用方式,於是用Seeing AI給卡蒂娜拍了一張照片。手機里傳出一個機械的男性聲音:「一個45歲棕色頭髮的女人正在微笑。」

「我太喜歡這個APP了!「,卡蒂娜說,顯然她對Seeing AI對她的年齡做出的判斷感到十分高興。當時,我8歲的女兒就在附近,試著做了個鬼臉。但是當她做完的時候,Seeing AI給出了這樣的報告:「一個六歲的棕色頭髮的女孩做出很輕蔑的表情。」

我們都忍不住笑了,但我還是覺得這個判斷有點不太準確。雖然它最後的判斷似乎並沒有完全錯,因為我女兒把舌頭伸出來了。但是對於計算機來說,這個詞的選擇還是很大膽的。

幾周後,我有幸與微軟研發Seeing AI的主要工程師之一Saqib Shaikh進行了一場交談。一開始我很奇怪,Saqib Shaikh從小就失明,為什麼他做出應用程序會選擇「輕蔑」這樣的描述字眼呢?後來我才了解,這是來自微軟演算法訓練的數據。

Saqib Shaikh同樣還是來自英國劍橋微軟公司的研究人員,他解釋說,為了建立這個系統,他們選擇了八種跨越了不同種族和文化的情緒表達,包括悲傷、憤怒、恐懼和蔑視等等。

2015年11月,微軟發布了一款情感識別工具,其他軟體開發商可以用它來開發應用程序。Saqib Shaikh表示:「科學家們列出了他們認為重要的需要敘述的事項,比如性別、年齡、頭髮顏色和情感等。」然後,一組人用這些描述對數千幅圖像進行分類,將辨別程序「教給」Seeing AI。

他補充道,事實證明,這樣的研究目前正支撐著微軟以認知服務(Cognitive Services)的名義向更多企業銷售的更為主流的視覺識別軟體。例如,一家名為Prism Skylabs的商業情報公司就利用它幫助零售商監控視頻內容,以查看他們的送貨卡車何時到達。

儘管人工智慧目前只有一小部分用戶,但它的發展表明,未來我們其他人可能也會普遍用到視覺識別等人工智慧技術。現在人們使用的許多技術,從滑鼠到文本到語音軟體,再到預測性文本輸入法,甚至打字機,都是植根於針對人殘疾人的研究成果。

Audible的高管告訴我,Audible的存在可以說要歸功於盲人,而曾為蘋果 Siri提供支持的語音技術公司Nuance就誕生於殘疾研究領域。需求是發明之母,而聾啞人和視障人士是技術發展的先驅者。

諾丁漢特倫特大學(Nottingham Trent University)前講師托尼·艾倫(Tony Allen)在接受採訪時提到:」我們的技術已經發展到能夠處理語音和語言信息,我們需要讓未來的電腦去學會適應我們,而不是讓我們適應電腦。為失明、失聰或癱瘓的人開發各種技術,可以幫助進一步推進研究方向。

如今,經過改進的助聽器已經找到它的主流用戶。蘋果的無線AirPods為聽力較差的人提供了一項名為Live Listen的功能,可以讓他們在嘈雜的房間里用iPhone麥克風聽對話,而聽力非常好的人可以利用這個特性來進行一些隱蔽的傾聽。

Starkey聽力技術公司成立於1970年,當時是明尼蘇達州伊甸草原的一家助聽器製造商。如今,該公司推出了號稱世界上第一款智能助聽器的產品,這是一款小巧玲瓏的設備,能追蹤人的腳步,探測跌倒,並能翻譯20多種語言。Starkey公司的技術總監、助聽器用戶保羅·蘭姆(Paul Lamb)說,所有這些新添加的額外功能「將使聽力技術成為主流」。

卡蒂娜用「 Seeing AI」來閱讀手寫卡片,並計算錢包里的零錢。羅賓·斯賓克斯(Robin Spinks)還有部分視力,他在訪問一家餐廳時使用這款應用程序閱讀菜單。斯賓克斯說:「我做這一切的時候非常謹慎,所以看起來與其他用餐的人並沒什麼不同。這種令殘障人士的生活基本走向正軌的生活是之前難以想像的。」

沙伊克說,一些盲人使用這款應用程序來解說一部外語電影的字幕,還可以在觀看足球比賽時用手機對著電視,這樣電視就能讀取最新比分。Shaikh希望有一天當他走在大街上的時候,可以用這款應用識別地標,比如商店或新建築。

現年37歲、總部位於倫敦的謝赫在2014年微軟工程師聚會上第一次為人們帶來了人工智慧的曙光。當時,他們使用了微軟的深度學習軟體,這是一種很流行的人工智慧運行方法,使用數據層來幫助預測結果。他們還將自己的培訓數據添加到系統中,拍攝了數千張10美元鈔票的照片,以便應用程序能夠識別貨幣。

最近增加的一項功能允許用戶用手指在照片上滑動,這樣他們就可以「觸摸」照片中物體的邊緣,比如桌子或植物。他們現在可以通過微小的振動,即觸覺反饋和聲音來感知邊緣。

除此之外,Shaikh還有更豐富的方式來更新他的應用程序。

我私下問卡蒂娜,她是否還想知道一些其他的細節,關於她遇到的人的情況,比如著裝是否整潔。「當然啦!」她馬上回答,「我覺得這非常重要,我很關心一個人看起來是否整潔。他們的衣服可以打補丁,也可以撕破,但是必須要保持乾淨。」

斯賓克斯希望更詳細地了解他周圍的藝術史、人物史或建築史。他把這些視覺線索描述為有視力的人認為理所當然的事情。英國皇家盲人協會的斯賓克斯說:「盲人想要的第一件事就是和完全視力正常的人平等。

斯賓克斯的一位失明同事說,他想要一款能夠謹慎地告訴他某人是否有吸引力的應用程序。這對他來說是一個很有意義的需求。那麼微軟能夠給它的人工智慧植入這種能力嗎?比如辨別一個人的種族或體型?

Shaikh表示:「總的來說,我認為我們應該提供充足的信息,讓客戶做出自己的判斷,我不認為一個應用程序可以全權為客戶做出絕對的判斷,因為這些都是非常私人的事情。」

這些是獨屬於人類的高級情感,但是我們看到人工智慧已經在嘗試著對人的年齡和情感做出個人判斷。雖然Shaikh說用戶可以聯繫微軟進行修正,但很多人只能相信演算法告訴他們的,然而Shaikh目前並沒有刪掉識別吸引力或種族的系統。

如果成功了,這可能會讓盲人的生活更接近斯賓塞所希望的平等狀態,但當這種技術成為主流時,它也可能給偏見判斷帶來更多複雜的問題。

在我們的採訪中,當卡蒂娜向我們回憶起她在當地的公園裡偶遇一個男人的故事時。她說:「當時我們聊了起來,聊天的感覺非常好,也很正常。」然而,在他們道別之後,附近的一位朋友透露,如果卡蒂娜能看到那個男人的樣子,她絕不會想和他說話。因為他很臟。

卡蒂娜回憶道:「但是在我眼裡他很好,真的非常好,這給了我一個教訓,不能光從外貌信息去簡單判斷一個人的屬性」


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 長大的小老鼠 的精彩文章:

三星華為競相推出摺疊手機 蘋果為何按兵不動?時機未到

TAG:長大的小老鼠 |