科技有愛:視障用戶也能「看到」圖片了
近年來,隨著互聯網技術快速發展,以大數據、雲計算、人工智慧為代表的新一代前沿科技,正以前所未有的能量,改變著我們的日常生活。外國朋友對中國「新四大發明」,羨慕到不行,而身處科技浪潮下的中國人,卻早就習以為常。
然而,在你我享受科技「紅利」所帶來便利的同時,一個龐大的群體,卻常常被人忽略:數據顯示,目前中國有約1300萬視障者,佔總人口的1.2%到1.3%。除此之外,中國還有千萬級別的讀寫、聽力、言語障礙人士。
圖註:第二次全國殘疾人抽樣調查分類數量統計(單位:萬人)
來源:中國殘疾人聯合會
製圖:TechWeb
和每位普通用戶一樣,他們也身處於這個數字化、信息化的時代,他們也需要使用電腦、手機,並通過互聯網工作學習、購物娛樂。讓科技「雨露均沾」、讓我們不再「不一樣」、實現「信息無障礙」,這已成為亟待解決的重要課題。
值得欣慰的是,這類「千人千面」的用戶需求,正逐漸被社會各界和廣大互聯網企業所關注。同時,受益於人工智慧等新技術的不斷創新,也為無障礙交流的實現,在技術開發和場景落地等環節創造了可能。目前,在無障礙化交流領域的科技創新,得到了全球科技公司的普遍重視。
比如針對視覺方面,蘋果為失明或弱視人士開發的Voice Over(旁白)語音輔助功能,其iOS內置的屏幕閱讀器以朗讀的方式,為有需要的朋友在操作設備時提供語音播報,用畫外音為「愛心」導航。
對於聽力障礙用戶,谷歌此前也提供了一種類似「屏幕字幕」的功能,幫助用戶在需要查看含有語音的頁面時,可不依賴於音頻輸出,由系統自動甄別聲音後,在屏幕上轉化為實時字幕,用文字記錄「愛心」。
圖源:谷歌
國內方面,越來越多的中國互聯網科技企業,也正在為全球網路信息無障礙事業貢獻著各自的一份力量。比如較早著手於信息無障礙功能改造的騰訊,旗下產品和技術團隊就嘗試將圖片識別、文字識別等人工智慧,賦能於實際的應用場景,幫助障礙用戶更好感受互聯網生活。
去年手機QQ通過騰訊優圖實驗室提供的OCR技術,對「文字提取」功能進行無障礙溝通優化,幫助障礙用戶通過手機QQ「掃一掃」功能,識別圖片上的文字內容並進行語音播報。它還可以識別閱讀實體書、藥物說明等更多圖片及文本,這對於視障用戶或視力下降的老人來說,科技成為了他們的貼心「助手」,讓障礙用戶享受到更多的社交樂趣。
不僅如此,剛剛上線的最新安卓版QQ空間APP中,新增加的「圖片語音即時描述」功能。它主要運用騰訊AI Lab的「圖像描述生成」技術,該強化學習演算法曾在MS COCO相關類別的頂級國際挑戰賽上超越微軟和谷歌排名第一,機器能將圖片識別成一句文字描述,讓AI去理解圖片內容,並用較為通順的語言朗讀出來。這也是QQ空間在無障礙社交領域的一次新的嘗試,讓視障用戶藉助科技的力量理解圖片,讓圖片自己「說話」。
圖註:QQ空間APP 「圖片語音即時描述」功能
為了讓無障礙功能更實用、體驗更好,在功能上線前,QQ空間邀請視障用戶測試體驗,並在上線後持續收集視障用戶使用過程中給到的反饋和建議,不斷進行功能優化。一位視障小夥伴內測體驗後表示:「其他人可能沒什麼感覺,甚至認為參考性不大,但對我而言卻彷彿打開了一扇全新的大門。之前我對於一般熟的好友動態,只會通過文字揣摩他要表達的意思,關係好的才會評論問圖片是什麼?而以後這一步基本可以省掉,在也不必讓好友描述配圖了。」
確實,在這個產生巨大價值,蘊含無窮想像的信息化時代,互聯網已經成為驅動社會進步的重要動力。這股前所未有的科技變革中,每個人都應該能夠使用網路,並暢享網路帶來的便利,對於你我普通之人來說用處不大的設計,卻可能是讓他人連接世界的重要橋樑。
除了視覺和聽覺障礙,還有更多存在著運動缺陷、認知障礙、功能性損傷的朋友,探尋他們的個性化需求,幫助他們方便快捷地、無障礙地獲取信息,這將是全球互聯網科技公司未來實現社會價值的全新課題。
儘管「Accessibility」(無障礙功能)難以拼寫,卻不一定難以實現。隨著互聯網邊界的無限拓展,用戶必將呈現出不同維度的多樣化訴求。而讓網路信息無障礙,讓愛與希望無障礙,無疑是不可阻擋的必然趨勢。
※大屏+蔡司雙攝 Nokia7Plus遭曝光
※亞馬遜無人收銀便利店本周一將正式開業 系統自動扣費不用排隊付款
TAG:TechWeb |