小魚易連袁文輝:視頻雲平台語音交互不同於智能音箱
這一次,小魚易連將雲視頻運用到教育領域。
5月17日,小魚易連和高思教育,合作發布肩膀計劃,利用小魚易連「雲+AI」技術推進教育信息化變革,同時整合優秀教育資源。
1、
具體技術支持上,肩膀機會背後是一整套遠程雙師課堂技術解決方案作為支撐。小魚易連作為遠場音視頻雲識別的解決方案提供商,通過遠場音視頻雲識別能力保障雙師課堂生動流暢效果;同時動態調整不同網路帶寬下音視頻質量,依靠核心音視頻演算法保障授課、聽課端教室在互聯網丟包環境下順利上課;標準化的統一部署方案保障大規模的方案複製。
袁文輝表示,小魚易連遠場音視頻雲識別解決方案的核心技術之一,就是防丟包。
所謂」丟包「是指在通信中是指通信數據包丟失。數據包的傳輸,不可能百分之百的能夠完成,因為物理線路故障、設備故障、病毒攻擊、路由信息錯誤等原因,總會有一定的損失。當線路較差(如用數據機),數據的損失量就會非常大,補包工作也不可能百分之百完成。在這種情況下,數據的傳輸就會出現空洞,造成丟包。
袁文輝對雷鋒網表示,過去DVD一旦有了劃痕,日本款DVD機就播放不出來了,但是國內產品可以——因為國內廠商具備超強糾錯技術。袁表示,以前的視頻技術都是基於傳統專線,不會丟包,設計的時候便也沒有考慮過丟包問題。
小魚易連的核心策略,是通過優化音視頻編碼、構建新的媒體服務架構和信令系統、優化網路傳輸和網路部署。其中就包括抗丟包能力、 SVC 技術、網路上傳技術、糾錯技術等,在網路丟包30%的情況下都能確保視頻不卡頓。
2、
此外,相比於視頻,袁文輝表示,聲音處理技術難度更高。
但就本質而言,袁文輝對雷鋒網表示,小魚易連的核心壁壘並非某項技術,而是構築牆固的生態圈——目前,小魚易連正通過構建全球互聯的視頻雲平台,打造「雲+端+服務+業務」服務生態。提供視頻會議、遠程教育、遠程醫療、遠程金融及遠程政務等服務,實現人務互聯。
針對高思教育為什麼會選擇小魚易連這個問題,其實很明顯可以發現,雙方背後站著共同的投資人——李開復。他在現場表示,小魚易連特彆強大的技術就是在現有互聯網上能提供非常高清的視頻,在120寸電視上用外國友商十分之一、二十分之一成本達成這樣的技術。以後憑藉增強現實,可以幫助學生拉近與老師的距離。
但在具體技術方面,仍有很多不足要改進,包括像人臉識別,對數據的積累,對學生學習數據的積累,數據的補足可以幫助在課上提供好的技術解決方案,比如當學生回答客觀題或主觀書寫部分時,通過手寫識別,可以看到學生的答題過程與思路差異,對一個學生更長時間的數據積累,可以使得對其的畫像更加到位。另外,整個對學生像AR技術的使用上,其實AR技術本身也在不斷逼近真實,我們也跟進先進的技術,使線下比線上更加逼真,符合學生的認知。這是我們在後續持續不斷努力的一個方向。
袁文輝表示,更多需要突破的技術主要集中在收集更多數據處理分析上,尤其像視頻數據上課的過程是海量的數據,我們每節課都是錄下來存在雲端,但是這些都是非常難以處理和查找的,現在通過AI的方式把非結構化的數據結構化,將來你想看某個學生在整個課堂從頭到尾集中精神多少分鐘,走神多少分鐘,今天的技術很難實現,但是在未來查類似的數據很方便,因為人工智慧會幫助你,把非結構化做結構化的處理。
其次,在袁文輝看來,語音是比視頻更具難度的技術領域,具體包括回聲消除、迴響消除、自動聲音控制、噪音抑制這些機制全面組合在一起,才能形成高保真遠程面對面的傳輸。
而類比目前正火熱的智能音箱語音交互技術,袁文輝對雷鋒網表示,兩者是完全不同的方向。智能音箱通過麥克風達到比較好的性噪比,聲音要喚醒或者語音識別,說話聲音要比外面的雜訊超過一定的比例,才能識別出來。並不需要靠聲音回聲消除,說話聲音放大到最大,別的聲音都可以被抑制掉,不用考慮回聲消除的問題 。而小魚易連要解決回聲消除跟遠端交互難度更大,當然這是兩個不同的方向。
未來,袁文輝對雷鋒網預測, 小魚易連將具體運用到智慧法庭、智慧政務、公安、司法、醫療、教育等不同領域。
※百信銀行首度透露業績:授信用戶超百萬,累計放款逾150億
※專訪鄢志傑:阿里全面進軍 IoT,語音交互能做什麼、將做什麼?
TAG:雷鋒網 |