視覺語音雙重驗證定位會議發言人,「庄生曉夢」要以智能會議終端切入遠程會議市場
今年4月,視頻會議軟體提供商Zoom在美國納斯達克上市,上市首日即大漲72%,市值達到159億美元。不難看出,市場對遠程視頻會議這一領域十分看好。根據市場諮詢公司沙利文預測,從2017年到2021年,全球視頻會議預計複合年增長率將達到8.3%,預計2018年市場規模將達509億美元
思科、微軟、英特爾、谷歌、華為等科技巨頭都是這個領域的玩家。近年來,也有許多創業企業開始發力,挑戰既有巨頭,Zoom就是一個典型的例子。在中國市場,小魚易連則是相對領先的企業,今年4月獲得了騰訊數億元的C輪投資。除了SAAS等軟體產品,也有針對會議場景的技術提供方出現,如蛙聲科技,就聚焦AI聲學降噪,為會議場景提供收音設備。近日,36氪接觸到的上海庄生曉夢信息科技有限公司(以下簡稱「庄生曉夢」)也是一家針對視頻會議場景的解決方案提供商。
庄生曉夢目前主要產品有智能會議終端以及360度全景手機攝像頭COOLPO,接下來,我們來具體看看庄生曉夢兩個主要產品。
先是智能會議終端,這款終端以USB驅動,即插即用,可以適配目前市面上主流的雲視頻會議系統,主要可以應用與企業中小型會議室(10-30平方米),其具備的特色功能包括:
聽聲辨位,實時切換聚焦說話人畫面。硬體搭載全向360度攝像頭和全向麥克風陣列,同時具備語音視覺雙重認證功能。
人臉簽到;語音識別自動轉會議文字紀要,未來還計劃實現文字字幕實時顯示的功能。
音頻降噪,支持雙向通話的回聲消除;
360度交互與廣角雙模式,並可以實現一鍵切換。
其背後核心技術在於全向聲源定位、全向視覺演算法以及視覺語音融合驗證演算法等演算法,通過精確計算聲音方位角定位說話人位置,再調用視覺演算法確認聲音對象的確是發言人,之後系統會自動截取該對象的畫面,更新到會議畫面中。庄生曉夢的另一個優勢是能將這些演算法集成到相對便宜的晶元上,在產品研發上實現閉環產出,並不依賴晶元公司,同時也能切換到全國產晶元。
如何提高視頻會議交互性一直是視頻會議解決方案提供商們關注的重點。庄生曉夢產品可以實現說話人畫面的實時切換,這樣的功能設計可以讓相對「陌生」參會者明確發言人位置和身份,增強在場感。
「我們發現,目前市面上多數的雲視頻會議SAAS和專線會議提供商都正在著重提升議系統的流暢度和安全性,對於系統的交互界面並不十分看中。但是如果使用我們的硬體設備,可以直接提升用戶體驗,增加產品亮點。」庄生曉夢CEO朱雷震告訴36氪,「我們的方案也可以為科大訊飛這類會議記錄文本化服務商,提供說話人身份信息,是他們的整理記錄更加準確,之前他們的系統只能知道發言人的順序,無法得知發言人身份。」
目前該獲終端已與海康螢石達成在視頻會議上的深度合作,螢石已驗證本產品並給與生態合作夥伴稱號。之後也計劃藉助視頻會議SAAS廠商的渠道拓展市場。
另一個產品是360度攝像頭「COOLPO」,這個小設備可以直接安裝到手機已有的攝像頭上,配合相關軟體產品可以一鍵拍攝全景圖、拍攝超大廣角防抖視頻。
COOLPO
為什麼會選擇設計製造這樣一個產品,庄生曉夢有以下背景優勢:
在進行此次創業之前,團隊成員曾打造過一款全景圖拼接軟體,後建設了街景地圖產品,最終被百度收購。
創業後,最一開始,團隊也曾為電視台等客戶提供多目相機的圖像拼接方案,包括硬體和軟體兩個部分;也成為一些雙目相機廠商提供圖像拼接定製化的演算法方案。
「也是因為這些經歷,我們在思考能否通過為手機增加附加鏡的方式,使得手機也能實現部分全景相機、防抖廣角攝像機這類獨立電子產品才能實現的功能。於是,我們設計了一款這樣的產品,我們認為通過手機,能使這些技術更快地普通客戶人群使用。」朱雷震說。
COOLPO無需充電,作為手機附加鏡可以即插即用。防抖也是COOLPO的重要優勢之一,庄生曉夢使用的圖片及視頻拍攝之後再處理的方案,在自研的APP中,內嵌了電子防抖演算法、圖片智能裁剪拼接的演算法以實現防抖效果。
據朱雷震說,COOLPO能夠實現GO PRO、全景相機這類專門設備70%左右的呈現效果,但價格僅為它們的20%。目前也正在尋找COOLPO的渠道合作夥伴。
團隊方面,庄生曉夢共有12名全職員工,分別位於上海與美國菲尼克斯,CEO朱雷震有著多年個人消費軟硬體產品以及商用解決方案產品經驗,團隊成員基本來自於圖像演算法公司,晶元公司和科研院校。
融資方面,庄生曉夢曾於2018年3月獲得北京東方國獅數百萬人民幣的天使輪投資,現在正在尋求Pre-A輪融資。
※東風悅達起亞回應關停第一工廠;大眾美國召回66萬輛汽車;奇瑞新能源借殼失利轉向科創板
※火爆全球的變老濾鏡,可能沒你想像的那麼「好玩」
TAG:36氪 |