當前位置:
首頁 > 科技 > 微軟AI大會:推出在線人工智慧學院,小冰給人類打電話早於谷歌

微軟AI大會:推出在線人工智慧學院,小冰給人類打電話早於谷歌

智東西(公眾號:zhidxcom) 文 | 寓揚

智東西5月21日消息,今天,微軟在中國召開首屆人工智慧大會。它與微軟Build開發者大會類似,可以算作Build大會的中國版。會上微軟也對Build大會中AI方面的進展進行呈現,比如Azure IoT Edge(邊緣計算)、AI會議系統、微軟小娜與亞馬遜Alexa的「聯姻」等。

而今天的微軟AI大會也重點介紹了微軟小冰的最新進展,包括底層技術框架的改變、AI打電話、語音韻律改善、與人類協同創造等。此外,微軟還展示了機器翻譯技術在小米生態鏈產品魔芋翻譯機中的落地。

有趣的是,在谷歌I/O大會上展示AI打電話後,微軟(亞洲)互聯網工程院就發布技術聲明,人類歷史上第一次與人工智慧進行全雙工語音電話是在中國發生,在2017年9月微軟小冰就主動給人類打了第一個電話。

在展示AI會議系統時,微軟黃學東博士還在現場diss了一下同行谷歌的全雙工技術,戲稱如果谷歌的是全雙工,那麼微軟的就是「全五工」,微軟的AI系統可以同時支持5人對話。

今日,微軟還宣布收購對話系統創業公司 Semantic Machines,它由對話式AI知名研究人員UC Berkeley 的 Dan Klein 教授和斯坦福大學的 Percy Liang,以及前蘋果首席語音科學家 Larry Gillick等人共同創辦。

此外,微軟還推出在線人工智慧學院,目標是一年內培養10萬餘名AI人才,免費提供AI課程,還可以申請微軟專業學位課程作為職業技能認證。

會後,微軟全球高級副總裁、雲計算與人工智慧事業部負責人郭昱廷接受了智東西等媒體的採訪,介紹了微軟在物聯網終端的布局,製造業、工業、智能家居等會是微軟的重要場景,並通過邊緣計算和雲計算共同實現智能化。


一、推出AI看圖 落地機器翻譯

今天的微軟AI大會與2周前微軟在美國召開的Build開發者大會類似,可以理解為Build大會的中國版,在展示中更加側重與中國企業的結合,並且重點介紹了微軟小冰的一些新進展,畢竟小冰就是誕生在中國的微軟亞洲研究院。

現場,微軟資深副總裁、大中華區總裁兼CEO柯瑞傑做了一個開場白,他介紹到,微軟中國已經有25年的歷程,目前有5000名員工,17000合作夥伴,是美國以外最大的研究院。微軟的開發者超過40萬,有超11萬企業客戶,在美國以外認知服務使用量第一。

微軟全球執行副總裁、人工智慧即微軟研究事業部負責人沈向洋博士也展示了一下Build大會中重點介紹的內容,比如重點介紹了微軟在邊緣計算的布局Azure IoT Edge,與高通、大疆、Roobo等推出視覺AI、智能家居等領域的解決方案。

每年新增90億台基於微控制器的設備,但是聯網的不到1%。微軟最新推出的Azure Sphere,通過聯網,為設備提供安全的雲端服務、微控制器、和安全的操作系統,也希望與中國公司合作,建立這個物聯網端的生態系統。

微軟在四個關鍵領域進行研發,包括認知服務、對話式AI、開放的平台與工具、實時人工智慧基礎設施。後面的演講也主要圍繞這四個方面展開。

在認知服務上,全球已有100萬開發者在使用這項服務,微軟目前提供全面可定製的24項服務,其中17項已經正式商用。微軟還重點介紹了AI圖片描述功能與OCR光學識別引擎。其中當你給機器一張照片時,它能夠像人類一樣對圖像進行描述,目前已經支持中文。比如在這張圖片中,AI描述到,這位女士在桌前吃蛋糕,並且表情很開心。

微軟還重點展示了魔芋翻譯機,它由小米生態鏈企業香蕉出行推出,採用了微軟翻譯系統,算是微軟機器翻譯能力在翻譯機這一硬體產品上的落地。這款產品可以在14中語言中進行切換,現場進行了較為流暢的中英互譯,但在語音切換的演示中出現了一些烏龍,微軟黃學東笑稱「網路問題」。

此外,微軟還展示了「AI會議神器」,它今天以中文的形式更直觀的進行了現場展示,應用於會議場景,目前可支持5人的實時對話記錄。在現場Demo展示中,AI會議系統會對會議中每個人的發言進行實時的記錄,並標明了發言人,不知道是否是搭載了聲紋識別?在左側呈現會議記錄的同時,右側也會呈現會議中的待辦事項。


二、小冰早就能打電話 還能讓兒童成為故事的主人公

微軟小冰可以說是今天的主角,一方面它代表了微軟對話式AI的進展,也是主場參戰,畢竟小冰誕生於中國,現場重點介紹了小冰的最新進展。

目前微軟小冰已經有1億用戶,累計對話量超過300億,它可以觀察人的語音、語調以及情緒,還可以實時預測人所要說的內容。近幾年小冰也是頻頻化身主持人、歌手、詩人等進入人們視野。沈向洋稱:「小冰的粉絲數量,比其他聊天機器人的用戶加起來還要多」。

微軟亞洲互聯網工程院副院長李笛先介紹了微軟最近更新的全雙工技術,之前的對話更多的是基於單個任務的對話,而小冰則採用了面向對話流程的底層技術架構,即他所說的Session-oriented,可以理解為像河流一樣的對話,小冰關注的不在於一個任務的完成,而在於整個對話的效果。

針對谷歌最近秀出的AI打電話,他稱微軟小冰去年9月就給用戶主動打了第一個全雙工電話。現場微軟展示了一個用戶向小冰傾訴工作生活中的煩惱,在聊天過後,小冰還主動打電話給用戶進行安撫。

近期,微軟小冰還落地小米生態鏈企業Yeelight的智能音箱,李笛介紹了一個用戶與小冰進行了長達6小時的對話,涉及8個領域,53個話題,小冰完成了16個任務,來展現小冰的對話能力。

他稱,儘管到今天小冰依然存在前言不搭後語,但是它可以像河流一樣與用戶進行對話,只有有機會保持對話和引導對話,才能探索更多落地應用。比如小冰在日本提供打折券,4日內平均到店完成率達到57%。今年秋季微軟會在中國和日本開放全雙工語音交互。

今天微軟還介紹了小冰的兩項新進展:韻律訓練與協同創造。韻律訓練主要是小冰像人類學習語言的聲調韻律,比如小冰對凱叔(就是凱叔講故事的凱叔)的聲音進行學習,展示的聲音在聲調、韻律等方面已經與凱叔十分接近。

另外一項協同創造已經是小冰「創造」能力的展示了,微軟分享了小冰的兩項新進展,一項是近期小冰會推出一本新的詩集,與上一本不同的是,這本詩集是由小冰和人類共同創作。

另外一項是與家長一起為孩子講屬於他們的個性化故事。家長可以設定主人公的名字(比如你的孩子),和設定故事的走向(比如更傾向教育)。然後小冰會採用專門的深度學習模型,能夠對故事文本進行個性化定製,自動分配聲音角色和背景音樂等,利用約 20 秒時間即可生成一個10 分鐘左右的童話故事。該技能將在今年兒童節前夕正式發布。

這個技能可謂是眾多父母的福音呀, 不但可以讓孩子成為故事的主人公,還可以由家長設定故事傾向,實現寓教於樂的目的。


結語:深入落地的微軟

無論是今年微軟的Build大會,還是今天微軟的中國首屆AI大會,我們都可以感受到,微軟十分重視邊緣計算,重視物聯網終端的布局,並提供終端解決方案、操作系統、雲端服務等來打造物聯網端的生態系統。而此次微軟在中國舉辦AI大會,則意味著微軟更加註重AI能力在中國企業的落地。

微軟小冰作為一款主打情商路線的對話式AI,一方面是交互能力更強,另一方面微軟也開始了探索小冰的行業應用和商業落地,比如落地小米生態鏈企業Yeelight智能音箱,在日本進行商業場景的探索。

這樣一款主打情商的對話式AI,當其交互能力進一步提升後,又會帶來多大的商業價值呢?


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 智東西 的精彩文章:

剛剛,我們活捉20家外骨骼機器人公司,人類離鋼鐵俠不遠了
傳谷歌4000萬美元收購光場相機公司Lytro,真是白菜價!

TAG:智東西 |