隔空互動,你不用再去辦公室了!微軟Build 2019黑科技秒殺同傳+速記
新智元原創
來源:微軟
編輯:金磊、肖琴
【新智元導讀】今天,微軟召開一年一度全球開發者大會 Build 2019。微軟CEO納德拉在會上發布了一系列重磅產品,其中極具未來感的辦公產品格外吸引眼球。現在讓我們來看看微軟今年又帶來了哪些驚喜吧!
未來感爆棚!
又一年微軟全球開發者大會如期而至,同樣的納德拉,帶來了一個極具未來感的微軟。
納德拉在本次大會上發布了Azure和開發者相關眾多產品,堪稱「全家福」亮相:
未來會議室公布「丹麥項目」;
微軟Teams增設AR隔空辦公;
AI輔助編碼IntelliCode發布預覽版;
上線基於Chromium重新打造的Edge瀏覽器;
Cortana(小娜)的會話功能得到很大改進;
收購首個使用微軟AI的自主系統Bonsai
開放量子編程語言Q#和量子編譯器源代碼
其中,最引人注目的當屬微軟在辦公領域的一些列突破,可以說是極具未來感與科幻感,引得網友一片驚呼。當然,開發者相關的眾多發布也是非常吸睛的!
「未來會議室」再升級,秒殺同傳 速記
在去年Build大會上,微軟推出的未來會議室使用的是360度相機和麥克風陣列,可以檢測會議室中的任何人說話。攝像頭能夠把各個畫面拼成一個全景畫面,還可以進行人臉識別,以確保參會者的身份。此外,還能把會議室預約系統做進去。
微軟全球開發者大會 Build 2018 展示未來會議室
更強大的是,這個未來會議室還有基於語義分析的會議紀要功能,能夠實時同傳 速記。這著實亮瞎了一票觀眾,紛紛表示同傳、速記要失業了。
細心的讀者可以發現,未來會議室中間會有一個黑色的柱狀物體,這便是麥克風陣列中的「重要設備」。
而在今年的 Build 大會上未來實驗室再升級,公布了「丹麥項目」——簡單來說就是讓你身邊配有的普通麥克風「秒變」虛擬麥克風陣列:
「重要」設備,拿掉!
虛擬麥克風陣列將現有設備 (如手機或筆記本電腦) 與普通麥克風如搭樂高積木一般動態地組合成一個更大的陣列。丹麥項目可以幫助客戶在有或沒有專門的麥克風陣列 DDK 的情況下都可以更容易地轉寫對話,隨時隨地使用 Azure 語音服務。
丹麥項目未來的應用場景非常廣泛。例如,可以對多個 Microsoft Translator 應用程序進行配對,更有效地幫助多人使用行動電話進行溝通,從而將語言障礙降到最低。
網友們不禁驚呼:「真的是越來越智能了!」
但推動微軟AI演進歷程,與其近三年來在語音和語言研究中的突破密不可分。微軟在以下幾個廣泛使用的公共基準測試任務中,率先實現了 AI 超越人類水平的歷史性里程碑:
2017年:在對話語音轉寫任務(Switchboard) 中,微軟語音識別系統的詞錯率降到 5.1%,準確率超過專業速記員。
2018 年:在漢英新聞機器翻譯任務(WMT17) 中,微軟機器翻譯系統達到了可與人工翻譯媲美的水平。
2019 年:在斯坦福對話式問答任務(CoQA) 中,微軟機器閱讀理解系統刷新記錄,成為目前排行榜上唯一一個模型分數超過人類分數的團隊。
這些突破對從翻譯應用到智能音箱等眾多口語應用產生了深遠的影響。雖然現在市面上已經有智能音箱,但大多數智能音箱一次只能處理一個人的語音指令,並且在發出指令之前,需要一個喚醒詞。
微軟已將一些重要的技術突破加入到 Azure 語音服務中,並提供新的對話轉寫功能,該功能已經在今天的預覽版中提供。該功能通過微軟的 Devices SDK (DDK),純音頻或視聽麥克風陣列設備得到了增強。這是人工智慧進化歷程中的重要一步,因為環境遠場多人語音轉寫幾十年來都沒有得到突破性的進展。
新的會話轉寫(Conversation Transcription) 功能擴展了微軟現有的 Azure 語音服務,支持實時的遠場多人語音轉寫和說話人歸因。與 Speech DDK 相結合,房間里有一群人在談話時,會話轉寫也可以有效地識別每個人的語音,處理諸如交叉對話等常見但具有挑戰性的場景,並生成轉寫。
會話轉寫功能利用多通道數據,包括來自代號為 Princeton Tower 的 Speech DDK 的音頻和視覺信號。邊緣設備是基於參考設計的 360 度音頻麥克風陣列或 360 度魚眼攝像頭,通過視聽融合來支持更好的轉寫。邊緣設備將信號發送到 Azure Cloud 進行神經信號處理和語音識別。
隔空辦公,身臨其境
很多時候辦公會因為地域的差距不得不選擇出差,但是微軟在此次發布會中展示了未來辦公的方式——無需出差便可身臨其境!
只需雙方都打開微軟的Teams軟體,建立一個AR「房間」,戴上AR眼鏡,便可以開始隔空辦公了!
更神奇的是,隔空雙方還可以通過AR進行互動。
當然,虛擬交互、創作也是不在話下的。
這看起來彷彿只有在科幻大片中才能見到的工作方式,已然開始進入我們的生活了!
因為與面對面的人交談總是比視頻聊天或通過電話更好,這樣的技術會使項目上的合作變得更加容易。
AI輔助編碼——IntelliCode發布預覽版
發布會上還曬出來AI輔助編碼工具,現在已經普遍可用!
它支持Visual Studio中的C#和XAML以及Visual Studio Code中的Java,JavaScript,TypeScript和Python。 默認情況下,它現在也包含在Visual Studio 2019中。
IntelliCode本質上是下一代IntelliSense(微軟極受歡迎的代碼完成工具)。那麼又是什麼原因使得 IntelliCode與眾不同呢?
答案是微軟通過向GitHub提供數千個至少有100顆星的開源項目的代碼來訓練它。 使用此數據,該工具可以製作更智能的代碼完成建議。 它還會在提出建議時考慮當前的代碼和上下文。
默認情況下,IntelliSense會為開發人員提供按字母順序排列的列表。雖然這很有用,但是用戶需要的代碼往往是列表中的一些項目。
像IntelliCode這樣的工具的承諾是讓開發人員的生活更容易,提高生產力,減少bug的可能性。隨著這些工具變得越來越智能,它們很可能能夠更深入地進行預測,甚至可能建議根據用戶要實現的內容以及其他人如何解決類似問題的知識自動完成程序代碼的大部分。
基於Chromium重新打造的Edge瀏覽器上線,內置IE模式
2015年發布的Edge瀏覽器,一直沒有取得太大進展。
事情到了不得不改變的時候。2018年末,微軟做出了一個巨大的決定:拋棄微軟自己開發的瀏覽器內核,採用Chromium內核重新開發。
基於 Chromium 內核的新 Edge 瀏覽器
上個月,微軟終於正式公開了基於 Chromium 的 Edge 瀏覽器,向 Windows 10 用戶開放了首批測試版本。
在今天的大會上,Edge 瀏覽器迎來三個新的變動,一是 IE 模式,二是隱私控制,三是收集功能。
IE模式
新標籤頁打開IE模式
新版本Edge瀏覽器將內置IE模式,只需在Edge內打開一個新標籤頁就可以直接訪問IE模式。也就是說,你可以在Edge瀏覽器中運行基於Internet Explorer的舊版web應用程序,而無需切換到其他瀏覽器。
收集功能
Edge還增加了新的收集功能(Collections),微軟表示,收集功能可以幫助用戶更有效地收集和組織內容,而且該功能還與Office集成。 打開Edge瀏覽器右側的面板,可以顯示所有收集,也可以通過將想要的內容拖放到面板中直接收集。
隱私控制
Edge瀏覽器將支持全新的隱私控制,你可以在無限制、平衡和嚴格三種模式中選擇。根據你選擇的隱私控制模式,Edge 會自動調整設置,限制第三方和網站通過互聯網跟蹤你的行為。
儘管微軟表示這些新功能將在下一版本的Edge瀏覽器中推出,不過還沒有說明具體日期。目前可以在官網下載開發版本嘗鮮。
小娜沒黃:技能型的語音助理,不止是對話
2018年,谷歌大秀了一把Google Assistant的「Duplex雙工技術」,一通如同真人一般的訂座電話讓人驚呼「給你打電話的可能不是人」。相比之下,微軟的數字助理Cortana(小娜)似乎沒有太多聲音。
不過,微軟一直在慢慢地將Cortana重新定位為一種「技能型語音助理」,而不是Google Assistant、亞馬遜Alexa或蘋果Siri的競爭對手。
在今天的大會上,微軟展示了Cortana如何響應對話、主動組織會議和提醒。接近3分鐘的demo中,Cortana與用戶無障礙對話,像一個真正的工作場所的「助理」,同樣令人印象深刻。
Cortana的會話功能得到了很大的改進。微軟去年收購了Semantic Machines公司,他們與微軟的研究人員合作,正在構建一種會話AI,將技能和上下文語義結合起來,讓Cortana這樣的數字助理真正能做你讓它們做的事情。
收購Bonsai:首個使用微軟AI的自主系統
今年Build大會的一個有點意外的主題是——自主機器人。
這個小小的蛇型機器人叫Sarcos Guardian S,可以爬過地震後的碎石廢墟等人類無法進入的地方。
不過,Sarcos機器人仍需要人類操作員遠程控制。現在,微軟和 Sarcos 合作,為 Guardian S 增加智能功能,使其能夠自主地導航。
這得益於微軟去年收購的專註於增強自主系統學習能力的AI初創企業Bonsai。微軟正在構建一個端到端的工具鏈,幫助每個開發人員和組織更輕鬆地為自己的場景創建自主系統——無論是自主機器人,還是可以檢查遠程設備的無人機,或通過自動校準設備幫助減少工廠停機時間的系統。
今天,微軟宣布了該平台的第一個預覽版本的自主系統,開發人員可以與專家合作,使用可自主運行物理系統的Microsoft AI 和 Azure 工具構建智能體。
開放量子編程語言Q#和量子編譯器源代碼
量子計算方面,微軟宣布將在不久的將來開放Q#編譯器和量子模擬器的源代碼,作為量子開發套件的一部分。
微軟表示這個想法是為了幫助研究量子計算的研究人員和大學更深入地使用這些工具,以幫助他們開發和理解量子技術。
簡而言之,該工具包具有開發人員構建自己的量子計算程序和實驗所需的一切。你可以使用它來學習基本的量子概念,編寫第一個量子應用程序代碼,並提供真實的解決方案。
※周志華等人新書:《演化學習:理論和演算法的進展》正式上線!
※吊打YOLOv3!普林斯頓大學提出CornerNet-Lite,已開源
TAG:新智元 |