一口氣看完微軟人工智慧布局和產品落地

最新 05-22

關注雷鋒網回復關鍵詞2018

抽送價值 3999元 GAIR 大會參會門票3張

截止到5.31 24時

文 | 李詩

來自雷鋒網（leiphone-sz）的報道

目前，微軟、Google、亞馬遜、蘋果、Facebook都巨頭都在布局人工智慧，將人工智慧作為公司全面發展戰略，涉及方方面面，不花費一通功夫，很難一下子了解各大公司的技術、布局和產品落地。

今天，在北京召開的微軟2018人工智慧大會上，微軟把自家做的事一股腦全說了。

今天的發布會上，微軟著重強調了其新的「世界觀」：智能雲和智能邊緣；展示了微軟在語音語義、視覺、機器翻譯的多項技術；搭載著全新的「全雙工語音技術」的微軟小冰帶來了原創詩歌、歌曲和兒童故事；微軟發布ONNX項目及ML.NET打造開源跨平台人工智慧開發框架；中國移動、大疆、唯品會、小米生態鏈分別展示了與微軟人工智慧的合作成果。

微軟全球執行副總裁、人工智慧及微軟研究事業部負責人沈向洋博士介紹到，在這樣的新時代，微軟有了全新的世界觀：智能雲和智能邊緣。

智能雲指的是微軟Azure，是微軟專為人工智慧打造的雲平台。Azure匯聚了微軟在人工智慧領域的全部投入與技術積累，是開發、部署、運行人工智慧的雲平台，同時也是將智能雲與智能邊緣融會貫通的關鍵環節。

微軟一直在拓展Azure的功能，Azure目前有四個方面：公有雲Azure、混合雲Azure Stack、物聯網Azure IoT Edge和Azure Sphere，以這四個方面打造出完整的計算環境，支持全新應用場景。

Azure Stack是Azure公有雲在本地數據中心的擴展，可以在邊緣和離線環境運行、滿足多種監管要求。例如石油開發公司同時使用Azure公有雲和Azure Stack可以按照辦公地點靈活分配計算資源。

Azure IoT Edge是微軟在2017年Build大會推出的針對智能邊緣計算的產品，可以在Linux和Windows上運行，而2018年Build大會上，微軟宣布將 Azure IoT Edge 開源，允許開發者進行擴展、添加功能，並部署到任何環境中。

Azure 上的認知服務也可以擴展到Azure IoT Edge，目前微軟已經推出了定製視覺服務，可以讓無人機或其它工業裝備無需連接到雲，就能做出快速的響應和處理。會上，大疆展示了與微軟的合作，利用Azure IoT Edge和微軟人工智慧服務，大疆開發出適用於農業、建築行業、公共安全及更多應用場景的解決方案。

Azure Sphere主要用於保護和驅動智能雲上的設備。2020年，全球智能邊緣設備的總數將超過200億台，世界會成為一台超級計算機，但是我們也會擔憂安全問題。Azure Sphere方案將提供經過特殊設計的安全晶元、安全操作系統和能夠守護每台設備的雲端安全。

在介紹完Azure雲平台的四個方面後，沈向洋介紹了微軟將Azure與AI結合，打造最佳人工智慧雲平台的四個方向：認知服務、對話式人工智慧、開放平台與工具、實時人工智慧基礎設施。

CaptionBot能像人一樣理解和描述一張圖片，例如，你上傳一張照片，CaptionBot能夠給出一段文字描述：比爾蓋茨正拿著一副網球拍，他看起來很高興。

此外，還介紹了微軟OCR（(Optical Character Recognition光學字元識別），將為各種人工智慧應用增加圖形文字識別功能，目前支持從Office到Skype、Bing、HoloLens的微軟應用，可以識別圖像內的文字，例如識別車牌號、海報甚至是手寫的筆記。

CaptionBot和OCR都是Azure預製的人工智慧服務，微軟也針對變化的場景推出了定製視覺服務，可以讓不具備深度學習、機器視覺背景的開發者定製圖像標籤模型、物件認知模型。

微軟技術院士黃學東介紹了微軟在人工智慧語音語義方面的進展。在計算機視覺方面，2015年微軟亞洲研究院發布的152層殘差網路（ResNet）的圖像識別準確率已經達到96%，勝過人類；2017年8月，微軟在Switchboard語音識別基準測試中的錯誤率已經降低至5.1%，達到了媲美人類專業速記員的水平；2018年1月，微軟亞洲研究院自然語言計算組率先在斯坦福大學發起的SQuAD文本理解挑戰賽上獲得超越人類的分數；2018年3月，微軟亞洲研究院與微軟雷德蒙研究院宣布，其研發的機器翻譯系統在通用新聞報道測試集newstest2017的中-英測試集上，第一個達到了可以與人工翻譯媲美的水平。

5月初，谷歌在I/O大會上展示了Google語音助手的Duplex（雙工）技術，能主動給餐館、理髮店打電話，幫助用戶預約時間。由於其聲音和音調與人類幾乎沒有差別，能實現連續對話還能理解上下文快速反應，在朋友圈大火了一把。這時，微軟坐不住了，趕緊發出了技術聲明，表明微軟小冰在兩年前就實現了AI與人類通電話，並且在谷歌之前就公布了實現AI與人雙向交流的全雙工語音技術。

在現場，黃學東忍不住Diss了一下，說Google動不動就吹牛，「微軟不僅有全雙工，微軟更實現了全三工、全四工、全五工……」

現場展示了一款「全多工」的產品——微軟與Roobo合作的AI會議系統。微軟特意在現場準備了四個人的現場會議演示，可以看到，這款AI會議系統能識別不同人的聲音，實時以文字記錄下大家的發言內容，同時識別出涉及工作安排的內容生成代辦事項。這個產品，可以說是每個團隊中會議記錄員的救星。

黃學東還展示了語音定製技術，根據上傳的錄音，可以生成和用戶一樣聲音的AI助手。上傳30分鐘的錄音，得到的AI說話與用戶相似度不高，但是以10小時的錄音進行訓練後，就能得到較為逼真的模仿效果。想一想，你會想要把家人或者朋友的聲音放進AI里，讓它隨時陪伴你嗎？

黃學東稱今年微軟達到中文英文翻譯超過專業人士的水平。大會上，小米生態鏈企業香蕉出行展示了魔芋AI翻譯機，藉助微軟認知服務中的微軟翻譯打造，能夠提供14種語言的實時語音翻譯。雖然由於現場混音效果，魔芋AI有幾次識別不出語音指令，但翻譯的效果還是不錯的，可以說是出遊利器。

微軟有小娜和小冰兩個對話式人工智慧助手，小娜更傾向於發展智商，而小冰則是面向情商維度發展的人工智慧系統。

微軟小冰誕生已經三年，一直以逗貧、插科打諢的聊天風格著稱。最近，微軟將最新的全雙工語音交互技術(Full Duplex)應用在了微軟小冰上，同時提升了小冰的智商和情商，具備了以下能力：一次喚醒之後的連續對話、預測用戶接下來的對話內容、幫助用戶輕鬆完成多重任務、內容創造（寫詩、寫歌、講故事）。小冰不只是能夠執行用戶的任務，還能主動提供聊天語聊，陪伴和關心用戶。

這次大會上，微軟展示了一段小冰在一次電話聊天結束後，由於判斷出用戶情緒低落，認為需要再一次電話溝通，於是又撥打了一通電話，去詢問用戶情緒是否變好、提醒用戶早點休息、告知用戶明天天氣情況。

據了解，2016年8月起，微軟（亞洲）互聯網工程院通過人類用戶主動發起的方式，在明確告知用戶小冰並非人類的前提下，已讓小冰與人類用戶完成了累計超過60萬通電話交流。

在內容創作方面，微軟展示了小冰寫的詩、原創歌曲、有聲讀物。在有聲讀物領域，微軟已擁有接近4萬集有聲童話內容。這些有聲讀物全部由人工智慧技術生成，在與人類主播質量相當的前提下，數量足以陪伴一個孩子從2歲到9歲的全部時光。6個月來，這些有聲讀物已順利投放到佔中國市場90%的兒童早教機、故事機和在線播客平台，播放總時長超過400萬小時。

今年四月，微軟已經在中國和美國宣布了全雙工語音技術，並且有多項產品落地，微軟（亞洲）互聯網工程院副院長李笛宣布，今年秋天，微軟還將向合作夥伴和開發者開放「全雙工語音技術（Full Duplex）」開發者可以使用這項技術打造自己的對話應用。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 雷鋒網 的精彩文章:

※「拒買水軍」的明星尚女士，AI 水軍了解一下？
※Drive.ai公布完全無人駕駛汽車視頻，以合適的節奏推進無人駕駛商業化進程

TAG:雷鋒網 |

一口氣看完微軟人工智慧布局和產品落地

微軟新世界觀：智能雲和智能邊緣

雲計算、物聯網、大數據、人工智慧正在將我們的世界將變成一台巨大的計算機。

Azure 認知服務

對話式人工智慧

亞馬遜Echo智能音箱帶動了對話式人工智慧的產品落地，現在對話式人工智慧已經進入音箱、電視、車載等多個設備中，是新一代智能應用的核心。對話式人工智慧也在不斷升級其對話能力，追求越來越自然、流暢的人機交流。