第七代微軟小冰:入駐vivo、OPPO,登陸汽車平台,發布首個開發工具包
縱觀人工智慧領域當下戰局,無論是國外的微軟、谷歌、亞馬遜,還是國內的BAT,都很注重自己的人工智慧操作系統或人工智慧引擎的開發、迭代,人工智慧引擎也越來越多被應用到諸如消費電子、媒體影音、工業設計等領域。
其中,微軟小冰作為微軟在人工智慧領域的重點培養對象,也已經走過五個年頭,並在文本、語音、視覺這已知的三大技術領域小有所成,今年微軟對外更多在講的是微軟小冰的繪畫模型(畫家小冰),甚至為小冰在中央美術學院辦了「個人」畫展。雷鋒網此前也就微軟小冰的繪畫模型的相關技術問題與微軟(亞洲)互聯網工程院副院長、微軟小冰全球產品線負責人李笛進行了深度交流(參見雷鋒網此前報道《微軟李笛:為什麼說畫家小冰是最艱難的一次養成?》),也窺探了些許微軟小冰的研發及商用進程和思路。
8月15日,第七代微軟小冰發布會在北京召開,會上微軟官方公布了第七代微軟小冰技術框架的能力升級,主要公布了Dual AI、AI Creation、新技術突破、新框架發布,以及商業化進展五個方面的最新進展。
開場甜點:AI重現小說主人公
發布會上,首先登台的是微軟全球資深副總裁、微軟(亞洲)互聯網工程院院長王永東,王永東首先強調,微軟發布的內容都是已經上線的產品和合作。
其次,王永東拋出了開場甜點:微軟小冰與閱文集團合作,在學習了《全職高手》原著的文字,重建了小說中的世界觀和知識體系,並基於此進行了擴展和補充後,並通過建立知識圖譜創造了五位主人公的在線實體。據官方表示,這樣的在線實體也具有AI模型所具有的在交互中不斷迭代的能力。
基於此,微軟官方也表示,微軟小冰與閱文集團的合作內容已經擴大到100部作品主人公。
這也被王永東稱為有史以來最大規模將小說中人物進行賦能的計劃。
沈向洋:曆數小冰七代進程
隨後上台的全球執行副總裁、微軟人工智慧事業部及微軟全球研究院負責人沈向洋進行了此次微軟小冰關鍵技術能力發布,沈向洋首先回顧了微軟小冰的技術迭代及思考過程:
第一代,微軟小冰是基於文本、基於搜索簡單的對話能力,當時主要在思考人工智慧是走「爆款硬體」,還是走「技術框架」的道路;
第二代,我們認識到小冰需要有更多落地場景需要學習;
第三代,我們認識到小冰需要有不同的感官,需要加入語音、機器視覺的相關技術;
第四代,我們認識到知識圖譜的重要性,只有通過知識圖譜才能做更多IQ方面的嘗試;
第五代,這一代是我們的一個轉折點,我們開始做深層次模型、全雙工、人工智慧創造的相關思考及工作;
第六代,框架逐漸成熟;
第七代,今天發布的是第七代,這也將會有更強勁的質的飛躍。
沈向洋將小冰及其框架的具體發展過程比喻成森林和樹木的一個關係:人工智慧向前走需要一個框架,這個框架就是一片廣闊的土地,在這片土地上可以有森林,小冰只是這片森林中的一棵大樹。這棵大樹主要是為了驗證這一框架的可行性,之後將會是技術賦能。
對於小冰的發展,沈向洋認為主要經歷了關鍵三步:
第一步,做這樣小冰的人工智慧,迅速融入各類環境,能夠為大家接受;
第二步,迅速獲得用戶喜愛,可以和用戶進行交流;
第三步,持續迭代和演化,持續的發展能力。
此外,據沈向洋介紹,目前已經有4.5億台第三方智能硬體搭載微軟小冰。
發布會上,微軟首先介紹的是Dual AI的生態擴展。
微軟小冰產品負責人彭爽介紹稱,這一框架是一個半開放的生態。此外,微軟小冰除去此前公布的融入華為、小米的智能手機及智能音箱等產品中,擴展到小米有屏幕音箱上以外,具體有以下幾點生態邊界擴展:
在智能手機方面,此次進一步有vivo和OPPO兩大品牌加入,這也使得微軟小冰在國內集齊了智能手機領域華為、小米、vivo、OPPO四大頭部品牌;
在社交網路系統方面,微軟小冰在日本與LINE平台進行合作,在國內與QQ不斷合作,發布會上官宣,小冰已進入3000萬個QQ群。此外,微軟小冰進一步宣布與微信合作,具體與騰訊小微展開兩方面合作:
第一,與微信AI小微就對話開方平台能力進行合作;
第二,與微信AI涉及的智能硬體產品上展開合作。
內容諮詢平台方面,除網易、新浪外,再次與今日頭條合作,可以為人類發布內容留言,與人類進行交互。
電視電台方面,截止上個月末,微軟小冰已經覆蓋中國及日本50家電台/電視台,69檔節目,累計已參與播出時長為6908小時,今年生產時長是去年的2.05倍。
在此過程中,沈向洋總結時特彆強調,微軟小冰從交互到交流也將是其不斷發展的一個方向。
AI Creation:量產化AI生產線
去年7月微軟成立了小冰工作室,小冰首席科學家宋睿華將小冰工作室定義為一個系統性地對人類創造力建模的人工智慧平台。在發布會上,宋睿華也進一步公布了小冰工作室的最新動態,而這樣的最新動態也主要是基於文本、語音、視覺三方面技術能力的拓展。
在演唱模型方面,「微軟小冰在擁有越來越多接近人類嗓音的能力後,逐漸向技巧和風格化邁進。」現場,微軟官方現場編號為F10的微軟小冰以「民謠 戲曲」風格的聲音演示了曉月老闆的《少年弦》,以「音樂劇 High C」演示了周杰倫的牛仔很忙。
微軟小冰的人工智慧的創造能力可以複製,一個模型學會後,多個模型可以複製該能力。
宋睿華介紹,人工智慧創造更接近內容生產角色,滿足未來高度定製化的用戶需求。
文本及視覺能力方面,據宋睿華在發布會上介紹稱,中信出版社將出版小冰的第一部繪畫作品集。
我們希望將人工智慧創造上升到內容生產領域,這也是我們看到的未來時代發展趨勢。
宋睿華在大會上進一步解釋,未來需要定製化的內容,但是由於人類創作者難以實現高並發性,從內容生產源頭做高度定製化不現實,人工智慧有可能是解決這一矛盾的唯一方案。
微軟的人工智慧創造模型來源於其小冰工作室的「AI Creation模型庫」,基於此實現在人力不參與的情況下實現高並發內容的創造和分發。
據微軟官方表示,目前微軟已經實現兒童故事生產線,並交付給噹噹雲閱讀,為聯通沃音樂平台交付了作詞作麴生產線,與中國紡織工業聯合會共同搭建了服裝紋樣設計生產線並在發布會上正式公布上線。
宋睿華在發布會上特彆強調了兒童故事生產線,「微軟小冰以「文本 聲音 視覺 實體搜索」技術能力為基礎構建了「可交互有聲繪本」,只要上傳文本就可以生成類似劇本的有聲繪本。」
新技術突破:核心對話能力實現「主導對話」、全雙工語音落地車用場景、多模態感官完成公測
在介紹微軟小冰新技術能力突破時,小冰技術負責人周力首先上台表示,「我們不僅僅是為了打造一個微軟小冰這樣一個少女模型,而更在於其背後技術框架的能力提升。」
當AI在對話過程中處在平等或主導的地位時,人類反而能夠獲得更豐富的信息,人機對話也更有價值,這其中EQ起到關鍵作用。
第一,在核心對話引擎上,微軟小冰的對話引擎此次實現了「平等對話」向「主導對話」方向的跨越,主要表現為第七代微軟小冰已經可以預先籌劃未來對話,以在各種場合中主導對話走向。
如下圖所示,當小冰在第四輪開啟主導對話能力時,亮粉色的標記為小冰嘗試主導對話,可以預先判斷整個對話未來的若干走向,根據人類真實反映引導進入不同對話分支。第四輪到第十五輪整個對話過程由AI主導,「這也使得直男從最初不會聊天,到之後可以獲得更多有用信息」。
這一能力被微軟應用到在線零售場景中,官方表示,擁有主導對話在線推薦能力的在線零售場景的應用中,實現了零投訴的推銷。
第二,在全雙工語音交互技術上,繼電話、智能音箱後,微軟進一步將其拓展到汽車應用領域。
通過車載設備,我們已經在一些車型上測試,同時希望可以在5G普及後,提升微軟小冰全雙工在汽車上的落地普及。
第三,去年微軟小冰多模態感官的Demo如今已經完成公開測試。微軟小冰多模態感官是一種融合了全雙工語音、實時視覺與核心對話引擎的交互感官。今年2月通過安卓手機上的APP在日本邀請媒體進行了測試。
Avatar Framework:推出首個面向B端用戶的工具包
微軟(亞洲)互聯網工程院副院長、小冰團隊總負責人李笛上台介紹稱,Avatar Framework是小冰今年最大的一個飛躍。
首先,李笛解釋了微軟對人工智慧的理解:對於人工智慧諸如助理的定義可能會比較粗糙,微軟將其定義為AI beings,目前主要包括四類角色:
助理,從屬於某個特定人類,幫助人類實現某種用途或價值;
替身,某個特定人類授權其代為完成相應工作;
參與者,小冰在QQ群里作為參與者的出現,這類應用不從屬於某個特定人類,而是作為參與者與人類進行交互;
創造者,不直接與人類進行交互,而是通過AI衍生物與人類交互。
Avatar Framework被微軟定義為一個可以孵化各種AI beings的通用架構。簡言之,Avatar Framework提供的是一套工具包,此次公布的首個工具包版本關鍵信息如下:
該工具包與微軟小冰框架同源,可構建具有完整情感計算能力的人工智慧助手、社交對話機器人、人工智慧內容創作和IP人物角色等;
該工具包包含對話、聲音、視覺、觀點、技能、知識及創造力等豐富工具,並可驅動兼容的3D人物模型進行實時交互;
在本次發布前,微軟已通過Avatar Framework框架賦能軟銀Pepper等數十個第三方客戶AI,以及微軟小冰自身。本次發布會宣布了微軟與閱文集團針對100部小說主人公IP的合作;
本次發布的Avatar Framework V1版本是面向全部合作夥伴及客戶的版本。面向個人使用者的版本預計將於2020年春季發布。
據官方介紹,Profile工具是Avatar Framework的基礎,通過Profile構建一個AI being的人格主要分為三步:
第一步,填入76項基礎信息,微軟官方還特彆強調,這一步驟支持通過批量上傳文本信息,自動分析文本內容的知識圖譜,從中抽取基本信息;
第二步,設置27項性格特徵參數,例如這一階段如果將嚴肅程度調得很低,將自信程度調得很高,就可能打造出比較受小朋友歡迎的智能助理;
原型是一切的基礎,性格是原型的關鍵,這主要是因為一個AI being的性格參數決定了其創造、提供服務時候態度及傾向。
第三步,設置AI being喜歡或討厭的話題類型和客觀事物。
以上三步完成AI being的人格定義後,後續所有工具會在Profile中得到初始數據,訓練結果也會反饋影響到初始數據值。
隨後通過對話工具、聲音工具、視覺工具實現相應能力設置。此外,可以通過輸入兼容的3D模型,可以形成可視模型,具體3D模型兼容性要求如下圖左圖所示:
用微軟此次發布的工具驅動3D模型主要分為四步:使用推薦3D模型或導入新的3D模型,設計宏觀動作風格,設計標誌性動作,設置面部表情的豐富度。具體信息設置完成後,還可以根據此前人設定義自動匹配相關參數,此外還可以手動調整相關參數。
微軟小冰商業化進程ing
去年開始進行商業化,經過一年的發展,微軟人工智慧創造及商業事業部總經理、小冰團隊商業負責人徐元春在發布會上揭秘了當下進程。
微軟小冰的商業模式到底是什麼樣呢?
據微軟官方表示,目前微軟小冰已落地的商業客戶覆蓋金融、零售、汽車、地產、紡織等十個領域,客戶包括萬科、萬得資訊、萬事利、中國聯通等。
徐元春在發布會上也舉例進行了說明:
資訊領域,去年微軟利用AI ?Creation文本生成技術,幫助萬得進行滬深兩市上市企業的公告摘要,目前這個系統已經準確和穩定的運行超過21個月,從最開始面向機構投資者的長摘要拓展到面向個人投資者的短摘要,覆蓋了從系統服務到應用服務的全方位領域;
金融領域,我們和合作夥伴一起開發了金融電台產品,通過這個產品,可以讓摘要和財經信息即時、高質量、24小時不間斷的通過語音輸出給機構投資者和個人用戶;
知識產權領域,我們和青島出版社合作,利用語音合成技術,通過版權的雙向授權,開發了全新系列的兒童讀物《小紅馬》;
紡織領域,我們和中國紡織信息中心、國家紡織品開發中心推出了面向中小型紡織企業的AI設計平台,這個設計平台集成了流行趨勢預測、大數據、AI設計模塊,能夠完整的滿足一個中小型企業在AI設計領域全部的技術訴求;
音樂領域,我們與聯通沃音樂的合作,通過允許沃音樂在平台層面集成我們的AI作詞、作曲、編曲,以及其它音樂生成的能力,同時結合運營商的能力和海量的音樂資料庫,以及其他合作夥伴模塊,共同打造了完整和獨立的音樂平台,這個音樂平台可以為幾億用戶同時提供100%的音樂定製內容生產的能力。
人工智慧進程中,技術進入迭代期、商業化探索仍在繼續
從第七代微軟小冰的能力更新,雷鋒網也看到,微軟小冰在技術上已經覆蓋了當下可見的文本、語音、視覺三方面,此次發布更多強調的是能力的迭代升級、合作廠商的進一步拓展、架構的開放應用,以及人工智慧的商業化探索與進程。
人工智慧似乎離我們很遠,我們走在城市街道上仍難以看到網上盛傳的配送機器人,多數人家中也沒有新聞中看到的高逼格的智能家居系統,當下的人機交互方式仍以觸屏為主;人工智慧似乎又離我們很近,你聽到的電台主持人可能已經是人工智慧系統,您看到的即時新聞也有可能是人工智慧系統所生產,人工智慧也逐漸滲透到城市監控、工業生產、教育體系等你可能還不曾關注的領域。
一切都未必如期而至,但一切都在進程中。
※從4個雞蛋到1個鵪鶉蛋的能耗,阿里科學家努力了14年
※杉數科技陳廷豪:零售場景中的需求預測 | AI 研習社 第144期大講堂總結
TAG:雷鋒網 |