有情商的AI是什麼樣的？一窺微軟ICLR2019AI情感論文

新聞 05-03

雷鋒網按：如果機器智能具有人類情商，那麼機器智能是否會超越人類智能？近期Microsoft Research Blog發表了文章《向有情商的人工智慧發展》，介紹了有情商的AI，雷鋒網全文編譯如下：

【圖片來源：Microsoft Research Blog所有者：Microsoft Research Blog 】

最近在機器智能領域的成功依賴於為了做出決策而有效地搜索數十億種可能性的核心計算能力。如果成功的話，這一系列的決策往往表明計算能力正在趕上甚至超過人類的智力。另一方面，人類智能是高度可概括的、自適應的、穩健的，並且具有當前最先進的機器智能系統還無法產生的特性。例如，即使存在許多未知的變數，人類也能夠根據預期的結果提前進行重要的計劃。人類的智能在其他人類和生物參與的場景中閃耀，並始終顯示推理和元推理能力。人類的智慧還具有同情心、同理心、善良、有教養，而且重要的是，它能夠為了更大的利益而放棄和重新定義一項使命的目標。儘管幾乎所有的機器智能研究都集中在「怎麼做」上，但人類智能的特點是能夠問「是什麼」和「為什麼」。

我們的假設是，情商是開啟機器出現的關鍵，這些機器不僅更普遍、更強大、更高效，而且還符合人類的價值觀。人類的情感機制使我們能夠完成目前機器無法編程或教授的任務。例如，我們的交感神經和副交感神經反應使我們保持安全，並意識到危險。我們有能力認識到他人的影響，並想像自己處在他們的處境中，這使我們能夠更有效地做出正確決定和適應複雜的世界。飢餓、好奇、驚喜和快樂等驅動力和影響使我們能夠規範自己的行為，並確定我們希望實現的一系列目標。最後，我們表達自己內心狀態的能力是向他人發出信號並可能影響他們決策的一種極好的方式。

有情商的AI是什麼樣的？一窺微軟ICLR2019AI情感論文

【圖片來源：Microsoft Research Blog所有者：Microsoft Research Blog 】

因此，有人假設，將這種情商構建到一個計算框架中，至少需要具備以下能力:

·識別他人的情緒

·回應他人的情緒

·表達的情緒

·在決策中調節和利用情緒

從歷史上看，構建具有情商的機器的研究主要從人機協作的角度出發，並且主要集中在前三項功能上。例如，最早關於情感識別的研究始於近30年前，當時人們使用生理感測器、照相機、麥克風等來檢測一系列情感反應。存在這樣一些爭論：人們臉上的情感表達和其他生理信號有多一致和統一,並且這些是否真的反映了他們的內在感覺，研究人員已經成功地構建演算法，在人類表情的嘈雜世界中識別有用的信號，並且證明這些信號與社會文化準則是一致的。

根據人的內在認知狀態採取適當行動的能力對於高情商的人來說是必不可少的。諸如自動輔導系統、心理和身體健康支持以及提高生產力的應用等應用是目前正在進行的工作的重點。最近一系列關於順序決策的研究，如上下文強盜，正在這個地區慢慢取得進展。例如，我們自己的研究表明，一個對飲食管理的情感方面敏感的系統可以如何幫助受試者做出正確的決定。

幾十年來，情感表達一直處於計算的最前沿。即使是簡單的信號(例如，光、色、聲)也有能力傳達和激起豐富的情感。在將於ICLR2019上發表的「Neural TTS Stylization with Adversarial and Collaborative Games」（《神經TTS與對抗和協作遊戲的程式化》）（馬爽和宋耶魯合著）中，我們提出了一種新的機器學習方法來合成具有表現力的逼真的人類語音。該體系結構挑戰模型生成真實的語音，忠實於文本內容，同時維護一個易於控制的撥盤，以獨立的方式改變表達的情感。我們的模型在多個任務中實現了最開始的效果，包括樣式轉換（內容和樣式交換）、情感建模和身份轉換(適合新演講者的聲音)。文章提供了一個開源實現。

有情商的AI是什麼樣的？一窺微軟ICLR2019AI情感論文

【圖片來源：Microsoft Research Blog所有者：Microsoft Research Blog 】

雖然人工智慧系統的識別、表達和干預方面的研究在過去20年已經深入，但還有一種更引人注目的智能形式——一種為了更好地學習和更有效地做出選擇而有效地利用情感機制的系統。在最近的工作中，我們希望探索如何建立這樣的情感機制，以幫助我們的計算過程實現比目前更多的目標。

同樣出現在ICLR 2019，我們最近的工作探索了基於影響的內在動機的想法，這可以幫助學習決策機制。最近人工智慧在解決圍棋、Pac-Man和基於文本的RPG等遊戲方面取得的成功，很大程度上依賴於強化學習，在強化學習中，好的行為會得到獎勵，壞的行為會受到懲罰。然而，要讓計算代理學習一個合理的策略，需要在這樣一個行動獎勵框架中進行大量的試驗。我們提議背後的直覺是，從人類和其他生物如何利用情感機制中來更有效地學習中獲得靈感。

當人類學著面對世界時，身體（神經系統）的反應會對行為選擇的潛在後果提供持續的內在反饋，例如，當接近懸崖邊緣或在拐彎處快速行駛時，會變得緊張。生理變化與這些保護自己免受危險的生物製劑有關。人類對危險情況的預期反應是心率加快，心率變異性降低，血液從四肢分流，汗腺擴張。這是身體的「戰鬥或逃跑」反應。人類已經進化了數百萬年來建立這些複雜的系統。如果機器有類似的反饋系統呢？

有情商的AI是什麼樣的？一窺微軟ICLR2019AI情感論文

【圖片來源：Microsoft Research Blog所有者：Microsoft Research Blog 】

在「Visceral Machines: Risk-Aversion in Reinforcement Learning with Intrinsic Physiological Rewards」（《本能機器：在內在生理獎勵的強化學習中的風險規避》）一書中，我們提出了一種新的強化學習方法，它利用了人類戰鬥或逃跑行為的內在獎勵功能。

我們的假設是，這樣的獎勵函數可以規避強化學習環境中與稀疏和傾斜獎勵相關的挑戰，並有助於提高樣本效率。在我們的例子中，來自事件的外部獎勵並不是代理學習的必要條件。我們在模擬駕駛環境中進行了測試，結果表明，該方法可以提高學習速度，減少學習過程中的碰撞次數。我們對訓練自主系統的潛力感到興奮，這種系統能夠模擬以情感方式感受和響應刺激的能力。

有情商的AI是什麼樣的？一窺微軟ICLR2019AI情感論文

【圖片來源：Microsoft Research Blog所有者：Microsoft Research Blog 】

許多計算機科學家和機器人專家都渴望打造出類似於KITT和R2D2等流行科幻小說中令人難忘的人物形象的機器人。無論如何，我們都有很多機會來建立一個超越以往的整體情感計算機制，並幫助我們建立健全、高效和非近視的人工智慧。我們希望這項研究能讓我們重新審視情感在人工智慧中的應用。

我們希望5月份在新奧爾良的ICLR見到您，並期待著與您分享想法，交流高情商代理這一令人興奮的研究領域的可能性。

雷鋒網註：本文編譯自Microsoft Research Blog

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 雷鋒網 的精彩文章:

※不得了喲！這隻近紅外靈敏光譜儀，還沒一毛硬幣大！
※動用無人機，谷歌在美送快遞

TAG:雷鋒網 |