讓3D人形機器人學會如何行走，英特爾AI研究人員用了這個方法

科技 06-12

6月12日消息，來自英特爾AI實驗室和俄勒岡州立大學工程學院協作機器人和智能系統研究所的研究人員結合了多種方法，製作了性能更好的強化學習系統，可應用於機器人控制，控制自主車輛功能的系統和其他複雜系統。

協同進化強化學習(CERL)可以在類人、Hopper、Swimmer、HalfCheetah和Walker2D等基準測試中獲得更好的性能。使用CERL方法，研究人員能夠基於OpenAI的Humanoid基準測試使3D人形機器人直立行走。

這些成果在一定程度上是通過訓練系統實現的，該系統探索了更多的強化學習訓練環境，以尋求獎勵並完成特定的任務。

環境探索對於確保記錄各種經驗並考慮行動方案非常重要。研究人員在一篇解釋CERL工作原理的論文中說，與環境探索相關的問題已經出現，特別是在使用深度強化學習來完成具有挑戰性的現實任務越來越普及的情況下。該論文寫道，「神經進化將整個過程結合在一起，產生了一個超越任何個體學習者能力的學習者。」

CERL將基於策略梯度的強化學習和進化演算法相結合，然後在每批或每一代訓練系統中選擇表現最佳的神經網路。這樣，研究人員可以就可以使用最強大的神經網路來創建新一代的系統，並且可以將計算資源分配給實現最佳性能的演算法。

CERL還結合了重放緩衝區，用於存儲學習者在環境中的體驗，以便創建單個重放緩衝區並在系統之間共享體驗，從而實現比以前方法更高的樣本效率。

當前，人工智慧正在從多個方面賦予機器人越來越多的能力，相信隨著相關技術的不斷增強，人形機器人的應用場景也將會大大拓展。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 天極網 的精彩文章: