DARPA「終身學習機器」項目取得重大進展
導讀
2019年3月,美國防高級研究計劃局(DARPA)「終身學習機器」(L2M)項目研究人員在《自然·機器智能》雜誌發表了其有關人工智慧演算法的研究結果,介紹了一種由類似動物肌腱驅動的人工智慧控制機器人肢體,意味著該項目取得重大進展。
一、研究背景
當前的機器學習系統無法不斷學習或適應新的情況。系統程序在經過訓練後就會固化,因此在系統部署後,無法對新的、不可預見的情況做出響應,而通過增加新信息來修改程序缺陷又會改寫現有的訓練集。在當前技術條件下,解決這一問題需要使系統離線,並利用包含新信息的數據集對機器系統進行重新訓練。
二、研究目標
為解決上述挑戰,DARPA開展「終身學習機器」項目,旨在開發能夠在任務執行過程中不斷學習並變得越來越專業的系統,在將以前的技能和知識應用於新情況的同時,不會忘記之前的學習內容。
三、研究成果
自2017年首次公布以來,「終身學習機器」項目一直在研發下一代人工智慧系統及其組件,以及在生物有機體中能夠轉化為計算過程的學習機制。該項目通過不同時長和規模的資助及合同等形式為30個研究小組提供支持。
上述最新的研究成果由美國南加州大學維特比工程學院生物醫學工程和生物運動學教授弗朗西斯科·巴萊羅奎瓦等人取得。其所研究的機器人肢體依賴一種生物啟發的演算法,只需五分鐘的「非結構化玩法」(做出隨意動作使機器人能夠學習自身結構及其周圍環境環境),即可自行學習步行任務。機器人「邊做邊學」的能力是機器終身學習的重大進步。當前的機器學習方法依賴於針對所有潛在場景的預編程系統,這種做法非常複雜、費力且低效。南加州大學的研究人員所做的工作表明,人工智慧系統有可能從相關經驗中進行學習。
四、研究意義
DARPA信息創新辦公室項目經理哈瓦·西格爾曼表示,當前正處於人工智慧領域的重要轉型時刻。智能系統目前採用的固化訓練方法將很快被能夠現場學習的方法所取代。更安全、靈活、有效的人工智慧系統需要能夠在操作中學習並將學習內容應用於系統之前未經過訓練的新環境。這些能力對於像自動駕駛汽車這樣的複雜系統而言必不可少。「終身學習機器」項目研發的技術與自動駕駛汽車技術相整合,將使後者在不同條件下的駕駛行為變得更加專業,使其比人類更安全地駕駛汽車。
來源:DARPA網站/圖片來自互聯網
軍事科學院軍事科學信息研究中心申 淼
編輯:張岸佳
如需轉載請註明出處:「國防科技要聞」(ID:CDSTIC)
※DARPA啟動SAIL-ON項目開發可自主識別和響應現實環境變化的人工智慧系統
※美陸軍發布《利用機器人與自主系統支持多域作戰》白皮書
TAG:國防科技要聞 |