DeepMind開源Psychlab,將人工智慧與心理學聯繫起來
AiTechYun
編輯:yuxiangyu
想一想像購物這樣的簡單任務。如果你沒法拿起你的購物清單上的商品,這可以告訴我們關於你的大腦的什麼功能?它可能表明在搜索列表中的商品時,你無法將注意力從一個商品轉移到另一個商品上。這可能表明記住購物清單的困難。或者兩者都有。
看起來單一的任務實際上依賴於多種認知能力。我們在人工智慧研究中也面臨類似的問題,在這種情況下,任務的複雜性往往會使智能體取得成功所需的單個技能難以分離。但是了解智能體特定的認知技能可能會對改善其整體表現有用。
為了解決人類的這個問題,心理學家在過去的150年里設計了嚴格控制的實驗,目的是隔離一個特定的認知能力。例如,他們可能會使用兩個獨立的測試來分析超市的場景 – 一個「視覺搜索(visual search)」測試,它需要被測者在一個圖案中查找一個特定的形狀,可以用來探測注意力,他們可能會要求一個人回想研究列表中的商品來測試他們的記憶。
我們認為可以使用類似的實驗方法來更好地理解人造智能體的行為。所以我們開發了Psychlab這個建立在DeepMind實驗室的平台,它使我們能夠直接運用認知心理學等領域的方法來研究受控環境下人造智能體的行為。今天,我們開放這個平台供其他人使用。
Psychlab重現了虛擬DeepMind Lab環境中通常用於人類心理學實驗的設置。這通常包括坐在電腦顯示器前使用滑鼠來響應屏幕上任務的參與者。同理,我們的環境允許虛擬主體在虛擬計算機顯示器上執行任務,使用它的注視方向進行響應。這使人類和人工因素使用相同的測試,最小化實驗差異。也使得它更容易與認知心理學的現有文獻聯繫起來,並從中獲得思路。
隨著Psychlab的開源版本的發布,我們構建了一系列在虛擬計算機監視器上運行的經典實驗任務,並且它們具有靈活且易於學習的API,使其他人能夠構建自己的任務。
視覺搜索 -測試搜索目標物品數組的能力。
連續識別 – 為越來越多的項目測試內存。
任意視覺運動學映射 -測試刺激反應回憶的配對。
更改檢測 – 檢測延遲後重新出現的對象數組中變化的能力。
視覺銳度和對比敏感度 -檢測識別小對比度和低對比度刺激的能力。
玻璃圖案檢測 -測試全局形式的感知。
隨機點運動判別 -檢測相干運動的能力。
多個對象跟蹤 -測試隨著時間的推移跟蹤移動對象的能力。
每一項任務都經過驗證,證明我們的人類結果與認知心理學文獻中的標準結果是一致的。
以「視覺搜索」任務為例。在複雜的刺激物中定位物體的能力,比如超市貨架上的一件物品,已經被研究作為一種理解人類選擇性注意的方法。
當人們被賦予「在水平條之間搜索豎直條」和「在各種顏色的條之間搜索粉條」的任務時,其反應時間不會根據屏幕上的條數量而改變。換句話說,他們的反應時間是「固定大小」。然而,當任務是在不同形狀和不同顏色條中搜索粉條時,人的反應時間每增加一個條就會增加大約50ms。當人類在Psychlab上完成這個任務時,我們複製了這個結果。
這張圖片說明了在Psychlab的視覺搜索任務上人類和人造智能體反應時間的差異
當我們對一個最先進的人造智能體進行相同的測試時,我們發現它雖然可以執行任務,但顯示反應時間的結果並不是人類模式。在這三種情況下,他們用了相同的時間來應對。對於人類而言,這些數據暗示了並行和串列關注的區別。智能體似乎只有並行機制。識別人類與我們目前的人造智能體之間的這種差異,為未來改善智能體設計提供了思路。
Psychlab被設計為認知心理學、神經科學和人工智慧之間的橋樑。我們將其開源,已期更多的研究群體能夠在他們的研究中利用它,並幫助我們塑造未來。
TAG:ATYUN訂閱號 |