如何控制無人理解的智能系統?
人工智慧學家
作者:Vasant Dhar
翻譯:Younger審校:心
今年3月,微軟發布了人工智慧聊天機器人Tay,而後將其迅速下線。由此,人們對人工智慧的廣泛討論又有了新的轉變。在Twitter上進行了24小時的交互後,這個以青少年女孩兒為模型的bot,轉變成了一個「希特勒熱衷的性愛機器人」。
這個事情緊挨著谷歌無人駕駛汽車2月14號發生的事故,並迅速燃爆了人們對人工智慧的辯論。我們應該怎樣設計能夠將不當行為最小化的智能學習機器呢?
雖然上面所提的兩個事故相對較小,但表現了人們對其越來越多的擔心,即,在複雜環境中控制自適應學習的機器非常困難。著名的控制論專家 Norbert Wiener曾於50年前就警告了我們這種困難的可能性:「為實現我們的目標,如果要用我們不能有效干預其操作的機械代理……我們最好已經確保,機器中設置的目標與我們期待的一樣,而不只是各式各樣的模仿而已。」
機器用它們看到的東西,即「訓練數據」進行訓練,由此也產生了對應的困難,因為訓練數據不能完全代表機器將來可能面對的情況。這些情況無法提前預知,有時被稱為「edge cases(邊界案例)」,或者「Rumsfeldian unknowns」。但人們通常不需要提前「訓練」,利用常識,以及從樣例中進行分類和學習,就會很好地處理這些邊界情況。
這個難題目前還無明確的答案。但是,對這些系統的設計者來說,需要就未來可能發生的邊界案例,以評估最壞的情況會帶來什麼影響。
對於初學者來說,有必要分析訓練集上的錯誤,這能夠幫助我們了解一個系統最初已經學會的東西。
理解機器學了什麼至關重要。比如,最近有一個項目是關於估計電視台不同時間段觀眾的數量,我們發現,我國某些地區某些時間段,機器的預測非常離譜。
詳細地分析這些錯誤以後,我們發現,系統沒有意識到相關地區那些時間段里有特定的體育賽事。將數據加入訓練集後對系統再訓練,系統處理這些特殊情況的性能顯著提高,但其他的錯誤仍然還在,這表明機器能夠利用新知識,處理之前曾犯錯誤的情況。但這並不能解決所有的問題,這是增強系統魯棒性的第一步。
另外一個策略就是,利用互聯網上觸手可及的人類智能,創建一些機器可能會出現失誤的邊界情況。眾包是一種獲取或處理這類情況的一種通用手段。我的一些同事已經創建了一個叫做「beat the machine(打倒這個機器)」的系統,用戶會被請求識別,哪些案例機器的判斷可能會出錯。每次識別成功時,機器就能更好地學習這些情況,未來更好地處理相似的情況。
也有其他的方式在學習過程中添加磨練學習系統的對手,其中有些方式更加自動化。比如,為了誘導錯誤的產生,可以對訓練案例進行輕微修改,合成有對抗性的案例。當一個系統對它的預測行為非常自信時,不能分辨真實的案例和輕微修改後的案例,這種方式會非常有用,這也表明,試驗中的系統通過學習還未學到足夠魯棒的模型,我們還不能充分信任其自動化應用的成效。
這些方法的目的就是,通過將現有數據中還沒有的,新的且有可能性的特殊案例訓練系統,以使系統更加魯棒。
預估最壞場景下發生失誤的開銷也非常重要。金融行業領域有很多關於風險的文字資料,其中運用了嚴重性和頻率的概念,將風險量化為貨幣或其他類似單位。對這樣的架構,雖然我們不能提前預測這些事故是什麼,但我們需要創建與各種結果相對應的虧損分布的預測數據,包括邊界情況在內。如果這些虧損分布的預測結果還不可信,那麼或許系統的自動化功能還不完備。
備註:8月17號,第22屆致力於知識發現和數據挖掘技術的KDD-2016會議將於舊金山召開。
人工智慧學家Aitists
人工智慧學家是權威的前沿科技媒體和研究機構,2016年2月成立人工智慧與互聯網進化實驗室(AIE Lab),重點研究互聯網,人工智慧,腦科學,虛擬現實,機器人,移動互聯網等領域的未來發展趨勢和重大科學問題。
長按上方二維碼關注微信號 Aitists
投稿郵箱:post@aitists.com
※理解自己就不會無能無用
※為何機器人無法理解諷刺?
※伊能靜失控自抽「耳光」真的不能被理解嗎?
※別人無法理解的時尚,你能接受嗎?
※楊健侯秘傳太極拳內功述真!若無理解。則不能握其機巧。若無功夫。理解必成空疏。必待身授,可始親切
※紅人館|伊能靜失控自抽「耳光」真的不能被理解嗎?
※如何理解佛教是「無神論」?
※喵的思維,你們凡人怎麼能理解呢!
※我們要如何看待和理解暗物質和暗能量?
※家貓並不能真的理解人類?
※貓的邏輯思維不是你能理解的
※我們應如何理解「智」
※看完這部動漫,相信你能理解何為人性?
※了解免疫系統對於理解生物治療如何起作用非常重要
※心理測試:根據你的性格,看哪些人更容易理解你?
※人工智慧如何做到「好玩」和「有用」,你是怎麼理解的?
※動物的行為,人類是無法理解的
※為什麼別人總是無法理解你?
※收評:如何理解國人的思維方式?