利用遺傳演算法,完爆初級程序員
新智元報道
來源:arXiv
編譯:聞菲,常佩琦
【新智元導讀】讓AI自動編程是人工智慧領域長久以來的夢想之一。現在,來自彭博和英特爾實驗室的兩位研究人員,號稱實現了首個能夠自動生成完整軟體程序的AI系統「AI Programmer」,這個「AI程序員」利用遺傳演算法和圖靈完備語言,開發的程序理論上能夠完成任何類型的任務。AI自動編程的時代,大幕已開。
讓AI自動編程一直是計算機科學家的夢想。目前這個方面的成果還非常有限,比如讓AI自動補完編程語言,或者執行簡單的加法程序。今天我們要介紹的這項工作,號稱是第一個能夠全自動生成完整軟體程序的機器學習系統「AI Programmer」。
研究人員表示,他們用這個系統證明了長久以來的假設,那就是功能完備的程序確實能夠被自動生成。具體到這項工作,AI Programmer利用機器學習中的遺傳演算法,模擬複雜的指令。雖然現在AI Programmer生成的程序,複雜程度與人類新手程序員編寫的結果相當。但研究人員認為,AI Programmer編寫的程序完全可以超越傳統範疇,不受人類時間和智慧的局限。
AI編寫的程序只是在測試複雜度和計算資源之間找得到最適合的點。換句話說,可能性無限。
研究人員還表示,我們需要重新思考,設計新的、面向機器的編程語言,因為當前的編程語言是面向人類的,不適用於基於ML的編程。「在考慮ML驅動程序生成的未來時,我們需要放棄和重新考慮典型程序語言創建的方法。」
研究人員寫道,只有這樣做,我們才能開始設想一個由AI系統驅動,以人類創造力和設計為指導的計算機軟體開發的新未來。
AI Programmer的軟體架構。從圖中可見,由人類驅動的部分非常少,只需要在開始輸入指令,最後接收適用於某項任務的函數即可,剩下部分全部由機器完成。
AI Programmer:利用遺傳演算法自動生成程序,理論上能夠完成所有類型的任務
根據論文,研究人員選擇了無類型編程語言,只包括了8種指令來驅動AI Programmer生成軟體。
AI Programmer使用的編程語言是圖靈完備的,如表1所示。理論上,在時間和內存不限的情況下,圖靈完備編程語言能夠處理任何編程任務。本質上,任何一種具有這種特質的編程語言都能夠解決海量編程問題。同樣,AI Programmer生成的軟體能夠完成所有任務。
有了這個保障,再來看AI Programmer的核心——遺傳演算法。
要使用遺傳演算法生成軟體程序,必須首先創建一個基因組(genome)。基因組是一組被組合在一起作為單個單元的基因。AI Programmer的基因組編碼為浮點數組,每個唯一指令的固定值範圍在0和1之間,如上面表1的基因範圍列所示。
創建好基因組後,AI Programmer就將其轉換為相應的程序,執行,並根據程序的輸出為結果程序分配適合度。生成的程序越靠近解決提供的任務,適應度就越高,越有可能繼續進行下一代的進化。在每一代,AI Programmer利用隨機選擇以及交叉和變異來創建子程序,其中包含輕微的隨機擾動,並且可能比其父母更好的基因組來解決目標任務。
圖3展示了從浮點數組中構建基因組的實例。每個值範圍映射到編程語言中的特定指令。最初,這些值是隨機的,導致生成的程序無法正常運行。但是,其中必將有一兩個能夠運行並執行一些有效的指令。一個程序執行得越成功,就越有可能繼續使用代碼,實現更成功的後代。
為了創建後代,父母將其基因的一部分交給孩子,這個過程如圖4所示。除了繼承父母的編程指令外,每個孩子也可能會遇到突變,也就是對特定基因增加受控但隨機的擾動。這導致特定基因的值發生修改,使所得到的編程指令發生變化,進而改變整個程序。
可執行程序根據其執行情況進行排名,如圖5所示。其中,特定程序會被立即從基因組池中刪除,成功的方案則被推進以產生新的後代。
AI Programmer使用結果:輸出「Hello World」,反轉字元串,加減乘,輸出斐波那契數列……
AI Programmer由C#.NET設計的模塊化框架組成。包括運行遺傳演算法的引擎,基因組編碼器和解碼器,用於執行模擬程序的沙箱解讀器,以及將代碼轉換為二進位可執行文件的編譯程序。雖然最初設計AI Programmer的時候使用C#,但需要注意的是,設計原則並不限於使用C#。
研究人員指出,AI Programmer的適應性測試軟體框架具有延展性,並已被開發。用戶可以自己設計無數的定製化軟體,最終指導系統的遺傳演算法(GA)生成和軟體程序演變。
如果目標程序旨在生成一個字元串,如」Hello World」(見上圖),測試分數可能是字元串中的數字。但由於AI Programmer是在位元組級生成代碼,測試分數應將輸出字元的增量差考慮在內。
研究人員表示i,他們能用AI Programmer生成很多軟體程序。表2是所生成程序的名單。
一開始,研究人員讓AI Programmer生成了一個非常簡單的程序來輸出「hi」。經過5700代後,測試成功。生成代碼如圖9所示。
經過580,900代後,生成了「hello world」,如圖10所示。
經過6,057,200代後,AI Programmer成功生成了」I love all humans」,如圖11所示。
AI Programmer生成反轉字元串的程序。生成代碼如圖13所示。
AI Programmer能在92,400代之後生成加法程序;在177,900代之後生成減法程序,如圖15所示。
圖16所示的生成程序可以從兩個初始輸入值來輸出斐波納契序列。
論文:AI Programmer,使用遺傳演算法自動創建軟體程序
摘要
在本文中,我們介紹了首個能夠自動生成完整軟體程序的機器學習(ML)系統,全程只需最低限度的人類參與。這個系統名叫「AI Programmer」,以遺傳演算法(GA)為核心,加上緊密約束的編程語言,將其ML搜索空間的開銷降到最低。AI Programmer的新穎部分源於(i)獨特的系統設計,包括用於效率和安全性的嵌入式手工解釋器(hand-crafted interpreter),以及(ii)對遺傳演算法的增強,納入了指令基因(instruction-gene)隨機化綁定,以及編程語言特定的基因組構建及消除技術。我們詳細介紹了AI Programmer的系統設計,詳細介紹了系統的工作原理,以及使用主流CPU來演示其軟體生成功能和性能的實驗數據。
論文地址:https://arxiv.org/pdf/1709.05703.pdf
【號外】新智元正在進行新一輪招聘,飛往智能宇宙的最美飛船,還有N個座位
※「AI系統首次實現真正自主編程」利用遺傳演算法,完爆初級程序員
※為什麼說AI創業不是4、5個人的團隊就能搞定的事
※24分鐘訓練完ImageNet:ResNet僅需120萬美元,創世界紀錄
※聯合谷歌Waymo,英特爾無人駕駛迎來最重要合作夥伴
※LeCun:一味模仿人腦將阻礙AI的發展
TAG:新智元 |