AI已經破解三體問題？專家：你們想多了

最新 12-12

　　前段時間，『AI 破解三體問題』、『AI 哥白尼重新發現物理規律』的新聞充斥各大媒體的頭條，感覺 AI 好像馬上就要顛覆物理學了。然而事實真的是這樣嗎？

　　為了解答這個問題，人工智慧領域專家 Gary Marcus 與計算機科學教授 Ernest Davis 共同發表文章，分析了最近熱議的 AI 在物理領域的『跨界研究』，指出了其中的局限。

　　選自NAUTIL

　　作者：GARY MARCUS & ERNEST DAVIS

　　機器之心編譯

　　機器之心編輯部

　　文章表示，AI 破解的所謂『三體問題』其實只是三體問題的一個特例，在一般三體問題的求解道路上都還有很長的路要走，更別說其他更複雜的四體、五體問題了。論文作者和媒體都有誇大其詞的嫌疑。而所謂的『AI 哥白尼』更是一個噱頭，AI 所做的工作並不是所謂的『發現』，而是一些計算工作，定義物理問題、『發現物理規律』這種事還是需要人來完成。

　　以下是文章內容：

　　AI 能否自學物理規律？深度神經網路能否迅速取代經典計算機？如果從最近的新聞頭條標題來看，我們離這一天似乎已經不遠了。

　　在最近一篇應用 AI 求解三體問題的報道中，媒體給出的標題是『用神經網路解決三體問題，速度提升 1 億倍：機器學習為解決應用數學中的一大經典問題提供了全新的解決方法』。

上個月，一篇文章指出，神經網路能以 1 億倍的速度解決三體問題。

　　在應用 AI 發現物理規律的報道中，一家媒體用到的標題是『有了機器學習，誰還需要哥白尼？』在關於此事的另一篇報道中，一位記者給出的標題是『AI 自學物理規律』，並將其描述為『AI 和物理學中值得紀念的時刻，』『可能成為解決量子力學問題的關鍵所在。』

人類用了幾個世紀來發現『地球繞著太陽轉』，而神經網路只需要幾個小時就能得出結論？

在媒體的報道中，AI 已經能夠自學物理學了。

　　但問題在於，這些作者並未給出令人信服的證據。

　　其實，這些說法和事實相去甚遠。所有這些報道都源自最近的兩項研究，它們利用機器學習來探索行星運行的不同方面。兩篇論文都是在嘗試有趣的創新，但二者的結果都沒有那麼振奮人心。

　　這兩篇論文中誇大的觀點，以及圍繞它們進行的炒作，都是科學記者（有時是科學家自己）傾向於誇大 AI 和機器學習進展影響的表現。

　　與往常一樣，在看到某個 AI 系統取得重大進展時，人們首先要問，『這個系統有什麼用？』下面就來說說這兩項研究。

　　牛頓都解決不了的三體問題，AI 能不能行？

　　三體問題就是預測三個物體（通常是星球）在彼此的引力作用下如何運動的問題。

　　如果空間中只有兩個物體，那麼用牛頓證明過的定律就能解釋它們的運動，即它們會按照一個圓、橢圓或雙曲線的軌跡運動。

　　但牛頓和其他科學家也證明過，如果空間中有三個或以上的物體，它們之間的相互運動就會變得異常詭異和複雜。沒有一個數學公式能表示這一運動，因此在一段較長的時間裡精確預測物體的運動軌跡變得非常困難。

　　三百年來，尋找求解三體問題的優秀計算方法一直是困擾計算物理學家的一大難題。

　　有關『AI 解決三體問題』的文章出自 arXiv 上一篇名為「Newton vs The Machine： Solving The Chaotic Three-Body Problem Using Deep Neural Networks」的論文（論文一）。

　　通常來說，技術論文要比媒體文章謙遜許多。但作為一篇技術論文，這篇文章還是顯得『野心勃勃』。論文的最後一部分寫道，他們預測這項為一個狹窄案例開發的技術會擴展到一般三體問題，並最終用於解決四體、五體問題及其他混沌系統問題，這可能掀起一場巨大的變革。

　　但問題在於，作者並未給出有說服力的證據來證明這一點。其實，他們的研究甚至還沒有到覆蓋當下三體問題的完整範圍。相反，他們只是著眼於三體問題的一個特例，即三個質量相同的粒子從特定位置開始運動，且初始速度為零。

　　不僅如此，他們還完全依賴於傳統的物理引擎或模擬器，也就是說，沒有 AI，沒有機器學習，只有對運動微分方程的傳統數值解法，從 10000 個不同的起始點生成運動軌跡。

　　接下來，他們用這個資料庫作為輸入來訓練神經網路，然後在新的樣本上測試該網路（新樣本的真實解也由模擬器算出）。結果發現，該神經網路能夠以合理的準確率預測粒子的位置，而且速度比傳統模擬器快幾個數量級。

　　本質上來說，他們是將神經網路作為一種新的工具，從已知的值中進行插值，而這些已知的值是利用外部經典系統算出的。與其他技術相比，神經網路可能更擅長於值的平滑空間插值問題，但大部分工作都是由外部先驗系統完成的。而且，重要的是，他們沒有證明同樣的插值方法在其他更複雜的現實世界物理問題中同樣奏效，即使在最簡單的情況下的證明都沒有（即改變粒子質量），更不用說大於三的多體問題了。

　　同時，從技術上來講，即使對於三體問題，他們解決的這類問題也只是一個簡單的子集（只有兩個自由度，一般三體問題有 10 個自由度）。在他們所解決的有限問題子集中，你只能決定第三個物體相對於前兩個物體的相對位置。在完整的三體問題中，你還可以選擇第二和第三個物體的質量及初始速度，這些選擇中的每一個都可以從根本上改變系統隨時間變化的運動軌跡。

　　我們知道，這種問題的複雜程度會隨著自由度數量的增加而呈指數級增加。因此他們所解決的問題的難度並不是一般多體問題的 1/5 那麼簡單。而且，隨著粒子數量的增加，情況會迅速變得複雜起來：四體問題有 17 個自由度，五體問題有 24 個自由度，n 體問題 7n-11 個自由度……

　　其次，如果只需要考慮兩個自由度，那麼計算 1 萬個數據點就可以很好地覆蓋。就像你要繪製出山的形狀，那麼你只需要測出 10，000 個點的海拔高度（即 100 x 100 的網格），就可以非常可靠地估算出這兩個點之間任一點的海拔。然而，隨著維數（自由度）的增加，事情會變得更加複雜，平滑插值的可能性也隨之降低。

　　第三，高度依賴初始條件，兩種略微不同的初始條件都可能導致完全不同的結果。這不是你所用的演算法的局限，而是這類問題的固有屬性。所以聲稱機器學習能夠預測較長時間內的混沌系統狀況就好比說它已經能夠預測熱雜訊、放射性衰變這樣的隨機行為，無論用哪種演算法，都是做不到的。大多數媒體忽略了這一點。

　　一篇原載於 Popular Mechanics 的文章「Why Is the Three-Body Problem Unsolvable？」提出了這一點，當初始條件變得複雜時，結論尚有討論的空間。

　　最後，論文中比較的對象也有缺陷。紐約大學數學系的 Jonathan Goodman 是動力學系統的專家，他表示，現代自適應方法可以比論文中引用的時序方法更快地計算這些軌跡（所以他們應該拿自適應方法進行對比），傳統的模擬器沒有多大用。

　　那麼，是否真的存在 AI 哥白尼？

　　哥白尼項目的情況也好不到哪兒去。

　　即將發表在 Physical Review Letters 上的一份研究（論文二）表明，研究者構建了一種神經網路，可以將物理過程中的數據作為輸入，從中提取決定性的關鍵參數。他們描述了四個涉及簡單物理系統的實驗，這些神經網路看起來效果很好。

　　這項『在天文學領域重新發現哥白尼系統』的研究一度使得大眾媒體興奮不已。

　　但問題在於，神經網路推斷出『地球和火星圍繞太陽運行』的說法完全是一種誤導。事實上，神經網路無法理解誰是圍繞誰運行的，它沒有幾何感知能力，也不知道旋轉意味著什麼。在這裡，神經網路所做的就是通過計算獲得兩個數值參數，它並不知道這些數字代表了對固定中心點的角度。

　　就神經網路而言，這些可能是隨時間變化的質量、電荷，或者是來自兩個不同中心點的角度。機器獲得了數據源之間的相關性，但是卻無法推斷這些數據源與世界之間的關係。是人類科學家將其識別為從太陽測量的地球和火星的角度，並抽象出這樣的事實：這些數值應該被解釋為軌道。哥白尼發現的工作，事實上已經被事先完成了，這個系統只是一個計算器，而不是一個物理規律發現者。

　　此外，在作者生成的合成數據中，地球和火星在同一平面上以恆定速度繞圓形軌道運行。在實際的太陽系中，情況壓根就不是這樣：火星的軌道平面相對於地球的軌道（黃道）傾斜了 1.8 度。因此，火星對於固定位置恆星的運行方式不僅是一個東西向的圓，就像兩個軌道共面時一樣，也會以大約 4 度的角度南北偏轉。經過數年觀察，火星在天空中的位置並不會是簡單的圓形路徑，它應該存在於 4°寬度的矩形空域中。哥貝尼真正的挑戰（早在現代計算機出現前就解決了，而且並沒有用到大數據）要比神經網路處理的內容複雜得多。

火星角度：火星在距黃道平面最遠的位置。此時，從太陽到火星的直線與黃道平面之間的夾角α= 1.8 度。當火星在此處時，地球的位置每年都在變化。Earth（1）是地球最接近火星位置的位置；當地球在這個位置時，從地球到火星的直線與黃道之間的夾角為β= 5.5 度。Earth（2）是地球離開火星位置最遠的地方；當地球在這個位置時，從地球到火星的直線與黃道之間的夾角為γ= 1.1 度。出於展示的考慮，垂直軸已被放大。

　　4 度聽起來微不足道，但按照天文觀測的標準來說還是很大的。對比一下，獵戶座的腰帶只有 2.7 度寬，托勒密 Almagest 的測量結果大部分可以精確到 0.1 度以內。

　　因此，太陽系中的托勒密模型和哥白尼模型都必須具備解釋火星及其他行星橫向運動的機制。哥白尼模型因此比其他簡單模型要複雜得多，它某種意義上是由神經網路生成的，在該神經網路中，地球和火星按照圓形軌道繞著太陽公轉。哥白尼模型包含 48 個本輪（epicycle），這一點上它比托勒密模型要多，不過其他方面會更簡單。這個網路系統甚至不參與橫向運動。

　　由於在複製哥白尼上取得了成功，媒體們都希望這種機器學習技術可以讓理論物理學開啟一個新時代。Nature News 上的一篇文章甚至這樣說：『一個可以自學物理學的神經網路能解決量子力學奧秘。』

　　這是一種幻想，因為在那個實驗中，所觀察到的數據和提取參數之間的關係過於簡單，而在大多數量子理論的實驗中，觀測值與基礎理論之間的關係要微妙得多，並且需要極其微妙的理論才可揭示其中規律。神經網路對於這些物理規律的探知甚至連觸及問題的表面都算不上。

　　這些特殊研究本身倒沒有很大的缺陷，但它們被報道的方式卻是一個嚴重問題的徵兆。諸如此類言過其實的報道最終導致了一些問題：最臭名昭著的文章是 Chris Anderson 在 2008 年的《理論的終結：因為數據的泛濫，科學理論已經過時》。

　　這種觀念逐漸成為了眾識的一部分———人工智慧和深度學習理論很快將取代其他的計算方法，即使是在那些還沒搭建起完備系統知識的領域也會如此。媒體對深度學習的吹捧給大眾傳遞了一種錯誤的印象，就好像無需考慮某個領域的基礎知識，只依靠龐大的神經網路和數據集就能解決任何問題。

　　實際上，世界上的許多問題都很棘手，需要結合特定領域的大量專業知識才能解決。在這兩篇論文的問題中，如果有人想解決三體問題或者類似的問題，必須花費大量時間去研究微分方程、數值計算和動力系統等領域的知識。如果是自然語言理解方面的問題，那就得好好研究語言學和心理語言學的知識，而不只是需要收集大量數據和大型計算機。

　　人們普遍認為，『數據+神經網路』是一個通用公式：在這個基礎上，科學家選擇自己的研究內容，公司和政府選擇自己要資助的內容，期刊和會議選擇自己要出版的內容，大學選擇課堂上教什麼，而學生也由此選擇自己應該學習的內容。但現實情況是，從目前的水平來看，神經網路無法完全替代經過數百年發展而來的複雜科學分析工具，並且迄今也尚未複製過去的偉大科學成就，更不用說對其進行改進了。我們應該將它們視為補充現有技術的工具，而不是用它去對基礎科學方法進行修訂。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

請您繼續閱讀更多來自 新浪科技 的精彩文章:

※人類如何在地球之外尋找生命跡象？後果可能並不愉快
※如果地球是平的會怎樣？大氣、潮汐連月亮都會消失