當前位置:
首頁 > 新聞 > ?批量生產數學猜想,這樣的自動演算法學會了探索基本常數

?批量生產數學猜想,這樣的自動演算法學會了探索基本常數

機器之心報道

參與:思源、張倩、一鳴


印度歷史上有一位著名的天才數學家拉姆努金,他留下了很多偉大的公式。雖然有些沒有證明,只能稱之為猜想,但後來還是被應用到了很多意想不到的領域。他思維跳脫、運算能力極強,常常得出自己也證明不了的公式,哈達將其與歐拉和雅克比相比。然而,這種天才數學家百年難遇,那麼,在我們這個時代,由誰去提出這些猜想呢?近日,以色列理工學院和谷歌的研究者公布了自己的一項工作,並將其稱之為「拉姆努金機器」,表示他們可以用演算法批量生產數學猜想……

e、π等基本常數普遍存在於物理、生物、化學、幾何學、抽象數學等各個學科,在這些學科中發揮輔助性作用。然而,幾個世紀以來,有關基本常數的新數學公式很少,通常是通過數學直覺或獨創性偶然發現的。

但最近,來自以色列理工學院和谷歌的研究者發現了一種利用演算法生成基本常數猜想的新方法,並將其命名為「拉姆努金機器」(Ramanujan Machine)。Ramanujan Machine 利用計算機的算力進行數學計算,目前已經發現了幾十個新的猜想。

?批量生產數學猜想,這樣的自動演算法學會了探索基本常數

打開今日頭條,查看更多圖片

研究者表示,他們利用演算法搜尋新的數學猜想公式。社區可以為這些猜想提供證明,還可以提出或開發新的演算法。任何新的猜想、證明或演算法都將以提出者的名字命名。

也許我們高中或大學偶爾發現過什麼,例如 liqui_date_me 在 Reddit 上表明,他在剛學習無窮級數的時候,就發現 ∑n!/n^n 會收斂到約為 1.8 的隨機數,新研究也許會告訴我們這些值都有什麼意義。Ramanujan Machine 就是將這些「發現」總結起來,形成合理的猜想。

Slash Sero 在 Reddit 上也評論說:「這些發現的猜想都是已知等式的變體,它們在技術上是新的,但是在語義上並不是新的,我們可以通過分數的重新分布定義任何數學常數。不過這種演算法非常有意思,它能自動化搜索和測試新表達式,這原本都是需要人力完成的。」

不管怎麼說,這項研究都旨在激勵大家進行數學和人工智慧驅動的科學研究。

論文鏈接:https://arxiv.org/pdf/1907.00205.pdf

什麼是基本常數猜想

基本常數的簡單公式通常散發著簡潔的數學之美。比較有名的基本常數包括歐拉恆等式(Euler"s identity)——e^iπ + 1 = 0,還有黃金比例的連續分數表示:

?批量生產數學猜想,這樣的自動演算法學會了探索基本常數

這些規律公式(Regular Formula,RF)的發現通常是零星的,常被歸功於數學獨創性或深刻的直覺。一個比較著名的例子是高斯發現數列規律的能力,他發現的規律帶來了新的分析領域(如橢圓函數和模函數)和關於質數定理的假設。他甚至說過一句名言「我得到了結果,但我現在還不知道是怎麼得出來的」(I have the result, but I do not yet know how to get it),從中可以看出發現數據規律和 RF 的重要性,它使數學發現成為可能。

為什麼能自動搜索基本常數猜想

和物理學或其他學科的評價不同,數學常數可以用恰當的公式計算到特定的精確度(以位數為計),因此可以證明一個絕對的正確結果。在這種情況下,數學常數包括無限的數據(例如無理數的無限長度)。研究人員使用這個方式尋找新的規律公式,並將已有的精確表示作為標註真值。

由於基本常數的應用無所不在,尋找這種規律可以揭示很多可能的新數學結構,如 Rogers-Ramanujan 連分數(以模塊化的形式)和 Dedekind η 和 j 函數。既然我們有了數據及結構,那麼豈不是能通過梯度下降搜索到新數學猜想?

用機器學習自動學習新猜想?

Ramanujan Machine 到底是不是用機器學習搜索新的猜想,這就要看我們對機器學習的定義了。它同樣採用梯度下降「學習」更合理的猜想,只不過是在一種獨特的潛在空間中學習。論文作者表示,過一段時間他們將使用更直接的機器學習方法,並展示更多的可能性。

在 Ramanujan Machine 這項研究中,研究人員建立了一種新的機制,用於學習常數和一系列新猜想之間的關係。由於機制可以以許多種規律公式表示,研究人員提出了一種潛在的等式——廣義連續分數:

?批量生產數學猜想,這樣的自動演算法學會了探索基本常數

如圖,b_n ∈ Z,n = 1, 2, . . .,分別是部分分子和分母。廣義連續分數中的這種分子和分母的多項式表達方式是數學界幾個世紀以來一直研究的問題。

研究人員提出,他們的思路是找到廣義連續分數和基本常數之間的函數關係。簡單來說,列舉和表達具有美感,因此研究人員將實數多項式加在等式兩邊。他們總共提出了兩種搜索演算法。

第一種方法是中間逼近(Meet-In-The-Middle,MITM)演算法,從而以相對小的精度降低搜索空間、減少錯配。這種演算法提升了很大一部分廣義連續分數在剩餘次數中的迭代,用於檢驗它們是否成為新的猜想中的規律公式。因此,這種演算法稱為 MITM-RF。第二種演算法使用基於優化的策略,研究人員稱之為 Descent&Repel,通過轉換為實數網格點來定義猜想中的正則公式。

MITM-RF 演算法提出了一些新的猜想,如圖:

?批量生產數學猜想,這樣的自動演算法學會了探索基本常數

猜想 1-4:自動生成的數學公式猜想,它們都是應用 MITM-RF 演算法,並通過該論文提出的 Ramanujan Machine 生成的。

?批量生產數學猜想,這樣的自動演算法學會了探索基本常數

如上圖所示為 MITM-RF 方法。研究者首先會低精度地枚舉等式右邊的表達式 RHS(Right-Hand-Side),值會儲存在哈希表中。然後研究者會枚舉等式左邊的表達式 LHS,並搜索與 RHS 相匹配的項。隨後模型會重新計算匹配,並獲得更高精度的結果。這個重計算的過程會一直進行下去,直到達到了某種精度,我們就能將其作為新提出的猜想。

學習的新猜想只是巧合?

我們可能會疑惑,模型找出來的猜想是數學上的恆等關係,還是說只是數值上的巧合?如果是數值上的巧合,那豈不是說前面很多步都是準確的,但隨著數值計算越來越多,它總會出錯而崩潰。然而,這項工作中提出的方法使得猜想非常魯棒:對於 10^9 大小的枚舉空間,以及小數點後 50 位的數值精度,隨機找到能匹配的猜想概率要小於 10 的負 40 次方。

這個極小的概率可以讓我們相信,新的猜想也許是等待嚴格數學證明的「真理」。在過去一段時間中,這種猜想的證明會帶來很多新發現,例如費馬大定理(Fermat"s Last Theorem)被證明後,得出來的新數學架構。研究者相信這些批量生成的新猜想也有相同的地位,它們的證明會帶來全新的技術進步。

學習的參數猜想有什麼用

與本文提出的方法相比,很多已知的基本常數的 RF 都是通過傳統的數學證明(即從這些常數的已知特性中推導出的序列邏輯步驟)發現的。在本文中,研究者旨在反轉這一過程,在沒有關於基本常數數學結構先驗知識的條件下,僅用它們的數值數據為其找到新的 RF。每個 RF 都可能使產生該 RF 的數學結構的逆向工程成為可能,並為該領域提供新的見解。本文中的方法在經驗常數中尤其有效,如混沌理論中的費根鮑姆常數(Feigenbaum constant)(見表 2),該常數是從模擬中通過數值推導出來的,沒有解析表示。

?批量生產數學猜想,這樣的自動演算法學會了探索基本常數

表 2:來自不同領域的基本常數示例,這些都是本文方法的相關目標。

新的 RF 猜想可能會有有趣的應用,快速收斂的 GCF 和其他恆等式用於高效計算不同的常數。例如,計算π最高效的方法之一就是基於 Ramanujan 提供的一個公式。更廣泛地來說,新的 RF 可以幫助我們更快地計算其他常數,如上面展示的 e 的超指數收斂。新 RF 的另一個潛在應用是證明基本常數的內在特性。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

機器人見多了,你見過機器船嗎?MIT新版ROBOAT可以自動組裝
注意力機制可解釋嗎?這篇ACL 2019論文說

TAG:機器之心 |