深度學習遇上物理學:上能分析星系團,下能解碼基本粒子
Facebook 用來識別人臉的技術也可以用來識別粒子嗎?
當你向 Facebook 上傳了一張你朋友的照片後,這張照片就進入了一個複雜的幕後處理過程。演算法迅速行動並分析照片的每一個像素,直到將朋友的名字和這張照片匹配起來。這類型的前沿技術也被用在了自動駕駛汽車上,使得自動駕駛汽車能夠從背景中區分行人和其它車輛。
這項技術也可以用來區分μ介子和電子嗎?很多物理學家相信這一點。在該領域的研究人員正著手運用它來分析粒子物理數據。
支持者們希望利用深度學習節省實驗時間、金錢和人力,讓物理學家們做其它不太繁瑣的工作。另一些人希望能提高實驗的結果,相比以前使用的任何演算法,這個演算法能使他們更好地識別粒子和分析數據。儘管物理學家們不認為深度學習是萬能的,但一些人認為它可能在應對即將到來的數據處理危機中起到關鍵作用。
神經網路
直至今日,計算機科學家們仍經常人工編寫演算法,一個任務往往需要無數個小時的複雜計算機語言工作。「我們仍然做著不錯的科學工作,」費米國立加速器實驗室的科學家 Gabe Perdue 說,「但是我認為科學工作還可以做得更好。」
而如果要使用深度學習,我們則需要一種不同的人類輸入。
一種實現深度學習的方法是使用卷積神經網路(CNN)。CNN 是模擬人類視覺感知建模的。人類用自身的神經元網路處理圖像;CNN 通過輸入層節點(node)來處理圖像。人們通過向網路送入預處理的圖像來訓練 CNN。通過學習這些輸入,演算法會不斷調整各節點的權重並因此學會識別模式和相關點。由於演算法不斷修正這些權重,預測結果會變得越來越準確,甚至超越人類。
卷積神經網路以通過將多個權重綁在一起的方式來縮短分解數據處理的步驟,這意味著必須調整的演算法元素更少。
CNN 出現於 90 年代末。但是近年來隨著許多方面的突破(如處理圖形的硬體價格降低、訓練數據集不斷擴增以及 CNN 架構本身的創新),越來越多的研究人員開始使用它們。
CNN 的發展導致語音識別、翻譯以及其它傳統上由人類完成的任務的進步。一家 Alphabet(谷歌母公司)旗下位於倫敦的公司 DeepMind 使用 CNN 創建了 AlphaGo,這個計算機程序在 3 月份打敗了世界排名第二的圍棋選手,圍棋是比國際象棋更複雜的策略棋盤遊戲。
CNN 使得我們可以更從容地處理大量的基於圖像的數據,而之前我們對這些數據束手無策——高能物理學中經常會碰到這種圖像數據。
進入物理學領域
隨著大數據和具有處理大量信息所必需的計算能力的圖形處理單元(GPU)的出現,CNN 在 2006 年開始得到大規模運用。Perdue 說:「從那之後,精確度有了很大的提高,人們也還一直在繼續高速地創新。」
大約一年前,各類高能物理實驗的研究人員開始考慮將 CNN 引入他們的實驗的可能性。「我們把物理問題變成了:『我們能否分辨一輛自行車和汽車?』」SLAC 國家加速器實驗室研究員 Michael Kagan 說,「我們只想弄清楚如何以正確的方式重組問題。」
在大多數情況下,CNN 將用於粒子識別和分類以及粒子軌跡重建。一些實驗已經使用 CNN 來分析粒子的相互作用,其準確性很高。例如,NOvA 中微子實驗的研究人員已經將 CNN 應用到了其數據上。
「CNN 本來是用於識別動物和人的圖片,但它也能很好的用於物理領域的識別,」費米實驗室科學家 Alex Himmel 說,「預測結果非常好——相當於我們的檢測器多產生了 30% 的數據。」
從事大型強子對撞機(LHC/Large Hadron Collider)實驗的科學家們希望藉助深度學習來使他們的實驗更自動化,CERN 物理學家 Maurizio Pierini 說:「我們正試圖在一些任務上取代人。用人來看管比用計算機看管要昂貴得多。」
在檢測器物理學以外,CNN 也被證明是有用的。在天體物理學方面,一些科學家正在開發可以發現新的引力透鏡的 CNN;引力透鏡是指可以扭曲來自它們後面的遙遠星系的光的大型天體(如星系團(galaxy clusters))。對望遠鏡數據掃描以尋找引力透鏡扭曲現象的過程是非常耗時的,並且普通的模式識別程序難以區分它們的特徵。
「公平地說,在使用這些工具時,我們僅僅涉及了很淺的部分,」在費米實驗室的 NOvA 實驗項目工作的威廉瑪麗學院博士後研究員 Alex Radovic 說。
未來的數據盛宴
一些科學家認為神經網路可以幫助應對他們預見的即將到來的數據處理危機。
計劃於 2025 年推出的升級版大型強子對撞機將產生大約 10 倍的數據。暗能量光譜儀(Dark Energy Spectroscopic Instrument)將收集大約 3500 萬個宇宙物體的數據,大型綜合巡天望遠鏡(Large Synoptic Survey Telescope)將捕獲近 400 億個星系的高解析度視頻。
數據量一定會飛速增長,但從前計算機晶元處理能力的指數級增長預計將會陷入停頓。這意味著處理更大量的數據將越來越昂貴。
「對於 10 倍的碰撞次數,你可能需要超過 100 倍的處理能力,」Pierini 說。「用傳統的做事方式,我們會走入死胡同。」
然而,並不是所有的實驗都適用於該技術。
「我認為有時這會是正確的工具,但它不會一直是正確的,」Himmel 說,「數據與自然圖像越不相似,神經網路的有用性越低。」
大多數物理學家都同意,CNN 不適合剛剛啟動的實驗中的數據分析,因為神經網路對於計算過程不是很透明。「這會很難說服人們相信他們已經發現了新的東西,」Pierini 說,「我認為用紙和筆做事情仍然是有價值的。」
在某些情況下,運用 CNN 的挑戰將超過獲益。例如,如果數據尚未轉換為圖像格式,則需要將其轉換為圖像格式。並且神經網路需要大量的數據用於訓練——有時不得不模擬數百萬的圖像。即使這樣,模擬也不如真實數據那麼好。因此,神經網路必須用實際數據和其它交叉檢查進行測試。
「一個高標準的物理學家能夠接受任何新事物,」德克薩斯大學阿靈頓分校的物理學副教授 Amir Farbin 說,「需要跨越很多障礙去說服大家這是對的。」
展望未來
對於那些相信 CNN 結果的人,CNN 意味著更快的物理學和值得期待的未知。
一些人希望用神經網路來檢測數據中的異常,這可以指示檢測器中的缺陷或者為新發現指引線索。為了尋找新發現,研究人員可以只是讓 CNN 遍曆數據並試圖找到突出點,而不是一定要找到具有特定標誌的新事物。「不必指定要搜索的新物理的領域,」Pierini 說,「這裡獲取數據的方式更開放。」
日後,研究人員甚至可能開始採用無監督學習來處理物理數據。無監督學習,顧名思義,是指可以無需人工指導就訓練大量數據的演算法。科學家可以傳輸給該演算法相應的數據,然後該演算法就能從中得出結論。
「如果你足夠聰明,你可以使用它來做所有類型的事情,」Perdue 說,「如果它能夠推斷新的自然規律或類似定律,這將是驚人的。」
※世界的本源並非是物質
※睡覺時學習,不再是傳說
※一個備受吹捧、關於所有事物的萬物理論
※2016年人工智慧十大失敗:從種族主義到致命車禍
※Science:實用量子計算機已近在咫尺
TAG:機器之心 |
※深度學習和量子物理的共同點,或可用物理學打開深度學習黑箱
※量子物理學實驗證明所謂「迷信」可能是超前科學!
※新技能get,物理老師為證力學原理 菜刀上做俯卧撐嚇壞學生
※科學家要實驗看人的心智是否能影響物理學!
※科學家發現一種奇特材料,能連接經典物理學和量子物理學
※下一批碼農,將是物理系學生
※拓撲學與物理學結合,量子計算機正在成為現實
※量子力學不只是物理學,也許也是金融學
※再碰撞物理學
※外行也能看懂的「物理學最深邃的理論」
※玩了這個量子力學遊戲,你也能成為物理學家!
※探索前沿一期:暗物質最新研究,可能顛覆物理體系
※從虐貓狂人薛定諤名言談起,物理學究竟能不能解釋化學和生物?
※新的研究計劃將激光聚焦於高能量密度的物理學
※天大的誤解:物理學是一門實驗的科學
※初二物理測量平均速度同步學習,必備!
※量子力學更怪了: 物理學家觀察到量子物質的一個新形態
※全部物理宇宙都能由數學理解
※物理學的六個基本原理