谷歌AI神助攻!開源「獵星代碼」普通人坐電腦前就能發現新行星
整理 | 呂夢
微信 | ai_xingqiu
網址 | 51aistar.com
去年12月,谷歌的神經網路技術通過分析NASA 開普勒望遠鏡的數據,從已知的行星系統中發現了兩顆系外行星。
而近日,谷歌開源了「獵星代碼」,任何人只要下載代碼和數據,就能在自己的計算機上運行,像天文愛好者一樣發現新的行星!(附下載地址:https://github.com/tensorflow/models/tree/master/research/astronet)
我們先來回顧下整個事件:
去年12月,NASA宣布了一個重大新聞:即通過分析開普勒太空望遠鏡的觀測數據發現,在距離地球2545光年的開普勒-90星系中,又發現了第八顆行星!命名為——開普勒-90i。
最重要的是,這顆名為開普勒-90i的行星是天文研究第一次使用了人工智慧技術發現的。
NASA的科學家通過使用Google機器學習技術來對開普勒數據進行分析,效率和準確性上也遠遠超過傳統的分析方法。
這架望遠鏡於2009年3月6日在美國佛羅里達州被發射升空,它直徑約2.7米,長約4.7米,是世界上首個用於探測太陽系外類地行星的飛行器。
在「服役」的這些年裡,開普勒在太陽系發現的候選行星已經將近5000顆,其中2500多顆已經被確定為真正的行星。這些星球中,大約50顆被認為是類似地球大小的宜居行星,其中超過30顆已獲得確認。
由於開普勒太空望遠鏡收集了大量的數據,觀察了大約20萬顆恆星,每30分鐘拍攝一張照片,創造了約140億個數據點。這140億個數據點可以轉化為約2萬億個可能的行星軌道。
開普勒太空望遠鏡
對於這些數據,科學家們過去主要通過自動化軟體或人工的方式找到那些信號強的行星——即便如此,這也是一個非常浩大的工程量,耗時且耗費人力。
此外,與恆星相比,太陽系外的行星不但體型小而且不發光,探尋難度非常大。
在數據太多無法用人力處理的情況下,機器學習的好處就凸顯了出來。
Google AI 高級軟體工程師Christopher Shallue與德州大學奧斯汀分校的天體物理學家Andrew Vanderburg,就曾在新聞發布會上解釋他們是如何訓練人工智慧程序來識別遙遠恆星周圍的行星的,「谷歌使用的工具實際上與識別照片中貓和狗的工具是類似的」。
九大行星動態自轉圖
大體過程和原理如下:
1.首先,開普勒太空望遠鏡探測行星的方法為「凌日法」,就像動圖中,如果一顆行星從母恆星前方橫越時,恆星的視覺亮度會略微下降。
圖中,這種呈U形的明暗信號變化模式通過白色的線條來表示,而藍色的點狀分布,則是NASA在分析這些光變曲線後,得出的「開普勒天體」的數據。
2.科學家們使用超過15000個標記的開普勒信號的數據集,創建了一個TensorFlow模型來區分行星與非行星。
3.再讓人工智慧系統來學習開普勒太空望遠鏡收集的光線信號,以識別外系行星。
Google團隊使用了其中一半的數據用作訓練,其中有3500個信號經過驗證為行星或行星候選者。該網路的輸入是同一個光曲線的兩個獨立視圖:一個寬視圖,允許模型檢查光曲線上其他地方的信號(例如,雙星會引起次級信號);一個是放大視圖,使模型能夠仔細檢查信號的形狀(例如將「U形」信號和「V形」信號區分開來)。
當完成模型訓練後,Google團隊的研究人員用它研究了光曲線的的特徵,以檢驗模型的輸出是否與我們的期望相符。
方法很簡單,就是系統地掩蓋輸入光曲線的某一個小區域,來檢測模型輸出的變化。結果顯示,如果掩蓋那些對判斷信號特別重要的區域,模型輸出也會相應的改變;但如果掩蓋的是不重要的區域,則不會產生顯著的影響。
經過以上的驗證後,研究人員對模型的預測能力就充滿了信心。他們選擇了670顆恆星,期望能在它們的光曲線中搜索到新的系外行星。之所以挑選這670顆恆星,是因為我們已知這些恆星有多個軌道行星,研究人員們相信這些恆星中應該還擁有一些尚未被發現的行星。
感興趣的朋友何不下載代碼探索一番,說不定下一顆聞名世界行星就是從你的電腦里被發現的。
如果你想了解最前沿的AI技術和場景應用
一網打盡AI界前瞻科技和深度報道
如果你想持續拉升逼格
歡迎關注AI星球,並轉發朋友圈為我們打Call哦~~
你們的支持才是我們創造優質內容的不竭動力~送你花花
※當監控攝像頭有了AI大腦,是福還是禍?
※與谷歌「翻臉」,傳亞馬遜CEO貝佐斯親自下令封殺Nest設備
TAG:AI星球 |