你也可以用電腦計算望遠鏡數據以尋找遙遠行星的證據
【博科園-科學科普】為了尋找適合生命的遙遠行星,美國宇航局建立了一個眾包項目,志願者在其中搜尋望遠鏡圖像,以尋找恆星周圍的碎片,這是太陽系外行星的良好指標。利用該項目的成果,麻省理工學院的研究人員現在已經訓練了一個機器學習系統來搜索碎片盤本身。搜索的規模要求自動化:在NASA的廣域紅外探測任務(WISE)任務中收集到的數據中,可能有近7.5億的光源。在測試中,機器學習系統在97%的時間裡同意了人類對碎片的識別。研究人員還訓練他們的系統根據他們可能包含可探測的系外行星來評估碎片。
一顆年輕的類似太陽的恆星被它的行星形成的氣體和塵埃圓盤包圍著,圖片版權:NASA/JPL-Caltech
麻省理工學院的研究人員在一篇描述《天文學和計算》雜誌上的新工作的論文中稱,他們的系統發現了367個未經檢驗的天體,它們是未來研究中最有希望的候選者。這項工作代表了一種不同尋常的機器學習方法,這是該論文的合著者之一Victor Pankratius所倡導的,他是麻省理工學院Haystack天文台的主要研究科學家。通常機器學習系統將梳理大量的訓練數據,尋找數據特徵與人類分析所應用的某些標籤之間的一致性關聯——在這種情況下,恆星被碎片環繞。
但Pankratius認為,在科學領域,機器學習系統如果能明確地包含一點科學理解,幫助指導他們的搜索,尋找相關性,或者識別出符合科學興趣的標準偏差,將會更有用。Pankratius說我們的主要目標是超越人工智慧的今天,今天正在收集數據,正在努力尋找數據的特徵。最終會得到數十億的特性。那你和他們一起做什麼?作為一個科學家,你想知道的不是計算機告訴你某些像素是特定的特徵。這是一個物理相關的東西,這是物體的物理參數
這篇新論文誕生於麻省理工學院的一個研討會上,Pankratius與Sara Seager(1941年,地球、大氣和行星科學教授)共同教授,她以系外行星研究而聞名。該研討會是系外行星的天文信息學,介紹了一些數據科學技術,可以用來解釋新的天文儀器產生的海量數據。在掌握了這些技巧之後,學生們被要求將這些技巧應用到懸而未決的天文學問題上。在她的最後一個項目中,航空航天大學的研究生Tam Nguyen選擇了訓練機器學習系統來識別碎片磁碟的問題,而新論文是這項工作的一個延伸。Nguyen是論文的第一作者,她和Seager, Pankratius和Laura Eckman一起,她是電子工程和計算機科學專業的本科生。
在NASA的眾包項目中,研究人員得到了人類志願者識別出的帶有碎片圓盤的光源的天體坐標。這些圓盤可以被識別為橢圓,在它們的中心有稍微明亮的橢圓。研究人員還使用了WISE任務所產生的原始天文數據。為了準備機器學習系統的數據,Nguyen將其分割成小塊,然後使用標準信號處理技術來過濾由成像儀器或環境光引起的工件。接下來她在他們的中心識別出那些有光源的區塊,並利用現有的圖像分割演算法來移除任何額外的光源。這類程序在任何計算機視覺機器學習項目中都是典型的。
但是Nguyen使用了物理學的基本原理來進一步修改數據。首先她觀察了四個不同頻段的光源發出的光強度的變化。她還使用標準的度量標準來評估光源的位置、對稱性和規模,為她的數據集設定包含的閾值。除了來自NASA眾包項目的標籤碎片,研究人員還列出了一些天文學家認為可能是系外行星的恆星。從這些信息中,他們的系統還可以推斷出與系外行星存在相關的碎片盤的特徵,從而選擇367名候選者進行進一步研究。考慮到可擴展性與大數據挑戰,利用眾包和公民科學發展訓練數據集天文觀測和相關對象的機器學習分類器是一種創新的方式來解決挑戰不僅在天文學中,而且不同的數據密集型科學領域。
使用計算機輔助的發現管道來自動化提取、分類和驗證過程,將有助於系統地將這些功能組合在一起。」本文很好地討論了這一方法對碎片磁碟候選者的有效性。這些經驗教訓對於將這些技術推廣到其他天文學和不同學科的應用是很重要的。磁碟偵探科學團隊一直致力於自己的機器學習項目,一位美國宇航局戈達德太空飛行中心的天體物理學家和領導者的眾包disk-detection項目被稱為磁碟偵探。我真的很高興Nguyen正在研究這個問題,因為我真的認為這種機器-人類合作對於分析未來的大數據集是至關重要的。
知識:科學無國界,博科園-科學科普
內容:經「博科園」判定符合今主流科學
來自:麻省理工學院
編譯:中子星
審校:博科園
解答:本文知識疑問可於評論區留言
傳播:博科園
※1.27億年前的幼鳥化石揭示了禽類進化過程
※只有暗物質才能解釋宇宙,而不是被修正的引力理論!
TAG:博科園 |