當前位置:
首頁 > 新聞 > 機器學習正在導致「科學危機」

機器學習正在導致「科學危機」

新智元報道

來源:BBC

編輯:三石

【新智元導讀】目前,機器學習已經深入各個科研領域,併產生了深遠的影響。無獨有偶,許多科學家利用機器學習產生的結果卻具有誤導性,甚至往往完全是錯誤的。因此,來自休斯頓萊斯大學的Genevera Allen博士發出警告:若不改進技術,機器學習系統使用量的激增將導致一場「科學危機」。

警告:機器學習導致了一場「科學危機」!

目前,許多科學家用機器學習技術來分析數據等,但其產生的結果有時是具有誤導性的,而且往往是完全錯誤性的。

來自休斯頓萊斯大學的Genevera Allen博士說,這種系統使用的增加導致了一場「科學危機」

她警告科學家們:

如果科學家們不對機器學習技術進行改進,就等同於浪費時間和金錢。

採用機器學習技術來分析處理已有的數據集像是一股熱潮,從生物醫學到天文學,比比皆是。而且這些數據集往往「體量」龐大、價格昂貴。

「可複製性危機」

雖然Allen博士發出了這樣的警告,但是根據她們的說法,團隊所提出的答案可能不完全是正確的

因為軟體識別的模式只存在於數據集中,而不存在於現實世界中。

Allen博士表示,有缺陷的機器學習正在製造一場「科學危機」

Allen博士說:

通常情況下,先使用機器學習技術併產生了一定結果的研究,往往不會發現它是錯誤的。

直到其他人在將這些技術應用於更大的數據集中,然後產生的結果與前人的結果完全不同,這時人們才會驚呼:「天哪!這兩項實驗結果完全不一致!」

目前,科學界普遍承認存在可複製性危機。我敢說,其中很大一部分原因確實來機器學習技術在科學研究中的使用。

科學上的「可複製性危機」指的是當另一組科學家嘗試同樣的實驗時,研究結果沒有被重複。這意味著最初的結果是錯誤的。一項分析表明,世界上85%的生物醫學研究都是徒勞的。

這是一場已經持續了20年的危機。

這場危機之所以會出現,是因為實驗的設計不夠完美,無法確保科學家們不會自欺欺人——只想得到自己想要的結果。

具有缺陷的模式

Allen博士表示,機器學習系統和大數據集的使用加速了這場危機。

這是因為機器學習演算法專門用於在數據集中查找「有趣」的東西。因此當它們搜索大量數據時,將不可避免地找到一種模式。

真正的挑戰在於,我們真的可以相信這些「發現」嗎?

那些所謂的科學發現,能夠代表真正的科學嗎?它們是可重複的嗎?若是給定一個額外的數據集,運用同樣的方法,是否會得到相同的結果呢?不幸的是,事實往往並非如此。

機器學習也應用於生物醫學研究

Allen博士正與休斯頓貝勒醫學院的一組生物醫學研究人員合作,以提高他們研究結果的可靠性。

她正在開發下一代機器學習和統計技術,這些技術不僅可以篩選大量數據進行「發現」,還可以報告結果的不確定性及其可能的重複性。

她告訴與其共事的科學家:「收集這些數據集是非常昂貴的,論文的發表可能會需要更長的時間,但是你們的成果是能夠經得起時間的考驗的!」

「這將為科學家節省資金。更重要的是,可以保障科學不會按著這些錯誤的方向發展。」

https://www.bbc.com/news/science-environment-47267081

更多閱讀

【加入社群】

新智元 AI 技術 產業社群招募中,歡迎對 AI 技術 產業落地感興趣的同學,加小助手微信號:aiera2015_2入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名 - 公司 - 職位;專業群審核較嚴,敬請諒解)。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

谷歌、DeepMind重磅推出PlaNet,數據效率提升50倍

TAG:新智元 |