人人都該知道的20個科學事實

最新 10-15

條件差異和幾率都會引起變化

現實世界的變化是不可預測的，而科學想探究是什麼造就了這些變化。為什麼現在比過去十年更熱?為什麼某些地區的鳥比其他地方的多?關於這些趨勢有很多解釋，科學研究的最大挑戰是從無數的其他來源的變化中，梳理出我們感興趣的過程所起到的作用(比如，要研究氣候變化對於鳥類數量的影響，就要把「氣候變化」這個因素，從農業集約化、入侵物種的傳播這類大範圍變化，以及偶然的個體出生和死亡這些本地小規模事件中剝離出來)。

2.沒有絕對準確的測量

事實上，所有測量都存在誤差。每一次重複試驗都可能得到不同的結果。在某些情況下，與實際變化相比，測量誤差也許會很大。比如，如果你得知上個月的經濟增長了0.13%，那麼實際上縮減的可能也是存在的。提出結果時應該給出結果的誤差範圍，以避免不合理精確度的出現。

3.偏倚是很普遍的

實驗設計或測量裝置可能會對實驗結果造成影響，在某一特定的方向上產生非典型結果。比如，同樣是想知道投票行為情況，分別進行當街採訪、電話採訪和網上調查，因為樣本的成分不同，就可能會得到不同的結果。而因為那些有「統計上顯著」的結果更可能會被報道和出版，只看文獻會讓人產生錯覺——問題的嚴重性或者解決方案的有效性會被誇大。實驗中的偏倚很可能這樣產生：實驗的參與者知道自己接受的是不同的治療，所以會嘗試表現的不同;調查者們對結果的收集會受「知道誰接受了治療」的影響。其實理想實驗應該是雙盲的(Double-Blind)，即參與者和收集數據的研究者都不知道哪些參與者接受了什麼處理。這在藥物試驗中是很容易做到的，但是對於社會問題就不可能。科學家們在希望找到數據來補充之前的調查結果，或者想反駁一個觀點的時候，比較容易產生確認傾向(confirmation bias)。

4.樣本量通常越大越好

大的樣本量得到的平均觀測結果往往比小樣本量的更有益。換言之，當我們積累證據的時候，我們的理解也在加深。這對那些變數多、容易產生測量誤差的複雜體系尤其重要。一種藥物的有效性在每個個體間都存在差異，因此為了在藥物測試中更可靠、準確的估計藥物的平均功效，一個有數以萬計的樣本的實驗要比一個只有數百個樣本的實驗好得多。

5.相關關係不代表因果關係

假定一件事物可以導致另一事物固然是很誘人的。然而，相關關係的得出有時候是出於偶然，又或者某兩種看似相關的因素的關係，其實是由複雜的或潛在的第三因素決定的。比如，生態學家曾一度認為有毒的藻類殺死了一條河流入海口處的魚;但後來發現是因為魚死了所以藻類繁盛起來。並不是藻類本身導致魚類死亡。

6.回歸均值效應可能造成誤導

單次測量中，至少有一部分極端的數據是由於偶然或誤差造成的，進行另一次測量，數據可能就沒有那麼極端(或顯著)了。比如，在經常發生車禍的地方放置一個測速相機，但隨後事故率的減小並不能歸因於放了測速相機，因為原來的高事故率本身可能是偶然，無論是否放測速相機，事故率都很可能向減少的方向發展。

7.數據範圍之外的推斷存在風險

在某一範圍得到的模型可能出了這個範圍就不適用了。所以，如果現在的氣候變化速率比現存物種在進化史中所經歷過的任何時期都要快，或是出現一個全新的極端天氣系統時，評價生態系統對於氣候變化的反饋就十分困難了。

8.注意基礎比率謬誤

一個不完美的檢驗到底有多准?這不但和檢驗本身好壞有關，還和我們要檢測的狀態本身發生的概率(基本比率)有關。比如，一個人做了有99%準確度的血液測試來檢測一種罕見疾病，結果呈陽性，但其實他健康的可能性比生病的可能性更大。如果10001個人來參加這個測試，其中只有一個人有病，此人的結果幾乎肯定呈陽性，但還有100個健康人(1%的人)測試結果也會呈陽性。這種類型的計算在任何篩查工作中——比如機場安檢——都相當重要。

9.對照很重要

除了待測變數之外，對照組與實驗組要保持一樣的條件。沒有對照組，就很難知道實驗處理究竟對結果有沒有影響。它可以幫助科學家確保沒有額外的因素在干擾結果。有時人們在藥物測試中表現出陽性可能是因為環境、提供測試的人甚至只是因為藥丸的顏色。在這種情況下，設置對照組(例如安慰劑組)就非常重要。

10.隨機化能夠避免偏倚

實驗應該儘可能採集隨機樣本。例如直接比較有參與健康計劃的家庭和沒有參與健康計劃的家庭中孩子的學習成績，是很容易帶上偏倚的(因為受教育程度較高的家庭也許本來就更可能參與健康計劃)。因此，好的實驗設計應當隨機選擇一些家長讓他們參與健康項目，隨機選另一些不讓他們參與。

11.尋求「重複」而非「偽重複」

在大量實驗、獨立群體中重複出現的數據更有可能是可靠的。基於多個實驗的系統回顧或元分析能夠提供單一研究無法媲美的信息。簡單地在一群人中挑一些個體出來並施加干預，比如在一個班級的孩子中做實驗，可能會產生誤導——因為這些孩子除了這個干預以外還有許多其他共同特徵。如果把在這些孩子中得到的實驗結果推廣到其他不具有相同特點的群體中，其實就是犯了「偽重複」的錯誤。偽重複會導致研究者對結果產生沒有根據的信心。加拿大紐芬蘭大淺灘就是因為「偽重複」實驗得出鱈魚數量豐富的結論，促進了世界最大鱈魚漁場的倒閉。

12.科學家也是人

科學家也想在促進他們工作的過程中得到某些利益，通常是地位或研究經費，某些時候可能是更直接的經濟獲益。這種情況可能導致數據的刻意選擇與誇大。同行評價不是絕對可靠的;期刊編輯可能更支持積極的、富有新聞價值的結果。多元、獨立的數據來源及重複結果才更可信。

13.顯著性很重要

統計顯著性表示一個事件出於偶然而發生的幾率，用P表示。比如一項實驗中實驗組與對照組的差異顯著性是P=0.01，這表示有百分之一的可能性是：實驗處理其實沒有效果，是偶然因素導致了實驗組和對照組的差異。科學家習慣將P

14.不顯著不代表沒效果

統計學上不顯著(P>0.05)不代表真正的無效，只代表它的影響沒有被我們檢測到而已。小型研究可能不足以找出真正的差異。比如用基因改造的抗蟲棉和抗蟲馬鈴薯做的某一組實驗顯示，這些作物對諸如傳粉者的益蟲不存在不利影響，但實際上這些實驗的樣本量都不夠大，如果有影響可能也檢測不到。

15.「效應量」很重要

顯著性可以衡量差異是「真的」還是「假的」，但如果差異是真的，它有多大?這是所謂的效應量。一項多次重複的實驗也許會得到統計上顯著、但效應量很小的結果(因此，可能並不重要。)效應量的意義不是一個統計學問題，而是生物、物理或者社會層面的問題。二十世紀九十年代，美國期刊《流行病學》(Epidemiology)的主編要求作者們停止使用統計學顯著性，因為他們總會誤讀這項數據，從而得出不科學和不正確的公共衛生政策。

16.「關聯性」會限制結論的推廣

科學研究結果能否應用在實際問題上，取決於研究條件和實際情況的相似程度多大。比如從實驗室動物實驗中得到的結果運用到人類的時候就很有局限性。

17.感覺會影響風險感知

寬泛地講，人們通常認為「風險」=「某個時間段內某一事件發生的概率」×「這個事件所引發的結果」。很多因素都會對人類的風險感知造成不同程度的影響，包括事件的罕見性、人們自以為對事件的掌控程度、結果的不利影響、風險是否自發等。比如，美國人就會嚴重低估在家攜帶槍支的危險(1%)，而嚴重高估住在核反應堆旁邊的危險(1000%)。

18.相關性會改變風險

計算獨立事件的結果是有可能的，比如極潮、強降水和關鍵員工的缺席。但如果這些事件相互關聯(比如風暴會導致高水位，而強降水會導致關鍵員工的缺席)，它們共同發生的幾率就比預期更大。信用評級機構對一大波次級房貸違約風險的低估就是2008年信貸市場崩潰的一個重要原因。

19.數據是可以選擇性呈現的

有時為了支持自己的觀點，實驗者會選擇對預期結果有利的證據。譬如，一項研究認為懷孕時的酸奶攝入量和後代患哮喘之間顯然有相關性，但要解讀它，我們首先要知道研究者是本來就打算驗證這一假說，還是在一大堆數據中偶然發現這一相關性的。相比之下，希格斯玻色子的某一段搜尋歷史則是所謂「旁視效應」的例證：如果你使勁使勁找，總能找出來點兒什麼。要學會問這個問題：有啥是他們沒告訴我的?

20.極端測量值可能會引起誤導

由於個體能力差異、取樣、偏見、測量誤差等因素的影響，所有數據測量的整理結果都具有可變性。例如學校的教學效率就會因為老師的能力、受試學生的代表性、學校所處地域、指標測量方法等因素的影響而呈現差異。但在解釋研究結果的時候，除個體差異之外的因素常常會被忽略掉。如果我們討論的是極值的結果(畢業率翻倍了)，比較極值和平均值的幅度(X校的畢業率是全國平均值的三倍)，或者是數值的範圍(表現最好和最差的學校之間有x倍的差距)，這就會帶來嚴重問題。排行榜就是其中的典型，很少有靠譜的結論。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 探秘宇宙解碼 的精彩文章:

※貓跳過屍體會出現「詐屍」嗎？
※要更深刻地了解宇宙，必須對比原子還小的結構進行研究
※兩個即將相撞的超大質量黑洞：雙人舞！
※潛在的危險威脅著我們地球還能存在多久？
※太陽發生20級地震時會怎樣？「負級地震」是個什麼概念？

TAG:探秘宇宙解碼 |