這個假理論,騙了所有人18年!
譯:徐寒易 校:譚坤 | 轉載自環球科學
差不多20年前,美國凱斯西儲大學(Case Western Reserve University)的心理學家夫妻 Roy Baumeister 和 Dianne Tice 設計了一個測試自制能力(self-control)的基礎實驗。「房間里的一個小爐子里烤著巧克力曲奇,」他們在一篇被引用過3千多次的論文(Baumeister, Roy F., et al. "Ego depletion: is the active self a limited resource?." Journal of personality and social psychology 74.5 (1998): 1252.)中寫道,「於是實驗室里充滿了新鮮巧克力和烘培的香甜氣息。」
這是心理學歷史上最重要的巧克力香氣。
實驗的原理是這樣的: Baumeister 和 Tice 把新鮮烘培的曲奇壘在盤子上,旁邊放著一碗紅白小蘿蔔。然後他們招呼一群志願學生進來。他們讓學生先在房間里等一會兒,吩咐一些學生只吃碗里的小蘿蔔,另外的學生只吃曲奇。然後,這些志願者要試著解決一個實際上無解的難題。
Baumeister 和 Tice 記錄了學生在解題任務中花費的時間,看看他們到底過多久會放棄。他們發現,那些吃了巧克力曲奇餅乾的人平均堅持了19分鐘,差不多和那些在對照組中什麼都沒吃的人一樣久。而那些吃了小蘿蔔的人平均只堅持了8分鐘就主動放棄了。
作者把這個現象叫做「自我損耗」(ego depletion),他們認為,這個現象揭示了一個關於人類精神的基本事實:我們的意志力是有限的,過度使用後它就會減少。當你被新鮮出爐的曲奇圍繞時,吃小蘿蔔就成了一件克己的壯舉,這會讓你精疲力竭。Baumeister 和 Tice 認為,意志力是一種心理能量,它就像肌肉一樣,會因為使用而變得疲乏。
這個簡單的想法對於普通人來說可能非常直觀易懂,但是,它在心理學界卻算得上是革命性的理論,後來演變成了一個龐大的研究領域。接下來的幾年裡,Baumeister 和 Tice 的實驗室,以及其他數十個實驗室用相似的實驗程序發表了大量的相關研究。首先,科學家用一個需要自制能力的任務消耗被試者的意志力,比如不吃巧克力曲奇、看很悲傷的電影——但要壓抑自己的反應;幾分鐘後,他們用一個難題、一個遊戲,或者其他需要耗費心力的任務來測試這些被試者。
心理學家發現,許多不同的任務都會耗盡一個人的能量,讓他們的認知能力枯竭。決定是否要買一塊肥皂就可能讓窮困潦倒的印度鄉村短工精疲力竭;狗忍住進食衝動的過程也會消耗它們的意志力;白人和黑人科學家討論種族政治時也會心力交瘁。2010年,為了了解這類研究是否可靠,一些由 Martin Hagger 帶領的科學家對該領域已發表的研究進行了薈萃分析(meta-analysis)。Hagger 的團隊使用了83項研究的198個實驗,最終證實了這些研究的主要結果:「自我損耗」似乎是一個真實可靠的現象。
2011年,Baumeister 和《紐約時報》(New York Times)的 John Tierney 基於上述研究發表了一本勵志科普書:《意志力:關於專註、自控與效率的心理學》(Willpower: Rediscovering the Greatest Human Strength)。這本暢銷書教導讀者如何將自我損耗的科學運用到生活中。作者稱,一杯加了糖的檸檬水就能補充自制能力的內在儲量;意志力就像肌肉一樣,經常訓練就能增加它的強度。在鄧普頓基金會(Templeton Foundation)對 Baumeister 的一次採訪中,他表示人真的可以塑造自己的品格。鄧普頓基金會是一個有宗教傾向的科學資助機構,它為 Baumeister 提供了一百萬美元的研究經費。彼時,他告訴《大西洋月刊》(the Atlantic),他從90年代末開始研究的效應是一個無可非議的事實。他說,「它們在許多不同的實驗室里被反覆驗證和拓展,所以我確信它們是真實存在的。」
但故事發生了逆轉。一篇正在印刷、將於下個月發表在《心理科學展望》(Perspectives on Psychological Science)上的論文描述了一次基於此理論,並試圖重現其主要效應的宏大嘗試。在幾大洲的24個不同實驗室,超過兩千名被試者參與了這項研究,但研究者沒有發現任何效應。自我損耗的效應為零:沒有跡象表明人類的心理會像自我損耗理論所描述的那樣運作,換句話說:他們的結果和此前幾百項相關研究的結論全然不同。
這並不是心理學理論第一次受到挑戰——完全不是。心理學以及許多其他領域出現的「可重複性危機」已是確定無疑了。去年夏天的一項研究試圖嚴格複製100個心理學實驗,結果只成功重複了其中的40%。前幾日出現了一個對這個研究的評論,聲稱最初的那些研究者犯了統計錯誤。但這個評論本身也受到了攻擊:有人說它曲解事實、無視證據,且批評者沉浸在自己的主觀臆想中。
對於科學家和科學記者而言,心理學界不同陣營間的互相討伐令人擔憂。我們更願相信已經發表的研究結果大概率是真實的,但這項關於自我損耗的最新研究卻處在了更高的利害位置上:它不是要警告我們某些單一的研究不可靠,而是給整一套成型的研究文獻蒙上了陰影。換句話說,它的攻擊目標不是單個研究,而是支撐一個領域的宏大理論。
Baumeister 關於意志力的理論以及他用來測試這個理論的巧妙方法,已經在實證研究中被一次次地重複運用。這個效應曾被以幾百種不同的方式改造,而背後的概念則被薈萃分析所肯定。這不是一個建立在薄弱證據上的瘋狂新理論,而是一座由數年積累的堅實證據搭建起來的知識大廈。
但現在看起來,這座「自我損耗」的大廈可能只是一座由腐朽的材料堆疊而成的海市蜃樓。這就意味著,一整個研究領域——以及某些科學家職業生涯的輝煌成果——可能建立在一個虛假的前提之上。如果連這樣的巨廈都能一夕傾倒,下面又會輪到什麼?這不僅令人擔憂,還令人毛骨悚然。
* * *
為了搞清楚到底出了什麼問題,Carter 重新查閱了2010年的那篇薈萃研究——那篇用了83項研究、198個實驗的論文。他越是仔細研究,越發現結論不對勁。首先,薈萃分析僅僅囊括了已發表的研究,這就意味著它會產生偏向陽性結果的標準偏差。第二,它包含了在測量自制能力方面相互矛盾或反直覺的研究。比如,一個研究發現,自我損耗後的被試者會給慈善機構捐獻更多的錢,但另一個研究卻說自我損耗後的被試者不太願意花時間幫助陌生人。
他和他的導師 Michael McCullough 用一種先進的分析方法對2010年那篇論文的數據重新進行了分析,他們什麼效應也沒發現。在2015年他們發表的第二篇論文中,Carter 和 McCullough 進行了第二次薈萃分析,這次他們使用了不同的研究數據,包括48個從沒有發表的研究。再一次,他們發現只有「非常微弱的證據」支持這個效應。
「突然之間我感到一切都開始崩塌。」Carter表示。他現在31歲,還沒有得到助理教授的職位。「我已經基本失去了方向。通常我會說,好吧,有100篇發表的論文支持這個理論,我應該感覺不錯,我能感到充滿信心。但是這一切都不復存在了。」
並不是所有人都相信Carter和McCullough對這個領域的重新評價。他們用來校正論文偏差的神奇方法還太新,沒有被完全驗證過。一些這個領域裡的著名學者稱他們的結論過於草率。
但是此時此刻,這個領域也出現了其他的問題徵兆。比如,檸檬水效應乍一看是不太合乎邏輯的。大腦不可能那麼快地從一杯檸檬水裡攝取足夠的葡萄糖——喝一杯檸檬水不可能對結果有什麼大影響。另外,一些實驗室通過讓人們用檸檬水漱口再吐掉的方式得到了相同的結果——被試者也恢復了自制能力。其他實驗室則發現被試者的信念以及思維模式能夠影響意志力是否被消耗、如何消耗。
這些批評本身並不致命。意志力可能是一種有限的資源,但我們可以根據自己的動機來使用意志力。不管怎麼說,我們就是這麼花錢的:一個人的購買習慣可能包括許多不同的因素,包括她有多少現金,她對自己財務狀況的感受等。但是對於意志力本質的更為宏觀的質疑以及薈萃分析的爭論,使得這整個領域開始變得十分可疑。
2014年10月,美國心理科學學會(Association for Psychological Science, APS)發表聲明稱將嘗試解決這個不確定性。APS會創立一個「重複實驗報告註冊」(Registered Replication Report)計劃。該計劃將安排許多不同實驗室實行一系列實驗,目的在於測試一個代表重要的研究理念的關鍵實驗(這裡就是自我損耗的相關實驗)。撰寫了2010年的薈萃分析的 Martin Hagger 將成為這項計劃的領頭作者。Roy Baumeister會為研究方法做諮詢顧問。
這個實驗複製團隊必須選擇特定的實驗形式:他們到底複製幾百個自我損耗實驗中的哪一些?Baumeister 推薦了一些他最鍾愛的實驗設計,但事實證明,它們中的大多數都無法操作。複製團隊需要那些能夠在各種不同實驗室里被可靠複製的任務。巧克力曲奇實驗就達不到這個標準。如果哪個實驗室把曲奇烤焦了怎麼辦?這會把整個實驗搞砸!
在Baumeister的建議下,Hagger的團隊敲定了一篇發表在2014年的論文,論文的作者是密歇根大學的研究人員。這個研究使用了一個標準的測評自制能力的任務:被試者觀看在屏幕上一閃而過的簡單單詞,如level、trouble、plastic、business等,如果出現包含字母e的單詞,且 e 旁邊2個字母不包含母音的話,被試者需要敲擊一個按鍵(也就是說,當被試者看到 trouble 這個單詞時需要按鍵,但遇到 level 和 business 就得抑制他們按鍵的衝動)。在最初的實驗中,完成這種自制能力任務使被試者產生了非常強烈的自我損耗效應:被試者在接下來另一個電腦測試中的得分顯著變差了。
複製團隊在24個不同的實驗室中重複了這個實驗,其中一些實驗室把任務中的單詞翻譯成荷蘭語、德語、法語和印尼語。研究作者之一、加拿大多倫多大學的Michael Inzlicht表示,在24個實驗室中只有兩個實驗團隊得到了顯著的正向效應。有一個實驗得到了負向效應,也就是說它加強而非減弱了自我意志。將所有的實驗綜合在一起後,整體上沒有跡象表明 Baumeister 和 Tice 的原效應存在。
這到底是什麼意思?這個結果最起碼說明,一個特定的任務——字母e遊戲——並不會使人的意志力衰竭,或者是,該任務之後的測試並沒有有效地測量到自我損耗。事實上,Baumeister 自己對這個項目的觀點也是這樣。他從澳洲打電話告訴本文作者,「全世界的人都做了這個實驗,結果大家什麼效應都沒有發現,這讓我感覺很不好。」他依然相信自我損耗是真實存在的,僅僅是這個任務失敗了,理論框架並沒有動搖。
在他的實驗室里,Baumeister 告訴我,字母 e 任務可以用不同的方式來實施。首先,他會訓練被試者挑出所有包含字母 e 的單詞,直到這個任務變成一個根深蒂固的習慣。在此之後他才會加入第二個規則,即忽視e旁邊的2個字母含有母音的單詞。他認為這個版本的任務需要更多的自制能力。
其次,他會讓被試者用紙和筆,而不是用電腦來做這個任務。他提出,紙筆任務需要更多自制能力,因為抑制整個手臂的動作比抑制鍵盤上蠢蠢欲動的手指需要更多的自制能力。
Baumeister 認為,如果說這個實驗複製計劃得到了任何有用信息,那就是該領域的研究過於依賴電腦了。「過去做實驗是一門手藝。你要和人打交道,讓他們進入正確的心理狀態,然後你再測量結果。但是現在出現了一種思潮,那就是讓所有的事都自動化,這樣所有的事都能夠在網上快速方便地完成。」他接著說道,如今在行為科學裡,實際發生的行為越來越少,「現在參加實驗就是坐在電腦前讀一些東西。」
* * *
相較於 Baumeister,我更願意把這個實驗複製計劃的失敗看成一個重大事件。我們可以假設實驗任務選錯了,而自我損耗是真實存在的。如果真的是這樣的話,那麼這個研究明顯說明這個效應並不像它看上去那樣穩定。自我損耗的最大賣點就是它的靈活性:自我損耗不僅僅適用於巧克力曲奇和小蘿蔔實驗,還適用於單詞遊戲、白人和黑人之間的談話、是否購買肥皂的決策,甚至狗的行為。事實上,該效應的不可思議的適用範圍常被人稱頌。我們用這麼多不同方式做的這麼多實驗,怎麼可能都錯了呢?
現在我們知道了,自我損耗的效應可能非常脆弱。它對測試方式十分敏感,以至於從紙筆測驗轉換到電腦測驗就能將其抹殺。如果真是這樣,那麼我們為什麼還要相信這個實驗其他形式上的變體呢?如果真是這樣,自我損耗的理論的宏大性就嚴重縮水了。
即使對於那些願意承認自我損耗領域出了大簍子的人,讓他們接受這麼個宏大理論的解體並不是一件容易的事。對於自我損耗持樂觀態度的人可能會承認,心理學的研究的樣本太小,以至於無法反應真實的效應,或者說心理學家總是在瞎統計,直到得出顯著的結果才住手。但這些觀點都沒有暗示研究者故意造假,僅僅承認了一種馬虎的研究標準的普遍性。但是,樂觀者依然會說,僅憑一篇文獻之力,不可能讓這種類型的錯誤如此徹底地散布在學界之中;這麼多受干擾的虛假結果,也不可能表現得如此一致。如果所有這些成功的效應都是隨機產生的,它們完美的吻合簡直是個奇蹟!
悲觀者持相反的觀點:一個壞結果很容易直接導致下一個壞結果。自我損耗理論如此醒目、如此無處不在,你可以用一千種方式來測試它。你不需要烤一盤巧克力曲奇,僅需用一碗滿溢的 M&M 巧克力就可以引誘你的受試者。你不需要和受試者談論另一個種族,你只需讓他們回憶一次成為種族歧視受害者的經歷即可。標準實驗範式的不同版本都能夠測試出同樣的效應,這就是宏大理論的本質。
這意味著你可以按照你的想法對概念進行不限次數的微調,直到得到一個看起來產生了正向結果的版本。但是,你能對這個概念進行復現,並不總意味著你得到的結果是真實的。它僅僅說明你嘗試了各種不同的方法,說明不管失敗多少次,你都願意堅持直到最後知道做出成功的實驗——說明你擁有證明自己的假設的意志力。
從表面上看,這個新的「複製實驗報告註冊」計劃並沒有將我們所知的意志力理論完全推翻。一個人的自制能力當然可以失效,只是我們並不清楚它何時發生、為什麼發生。Baumeister 可能是完全正確的——人們有心理力量的一個「蓄水池」,每當我們使用了它,它就會枯竭了。但是他和 Tice 在20年前發明的包含2個任務的實驗方法看起來不太靠譜。於是,整個領域都被質疑了。
「總有一天我們必須推倒一切重來,這個計劃僅僅是個開始。」Inzlicht表示。他指的並不僅僅是所有的自我損耗研究,而是他對整個社會心理學的感受。
所有的舊研究方法都被質疑了。甚至是曾被視為評估大量研究的黃金標準的薈萃分析看起來也變得有些毫無用處。Inzlicht警告我,「薈萃分析完蛋了。」如果你分析200項粗陋的研究,你最後只能得到粗陋的結論。這就是所謂的垃圾進,垃圾出。
Baumeister打算用他認為行得通的研究方法進行他自己的複製研究。「我們打算做直接且不摻假的研究。我們必須回到起點,回到20年前的地方……發表證偽研究比證實研究要容易得多,」他面帶倦容地告訴我,「日子不好過。這並不有趣。」
那些畢生研究都因此備受質疑的人的日子並不好過,而這個領域的批評者也沒有感到歡欣鼓舞。「我覺得置身於黑暗中,」Inzlicht在最近的一篇博客中這麼寫道,「我感到身下的大地開始震動,我不知道什麼是真的,什麼又是假的。」
TAG:哲學與心理 |
※又一个名人离世了!年仅31岁!惊动了所有人!
※又一個名人離世了!年僅31歲!驚動了所有人
※又一個名人離世了!年僅31歲!驚動了所有人!
※這顆1000歲的老樹被人類在中間挖了一個洞,130年後所有人都沉默了!
※妈妈比18岁女儿还年轻10岁,一出场惊呆了所有人!
※又一個有錢女.星倒下,年僅 4 4歲,震驚所有人!
※26年!毛主席瞞了所有人
※90後女孩,做這個行業,月入7萬,看懵了所有人!
※13年前她花10萬元只買了一個豬圈,所有人都嘲笑她,可現在……
※這位60歲大叔的畫,騙了所有人……
※90後女孩,做這個行業,月入7萬,看懵了所有人
※日本一個83歲妓/女站街60年,所有人都看哭了……
※一女子15年不穿內衣,15年後的結果驚呆了所有人!
※又一名年輕女孩離世,年僅18歲,(調查結果)震驚所有人!
※自閉女孩一年減肥180斤,整個過程震驚了所有人
※他們年過八十,有11個曾孫,卻比18歲情侶還甜蜜,感動所有人……
※2017年到了,感恩一路幫助過我的所有人
※震驚!80歲「苦行僧」40年做了一件事,驚呆所有人
※2017年,感恩一路幫助過我的所有人!