當所有法官都一致認為有罪時,為什麼犯人反而被無罪釋放了?
根據我們普通人對法律的認知,如果所有法官一致判定某人有罪,那麼該嫌疑人就是有罪的,並且會受到法律的懲罰。
然而古猶太律法的相關推論卻違反人的直覺,它表示:如果受審嫌疑人被所有法官一致判為有罪,那麼該嫌疑人會被無罪釋放。
聽上去很不可思議,其實當時的立法者已察覺到了一致性同意通常意味著審判程序中存在系統誤差,哪怕他們還不知道是什麼誤差。他們以直覺推斷到,如果什麼事情好得簡直不真實,其中多半有誤。
在一篇發表在《英國皇家學會學報A》上的文章中,來自澳大利亞和法國、由拉克倫·J·岡等人組成的研究團隊深入研究了這一概念,他們將其稱為「一致性悖論」。
「如果多名獨立目擊者都一致指證是某名嫌疑人犯下了罪行,我們會假設他們不可能都出錯,」論文合著者德里克·阿伯特說,他是澳大利亞阿德萊德大學的物理學家和電子工程師。「全體一致性通常被認為是可靠的。但其實讓數量龐大的人群都達成一致的概率很小,所以我們對一致性的信念站不住腳。『一致性悖論』表明,我們通常遠遠不如自己以為的那樣確定。」
要做到所有人一致,太難了
研究者以現代警察局的「證人辨認」環節為例展示了這一悖論,目擊者要嘗試在站成一排的幾個人里指證出嫌疑人。研究者證明,當意見完全一致的目擊者數量增加時,他們正確的幾率會降低,直到與隨機猜測的正確率相差無幾。
在警察局的辨認里,系統偏差可能是任何一種偏向,比如隊列被呈現給目擊人的方式,或者目擊者自有的個人偏見。重要的是,研究者展示了甚至是極其微小的偏差也會為整體結果帶來巨大影響。特別地,就算只有1%的目擊者顯示出對特定嫌疑人的偏向,那麼僅當三位都指向同一嫌疑人後,目擊者們正確的概率就開始下降。違反直覺的是,如果這眾多目擊者中有一位指證了不同的嫌疑人,那麼其餘目擊者是正確的概率會大大增加。
在警局的嫌疑人隊列中,某人有罪的概率隨著前三位目擊者一致指證他/她而增加,但接下來隨著更多目擊者的一致指證而下降。不同顏色的曲線代表不同誤差率,黃色代表零誤差 | Gunn等,2016英國皇家學會
這一現象發生的數學原因可以在貝葉斯分析中找到解釋,只需一枚兩面重量有偏差的硬幣就能用最簡單的方式理解。如果一枚有偏查的硬幣被設計成投擲時55%的時候正面朝上,那麼當記錄了足夠的硬幣投擲結果後,你就能看出正面朝上的次數大於背面朝上。這一結果不代表概率定律在二元系統中發生改變,而是這一系統自己失效了。同理,根據概率定律,讓數量龐大的目擊者群達成一致意見的可能性太小,所以更有可能是系統本身不可靠。
研究者說,這一悖論意外出現的次數比我們所想的更頻繁。人數眾多的一致性同意在某些特定情境中仍是好事,但只在零偏差或近零偏差的前提下。阿伯特舉例,讓目擊者們從一排香蕉中指出蘋果——此任務簡單到幾乎不可能出錯,因此眾多人一致同意的情況就變得十分有可能。
另一方面,罪犯指認比一行香蕉中的蘋果要複雜得多。在一場模擬犯罪實驗中,目擊者僅在兇手逃跑時短暫看到兇手,結果顯示誤指率高達48%。在這類情況下,人數眾多的一致性同意本該極不可能出現。不過,當每位目擊者都曾獨立被兇手挾做人質,在槍口下遭受威脅長達一月的情況下,誤指率將遠低於48%。所以和短暫目睹相比,這一效果達到的程度就更接近於香蕉指認。
很多領域都存在「一致性悖論」
除了在法律領域,一致性悖論還有其他許多應用,研究者在論文中討論的一項重要用途是密碼學。數據加密經常通過辨認對方提供的一些天文數字是合數還是質數來進行。其中一種實現方法即重複名為拉賓-米勒檢測的概率檢測,直到合數被誤認為質數的概率變得極低:2^-128的概率通常被認為可接受。
這種情況下發生的系統失誤則是計算機故障。大多數人從未考慮過這種可能性:一束外來的宇宙射線可能會翻轉一個比特位,轉而導致計算機檢測將一個合數誤作質數。畢竟此事件發生的概率極小,每月約為10^-13。但重要的是它比2^-128大,所以就算失誤率如此微小,它仍對所期望的安全水平有決定性影響。因此,加密協議可能不如看起來那麼安全——畢竟,那些顯示高安全水平的檢測結果實際上更有可能代表著計算機故障。為了真正達到所需安全水平,研究者建議這類「隱藏」錯誤一定要儘可能減少到向零靠攏。
一致性悖論或許違反直覺,但研究者解釋說一旦我們擁有了完整信息,一切就變得合理起來。
「同大多數『悖論』一樣,並不一定是我們的直覺糟糕,而是我們的直覺被灌輸了不良信息,」阿伯特說。「在這些例子中,讓我們吃驚的是我們普遍沒意識到目擊者的指證正確率實際上如此之低,也沒有意識到在密碼學中,計算機微小的錯誤率會如此意義重大。」
研究者注意到,一致性悖論和迪昂-奎因假說有所關聯。後者表述為,科學假說不可能被獨立檢驗,而總是被成組檢驗。比方說,一項實驗不僅檢驗了某特定現象,還檢驗了實驗儀器的校正功能。在一致性悖論中,失效的是方法(即「輔助假設」),而後削弱了主要結論的可信度。
用無數案例說話!
其他領域中一致性悖論的出現不計其數且千差萬別。下面是阿伯特原話講述的一些例子:
01
大眾汽車的尾氣檢測
大眾公司偷偷設計了一種計算機晶元,讓引擎在檢測時以排放最低尾氣的模式運行,但在現實中,汽車開上路時排放的尾氣並不達標。尾氣的低排放太一致,「好得不真實」。曝光大眾的尾氣檢測小組首次產生懷疑,就是因為他們發現新車和車齡五年的汽車有著同樣的排放水平!正是前後一致性暴露了不法晶元帶來的系統偏差。
02
神秘「殺手」海爾布隆魅影
在1933-2008年間,發生了一件其壓倒性證據「好得不真實」的著名案例。歐洲的警察在分布於法國、德國和奧地利的15處犯罪現場都採集到了同樣的女性DNA。這名神秘殺手被稱作海爾布隆魅影,警方從未能找到她。這些DNA證據長年一致且具有壓倒性,可它們是錯的。這最終被發現是一個系統誤差。用來採集DNA樣本的棉簽被同一位女士意外污染——當她在工廠製造這些棉簽時。
03
全票取勝的大選
當一屆政府贏得了選舉,有人不滿自己支持的黨派只以微小的優勢險勝。我們總希望自己鍾愛的政治黨派以全票支持取勝。然而,如果這一情況真的出現,我們就應當懷疑是操縱選票導致了系統偏差。一則都市傳奇堅信普京曾贏得140%(!)的選票。如果確有其事,那麼民主制度在此處明顯失效。實用建議是,在健全的民主制度中,當一方政黨並非靠中傷「愚蠢」的對方選民,而是以微小優勢獲勝時,我們應當為雙方選民保有了民主的正直性而歡呼。
04
完美的實驗結果
在科學中,理論和實驗緊密相連,一定得相互支持。在每個實驗中總有「雜音」,因而我們必須期待誤差的出現。科學史中有不少著名實驗,其結果「好得不真實」。有許多歷年來一直處於爭議的例子,最著名的當屬密立根確定電子電荷的油滴實驗,和孟德爾的植物育種實驗。如果實驗結果太過乾淨,不包含預料中的雜音和異常值,那麼我們就有理由推測發生了確信偏誤,由實驗者擇優挑選數據而引起。
密里根油滴實驗是平衡重力與電力,使油滴懸浮於兩片金屬電極之間。並根據已知的電場強度,計算出整顆油滴的總電荷量 | socratic.org
05
全體通過的決議
當今大型機構的許多委員會會議中,人們越來越傾向於認為決議必須全體通過。比如說,一個為應聘者評級或評估關鍵績效指標的委員會通常爭論不休,直到房間里的所有人都達成一致。如果其中一兩位成員不贊同,其餘委員會成員往往要先說服他們,再進入下一項事宜。根據我們研究分析所給出的實用建議是,應該歡迎不同意見。一個明智的委員會應接受異議,如實記錄分歧。分歧紀錄不是負面而是正面的,它證明了出現系統偏差的可能性比較低。
06
「數學不合情理的有效性」
尤金·維格納曾經構造出短語「數學不合情理的有效性」來形容自己有些古怪的感受,認為數學用以描述物理定律時似乎匹配得太過完美。某種程度上,維格納就是在表達數學「好得不真實」。
現實是,現代裝置和儀器不再靠簡潔的解析數學方程式,而是由嵌入模擬軟體工具的經驗式來分析。對一些未來的重大科學問題而言,尤其是在複雜系統領域,我們更多依靠大數據和機器學習,而非數學。
圖 | pixabay
既然我們所知的解析數學並不是解決每種問題都適用的萬能鑰匙,那我們又是為什麼會一度認為數學擁有「不合情理的有效性」呢?這是由於我們閱讀的每篇優秀科學論文都有著優美的數學公式,造成了系統性的確信偏誤。其實還有更多被拒的公式從未被發表,我們也從未得見。我們今日所有的數學已經經歷了擇優挑選。
一個AI
但是當所有人都說你丑的時候,不要僥倖有「一致性悖論」,不存在的!
TAG:煎蛋 |