小白學統計兩樣本估計和假設檢驗基礎
基礎準備
估計和假設檢驗根據樣本數的不同,分為:單樣本估計和假設檢驗;兩樣本估計和假設檢驗;多樣本估計和假設檢驗。
前面討論了單樣本參數推斷性統計:總體參數的估計和參數的假設檢驗。
通過前面的學習可以發現,推斷性統計的基礎是樣本的抽樣分布。不同的總體分布情況,總體均值、方差和標準差的情況,樣本容量的大小適用不同的抽樣分布(統計量),然後才能得到準確或近似的總體參數的區間估計和假設檢驗結果。單樣本估計和假設檢驗如此,兩樣本和多樣本估計和假設檢驗也是如此。
兩樣本估計和假設檢驗的作用和統計量
單樣本估計和假設檢驗是用單個樣本的參數來估計總體的參數,用單個樣本的參數對總體參數進行檢驗。那麼兩樣本估計和假設檢驗的作用是什麼呢?作用就是通過從兩個總體中抽取樣本,然後用它們估計和檢驗兩個總體同個類型未知參數的差別(關係)。
為了達成上面的目的,需要選取合適的統計量。對於兩總體均值的差別,通過統計量兩總體均值差(μ1-μ2)來考量;對於兩總體方差的差別,通過方差比考量。
兩樣本類型
兩個樣本根據抽樣類型的不同可以分為:獨立樣本和成對樣本。獨立樣本:若從一個樣本中選取的觀測值,無論怎樣都不會影響從另一個樣本中選取的觀測值概率,則稱樣本為獨立樣本;成對樣本:若從一個樣本中選取的觀測值,以某種方式決定了另一個樣本中選取的觀測值,則稱樣本為成對樣本或配對樣本。
例如:某種新型眼藥水的檢驗問題,廠家聲稱它比傳統的眼藥水見效快,檢驗這個說法可以用獨立樣本或成對樣本。在獨立樣本情況中,隨機選取兩組不同的測試者,其中一組用傳統眼藥水,另一組用新型眼藥水;在成對樣本情況中,只選一組測試者,並讓每個人左眼使用傳統麻醉劑,有眼使用新型麻醉劑。
通常獨立樣本是唯一選擇,因為很多時候兩個樣本都是隨機確定的,所以獨立樣本是唯一可能的情況。而成對樣本能夠較好的控制外部變數,例如兩種藥水試驗,將兩種藥水用於同一人可以控制樣本間關於個體在年齡、健康狀況或其他可能影響眼藥水反映的外部變數間的隨機差別;此外成對樣本在兩樣本估計和假設檢驗問題上的置信區間更精確,檢驗功效更強(見後面推導)。
均值差兩總體均值差的最優估計
樣本均值抽樣分布的均值是總體均值的最優無偏估計,可以擴展到兩樣本情形:來自兩個總體的樣本均值抽樣分布的均值差是兩個總體均值差的最優無偏估計,任何特定的兩樣本均值差是兩總體均值差的一個點估計。
均值差的理論抽樣分布
一個離散的或連續的概率分布,若它對兩樣本統計量:均值差的所有可能值指定了概率或密度,則稱這個概率分布為均值差的理論抽樣分布。該抽樣分布有以下結論:
通過均值差的抽樣分布(正態分布或t分布)可以把樣本均值差和總體均值差聯繫起來,從而進行兩總體均值差的估計和假設檢驗,如下圖所示:
均值差的置信區間和假設檢驗類型
已知條件不同,估計和假設檢驗的方法也不同,有以下幾種類型:
均值差的置信區間:標準差已知的正態分布總體的獨立樣本;
均值差的假設檢驗:標準差已知的正態分布總體的獨立樣本;
均值差的置信區間:標準差未知,但假定相等的正態分布總體的獨立小樣本(小於30)
均值差的假設檢驗:標準差未知,但假定相等的正態分布總體的獨立小樣本(小於30)
均值差的置信區間:標準差未知的任何總體分布的獨立大樣本(大於等於30)
均值差的假設檢驗:標準差未知的任何總體分布的獨立大樣本(大於等於30)
均值差的置信區間:成對樣本
均值差的假設檢驗:成對樣本
方差比兩總體方差比的最優估計
比較總體方差不能和總體均值一樣,用方差的差來進行統計推斷,而應該用方差比。由於樣本抽樣分布的方差是總體方差的最優估計量,所以兩樣本抽樣分布的方差比也是兩總體方差比的最優估計量,任何特定的樣本方差比是總體方差比的一個點估計。
為了對兩總體方差比進行估計和假設檢驗,需要將特定的點估計值與總體方差比聯繫起來的統計量(抽樣分布),這時可以使用F統計量。
F統計量和F分布
F分布不是一個分布,而是一個連續概率分布族,每個正整數值自由度的組合都是一個F分布。因為F統計量是兩個獨立的卡方統計量被本身各自的自由度相除後的比,所以F分布很想卡方分布,而且和卡方分布隨著自由度增加越來越對稱一樣,F分布也隨著兩個自由度的增加越來越對稱,如下圖所示:
F分布的臨界值
當樣本來自正態分布時,它有自由度為n-1的卡方分布:
同樣的,當兩個樣本都來自正態分布時,有由兩個自由度影響的F分布:
如下面曲線所示:
方差比的置信區間和假設檢驗類型
由於卡方分布的前提是正態分布總體,所以F分布也有正態分布總體的假定條件:
方差比的置信區間:參數未知的正態分布總體的獨立樣本;
方差比的假設檢驗:參數未知的正態分布總體的獨立樣本;
不同類型均值差和方差比的估計和假設檢驗將會在下篇中用具體範例進行應用說明。
※只能做火箭上天旅遊?SpaceVR要用簡單的方式為用戶提供新式「太空旅遊」
※用生理信號判斷心理壓力,心潮減壓提供科學標準化解決方案
※科技力量能否重振美國經濟?
※SpaceX火箭爆炸發生在最糟糕的時機
※打造高大上的Canvas粒子動畫
TAG:推酷 |
※非參數估計的根基,核密度估計大陳述
※超越喬布斯的節奏?這個建築估計會讓蘋果設計師都汗顏
※這個哪個國家設計師的奇葩設計,腦子估計進水了吧
※這樣健身估計效果會好一點
※數字陣列和軟體化雷達->一體化->信號檢測與估計->雷達系統
※全球最坑爹的奇葩無腦設計,這些設計師估計要失業了!
※IV和GMM相關估計步驟,內生性、異方差性等檢驗方法
※如何對慢性淋巴細胞性白血病進行準確的預後估計
※新方法可估計泳池中尿量以助監控水質
※山寨貨的設計師,估計會操作PS就可以上崗了!
※兒童支氣管肺炎的預防、識別和估計知識
※這樣的香菇燉肉 估計能吃好幾碗白飯咯
※整容整這樣,估計是瘋了
※國產手機集體「撞臉」,保持自主設計的估計也就這一家了!
※他們兩個人估計真的會結婚
※秀場上的雷人奇葩造型,設計師估計會被模特打死!
※黃子韜節目中大膽透露解約內幕 吳亦凡、鹿晗估計也是這樣
※這些公共設施誰用誰尷尬,設計師要站出來估計會被吐口水!
※鐵觀音這樣子用 估計美食館就要倒閉了