以單樣本t檢驗為例的各種假設檢驗概述
2022-01-04由 程式設計小寶 發表于 漁業
t檢驗怎麼看是否顯著性
統計學的目的是根據樣本中包含的資訊對一個種群進行推斷。用來描述種群特徵的數值方法稱為引數。總體引數為:
μ:平均數
M:中位數
σ:標準偏差
π:比例
大多數推論的問題都可以被定義為一個種群的以上引數之一。作出推論的方法可分為兩類:
估計總體引數的值
測試關於引數值的假設
有許多測試可用於測試假設 - 但我們何時使用哪種測試?這取決於我們擁有什麼資訊,以及要測試的假設。下面的流程圖提供了各種假設檢驗的摘要以及何時應該使用它們。
在本文中,我們將更詳細地介紹單樣本t檢驗。
單樣本t檢驗
單樣本T檢驗,主要用於檢驗單個變數的均值與指定的檢驗值之間是否存在顯著性差異,再者,樣本均值與總體均值之間的差異顯著性檢驗,也屬於單樣本T檢驗。
假設
雙尾單樣本t檢驗的零假設和備擇假設為:
零假設:樣本均值等於總體均值
備擇假設:樣本均值不等於該總體均值
同樣,我們可以對右尾檢驗和左尾檢驗提出假設。零假設和備擇假設可歸納如下:
測試統計
可以使用以下公式計算單樣本t檢驗的檢驗統計量:
其中,
計算得到的t值與t分佈表中自由度df = n-1的臨界t值進行比較。如果計算出的t值>臨界t值,我們拒絕零假設。
例
在一項青光眼研究中,從21名老年受試者樣本中記錄了下列眼壓值。根據這些資料,我們能否得出種群的平均眼壓與14mm Hg不同的結論?
第1步:測試方法
我們需要使用的測試是單樣本t檢驗方法(假設檢驗均值是t檢驗,因為我們不知道總體標準差,所以需要用樣本標準差s來估計)。
第2步:假設
列出你的測試是有效的所有假設。即使假設沒有得到滿足,我們應該評論這將如何影響我們的結果。
因變數必須是連續的。
觀察結果彼此獨立。
因變數應近似正態分佈。
因變數不應包含任何異常值。
第3步:假設
零假設描述了關於總體均值的宣告。因此,零假設表明眼壓的總體平均值為14 mm Hg,而備擇假設指出眼壓的總體平均值與14 mm Hg不同。它可以在數學上表述如下:
第4步:計算檢驗統計量
ȳ=樣本均值= 15。623
s =樣本標準差= 3。382
n = 21
μ= 14
我們得到,t = 2。199
在這種情況下(雙尾),p值是t分佈兩端的面積。
步驟5:確定p值並與顯著性水平進行比較
在計算了測試統計量之後,現在我們可以計算p值(使用t-table)。t統計量的對應p值為0。0398。
那麼,p值是多少呢?零假設成立的前提下,觀察樣本結果或更極端結果的機率。如果這個機率很小,我們可能會拒絕零假設。
在我們的例子中,p值是觀察到單樣本均值為15。623 mm Hg的機率,或者更極端的值,假設實際平均壓力為14mm Hg。
如果p值= 0。0398,小於0。05(我們選擇的顯著性水平),我們拒絕零假設。有足夠的樣本證據可以得出結論,真正的平均眼壓與14 mm Hg不同。
我們可以使用scipy模組在Python中實現單樣本t檢驗。
#import librariesimport pandas as pdfrom scipy import statsimport osos。chdir(‘C:\\Users\\rohan\\Documents\\Analytics\\Data’)#import file and apply one sample t testa = pd。read_excel(‘onesamplet。xlsx’)stats。ttest_1samp(a,14)
輸出: