sta final Flashcards
標準誤 standard error
標準誤(SE):指樣本平均值抽樣分配的標準差,公式為(σx =σ/ √n) (1)。可用來表示抽樣分配各統計數的分散情形、抽樣誤差。標準誤越小代表離散程度越小、數值越集中、抽樣誤差越小(1)。易受樣本數影響,當樣本數越大,分配會越集中(1)。
e.g. 母群平均值為50、標準差為10,反覆無限次抽取25個樣本,則該抽樣分配之標準差為10√25 = 2。(2)
1.何謂假設考驗?進行假設考驗時應有那些步驟?試以假設考驗的步驟逐一解釋,每一個步驟的意義。(12分)
假設考驗:(7)
為推論統計的一種(1)。將研究假設以數量或統計詞表示成統計假設(即虛無假設H0、對立假設H1),針對假設建構適當的抽樣分配(2),並收集資料檢視樣本在抽樣分配的位置、判斷是否落入拒絕區(2),以檢視H0,H1何者被支持或保留的歷程(2)。
假設考驗步驟:每個步驟1分,不完整斟酌扣0.5分,扣完為止
(1) 針對變項間的預設的關係建立研究假設以及統計假設(H0、H1)。
(2) 選擇抽樣分配及考驗方法(e.g. Z、t、F、X2 test)。
(3) 決定顯著水準(α level),並依照假設決定考驗方式為單尾或雙尾。
(4) 計算統計考驗值(e.g. Zobs)或查表取得p value。
(5) 比較考驗值與決策值(e.g. Zobs、Zcri),或p value與α值,以做出決策,並解釋結果。
level of significance顯著水準
研究者在Ho為真的抽樣分配中,設定一定比率為拒絶Ho機率,此比率即為顯著水準,以α來表示,亦為Ho為真時,錯誤拒絶Ho的機率,即第一類錯誤的機率,常用的顯著水準包含.05、.01、.001,將樣本在抽樣分配落點的累積機率p值與 α 做比較,p ≤ α 即可拒絕H0,接受H1。
舉例:某研究者對於「女生的語文能力優於男生」此議題感興趣,因此根據「女生的語文能力優於男生」的研究假設,對樣本進行假設考驗,以檢視此說法的正確性。設男生的平均語文成績為 μ1,女生的平均語文成績為 μ2,則 H0:μ1 ≧ μ2;H1 = μ1 < μ2。平均值抽樣分配呈常態分配,使用Z分配檢驗。 設α=.05,即當樣本點落在平均值抽樣分配-1.645Z以下的區域時,可拒絶Ho,此機率發生機率為0.05。
p-value
指在H0為真的抽樣分配中,單側檢定時,為樣本在分配中到最近端點的累積機率,雙側檢定時,則為樣本累積機率的二倍。利用p-value與α值的比較可以顯示出樣本是否落入拒絶區,若p≦α表示拒絶H0,接受H1。
舉例:某研究者對於「女生的語文能力優於男生」此議題感興趣,因此根據「女生的語文能力優於男生」的研究假設,對樣本進行假設考驗,以檢視此說法的正確性。設女生的平均語文成績為 μ1,男生的平均語文成績為 μ2,則 H0:μ1 > μ2;H1 = μ1 ≤ μ2。平均值抽樣分配呈常態分配,使用Z分配檢驗。 若樣本在抽樣分配的累積機率p=.03,而α=.05時,則樣本點落入拒絶區,拒絕H0,接受H1,即在.05顯著水準下,接受女生語文能力優於男生的假設。
Statistical hypothesis統計假設
將研究假設用數量或是統計學符號來表示。在統計假設檢定方法裡,我們設定兩個互斥的假設,然後根據樣本與統計方法選擇其一。兩個互斥假設定義如下:
(1)虛無假設(null hypothesis)是我們要質疑、否定的假設。常用符號H0表示。
(2)對立假設(alternative hypothesis)是我們要建立、肯定的假設。常用符號H1表示。
舉例:
研究者想知道戴眼鏡的人是否比較聰明
μ1=戴眼鏡的魏氏智力測驗分數
μ2=沒戴眼鏡的魏氏智力測驗分數
H0:μ1 ≦ μ2
H1:μ1 > μ2
中央極限定理
從母群中重複抽取個數為n的樣本,當n足夠大,樣本平均值分配便會接近常態分配,且樣本平均值的平均數為u,標準差是(σx =σ/ √n)
Distribution of sample means
以取後放回的方式,從母群中隨機抽樣本數為n的所有可能樣本,計算每樣本的平均值,所有樣本所形成的分配就是平均值抽樣分配,有以下特點(1)集中趨勢為 um,分散趨勢是σm (2平均值抽樣分配的平均值等於母群平均值 (3)抽樣分配標準差與母群標準差的關係是(σx =σ/ √n)
Statistical hypothesis
將研究假設用數量或是統計學符號來表示。在統計假設檢定方法裡,我們設定兩個互斥的假設,然後根據樣本與統計方法選擇其一。兩個互斥假設定義如下:
(1)虛無假設(null hypothesis)是我們要質疑、否定的假設。常用符號H0表示。
(2)對立假設(alternative hypothesis)是我們要建立、肯定的假設。常用符號H1表示。
統計考驗力power
解釋:指在自變項真的有效時,實驗結果允許我們拒絕虛無假設的機 率。由於考驗力是一種機率,它的值可以在 0 和 1 之間變動,考驗力 越高,實驗偵測到自變項真實效果的敏銳度就越高。對於考驗力的整 理:
(1) 考驗力(1-β)越高,型二錯誤(β)會降低。 (2) 考驗力會隨著N改變而變化,若N增加,就能增加考驗力。 (3) 考驗力隨著自變項的實際效果而變化。效果(Preal)較大的實驗比效 果較小的實驗更具有考驗力。 (4) 考驗力隨著α的大小而變化,若α越嚴苛,考驗力就越低。 (5) 從雙側考驗變成單側考驗也能增加考驗力。
effect size 效果量
解釋:在推論統計中,單母數平均值差檢定中,假設考驗是以抽樣分 配為檢驗的分配,該分配受到樣本數的影響,而有不同的標準誤,樣 本數大時,標準誤小,樣本平均值容易落入拒絶區,而達顯著,但實 際樣本平均值與母群平均值的差距可能沒有實質的意義,因此排除樣 本大小的影響,以樣本平均值與母群平均值的差異量,標準化後來表 示真正的效果,即為一種效果量。換句話說,如果獨變項真的有一定 的效果,效果量越大,表示測驗得分的平均數差距愈大,統計考驗力 相對地提高。Cohen 建議此效果量 ES 達 0.8 為大效果量、0.5 為中效果 量、小於 0.2 為小效果量。
舉例:已知五年級學生的數學平均成績為 75 分,標準差為 5。若某個 老師想知道 PBL 教學是否能提升五年級學生的數學程度,因此選擇某 個班級進行實驗,結果顯示,在學生嘗試 PBL 教學後,他們的數學成 績平均為 78 分,經過 Z 檢定後,結果達顯著。計算其效果量為(78-75)/5= 0.6,因此可以說 PBL 教學的效果量為 0.6,有中等以上的效果 量。
t distribution
解釋:t分配可被應用於當母群標準差未知時,進行平均值差異檢定 時之抽樣分配,其t值為(樣本平均數-母體平均數)/估計標準誤 =(M-μ)/SM(0.5 分) 。t 分配的特性: (每個 0.5 分) (1) 單峰對稱分配。 (2) 平均值為 0,標準差大於 1。 (3) 隨自由度而改變,自由度越大標準差越小。當自由度大於 30 以 上,標準差趨近於 1,分配也越趨近於常態分配。 (4) 分配兩端無限延伸,不與橫軸相交。 (5) 為連續變項之分配,因此以面積為機率值。
confidence interval
解釋:利用抽樣分配來推估母數可能落在某段範圍的發生機率,這段範圍稱為信賴區間,而發生機率稱為信賴水準 。95% 的信賴區間是指一個區間包含母群體數值的機率是 0.95。 信賴區間公式:x ̄ obt-sx̅ t0.025≦μ≦x ̄ obt+sx̅ t0.025 包含母體的信心就越大,區間越廣 ,如 95%信心水準的區間大 於 90%的信心水準。 舉例:假設研究者對於輔大臨心系學生的 IQ 相當感興趣,他從學生當 中,抽取一個 N=20 的隨機樣本。每位學生都進行 IQ 測驗,結果顯示
平均數是 135,樣本標準差是 8。在 0.95 的信心水準下,輔大臨心系 學生的 IQ 分數信賴區間為 131.26≦μ≦138.74。(sx̅ =1.789, t0.025(19)= 2.093)
estimated d
解釋:當母群的標準差未知 ,使用 t 分配為抽樣分配時,Cohen’s d 效果量的計算中母群標準差以樣本的標準差來估計 ,此時效果 量即稱為估計 d, 估計 d= (x ̅−μ)/ ŝ ,而當估計 d=1 時代表效果相當於一 個標準差。
舉例:一群參與者在睡前使用螢幕測量出的警覺程度分數為 46,一般 分數為 50,樣本標準差為 4.50,得出估計 d= 46−50 4.50 =0.89,為大效果 量。
r 2
解釋變異百分比
在單樣本的平均值檢定中,當虛無假設為真時,μnull為母群的平均,以此計算 SSnull,為無效果下的變異數量,而若以樣本平均值為對立假設母群的平均值,以此計算的 SSreal,為有效果下的變異量, r 2 =(SSnull-SSreal)/SSnull,即效果可以解釋變異的百分比(2 分) 。利用 t 檢定值,可推得 r 2 =t 2 /(t 2 +df) (1 分) 。
舉例:若 8 位自閉症兒童的臉孔表情辨識力與一般兒童有顯著差異, t(8)=3.5,p<.05,則 r 2 =3.5 2 /(3.5 2 +8)=60.49%,屬於大效果量,即以自閉症 兒童的平均推估此類兒童的臉孔表情辨識力,可以降低以一般兒童平 均值推估變異的 60.49%,顯示出自閉症兒童與一般兒童的差異。