第十五章習題解答15-
第十五章變異數分析
1.變異數分析中的三個基本假設為何?請詳述之。
解:
ANOVA的基本假設有三個,分別為:
1. 每個反應變數的母體均為常態分配。
2. 每個母體變異數均相同。
3. 來自各母體的隨機樣本互為獨立。
2.何謂變異數分析?為何變異數分析是右尾檢定?試就一因子變異數分析模式加以說明之,並列出變異數分析表。
解:
(a) 因為統計資料常會受到各種因素的影響,而使個別觀測值產生差異,對於這種影響因素所造成之差異與檢定的統計方法稱為變異數分析。
(b) 因為:
E(MSE)=
所以可知對虛無假設及對立假設
不全相等的檢定就相當於對下列兩者作檢定:
:E[MSB]
= E[MSE]
:E[MSB]
> E[MSE]
ANOVA表
變異 來源 | 平方和 (SS) | 自由度 (df) | 均方 (MS) | F值 | |
處理間 | |||||
誤差 | |||||
合計 |
愈大,即MSB愈大於MSE,表示
不相等,故應拒絕虛無假設
。反之,當F值較小時,表示
可能相等,故不能拒絕虛無假設(notreject
),而且由以上的討論可知ANOVA分析是一種F的右尾檢定。
3.若資料表示3片晶片及每片晶片的上、中、下3個位置
的複晶矽層之厚度,則
(a)
試證明,式中
表示第
片晶片的3個厚度平均值。
表示所有晶片厚度的平均值。
(b) 試說明上式等號右邊兩項的意義。
解:
(a)
(b)
表示因晶片的不同而產生的平方和,即為組間平方和SSB。
為組內殘差的平方和SSE。故可將(a)式表示為SST=SSB+SSE。
4. 何謂聯立信賴區間?其與單一的信賴區間有何不同?
解:
聯立信賴區間是指所有區間都對的機率是,換言之各信賴區間的信賴水準變成
。而單一信賴區間是只唯一區間對的機率是
。
5.進行隨機區集設計時,加入區集設計的主要原則為何?
解:
區集設計是指在比較k種處理時,設計者安排相同條件,或條件極為接近的一些個體當成一個區集,且每一個區集的實驗個數均相同,區集設計的主要目的是為了減少實驗的誤差,增加檢定能力。
6.為研究某產品之使用量是否會因地區而產生差異,在甲、乙兩地分別抽查15、18份資料,得樣本資料:公斤,
,
公斤,
。
(a)試求甲、乙兩地區平均數差之90%的信賴區間。
(b) 在顯著水準0.1下兩地區之使用量是否有差異?
(c) 上題(b)之答案是否可由變異數分析得到?如果可以,請以變異數分析進行檢定。
解:
(a)
的信賴區間為:
(b) 因信賴區間不包含0,故表示甲、乙兩地區對某產品的使用量有顯著差異。
(c)
故拒絕,表示兩地區對某產品的使用量有顯著差異。
7.
下表是一份未完成的變異數分析表。它是由研究4種處理,且每個處理均有5個觀測值所得到的,試完成下列的變異數分析表,並且在顯著水準0.1下進行檢定。
變異來源 | 平方和 | 自由度 | 均方 | F值 |
處理 | 30 | |||
誤差 | ||||
總和 | 70 |
解:
變異來源 | 平方和 | 自由度 | 均方 | F值 |
處理 | 30 | 3 | 10 | 4 |
誤差 | 40 | 16 | 2.5 | |
總和 | 70 | 19 |
因為。故拒絕虛無假設,表示此四種處理有顯著差異。
8. 已知下列4組樣本的一些統計量數如下:
母體 | 1 | 2 | 3 | 4 |
20 | 15 | 20 | 10 | |
160 | 150 | 150 | 180 | |
5 | 10 | 10 | 12 |
試列出變異數分析表。
解:
變異來源 | 平方和 | 自由度 | 均方 | F值 |
處理 | 7153.847 | 3 | 2384.616 | 272.90 |
誤差 | 533 | 61 | 8.738 | |
總和 | 7686.8465 | 64 |
9.已知下列3組資料如下:
母體 | 1 | 2 | 3 |
30 | 50 | 40 | |
6 | 10 | 8 | |
3 | 4 | 5 |
若顯著水準為0.01,試檢定三個母體平均數是否有顯著差異?
解:
=30(68.33)
+50(108.33)
+40(88.33)
=306.668
=293+494+395
=478
不全相等。
F=
故拒絕,表示此三個母個體之平均數有顯著差異。
10.對A、B、C、D四種錄影帶做雜音測試,發現每一種雜音量均為隨機變數,且經檢定的結果,可接受每一種雜音音量皆為常態分配,並具有相同的變異數。現在又對錄影帶A、B、C、D分別測試5、5、6、7個,測得雜音量分別如下表所示:
A | B | C | D |
12 | 16 | 12 | 16 |
16 | 20 | 15 | 16 |
10 | 14 | 18 | 15 |
14 | 18 | 15 | 18 |
10 | 16 | 16 | 12 |
15 | 14 | ||
15 |
(a) 試建立變異數分析表。
(b)
利用變異數分析,取顯著水準為0.05,檢定是否不同的錄影帶其雜音會有差異?
(c) 試建立6組聯立信賴區間。
解:
(a)
變異來源 | 平方和 | 自由度 | 均方 | F值 |
處理 | 50.139 | 3 | 16.712 | 3.621 |
誤差 | 87.689 | 19 | 4.615 | |
總和 | 137.826 | 22 |
(b)
F=
故表示不同的錄音帶對雜音有顯著影響。
(c)
因為,查表可知
,則可得6個聯立信賴區間如下:
的信賴區間為:
=
(-8.5640,-0.2360)
的信賴區間為:
=
(-6.7563,1.2163)
的信賴區間為:
=
(-6.5945,1.1145)
的信賴區間為:
=
(-2.3563,5.6163)
的信賴區間為:
=
(-2.1945,5.5145)
的信賴區間為:
=
(-3.6315,3.6915)
11.廣告公司為比較四種廣告方法對促銷香水的效果,於是選擇了
20個類似的銷售區,以隨機方式各選其中五區,分別以四種不同的廣告方法促銷,經二個星期後記錄其產品的銷售量,得資料如下:
廣告方法 | A | B | C | D | E |
電視(1) | 52 | 48 | 38 | 42 | 46 |
報紙(2) | 36 | 40 | 36 | 38 | 34 |
網路(3) | 32 | 34 | 30 | 36 | 32 |
雜誌(4) | 48 | 44 | 40 | 42 | 40 |
(a) 試建立變異數分析表。
(b) 在顯著水準α=0.05下檢定四種廣告手法的平均銷售量是否相同?
(c)
求(電視)的95%信賴區間。
(d)
求的95%單一信賴區間。
(e) 求的95%聯立信賴區間。
解:
(a)
=5[(45.239.4)2+(36.839.4)2+(32.839.4)2+(42.839.4)2
=477.6
SSE=SST SSB =680.8 477.6
=203.2
變異來源 | 平方和 | 自由度 | 均方 | F值 |
組間 | 477.6 | 3 | MSB=159.2 | 12.535 |
誤差 | 203.2 | 16 | MSE=12.7 | |
總和 | 680.8 | 19 |
(b)
不全相等
F=
故拒絕虛無假設,表示四種廣告手法的平均銷量不同。
的信賴區間為:
=
(5.816,18.984)
因為信賴區間不包含零,故表示電視與網路兩種方法的銷售量有顯著差異。
(c)
(d)
的95﹪單一信賴區間為
或
(e),
的95%聯立信賴區間為:
12. 某一研究公司欲檢定三種品牌汽油每加侖行哩數的特性,由於不同汽油在不同品牌的汽車上會有不同的特性,故選擇同類型的五種品牌的汽車為區集(block),亦即每種品牌的汽車分別以每種汽油測試(每次測試一種汽油),得實驗結果如下:
汽車
汽油 | A | B | C | D | E |
1 | 18 | 22 | 32 | 20 | 22 |
2 | 20 | 28 | 30 | 26 | 24 |
3 | 20 | 26 | 34 | 26 | 22 |
(a) 在顯著水準α=0.05下,三種品牌的汽油每加侖行哩數之特性是否會有顯著的差異?
(b) 承(a),若改以完全隨機化設計(completely randomized
design)之變異數分析來分析,則應如何分析?並列出變異數分析表。且試比較(a)、(b)二種結果,並說明區集設計的需要性為何?
解:
(a)
=26.1335
=261.129
SSE=SST SSTR SSB =30.0675
F=
故表示此三種品牌的汽油之特性無顯著差異。
(b)SST=317.33
SSTR=26.1335
SSE=SSTSSTR =291.1965
F=
=3.8853
故表示此三種品牌的汽油間無顯著差異,比較(a)(b)兩結果可知區集的影響很大,區集設計主要的功能在降低來解釋變異,使檢定更有效率。
13.現有三個處理、四個區集之隨機化區集設計之資料如下:
變異來源 | 平方和 |
處理 | 80 |
區集 | 50 |
誤差 | |
總合 | 150 |
(a) 試建立變異數分析表。
(b) 在顯著水準為0.05之下,檢定三個處理間是否有顯著差異。
解:
(a)
變異來源 | 平方和 | 自由度 | 均方 | F值 |
處理 | 80 | 2 | 40 | 12.01 |
區集 | 50 | 3 | 16.67 | 5.01 |
誤差 | 20 | 6 | 3.33 | |
總和 | 150 | 11 |
(b)
F=
故表示三個處理間有顯著差異。
14. 隨機化區集設計和二因子實驗設計的基本假設有何不同?在進行變異數分析時,兩者的檢定對象有何不同?
解:
隨機化區集設計包含處理效應與區集效應,而二因子實驗設計包括二個因子。在進行檢定時,隨機化區集設計是檢定處理這因素是否會影響觀測值的特徵,而二因子實驗設計則是同時檢定此二種因子是否會個別影響個體的特徵及其交互作用是否顯著。
15.
在農業試驗中,常見改良埸利用不同的方法來試驗蔬菜施用化學肥料與有機肥料的差異性。現在同時在四塊土地上實驗,其產量以下表表示,試問在的顯著水準0.05下,兩種生產方式的平均產量是否相同?
土地
方法 | A | B | C | D |
化學肥料 | 8 | 4 | 6 | 4 |
有機肥料 | 8 | 6 | 10 | 6 |
解:
SST==32
SSTR=4(5.56.5)2+4(7.56.5)2
=8
=18
SSE=SST SSTR SSBL=6
F=,表示施用化學或有機肥料對蔬菜產量有顯著差異。
16. 某研究單位想瞭解小麥產量的因素,於是收集了4種小麥品種及3種肥料相對於小麥的平均產量,並以這些數據進行變異數分析,但所得的部份數據卻不甚遺失。
變異來源 | 平均和 | 自由度 | 均方 |
品種 | 140 | ||
肥料 | 30 | ||
誤差 | |||
總合 | 270 | 11 |
(a) 試問以上的數據是否可說明採用何種變異數分析方法,且此方法假設條件為何?
(b)
在顯著水準0.05下,試檢定小麥品種與肥料種類對小麥品種產量有無影響?
(c) 求出共同變異數的95%信賴區間。
(d) 在完全不增加因子及因子水準數的條件下,亦即保持4種小麥品種及3種肥料種類,試問有何方法可增加模型的檢定能力。
解:
(a)採用二因子變異數分析。其基本假設為:
1. 每個反應變數的母體均為常態分配。
2. 每個母體變異數均相同。
3. 來自各母體的隨機樣本互為獨立。
(b)
變異來源 | 平方和 | 自由度 | 均方 | F值 |
品種(A) | 140 | 3 | 46.667 | 2.8 |
肥料(B) | 30 | 2 | 15 | 0.9 |
誤差 | 100 | 6 | 16.667 | |
總和 | 270 | 11 |
在顯著水準0.05下,小麥品種與肥料種類對小麥產量均無顯著的影響。
(c)
共同變異數的95﹪信賴區間為
查表六得知,
得出6.92<<80.84
。
(d)使用二因子重複實驗。
17. 某工廠人事部想了解該公司工人的生產力與每日工時、工資兩因子的關係,於是隨機選出18個工人,選取工時7、8、9小時三個水準,每日工資有1000、1200、1600元/天三個水準,共可組成9種不同的處理,並將18個工人隨機指派至9個處理各2人,量測其生產力後,所得資料如下:
工時 (因子A) | 工資(因子B) | ||
1000 | 1200 | 1600 | |
7 | 90,88 | 100,96 | 124,120 |
8 | 90,92 | 106,100 | 130,128 |
9 | 68,72 | 96,90 | 116,108 |
在0.05的顯著水準下,試檢定:
(a) 不同的工時對生產力之影響是否有差異?
(b) 不同的工資對生產力之影響是否有差異?
(c) 工時與工資之間是否有交互作用存在?
解:
(a)工時對生產力:
不全相等
SST=
5353
=812.36
=4326.48
SSE=
=188164295713=98
SSAB=SSTSSASSBSSE=116.16
,故工時對生產力有顯著的影響。
(b)工資對生產力:
不全相等
,故工資對生產力有顯著的影響。
(c)工時與工資間的交互作用:
不全相等
,故工時與工資間的交互作用並不顯著。
18. 台北市政府由三個社區隨機各抽樣出5戶家庭,調查每戶之年平均所得,將資料整理後如下:(單位:萬元)
社區 | 平均所得 | 所得標準差 |
A | 96 | 5.2 |
B | 82 | 4.8 |
C | 106 | 6.4 |
(a)
在顯著水準0.05下試問此三個社區的所得是否有差異?
(b) 試求A社區平均所得的95%之信賴區間。
(c) 試求三組社區間之95%聯立信賴區間。
解:(a)
=364.16
故此三社區的平均所得有顯著差異。
(b)
(c)
,且自由度為12,
,
查表可知
則可得3個聯立信賴區間如下:
=
=
=
19. 某公司有興趣研究公司員工的學歷不同以及所屬部門的不同對工作滿意程度是否有影響,於是進行問卷調查,滿意程度由0至100,且分數愈高代表滿意程度愈高,得資料如下:
學歷 | 部門 | ||
行政 | 工廠 | 管理 | |
專科 | 70,74 | 78,72 | 68,74 |
大學 | 74,76 | 80,76 | 88,86 |
碩士 | 84,82 | 72,70 | 78,82 |
(a)
在顯著水準0.05下試檢定二個因子的影響顯著與否?
(b) 在顯著水準0.05下試問二因子間是否存在交互作用?
解:(a)
變異來源 | 平方和 | 自由度 | 均方 | F值 |
部門(A) | 65.778 | 2 | 32.889 | 4.323 |
學歷(B) | 172.444 | 2 | 86.222 | 11.411 |
(A) | 263.556 | 4 | 65.889 | 8.720 |
誤差 | 68 | 9 | 7.556 | |
總和 | 569.778 | 17 |
故表示在顯著水準0.05下,部門與學歷對工作滿意度均有顯著的影響。
(b)
故表示二因子的交互作用有顯著的影響。