106年 高普考 高考三級 統計 迴歸分析 試卷

pdf
420.87 KB
4 頁
MIS
侵權投訴
加載中. ..
PDF
106年公務人員高等考試三級考試試題
代號:21550
全四頁
第一頁
類科
目:迴歸分析
考試時間2小時
※注意:
使用電子計算器,須詳列解答過程。
不必抄題,作答時請將試題題號及答案依照順序寫在試卷上,於本試題上作答者,不予計分。
本科目除專門名詞或數理公式外,應使用本國文字作答。
參考之查表值:F分佈 α=0.05,臨界值 F
0.05
(df1,df2)t
0.05
(28)=1.701t
0.025
(28)=2.048
df1
df2
1 2
28 4.196 3.340
29 4.183 3.328
50 4.034 3.183
52 4.027 3.175
一、請回答下列問題:
1是探討美國在游泳池溺斃(Swimming-pool drownings)的人數和美國核能發電
廠發電Nuclear power plants數量數之間的關係這兩個變數的相關係數為 90.12%
請試述以簡單線性迴歸分析是否具有因果關係或意義?請說明理由。5分)
2005 2006 20082004 2007
2000 2001 2002 2003
1999
1999
700 deaths
600 deaths
500 deaths
s 400 death
Swimming-pool drownings
2009
850 BkWh
800 BkWh
750 BkWh
N
uclear power plants
700 BkWh
2006 2007 2009
2005 2008
2001 2003
2000 2002 2004
N
uclear power plants Swimming-pool drownings
1
一位數據分析師擬研究滷肉飯銷售量受到那些因素所影響。所蒐集的可能解釋變
數有價格、店內坪數、客流量、附近店家數、店內位置數、營業時間、店齡、配
菜種類、選取肉的部位、米的種類等十個可能的解釋變數。該分析師計畫作複迴
歸分析,要選擇重要解釋變數來描述反應變數(滷肉飯銷售量),請試述四種選擇
重要變數的方法。又大數據的時代來臨,我們應用迴歸分析,有時會遇到高維度
解釋變數的情況,解釋變數的個數(p)大到超過於樣本數(n)的情況,在高維
度的解釋變數情況,請試述上述四種選擇重要變數之方法是否仍適用?如果你的
答案為不適用,請說明理由。10 分)
(請接第二頁)
106年公務人員高等考試三級考試試題 代號:21550 全四頁
第二頁
類科
迴歸分析
一位分析師隨機抽取 55 位大學生並蒐集到五個變數。該分析師希望研究身高(Y,英
吋)與受測者左前臂長度(X1,公分)、左腳長度(X2,公分)、頭圍(X3,公分)
和鼻長(X4,公分)之間的關係。該分析師考慮配適下列三個迴歸模型:
模型 1Yiiiiii XXXX
β
β
β
β
β
ε
+++++= 443322110
模型 2Yiiii XX
ε
β
β
β
+++= 22110
模型 3Yiii X
ε
β
β
++= 110
請使用表 1和表 2中部分 R統計軟體輸出之變異數分析表(ANOVAAnalysis of
Variance)報表來回答以下問題:(每小題 10 分,共 30 分)
1 模型 1 ANOVA
ResponseY DF Sum of Mean F value
squares square
X1 1 590.21 590.21 123.8106
X2|X1 1 224.35 224.35 47.0621
X3|X1, X2 1 1.4 1.4 0.294
X4|X1, X2, X3 1 0.43 0.43 0.0896
Error 50 238.35 4.77
2 模型 2 ANOVA
ResponseY DF Sum of Mean F value
squares square
X1 1 590.21 590.21 127.782
X2| X1 1 224.35 224.35 48.572
Error 52 240.18 4.62
假設該分析師採用模型 1。在顯著水準 α=0.05 之下,請檢定 X3X4兩個解釋變數是否
可以從給定模型 1中刪除也就是用 α=0.05 檢定 0
430 ==
Η
β
β
2
R3X,XY,
並試述對立假設
統計量之值、決策法則和結論。並請計算偏相關係數 partial R2
|214 X,X
假設該分析師採用模型 2也就是在模型中僅考慮了兩個解釋變數這兩個解釋變
數是學生的左前臂長度(X1)和左腳長度(X2。該分析師想知道這兩個解釋變數
是否與身高(Y)有線性關係。在顯著水準 α=0.05 之下,請檢定 0
210 ==
Η
β
β
並請試述檢定統計量之值、決策法則和結論。另請計算模型 2的調整的複判定係
R2
adj R2the adjusted R-squared並試述其意義又該分析師要把身高的單位
英吋轉公分(英吋乘以 2.54,試述模型 2adj R2是否改變?
假設該分析師採用模型 3只考慮模型中具有一個解釋變數為學生的左前臂長度
X1。在顯著水準 α=0.05 該分析師想知道一個額外的解釋變數 X2是否在解
釋身高上具有顯著的貢獻。也就是說,該分析師想知道 X2對模型 3的貢獻。請協
助回答此問題並說明對立假設檢定統計量之值決策法則和結論在表 1和表 2
F檢定中,請試述需要做何假設,才能執行這些 F檢定。
(請接第三頁)
106年公務人員高等考試三級考試試題
代號:21550
全四頁
第三頁
類科
目:迴歸分析
(請接第四頁)
三、 在作迴歸分析時,經常會遇到離群值和有影響力觀察值(influential data point)的
問題。請試述何謂離群值和有影響力觀察值。並請分別試述兩種判斷準則偵測迴
51
2A 2B
3A 是另一 估計式
包括第 41 點觀察值 ,虛線估計式
不包括第
值?並請試述這組數據集是否包含任何有 4分)
3A 3B
歸分析中的離群值和有影響力觀察值。(12 分)
2A 是一組數據的散佈圖 2B 提供兩條估計線實線估計式 XY 97.48.2
ˆ+=
括第 51 點觀察值
))50,4(),(( =YX
,虛線估計式
ii
i
X98.
不包括第
5151
i
點觀察值。請試述這組數據集是否包含任何離群值?並請試述這組數據是否包含
任何有影響力觀察值?另請說明理由。(4分)
Y468.3
ˆ+=
組數據的散佈圖,圖 3B 提供兩條估計線,實線
影響力觀察值?另請說明理由。(
ii
4141
41
XY 08.495.6
ˆ+=
ii XY 21.593.1
ˆ+=
))16,10(),(( =YX
點觀察值。請試述這組數據集是否包含任何離群
106年公務人員高等考試三級考試試題 代號:21550 全四頁
第四頁
類科
目:迴歸分析
四、一位數據分析師受冰飲企業老闆的委託,欲知道每日最高溫和該公司冰品銷售是否
有線性關係以作為未來商品促銷的依據他蒐集了每日最高溫X以攝氏為單位)
和冰品銷售(Y,共 30 個樣本點。下列是這些數據的統計量:
30=n9892.28=
X
7065.34=Y2128.360))((
1
==
=
n
iii YYXXSXY
=
== n
iiXXSXX
1
20186.556)(
=
== n
iiYYSYY
1
20085.353)(
在配適 )()|( 1XxxXYE +==
β
α
的簡單線性迴歸方程式下,請利用最小平方法計算
參數估計值(
α
ˆ)與分別之標準誤。並請試述
1
ˆ
β
α
ˆ的共變異數,也就是 Cov(
1
ˆ
β
α
ˆ,
)15 分)
1
ˆ
β
請在試卷上完成下列變異數分析表在顯著水準 α=0.05請協助檢定 0
10 =
Η
β
並請試述檢定統計量之值、決策法則、結論和所需要之假設。10 分)
Source Sum of
Squares DF Mean square F value
Regression 1 4
Error 2 5 6
Total 3
一位分析師擬以
=
=n
iii
ii XX YY
n21
1
11
1
~
β
估計簡單線性迴歸模型 iii XY
ε
β
β
++= 10
斜率
ni ,...,1=
1
β
他可以證明 1
~
β
是一個不偏估計式。請寫出 1
β
的最小平方估計式 在無須推導
1
ˆ
β
1
~
β
的變異
數下,試述相較於最小平方估計式
1
ˆ
β
1
~
β
ˆ
β
何者為最佳之估計式?請詳細敘述所依據
的理由或定理。10 分)
1
收藏 ⬇️ 下載