
可以使用電子計算器。
不必抄題,作答時請將試題題號及答案依照順序寫在試卷上,於本試題上作答者,不予計分。
、二、三、四、五及圖一。
一、考慮簡單線性迴歸模型如下:
(1)
若解釋變數 X的值替代為 Z=aX+b,a≠0且b為常數,則模型(1)改寫為:
(2)
請比較
與
、
與
的關係。(10 分)
(1)與模型(2)的判定係數是否改變?(回答是或否即可)(2分)
二、若反應變數為Y,解釋變數為
,j=1,2,..,p,及 n個觀測值。考慮線性迴歸模型如下:
iippiii XXXY
22110
, i=1,2,…,n (3)
其中
為均數是 0,變異數是
的隨機誤差項。若將模型(3)以向量及矩陣方式
表達如下:
(4)
請分別定義Y、X、β及ε之向量及矩陣之表達式,並標示其行與列的大小。(8分)
試求模型(4)中,β的最小平方估計式。(10 分)
最小平方估計式為不偏的。(5分)
若欲求得 β的最大概似估計式,需對誤差 ε有如何的假設?(2分)
三、表一為民國 101 年縣市有關教育的資料(最後兩列分別為各變數值的加總與平方後
之加總),圖一為其對應之兩兩變數散布圖矩陣(Scatter matrix),表二為這些變
數之變異共變異矩陣(Variance-covariance matrix)。若考慮
及
放入模型中,
表三為其估計結果。表四為僅考慮
放入模型中的估計結果。
以題二中迴歸模型(4)的表達方式,表五為僅考慮
在模型中
與
的結果(上標 T代表矩陣的轉置)。
請回答下列問題:
在Y與
的散布圖中,可看到一個明顯的離群值(Outlier),請說明為那一個縣
市?(2分)
請計算所有變數之兩兩變數間的相關係數矩陣(Correlation matrix)。(10 分)
(請接第二頁)

若將題 中所發現的離群值排除後,再計算 Y與
的相關係數。另外,若將該離
群值排除,已知不會影響
及
的相關係數。請建議後續統計分析(包含迴歸
分析)該如何處理此一離群值。(6分)
請說明表三中三個「t statistic」的意義,及其值與所對應之 p value 所代表之結論。
(6分)
請說明表三中「Residual standard error」的意義。(5分)
請說明表三中「F-statistic」的意義,及其值與所對應之 p value 所代表之結論。
(5分)
請比較題 及題 的結論是否一致?無論一致與否,皆請說明為何能有這樣的結
果。(5分)
表三與表四中所得到
的迴歸係數估計皆為正的,是否可說明「國中生視力不
良率愈高,大專以上學歷所占比例愈高;高視力不良率可提升國民的教育程度,
因此視力不良率很高不是一件不好的事。」請評論引號中的話。(5分)
請說明為何表四的「Multiple R-squared」比表三的值小,但表四的「Adjusted
R-squared」卻比表三的值大。(5分)
僅考慮
在模型中的簡單線性迴歸模型,請計算其截距與斜率的估計值。(6分)
若考慮下列三個模型:
那一個模型為最適模型?請寫出理由及所根據的準則。(8分)
(請接第三頁)

表三
Residual standard error: 8.048 on 16 degrees of freedom
Multiple R-squared: 0.4683, Adjusted R-squared: 0.4018
F-statistic: 7.046 on 2 and 16 DF, p-value: 0.006388
表四
Residual standard error: 7.861 on 17 degrees of freedom
Multiple R-squared: 0.461, Adjusted R-squared: 0.4293
F-statistic: 14.54 on 1 and 17 DF, p-value: 0.00139
表五
= (649.1 31209.5)
(請接第五頁)