第一章習題解答
題號 | 答案 |
1 | 意義:「統計學是蒐集、整理、分析所得統計資料,並在不確定的情況下,對分析的結果作推論,解釋說明並且下合理決策的一門科學。」 內容: 一、統計資料 二、統計分析 針對蒐集得來的統計資料加以組織、呈現、分析、解釋,歸納出統計資料的基本特性和重要關係。然後根據分析的結果觀察資料未來的變動趨勢。 |
2 | 統計學分為兩類:統計方法和統計原理。依統計方法可分為敘述統計學和推論統計學,主要內容分述如下: 推論統計學 例如:新上任台北市長想大致瞭解台北市的國民所得水準,因此調查一組具代表性的樣本個體,將這些資料分類、整理,製成統計圖表呈現出來,並且計算統計量數(如平均數、變異數等)作簡單的比較,這些都是敘述統計學的部分。如果根據上述求得的數據推論全台北市的國民所得水準則屬於推論統計學的範圍。 |
3 | (1)常在電視新聞上聽到根據哪一項民調國民黨的候選人支持率有15%、 (2)今天的金曲龍虎榜公佈本週的排行榜第一名是張惠妹、第二名是許如 其它還有每天看到的氣象預測;民眾對交通狀況意向調查等等各式各樣的市場調查都要應用到統計的分析方法。 |
4 | 母體(population) 人們在研究某一現象或問題時,必須針對發生此一現象或問題的對象進行調查研究,調查研究的全體對象(可稱元素)即是所謂的母體。 樣本(sample) 樣本是研究者從母體中抽取部分元素所組成的集合,即全部研究對象集合感興趣的部分集合。 母體參數(parameter) 統計量(statistics) 估計誤差(estimating error) 當我們利用樣本統計量去推論母體參數時,不論用什麼抽樣方式或多精密的測量,樣本統計量與母體參數間總會有差距。這樣的差距我們稱為估計誤差,其又分成兩種類型,一為抽樣誤差(sampling error),另一為非抽樣誤差(nonsampling error)。 *抽樣誤差:指樣本統計量的數值與母體參數值間的差異。
算的錯誤等所引起,由於無法估計其大小,因此我們 通常假定此誤差不存在。 |
5 | 母體:(1) 樣本:(2)、(3) |
6 | 推論統計的目的是希望透過少量的樣本來推估母體的特徵,而普查則是對母體中的全體對象進行調查,因此資料以普查方式收集則推論統計學是不必要的 |
7 | 敘述統計:(1)、(2) 推論統計:(3) |
8 | 一但我們確定要研究的對象母體,且母體是有限的,則了解母體最好的方法,就是對母體內每一個個體加以調查並記錄其特徵,這種調查方式就稱為普查(census)。但如果母體的個數過於龐大,則普查所耗費的人力物力財力將非常龐大,對時間緊迫的人是無法容忍的,所以只能從母體中抽選一部份個體來加以調查,這種調查就稱為抽樣調查。 |
9 | (1)2500名員工;普查 (2)50萬客戶;抽查 |
第二章習題解答
1 | 質的資料:(4)、(5) 量的資料:(1)、(2)、(3);其中(1)、(2)為離散資料,而(3)為連續資料。 | |||||||||||||||||||||||||||||||||
2 | 組中點:上限與下限的中點,即 (1) 12.5的上組限為11,下組限為14,組距=4 (2) 16.5的上組限為15,下組限為18,組距=4 (3) 20.5的上組限為19,下組限為22,組距=4 (4) 24.5的上組限為23,下組限為26,組距=4 (5) 28.5的上組限為27,下組限為30,組距=4 | |||||||||||||||||||||||||||||||||
3 | (1),(2)
(3)直方圖 (4)多邊形圖。 | |||||||||||||||||||||||||||||||||
(5)直方圖。 | ||||||||||||||||||||||||||||||||||
4 | (1)次數分配
(2)直方圖 (3)多邊形圖 | |||||||||||||||||||||||||||||||||
5 | (1)
(2) (3) | |||||||||||||||||||||||||||||||||
6 | (1)
(2)
(3)
(4) | |||||||||||||||||||||||||||||||||
7 | 質的資料又稱屬性資料,常依據其性質的不同或類別的尺度而加以區分,故亦稱類別資料(category data)。 「例」:質的資料如性別、教育程度、職業別、產品的品質等,不能以具體的數值來表示。 量的資料(quantitative data) | |||||||||||||||||||||||||||||||||
8 | 量的資料又稱為屬量資料,其大多依照計量的特性而劃分的,也就是說可以用尺度衡量的方法以數字表示出來。 「例」:量的資料如人的身高、體重、子女數目、銷貨量、利潤額等等。大部分的統計資料屬於數量資料,如經濟成長率、薪資收入、就業人數、消費支出、產品的生產等、這些都可用數值來表示。 | |||||||||||||||||||||||||||||||||
9 | 通常全距、組數、組距會有下面之數學關係: 組距 | |||||||||||||||||||||||||||||||||
10 | 我們將全部的資料量分成若干類,每類稱為一組,則每一組的數目稱為組數。而在每一組的包含範圍中,用這組的最大值減去這組的最小值之差即稱為組距。 | |||||||||||||||||||||||||||||||||
11 | 不連續資料又稱離散資料,是可計數的(countable),具有最小的計數單位。 「例」:養育子女的數目、擲骰子所得到的點數等。 | |||||||||||||||||||||||||||||||||
12 | 連續資料是可以無限制細分的,即在任意兩個數值間可插入無限多個數值。 「例」:如人的身高、體重、時間、速度等。 |
第三章習題解答
1 | (1)平均數 (2)先將上表作排序,如下表 15
18 23 26 32 33 35 40 42 43 52 53 55 55 56 57 60 60 60 62 64 65 65
67 67 69 69 71 72 73 74 74 75 76 77 79 81 81 81 81 82 83 84 86 88
89 91 91 95 96 因全部50項,所以中間兩個數值的平均數為中位數,即第 50/2=25項與50/2+1=26項兩個位置之數值的平均數為中位數。而中位數 Me= (67+ 69)/ 2= 68 (3) 求眾數由上表發現81出現次數最多,即知81為眾數。 (4)先求標準差 利用未分組標準差之公式 變異係數 | ||||||||||||||||||
2 | (1)平均數 =5200/75=69.33 (2)中位數 因全部75項,所以中間數值即為中位數,即第(75+1)/2=38項,由表可知69為中位數。 (3)眾數 由表發現69出現次數最多,即知69為眾數。 (4)
變異係數 (5) 全距R=74-66=8 (6) 標準差
= 1.47 | ||||||||||||||||||
3 | 由題意知: 由標準差公式 所以可知
全班之平均成績 全班成績之標準差 | ||||||||||||||||||
4 | 先將資料由小到大排序 10 25 41
52 55 64 65 75 76 77 78 81 82 85 85 86 88 88 90 92 95 96 97 97 98
115
| ||||||||||||||||||
5 |
(1)
50×0.0668= 3.34,所以約有3個人不及格。 (2)
50×0.0122=0.61,所以沒有人超過90分。 (3)
50×0.35385=17.6925,所以為第18名。 | ||||||||||||||||||
6 |
(2) 總次數n= 60,故中位數位置在第60/2= 30項,而第30項落於第4組(32.25-32.75)。所以利用分組後之中位數公式得: 中位數 (3) 由次數分配表知,眾數組在32.25-32.75這一組中(組次數24為最多),此時利用分組後眾數之公式: 金氏插補法: 克如伯比率法:
皮爾生法: 首先必須先求出此次數分配的平均數及中位數,由(1)可知中位數Me=32.58且利用分組後的求法得出 平均數 Mo= (4)
(5)
| ||||||||||||||||||
7 | 數學及格人數的比例 英文及格人數的比例
| ||||||||||||||||||
8 | |||||||||||||||||||
9 | 設T表可考上的最低分數 T=189.74,220>189.74,故可考上。 | ||||||||||||||||||
10 | |||||||||||||||||||
11 | 全距、四分位差、平均絕對差及標準差都帶有與原始資料相同的單位,這些都是所謂的絕對分散度之衡量統計量,僅能表示一組統計資料的分散情形,但如果要比較兩組或兩組以上單位不同或雖然單位相同但其性質差異甚大的統計資料,單用絕對分散度之衡量統計量不能判斷其分散程度到底哪一個大、哪一個小。這時需要用相對分散度之衡量統計量來作比較。所謂的相對分散度之衡量統計量即絕對分散度之衡量統計量與某一中央趨勢之衡量統計量或其它適當數量之比,常以百分比表示,且它與原來的單位無關。一般最常用的相對分散度之衡量統計量是變異係數,通常以cv表示,變異係數乃標準差與平均數比值的百分數,即: 變異係數(coefficient of variance)
| ||||||||||||||||||
12 | (1) 平均數 *未分組資料的平均數 各個資料數值總和除以資料的項數即平均數。令 *已分組資料的平均數 其中 *未分組資料的中位數 若資料項數為奇數,其中間位置即
或
(3) 眾數 *未分組資料的眾數 在未分組的統計資料中尋找眾數可先依數值大小排列,其中出現次數最多的數值即為眾數;若某一數值在全部統計資料中佔最大比例時,不必將資料排列也可找到眾數。 *已分組資料的眾數 求分組資料之眾數的方法很多,一般最常見的有以下三種計算公式: (1)
金氏(W.I.
King)插補法 (3)皮爾生(K. Pearson)法 若論應用上之差異: 前面介紹的中央趨勢之衡量統計量有平均數、中位數、眾數。這些統計量都各有其不同的優缺點,因此在選用時,必須考量所用的測量尺度及用途。以測量尺度來看:
| ||||||||||||||||||
13 | (1) 全距 全距為測量分散度之最簡單的方法,計算容易、意義明顯。日常生活中用全距的例子很多,例如,每日氣象報告中均可看到最高溫和最低溫;股價指數行情中也有最高價和最低價;尤其工廠品質管制最常應用全距作管制圖。但全距的缺點為易受極端值影響,未能考慮到全部資料的變動情形,很多時候是資料的全距相同,但中間部分數值差異很大,因此用全距來衡量資料分散程度的結果並不可靠,它也會受抽樣以及樣本大小不同的影響,使用時必須考量資料本身的性質。 (2) 四分位差 若將統計資料中數值特別大或特別小的去掉,只剩下中間部分的數值來測定分散度,就可以更正全距的缺點,其中最簡單常用的便是四分位差。四分位差是把資料去掉兩端最大值及最小值各25%的觀察值只剩中間部分50%的觀察值,再求這50%資料的全距。通常先算出第一四分位數和第三四分位數。第三四分位數和第一四分位數的差即所謂的四分位距,通常以符號IQR;而四分位距的一半則為四分位差,通常以符號QD表示 其中,Q1為第一四分位數(First Quartile) Q3為第三四分位數(Third Quartile) (3) 平均絕對離差 平均絕對離差是簡單的分散度之衡量統計量,通常以MAD表示,與全距和四分位差不同的是它將統計資料中每一個數值都考慮在內,受極端值的影響又比較小,所以在樣本數不多時,常用平均絕對離差來測定資料的分散情況。平均絕對離差為一組統計資料各數值與某一中央趨勢之衡量統計量(通常為平均數或中位數)差之絕對值的平均數。由於在計算平均絕對離差時討論的是各數值與某一中央趨勢之衡量統計量的距離,不計正負號,因此牽扯到絕對值的計算使得公式的演算變得較為複雜。 | ||||||||||||||||||
14 | 形狀之衡量統計量是衡量一組資料是否對稱,資料分佈形狀峰度有多高等的問題。最常用的是偏態係數及峰態係數。 (1)
偏態係數
(2)
峰度係數 (一般以CK或ck表示峰度係數) *峰度係數 母體: 樣本: | ||||||||||||||||||
15 | 謝比雪夫定理與經驗法則之比較
*Chebyshev定理只能讓我們得到一個限制,它是多少比例以上或多少比例以下,但它可適用於任何資料分配。 經驗法則可較具體告訴我們約有多少比例的訊息,但它的限制條件便是只適用於常態分配或者近似於常態分配也可以。 | ||||||||||||||||||
16 | (1)若cov(X,
Y)>0,則 (2)
若cov(X,
Y)<0,則 (3)
若cov(X,
Y)=0,則 其中,cov(X,
Y)的值在(-∞,∞)之間,故無法從數值大小判斷其相關程度;相關係數的值在[-1,1]之間,故由 | ||||||||||||||||||
17 |
cov(X,Y) |