
108
年公務人員特種考試警察人員、一般警察人員考試及
108
年特種考試交通事業鐵路人員、退除役軍人轉任公務人員考試試題
 
考 試 別:一般警察人員考試 
等 別:二等考試 
類 科 別:刑事警察人員犯罪分析組 
科 目:資料探勘技術(包括資料庫管理與運用、線上交易處理【OLTP】、資料倉
儲【Data Warehouse】、資料探勘【Data Mining】) 
考試時間:2小時 座號:           
※注意: 
禁止使用電子計算器。 
不必抄題,作答時請將試題題號及答案依照順序寫在試卷上,於本試題上作答者,不予計分。 
本科目除專門名詞或數理公式外,應使用本國文字作答。
 
 
代號:20230 
頁次:2
-
1 
一、假設關聯資料庫的表格 R(A,B,C,D,E,F)有六個屬性 A,B,C,D,E,F,各
屬性均無多值(Multi-Value)現象,其功能相依(Functional Dependency)
有下列兩條: 
FD1:{A,B} → {C,D,E,F} 
FD2:C → B 
請以屬性封閉性(Closure)的概念,找出 R的所有候選鍵(Candidate 
Key)(6分) 
請證明 R不滿足 Boyce-Codd 正規化(BCNF)。(3分) 
請試圖將 R分割,並先找出你分割出來每一表格的所有候選鍵,再證
明分割出來的每一表格均滿足 BCNF,且同時證明你的分割滿足
lossless(無損)join 特性。(12 分) 
你是否會建議你上述的分割?為什麼?(4分) 
二、假設有個資料庫記錄了對全國某種受刑人數萬人做過的某次心理測驗,
B、C、D、E、F分別代表其具有某種行為傾向。以下 P{α}代表受刑人有
α行為傾向的機率,P{α,β}代表受刑人同時有 α與β行為傾向的機率。 
P{B}= 0.08, P{C}= 0.06, P{D}= 0.04, P{E}= 0.07, P{F}= 0.02, 
P{B,C}= 0.04, P{ B,D}= 0.04, P{B,E}= 0.06, P{B,F}= 0.02, P{C,D}= 0.04, 
P{C,E}= 0.04, P{C,F}= 0, P{D,E}= 0.02, P{D,F}= 0, P{E,F}= 0.2 
我們欲進行關聯規則(Association Rule)的資料探勘: 
請先解釋何謂支持度(Support)、信心度(Confidence)的概念。(6分) 
假設支持度最低門檻是 0.05、信心度最低門檻是 0.7,請指出上述那
些是 Large-1、Large-2 的項目集合(Item-set);並找出所有只包含 2
個項目集合的強(Strong)關聯規則。(14 分) 
在尋找關聯規則時,有個重要的反單調(Anti-monotonicity)特性可減
低運算成本,請先說明何謂此特性?再請以上述例子來說明應如何運
用此特性。(5分)