
106年公務人員特種考試警察人員、一般警察
人員考試及106年特種考試交通事業鐵路
人員、退除役軍人轉任公務人員考試試題 代號:20250 全一張
(正面)
考試別: 一般警察人員考試
等別: 二等考試
類科別: 刑事警察人員犯罪分析組
科目: 資料探勘技術(包括資料庫管理與運用、線上交易處理【OLTP】、資料倉
儲【Data Warehouse】、資料探勘【Data Mining】)
考試時間 : 2 小時 座號:
※注意:
禁止使用電子計算器。
不必抄題,作答時請將試題題號及答案依照順序寫在試卷上,於本試題上作答者,不予計分。
(請接背面)
一、全球 3C 公司是一間行銷全世界的歷史悠久的電腦、通訊與消費電子產品公司,它的
資料庫記錄了 1950-2017 年的每個月 200 種產品、在全世界各城市的銷售數量與金
額。請針對下列每一項的資料倉儲操作先給定義,再以上述背景為例來說明清楚該
操作內涵:⑴向下探究(drill-down)、⑵向上擷取(roll-up)、⑶切片(slice)、⑷切塊
(dice)、⑸轉軸(pivot)。(25 分)
二、假設關聯資料庫的表格 R(A,B,C,D)有四個屬性 A,B,C,D,其功能相依(Functional
Dependency)為{A,B,D}C與{C,D}B
請以屬性封閉性(Closure)的概念,找出 R的所有候選鍵(Candidate Key),請說
明清楚你使用功能相依的每一個推演步驟。(6分)
請證明 R滿足第二正規化(2NF)或反證 R不滿足 2NF。(3分)
請證明 R滿足第三正規化(3NF)或反證 R不滿足 3NF。(4分)
請證明 R滿足 Boyce-Codd 正規化(BCNF)或反證 R不滿足 BCNF。(4分)
若R不滿足上述任一正規化,請將其切割,以求滿足之,你必須說明切割後的各
表格為何滿足你所聲稱的正規化。(6分)
三、假設 XYZ 公司的商品包含 A、B、C、D、E、F、G等多種,由其交易資料庫記錄,
我們得知表一的資料,假設我們要求的最小支持度(Support)為 0.2、最小信心水準
(Confidence Level)為 0.7。請找出所有包含一個商品的高頻項目集合(Frequent
Item-sets),及其個別的支持度(7分)、找出所有包含兩個商品的高頻項目集合,
及其個別的支持度(12 分)、找出所有包含三個商品的高頻項目集合,及其個別的
支持度(4分)、列出至少兩條包含三個商品的強(Strong)關聯規則(Association
Rules)及其個別規則的信心水準(8分)。
表一
交易編號 銷售商品
A10001 A、B、C
A10002 A、D
A10003 D、E
A10004 A、B、C
A10005 C、F
A10006 F
A10007 D、F
A10008 A、B、C、G
A10009 E、G
A10010 A、B