
104年特種考試地方政府公務人員考試試題 代號:42240  全一頁
等別: 四等考試
類科: 圖書資訊管理
科目: 資訊系統與資訊檢索概要
考試時間 : 1 小時 30 分座號: 
※注意: 
禁止使用電子計算器。 
不必抄題,作答時請將試題題號及答案依照順序寫在試卷上,於本試題上作答者,不予計分。 
 
(請接背面) 
 
 
一、依據向量空間模式(Vector-Space Model)建構的資訊檢索系統,是將每一份文件表
達為對應的文件向量,請說明如何建構文件的向量,解釋文件向量分量(Component 
of Vector)的意義,並討論如何產生每一個分量的數值。(25 分) 
二、許多資訊檢索系統在建構索引時,排除了停用詞(Stop Words),但是某些資訊檢索
系統,並不排除停用詞。請先說明何謂停用詞,繼之討論排除停用詞與不排除停用
詞的利弊得失。(25 分) 
三、在大數據(Big Data,亦稱為巨量資料)的風潮下,圖書館界亦關心研究資料的典藏、
管理及使用,也就是近年備受關注的資料庋用(Data Curation)議題。圖書館若是提
供資料庋用的服務,則必須建構資料庋用系統,並提供檢索功能,請討論研究資料
的檢索與文件的檢索,在功能開發上,有何不同的考量。(25 分) 
四、有一些資訊檢索系統提供同義處理、同音處理、近似處理或是詞幹處理(Stemming)
後的檢索等,我們可以將前述的處理都視為是建構等價群集(Equivalence Class),例
如相同意義的詞彙形成一個等價群集;發音相同的詞彙形成一個等價群集。請討論
提供前述處理功能的檢索系統,對於檢索績效(Performance)的正面與負面的影響。
(25 分)