
年特種考試地方政府公務人員考試試題
等 別:四等考試
類 科:圖書資訊管理
科 目:資訊系統與資訊檢索概要
考試時間:1小時 30 分 座號:
※注意:
禁止使用電子計算器。
不必抄題,作答時請將試題題號及答案依照順序寫在試卷上,於本試題上作答者,不予計分。
本科目除專門名詞或數理公式外,應使用本國文字作答。
代號:
頁次:
-
一、請以資料、用戶、服務三個面向,說明數位圖書館(Digital Library)與
網頁搜尋引擎(Web Search Engine)之差異。(25 分)
二、當系統沒有要求使用者登入時,如何取得使用者查詢紀錄;若系統有要
求使用者登入時,如何得知其之前的查詢條件?(25 分)
三、假設某機構有一萬筆文件資料,擬採購檢索系統,針對 A、B兩套系統
做成效評估的比較:針對查詢詞 T,已知有 5筆相關文件,其中 A系統
回應有 10 筆資料,其第 1、3、9、10 筆為相關文件,而 B系統回應有 6
筆資料,其第 2、3、5筆為相關文件。就查詢詞 T而言,計算並比較說
明其檢索成效。(25 分)
四、在有 N篇文長近似的文件(如 N篇摘要,都約 300 詞)的全文檢索系統
中,索引詞彙 T在每一篇文件都有其權重。最簡單的詞彙權重設定方式
是布林(Boolean)邏輯方式,亦即詞彙 T出現在文件 D,則其權重為 1,
若沒出現在文件 D則其權重為 0。另一種詞彙權重設定方式為 TF x IDF,
亦即:T出現在 D的次數(或是正規化後之詞頻,TF)「乘以」T在N
篇文件中出現篇數的倒數(或是正規化後之文件篇數倒數,IDF)。請說
明並比較布林權重、TF、IDF 及TF x IDF 等四種權重方式,對相關文件
排序的影響。(25 分)