
 鼎文公職  解題 
 鼎文公職 解題 
 
 
 
正
公
《公職、國營事業、證照》 
線上解題:http://www.ezexam.com.tw
面、函授課程【憑准考證則享優惠】 馬上問:
馬上連: 
隨著網路的普及與資源的快速成長,有愈來愈多使用者依賴搜尋引擎來查詢資 訊。但由於網路資源數
量龐大,往往輸入任一檢索詞彙,都會得到數以百萬計的 檢索結果,造成使用者不少資訊負擔。再者,
當使用者因某種資訊需求而產生資 訊尋求行為時,其當下既有之知識狀態其實並不足以明確表達其需
求,常常無法輸入適切的檢索詞彙。 
 
為了克服上述資訊超載、認知負擔、及資訊不足等問題,已有不少互動式資訊檢索技術(Interactive 
Information  Retrieval  Techniques)的發展。這類技術主要是藉由使用者與系統間的互動來提昇檢索效
益。相關技術包括相似性回饋(Relevance Feedback)、詞彙擴展(Query Expansion)、及術語推薦(Term 
Suggestion)等。相似性回饋的作法為系統將前一階段所檢索出的文件,提供使用者選取後,系統再由
這些文件中抽取重要特徵進行檢索,以尋得更多相關文件。其中抽取比對的特徵如果是文件本身,則
稱為相似性回饋功能;若為文件中的相關詞彙,則稱為術語推薦(或是相關詞提示)。而詞彙擴展其實
與術語推薦的作法相似,只是前者為系統自動將相關詞彙進行擴展,後者則由使用者自行選取。過去
有關相似性回饋技術應用,以文件回饋較為常見,但使用者必須判斷那些文件相關,一來造成認知負
擔,二來由於回饋的文件包含資訊相當多元,回饋結果不一定符合檢索需求。換言之,術語推薦較不
需額外資訊,同時對使用者而言,也較易判斷,因此是互動式資訊檢索中比較可行的作法。 
 
從資訊取用時的資訊需求而言,使用者會從資訊物件本身的主題、個人推薦產生的個人興趣檔、瀏覽
次數、下載次數、點擊次數作為推薦系統推薦時的判斷依據,除了系統紀錄檔產生的紀錄 (ex: 瀏覽次
數 ) 以及透過資訊過濾系統更強調建立使用者對資訊需求與偏好的描述資料(profile),透過此描述資
料,過濾系統才能自動地協助使用者篩選不相關與不值得注意的資訊。資訊過濾的方式基本上分為三
種:基於內容特徵的過濾方式,基於個人認知與偏好的過濾方式,以及基於社會性、多人協同
(social/collaborative filtering)的過濾方式。 
 
若資訊文件內容為文字型資料居多,則需要透過關鍵詞自動抽取的方法進行。基本上關鍵詞的抽取方
法約分三類:一是統計分析法,這也是資訊檢索領域中最常使用的方法,其主要是分析文件中詞彙的
統計特性,如分析詞彙出現的頻率及位置,若符合預先設定的門檻值,即被視為關鍵詞。這類方法由
於未使用任何控制字彙,因此較不受語文的限制,且所抽取的詞彙其新穎性較高,也可抽取到控制字
彙未收錄的詞彙。但其缺點是所抽取詞彙常有錯誤組合或無意義的情形。第二種方法是詞庫比對法,
即利用事先已建立的控制字彙表或詞庫,與文件來進行比對。這類方法雖然簡便,但詞庫無法收錄所
有詞彙,同時也需人力維護,此外未知詞(Unknown  Term)一般也不會被詞庫所收錄。第三種方法則
是文法剖析法,即利用自然語言處理技術對文件進行文法剖析,所獲得的詞彙雖較有意義,但仍需詞
庫的配合,此外,在文句的文法並不完整的情況下,這類方法的成效其實不太明顯。上述關鍵詞自動
抽取技術基本上多以文件作為抽取來源,而所抽取出的詞彙,也多作為系統的索引詞彙依據。然而在
實際的資訊檢索環境中,使用者所 
使用的檢索詞彙經常與系統所使用的索引詞彙不一致。詞彙抽取後為了讓使用者能有效瀏覽所推薦之
相關詞彙,系統需要進行概念的分群。概念的分群可用樹狀架構或是放射狀知識圖譜的方式展現,現
在有許多資訊視覺化的技術可以補強這方面的呈現效果,有利於使用者利用界面上的功能選取系統推
薦詞彙。 
 
術語推薦能藉由提示與使用者查詢相關的詞彙,幫助其釐清問題及需求,以獲得 更完整精確的檢索結
果。