當前位置:趣味科普網>經驗>

截詞檢索有哪三種方式

經驗 閱讀(2.04W)

截詞檢索有哪三種方式

截詞檢索的方式可以分為有限截詞、無限截詞和中間截詞。

1、有限截詞,有限後截詞主要用於詞的單、複數,動詞的詞尾變化等。將“n”個截詞符放在檢索詞(關鍵詞、主題詞)的詞幹或詞尾可能變化的位置上。

2、中間截詞,一般來說,中間截詞僅允許有限截詞,主要用於英、美拼寫不同的詞和單複數拼寫不同的詞。

3、無限截詞,截去某個詞的尾部,是詞的前方一致比較,也稱前方一致檢索。

截詞檢索是預防漏檢提高查全率的一種常用檢索技術,大多數系統都提供截詞檢索的功能。截詞是指在檢索詞的合適位置進行截斷,然後使用截詞符進行處理,這樣既可節省輸入的字元數目,又可達到較高的查全率。尤其在西文檢索系統中,使用截詞符處理自由詞,對提高查全率的效果非常顯著。截詞檢索一般是指右截詞,部分支援中間截詞。截詞檢索能夠幫助提高檢索的查全率。在截詞檢索技術中,較常用的是後截詞和中截詞兩種方法。如果按所截斷的字元數目來分,有無限截詞和有限截詞兩種。截詞算符在不同的系統中有不同的表達形式,需要說明的是並不是所有的搜尋引擎都支援這種技術。