勵志

勵志人生知識庫

什麼是倒排索引

反向索引或倒排檔案

倒排索引(Inverted Index),也被稱為反向索引或倒排檔案,是一種用於快速查找文檔或文檔集合中包含特定詞彙的數據結構。

倒排索引的主要優勢在於它能夠通過詞彙快速定位到包含該詞彙的文檔列表,以及提供該詞在文檔中的位置信息。倒排索引主要由兩部分組成:單詞詞典和倒排列表。單詞詞典包含了文檔集合中出現過的所有單詞,並指向相應的倒排列表;倒排列表則記錄了某個單詞出現的文檔及其在文檔中的位置信息。

與傳統的正排索引(Forward Index)不同,正排索引是根據文檔來查找單詞,而倒排索引則是從單詞來查找文檔。倒排索引是文檔檢索系統中最常用的數據結構之一,它在全文搜尋和其他信息檢索套用中發揮著核心作用。