勵志

勵志人生知識庫

詞頻是什麼

詞頻是指在一定範圍內,如一箇文件、一段文本、一箇語料庫或一組文檔中,某個詞彙出現的次數。

詞頻用於衡量詞彙的重要程度,在情報檢索文本挖掘領域,詞頻是一種常用的加權技術,用於評估詞彙對文件或特定領域文件集的重複程度,通常會與“反轉文件頻率”(inverse document frequency,簡稱IDF)結合使用,形成TF-IDF指標,以更準確地評估詞彙的重要性和相關性。

此外,詞頻統計也是學術研究中常用的方法,有助於從文本內容中定量分析,選出高頻詞彙來表達文獻的主題內容。