TF-IDF(単語頻度-逆文書頻度)は、情報検索およびテキストマイニングで使用される数値統計であり、文書内またはコーパス内での用語の重要性を測定します。文書内での出現頻度を考慮し、すべての文書にわたる希少性も考慮に入れることで、用語の関連性を定量化します。用語のTF-IDF値が高いほど、文書の内容を表す上でより重要になります。