TF-IDF (Term Frequency–Inverse Document Frequency) est une statistique numérique utilisée dans la recherche d'informations et l'exploration de textes pour mesurer l'importance d'un terme dans un document ou un corpus. Elle quantifie la pertinence d'un terme en considérant la fréquence de son apparition dans un document, tout en tenant compte de sa rareté à travers tous les documents. Plus la valeur TF-IDF d'un terme est élevée, plus il est significatif pour représenter le contenu d'un document.