TF-IDF (Frecuencia de Término–Frecuencia Inversa de Documento) es una estadística numérica utilizada en la recuperación de información y la minería de textos para medir la importancia de un término dentro de un documento o un corpus. Cuantifica la relevancia de un término considerando la frecuencia de su aparición en un documento, al tiempo que tiene en cuenta su rareza en todos los documentos. Cuanto mayor sea el valor TF-IDF de un término, más significativo será para representar el contenido de un documento.