Un modelo de lenguaje grande (LLM) es un sistema de procesamiento del lenguaje natural (PLN) entrenado con enormes cantidades de datos de texto para predecir las siguientes palabras y frases probables.

  • Los LLM aplican técnicas de aprendizaje profundo como los transformadores para procesar texto y aprender los patrones estadísticos y las relaciones entre palabras y conceptos lingüísticos más amplios.
  • A medida que se proporcionan más datos, mejoran en la generación de lenguaje y texto realistas y similares a los humanos.

Ejemplos de uso de LLM:

  • Autocompletado de texto – Autocompletar consultas de búsqueda, correos electrónicos o documentos
  • Generación de texto – Crear ensayos, código, poesía, diálogos originales
  • Resumen de texto – Resumir y destilar información clave de documentos
  • Traducción – Traducir texto entre idiomas
  • Respuesta a preguntas – Proporcionar respuestas a preguntas basadas en hechos
  • Clasificación de texto – Categorizar documentos por tema, sentimiento, detección de spam
  • Reconocimiento de voz – Transcribir audio hablado a texto

Ejemplos conocidos de modelos grandes incluyen GPT-3.5 y GPT-4 de OpenAI, Gopher de DeepMind, OPT de Meta y Constitutional AI de Anthropic.

Los LLM de última generación pueden producir texto coherente, preciso y contextualmente relevante, al tiempo que innovan en lo que los asistentes de IA pueden lograr. Sin embargo, los riesgos en torno al sesgo, la seguridad y el uso indebido siguen siendo fronteras de investigación activas.