Un modelo de lenguaje grande (LLM) es un sistema de procesamiento del lenguaje natural (PLN) entrenado con enormes cantidades de datos de texto para predecir las siguientes palabras y frases probables.
- Los LLM aplican técnicas de aprendizaje profundo como los transformadores para procesar texto y aprender los patrones estadísticos y las relaciones entre palabras y conceptos lingüísticos más amplios.
- A medida que se proporcionan más datos, mejoran en la generación de lenguaje y texto realistas y similares a los humanos.
Ejemplos de uso de LLM:
- Autocompletado de texto – Autocompletar consultas de búsqueda, correos electrónicos o documentos
- Generación de texto – Crear ensayos, código, poesía, diálogos originales
- Resumen de texto – Resumir y destilar información clave de documentos
- Traducción – Traducir texto entre idiomas
- Respuesta a preguntas – Proporcionar respuestas a preguntas basadas en hechos
- Clasificación de texto – Categorizar documentos por tema, sentimiento, detección de spam
- Reconocimiento de voz – Transcribir audio hablado a texto
Ejemplos conocidos de modelos grandes incluyen GPT-3.5 y GPT-4 de OpenAI, Gopher de DeepMind, OPT de Meta y Constitutional AI de Anthropic.
Los LLM de última generación pueden producir texto coherente, preciso y contextualmente relevante, al tiempo que innovan en lo que los asistentes de IA pueden lograr. Sin embargo, los riesgos en torno al sesgo, la seguridad y el uso indebido siguen siendo fronteras de investigación activas.