Un grand modèle linguistique (LLM) est un système de traitement du langage naturel (NLP) entraîné sur d'énormes quantités de données textuelles pour prédire les mots et les phrases suivants probables.

  • Les LLM appliquent des techniques d'apprentissage profond comme les transformeurs pour ingérer du texte et apprendre les modèles statistiques et les relations entre les mots et les concepts linguistiques plus larges.
  • À mesure que davantage de données sont fournies, ils deviennent meilleurs pour générer un langage et un texte réalistes, semblables à ceux des humains.

Exemples d'utilisation des LLM :

  • Complétion de texte – Autocomplétion des requêtes de recherche, des e-mails ou des documents
  • Génération de texte – Création d'essais, de code, de poésie, de dialogues originaux
  • Résumé de texte – Résumer et distiller les informations clés des documents
  • Traduction – Traduire du texte entre les langues
  • Réponse aux questions – Fournir des réponses à des questions factuelles
  • Classification de texte – Catégoriser les documents par sujet, sentiment, détection de spam
  • Reconnaissance vocale – Transcrire l'audio parlé en texte

Parmi les exemples bien connus de grands modèles figurent GPT-3.5 et GPT-4 d'OpenAI, Gopher de DeepMind, OPT de Meta et Constitutional AI d'Anthropic.

Les LLM de pointe peuvent produire du texte cohérent, précis et pertinent sur le plan contextuel tout en innovant sur ce que les assistants IA peuvent réaliser. Cependant, les risques liés aux biais, à la sécurité et à la mauvaise utilisation restent des frontières de recherche actives.