Um modelo de linguagem grande (LLM) é um sistema de processamento de linguagem natural (PNL) treinado em enormes quantidades de dados de texto para prever palavras e frases prováveis.

  • LLMs aplicam técnicas de aprendizado profundo, como transformers, para ingerir texto e aprender os padrões estatísticos e as relações entre palavras e conceitos linguísticos maiores.
  • À medida que mais dados são fornecidos, eles se tornam melhores em gerar linguagem e texto realistas e semelhantes aos humanos.

Exemplos de uso de LLMs:

  • Conclusão de texto – Autocompletar consultas de pesquisa, e-mails ou documentos
  • Geração de texto – Criar redações, códigos, poemas, diálogos originais
  • Sumarização de texto – Resumir e destilar informações importantes de documentos
  • Tradução – Traduzir texto entre idiomas
  • Resposta a perguntas – Fornecer respostas a perguntas factuais
  • Classificação de texto – Categorizar documentos por tópico, sentimento, detecção de spam
  • Reconhecimento de fala – Transcrever áudio falado para texto

Exemplos conhecidos de modelos grandes incluem GPT-3.5 e GPT-4 da OpenAI, Gopher da DeepMind, OPT da Meta e Constitutional AI da Anthropic.

LLMs de ponta podem produzir texto coerente, preciso e contextualmente relevante, ao mesmo tempo em que inovam no que os assistentes de IA podem alcançar. No entanto, os riscos em torno de viés, segurança e uso indevido permanecem como fronteiras ativas de pesquisa.