LLM (Large Language Model)

Ein großes Sprachmodell (LLM) ist ein System zur Verarbeitung natürlicher Sprache (NLP), das auf riesigen Mengen von Textdaten trainiert wird, um wahrscheinliche nächste Wörter und Sätze vorherzusagen.

LLMs wenden Deep-Learning-Techniken wie Transformer an, um Text aufzunehmen und die statistischen Muster und Beziehungen zwischen Wörtern und größeren sprachlichen Konzepten zu erlernen.
Mit zunehmender Datenmenge werden sie besser darin, realistische, menschenähnliche Sprache und Text zu generieren.

Beispielhafte Anwendungen von LLMs:

Textvervollständigung – Autovervollständigung von Suchanfragen, E-Mails oder Dokumenten
Textgenerierung – Erstellung origineller Aufsätze, Code, Gedichte, Dialoge
Textzusammenfassung – Zusammenfassung und Destillation von Schlüsselinformationen aus Dokumenten
Übersetzung – Übersetzung von Texten zwischen Sprachen
Fragenbeantwortung – Beantwortung faktenbasierter Fragen
Textklassifizierung – Kategorisierung von Dokumenten nach Thema, Stimmung, Spam-Erkennung
Spracherkennung – Transkription von gesprochenem Audio in Text

Bekannte Beispiele für große Modelle sind GPT-3.5 und GPT-4 von OpenAI, Gopher von DeepMind, OPT von Meta und Constitutional AI von Anthropic.

Moderne LLMs können kohärenten, genauen und kontextbezogenen Text produzieren und gleichzeitig die Möglichkeiten von KI-Assistenten erweitern. Risiken in Bezug auf Voreingenommenheit, Sicherheit und Missbrauch bleiben jedoch aktive Forschungsbereiche.