大規模言語モデル(LLM)は、大量のテキストデータに対して学習させた自然言語処理(NLP)システムで、次に来るであろう単語や文章を予測する。
- LLMはトランスフォーマーのような深層学習技術を応用してテキストを取り込み、統計的なパターンと単語間の関係、より大きな言語的概念を学習する。
- より多くのデータが提供されればされるほど、リアルで人間のような言語やテキストを生成するのがうまくなる。
LLMの使用例:
- テキスト補完- 検索クエリ、電子メール、ドキュメントのオートコンプリート
- テキスト生成- オリジナルのエッセイ、コード、詩、ダイアログの作成
- テキストの要約- 文書から重要な情報を要約し、抽出する。
- 翻訳- テキストを言語間で翻訳
- 質問への回答- 事実に基づいた質問に対する回答を提供する
- テキスト分類- トピック、センチメント、スパム検出による文書の分類
- 音声認識- 話された音声をテキストに書き起こします。
大規模モデルのよく知られた例としては、OpenAIのGPT-3.5とGPT-4、DeepMindのGopher、MetaのOPT、AnthropicのConstitutional AIなどがある。
最先端のLLMは、AIアシスタントが達成できることを革新しながら、首尾一貫した、正確で文脈に関連したテキストを作成することができます。しかし、バイアス、安全性、誤用にまつわるリスクは、依然として活発な研究の最前線にある。