大規模言語モデル(LLM)は、大量のテキストデータに対して学習させた自然言語処理(NLP)システムで、次に来るであろう単語や文章を予測する。

  • LLMはトランスフォーマーのような深層学習技術を応用してテキストを取り込み、統計的なパターンと単語間の関係、より大きな言語的概念を学習する。
  • より多くのデータが提供されればされるほど、リアルで人間のような言語やテキストを生成するのがうまくなる。

LLMの使用例:

  • テキスト補完- 検索クエリ、電子メール、ドキュメントのオートコンプリート
  • テキスト生成- オリジナルのエッセイ、コード、詩、ダイアログの作成
  • テキストの要約- 文書から重要な情報を要約し、抽出する。
  • 翻訳- テキストを言語間で翻訳
  • 質問への回答- 事実に基づいた質問に対する回答を提供する
  • テキスト分類- トピック、センチメント、スパム検出による文書の分類
  • 音声認識- 話された音声をテキストに書き起こします。

大規模モデルのよく知られた例としては、OpenAIのGPT-3.5とGPT-4、DeepMindのGopher、MetaのOPT、AnthropicのConstitutional AIなどがある。

最先端のLLMは、AIアシスタントが達成できることを革新しながら、首尾一貫した、正確で文脈に関連したテキストを作成することができます。しかし、バイアス、安全性、誤用にまつわるリスクは、依然として活発な研究の最前線にある。