AIの基礎

セクション 5 / 40

生成AIの種類

文章・画像・動画・音声・音楽…作るものでAIは分かれる

生成AI(ジェネレーティブAI)とは、学習したパターンをもとに“新しいもの”を作り出すAIの総称です。何を作るかで、ざっくり種類が分かれます。

文章・対話(LLM)
ChatGPT, Claude, Gemini など。文章作成・要約・翻訳・コード生成。
画像
Midjourney, DALL·E, Stable Diffusion など。
動画
Runway, Google Veo, Kling など。
音声(読み上げ)
ElevenLabs などのナレーション・音声合成。
音楽
Suno, Udio など。
コード/エージェント
Claude Code など。文章AIが“作業”までこなす。

中心にいるのは「LLM(大規模言語モデル)」

ChatGPTやClaudeの正体は LLM(Large Language Model=大規模言語モデル)です。大量の文章を学習し、「次に来そうな言葉」を高精度で予測して文章を作ります。賢く見えますが、本質は超高精度の“続きの予測”です。

「辞書」ではなく「文章の達人」

LLMは“事実を調べて答える辞書”ではなく、“それっぽい文章を作る達人”です。とても便利ですが、もっともらしい間違いを言うこともあります(→「注意事項」のセクションで詳しく)。

「サービス」と「モデル」は別物

ChatGPTやClaudeは“サービス(アプリ)”の名前で、その中身で動いているのが“モデル”です。たとえばClaudeには Opus/Sonnet/Haiku という性能違いのモデルがあります(→「Claudeの種類」で解説)。

理解度チェック

すべて正解すると、次のセクションが開きます(はい・いいえ)。

  1. Q1.ChatGPTやClaudeの中心的な仕組みは「LLM(大規模言語モデル)」である。

  2. Q2.LLMは「事実を記録した辞書」なので、絶対に間違えない。

  3. Q3.生成AIには、文章だけでなく画像・動画・音声・音楽を作るものもある。

すべての問いに「はい・いいえ」で答えると押せます