AIとつくるはじめてのWeb開発

0/40

AIの基礎

セクション 5 / 40

生成AIの種類

文章・画像・動画・音声・音楽…作るものでAIは分かれる

生成AI（ジェネレーティブAI）とは、学習したパターンをもとに“新しいもの”を作り出すAIの総称です。何を作るかで、ざっくり種類が分かれます。

文章・対話（LLM）: ChatGPT, Claude, Gemini など。文章作成・要約・翻訳・コード生成。
画像: Midjourney, DALL·E, Stable Diffusion など。
動画: Runway, Google Veo, Kling など。
音声（読み上げ）: ElevenLabs などのナレーション・音声合成。
音楽: Suno, Udio など。
コード／エージェント: Claude Code など。文章AIが“作業”までこなす。

中心にいるのは「LLM（大規模言語モデル）」

ChatGPTやClaudeの正体は LLM（Large Language Model＝大規模言語モデル）です。大量の文章を学習し、「次に来そうな言葉」を高精度で予測して文章を作ります。賢く見えますが、本質は超高精度の“続きの予測”です。

「辞書」ではなく「文章の達人」

LLMは“事実を調べて答える辞書”ではなく、“それっぽい文章を作る達人”です。とても便利ですが、もっともらしい間違いを言うこともあります（→「注意事項」のセクションで詳しく）。

「サービス」と「モデル」は別物

ChatGPTやClaudeは“サービス（アプリ）”の名前で、その中身で動いているのが“モデル”です。たとえばClaudeには Opus／Sonnet／Haiku という性能違いのモデルがあります（→「Claudeの種類」で解説）。

理解度チェック

すべて正解すると、次のセクションが開きます（はい・いいえ）。

Q1.ChatGPTやClaudeの中心的な仕組みは「LLM（大規模言語モデル）」である。
Q2.LLMは「事実を記録した辞書」なので、絶対に間違えない。
Q3.生成AIには、文章だけでなく画像・動画・音声・音楽を作るものもある。

すべての問いに「はい・いいえ」で答えると押せます