主要AIサービス比較 - ChatGPT・Claude・Gemini・その他のモデルと特徴
主要なAIサービス(LLM:大規模言語モデル)の提供元、モデルラインナップ、特徴、料金体系を整理する。
サービス全体像
flowchart TD
A["主要AIサービス"] --> B["OpenAI<br/>ChatGPT"]
A --> C["Anthropic<br/>Claude"]
A --> D["Google<br/>Gemini"]
A --> E["Meta<br/>Llama"]
A --> F["その他"]
F --> G["Mistral AI"]
F --> H["xAI<br/>Grok"]
F --> I["Cohere<br/>Command"]
F --> J["Amazon<br/>Nova"]
主要サービス一覧
| サービス | 提供元 | 初回リリース | チャットUI | API | オープンソース |
|---|
| ChatGPT | OpenAI | 2022年11月 | chatgpt.com | OpenAI API | No |
| Claude | Anthropic | 2023年3月 | claude.ai | Anthropic API | No |
| Gemini | Google | 2023年12月 | gemini.google.com | Gemini API / Vertex AI | No |
| Llama | Meta | 2023年2月 | - | 各種ホスティング | Yes |
| Grok | xAI | 2023年11月 | grok.com | xAI API | 一部 |
| Mistral | Mistral AI | 2023年9月 | chat.mistral.ai | Mistral API | 一部 |
| Command | Cohere | 2023年 | coral.cohere.com | Cohere API | No |
| Nova | Amazon | 2024年12月 | - | Amazon Bedrock | No |
OpenAI - ChatGPT
OpenAIはGPTシリーズを開発・提供する。ChatGPTは最も普及したAIチャットサービスであり、AIブームの火付け役。
モデルラインナップ
| モデル | リリース | コンテキスト長 | 特徴 |
|---|
| GPT-4o | 2024年5月 | 128K | マルチモーダル(テキスト・画像・音声)。速度と品質のバランスが良い |
| GPT-4o mini | 2024年7月 | 128K | GPT-4oの軽量版。低コスト・高速 |
| o1 | 2024年12月 | 200K | 推論特化モデル。数学・科学・コーディングに強い |
| o1-mini | 2024年9月 | 128K | o1の軽量版。推論能力を維持しつつ高速化 |
| o3-mini | 2025年1月 | 200K | o1-miniの後継。推論性能向上 |
| GPT-4.5 | 2025年2月 | 128K | GPT-4oの後継。知識の幅広さと自然な対話 |
| o3 | 2025年4月 | 200K | 最上位の推論モデル |
| GPT-4.1 | 2025年4月 | 1M | コーディング特化。100万トークンのコンテキスト |
| GPT-4.1 mini | 2025年4月 | 1M | GPT-4.1の軽量版 |
| GPT-4.1 nano | 2025年4月 | 1M | 最軽量・最安価 |
料金プラン(チャットUI)
| プラン | 月額 | 主な機能 |
|---|
| Free | 無料 | GPT-4o mini、制限付きGPT-4o |
| Plus | $20 | GPT-4o、o1等の上位モデル利用 |
| Pro | $200 | 全モデル無制限アクセス |
| Team | $25/人 | ビジネス向け。管理機能付き |
| Enterprise | 要問合せ | セキュリティ・コンプライアンス強化 |
API料金(主要モデル・1Mトークンあたり)
| モデル | 入力 | 出力 |
|---|
| GPT-4o | $2.50 | $10.00 |
| GPT-4o mini | $0.15 | $0.60 |
| GPT-4.1 | $2.00 | $8.00 |
| GPT-4.1 mini | $0.40 | $1.60 |
| GPT-4.1 nano | $0.10 | $0.40 |
| o3 | $10.00 | $40.00 |
| o3-mini | $1.10 | $4.40 |
主な特徴・強み
- エコシステムの広さ: GPTs(カスタムBot)、プラグイン、Function Calling、Assistants APIなど豊富な機能
- マルチモーダル: 画像生成(DALL-E)、音声対話、動画理解に対応
- 推論モデル(oシリーズ): Chain-of-Thought推論により複雑な問題を段階的に解決
- ツール連携: Web検索、コード実行(Code Interpreter)、ファイル分析を統合
参考リンク
Anthropic - Claude
AnthropicはAIの安全性研究を重視する企業で、Constitutional AI(憲法AI)アプローチでClaude を開発。
モデルラインナップ
| モデル | リリース | コンテキスト長 | 特徴 |
|---|
| Claude 3 Haiku | 2024年3月 | 200K | 高速・低コスト。軽量タスク向け |
| Claude 3.5 Haiku | 2024年11月 | 200K | Claude 3 Haikuの後継。性能大幅向上 |
| Claude 3.5 Sonnet | 2024年10月 | 200K | コストパフォーマンスに優れた中位モデル |
| Claude 3.7 Sonnet | 2025年2月 | 200K | ハイブリッド推論対応。拡張思考機能搭載 |
| Claude 4 Sonnet | 2025年5月 | 200K | Sonnet系統の最新版 |
| Claude 4 Opus | 2025年5月 | 200K | 最上位モデル。最も高い知性と推論力 |
| Claude 4.5 Haiku | 2025年10月 | 200K | 最新の軽量モデル |
| Claude 4.5 Sonnet | 2025年10月 | 200K | 知識・推論・コーディングの総合力 |
モデル命名規則
Claudeのモデルは3つのティアで構成される。
| ティア | 位置づけ | 用途 |
|---|
| Haiku | 軽量・高速 | リアルタイム応答、大量処理 |
| Sonnet | バランス型 | 汎用的な業務利用 |
| Opus | 最高性能 | 複雑な推論、高度な分析 |
料金プラン(チャットUI)
| プラン | 月額 | 主な機能 |
|---|
| Free | 無料 | 制限付きSonnetアクセス |
| Pro | $20 | 上位モデル利用。優先アクセス |
| Max | $100/$200 | 大幅な利用量増加 |
| Team | $30/人 | チーム管理・共有機能 |
| Enterprise | 要問合せ | SSO、監査ログ等 |
API料金(主要モデル・1Mトークンあたり)
| モデル | 入力 | 出力 |
|---|
| Claude 4.5 Sonnet | $3.00 | $15.00 |
| Claude 4 Opus | $15.00 | $75.00 |
| Claude 4 Sonnet | $3.00 | $15.00 |
| Claude 3.7 Sonnet | $3.00 | $15.00 |
| Claude 3.5 Haiku | $0.80 | $4.00 |
| Claude 4.5 Haiku | $0.80 | $4.00 |
主な特徴・強み
- 長文コンテキスト: 200Kトークンの入力に対応。長大なドキュメント分析が得意
- コーディング能力: SWE-bench等のベンチマークで高スコア。Claude Codeとして開発者向けCLIも提供
- 安全性: Constitutional AIにより有害出力を抑制。ビジネス利用での信頼性が高い
- Artifacts: チャット内でコード・文書・図表を生成・プレビューできる機能
- Computer Use: デスクトップ操作を自動化するエージェント機能
- 拡張思考(Extended Thinking): Claude 3.7 Sonnet以降で対応。推論プロセスを段階的に表示
参考リンク
Google - Gemini
GoogleはDeepMindの技術を基盤にGeminiシリーズを開発。Google検索やWorkspaceとの統合が強み。
モデルラインナップ
| モデル | リリース | コンテキスト長 | 特徴 |
|---|
| Gemini 1.5 Flash | 2024年5月 | 1M | 高速・低コスト |
| Gemini 1.5 Pro | 2024年2月 | 2M | 200万トークンの超長文コンテキスト |
| Gemini 2.0 Flash | 2025年2月 | 1M | マルチモーダル出力対応 |
| Gemini 2.5 Pro | 2025年3月 | 1M | 思考機能内蔵の最上位モデル |
| Gemini 2.5 Flash | 2025年5月 | 1M | 思考機能を備えた高速モデル |
料金プラン(チャットUI)
| プラン | 月額 | 主な機能 |
|---|
| Free | 無料 | Gemini利用(制限付き) |
| Google One AI Premium | $19.99 | 上位モデル、Google Workspace統合 |
| Business / Enterprise | 要問合せ | Google Workspace Enterprise向け |
API料金(主要モデル・1Mトークンあたり)
| モデル | 入力 | 出力 |
|---|
| Gemini 2.5 Pro | $1.25〜$2.50 | $10.00〜$15.00 |
| Gemini 2.5 Flash | $0.15〜$0.30 | $0.60〜$3.50 |
| Gemini 2.0 Flash | $0.10 | $0.40 |
| Gemini 1.5 Pro | $1.25〜$2.50 | $5.00〜$10.00 |
| Gemini 1.5 Flash | $0.075〜$0.15 | $0.30〜$0.60 |
※ 入力料金はコンテキスト長(128K以下 / 超過)で変動するモデルがある。
主な特徴・強み
- 超長文コンテキスト: Gemini 1.5 Proは200万トークン対応。業界最大級
- マルチモーダル: テキスト・画像・動画・音声をネイティブに処理。動画理解に強い
- Google連携: Google検索、Gmail、Docs、Sheets等との統合(Gemini for Workspace)
- 無料枠の充実: Gemini APIは低レートながら無料利用枠がある
- Grounding: Google検索結果を参照した回答生成(情報の鮮度が高い)
参考リンク
MetaはLlamaシリーズをオープンウェイトで公開。ローカル実行やカスタマイズが可能な点で他と差別化される。
モデルラインナップ
| モデル | リリース | パラメータ数 | コンテキスト長 | 特徴 |
|---|
| Llama 3.1 | 2024年7月 | 8B / 70B / 405B | 128K | 多言語対応。ツール利用対応 |
| Llama 3.2 | 2024年9月 | 1B / 3B / 11B / 90B | 128K | 軽量モデルとビジョン対応を追加 |
| Llama 3.3 | 2024年12月 | 70B | 128K | Llama 3.1 405B相当の性能を70Bで実現 |
| Llama 4 Scout | 2025年4月 | 17B active / 109B total | 10M | MoEアーキテクチャ。1000万トークンコンテキスト |
| Llama 4 Maverick | 2025年4月 | 17B active / 400B total | 1M | MoEアーキテクチャ。高品質な出力 |
料金
- モデル自体は無料(オープンウェイトライセンス)
- ホスティングサービス経由の場合は各プロバイダーの料金が発生
- Amazon Bedrock、Google Vertex AI、Azure AI、Together AI、Groq等で利用可能
主な特徴・強み
- オープンウェイト: モデルの重みが公開されており、ダウンロードしてローカル実行可能
- カスタマイズ自由: ファインチューニング、量子化、独自デプロイが可能
- プライバシー: データを外部に送信せずローカルで推論できる
- MoEアーキテクチャ: Llama 4ではMixture of Expertsを採用し、効率性が大幅向上
- エコシステム: Ollama、vLLM、llama.cpp等の推論フレームワークが充実
参考リンク
xAI - Grok
xAI(Elon Musk設立)が開発するGrokは、X(旧Twitter)との統合とリアルタイム情報アクセスが特徴。
モデルラインナップ
| モデル | リリース | コンテキスト長 | 特徴 |
|---|
| Grok-2 | 2024年8月 | 128K | テキスト・画像理解対応 |
| Grok-2 mini | 2024年8月 | 128K | 軽量版 |
| Grok-3 | 2025年2月 | 128K | 推論・コーディング性能向上 |
| Grok-3 mini | 2025年2月 | 128K | 軽量版。Think modeあり |
主な特徴・強み
- X(Twitter)連携: リアルタイムのポスト情報にアクセスして回答生成
- 画像生成: Aurora(画像生成モデル)を統合
- DeepSearch: Web上の情報を深く調査して回答する機能
参考リンク
Mistral AI - Mistral / Pixtral
フランスのMistral AIは高効率なオープンモデルで注目を集める。
モデルラインナップ
| モデル | リリース | パラメータ数 | コンテキスト長 | 特徴 |
|---|
| Mistral Small | 2025年1月 | 24B | 32K | 低遅延・高効率 |
| Mistral Large | 2024年11月 | 123B | 128K | フラッグシップモデル |
| Pixtral Large | 2024年11月 | 124B | 128K | マルチモーダル(画像理解) |
| Codestral | 2024年5月 | 22B | 32K | コード生成特化 |
| Mistral Embed | - | - | 8K | テキスト埋め込み特化 |
主な特徴・強み
- 効率性: 比較的小さなモデルサイズで高い性能を実現
- オープンモデルあり: Mistral 7B等の基盤モデルをApache 2.0で公開
- ヨーロッパ発: EU規制への適合を意識した設計
- コード生成: Codestralはコード補完・生成に特化
参考リンク
Amazon - Nova
AWSが独自開発したNova シリーズは、Amazon Bedrockを通じて提供される。
モデルラインナップ
| モデル | 特徴 |
|---|
| Nova Micro | テキスト専用。最速・最安 |
| Nova Lite | マルチモーダル入力対応。低コスト |
| Nova Pro | バランス型。精度・速度・コストの最適化 |
| Nova Premier | 最高性能。複雑な推論向け |
主な特徴・強み
- Bedrock統合: AWSサービスとのシームレスな連携
- RAG対応: Amazon Bedrock Knowledge Basesと連携した検索拡張生成
- 低価格: 他社モデルと比較してAPI料金が安価
参考リンク
モデル選択の指針
flowchart TD
A["用途は?"] --> B{"API利用?"}
B -->|Yes| C{"予算は?"}
B -->|No| D{"ローカル実行?"}
C -->|高品質重視| E["Claude 4 Opus<br/>GPT-4o<br/>Gemini 2.5 Pro"]
C -->|コスト重視| F["GPT-4.1 nano<br/>Claude 4.5 Haiku<br/>Gemini 2.0 Flash"]
C -->|推論特化| G["o3<br/>Claude 4 Opus<br/>Gemini 2.5 Pro"]
D -->|Yes| H["Llama 4<br/>Mistral<br/>Gemma"]
D -->|No| I{"何を重視?"}
I -->|汎用性| J["ChatGPT Plus<br/>Claude Pro"]
I -->|Google連携| K["Gemini Advanced"]
I -->|コーディング| L["Claude Pro<br/>ChatGPT Plus"]
ユースケース別おすすめ
| ユースケース | 推奨サービス | 理由 |
|---|
| 汎用チャット | ChatGPT、Claude | エコシステム・使いやすさ |
| コーディング支援 | Claude、ChatGPT | SWE-bench等で高スコア |
| ドキュメント分析 | Gemini、Claude | 長文コンテキスト対応 |
| 数学・科学の推論 | ChatGPT (o3)、Gemini 2.5 Pro | 推論特化モデル |
| ローカル実行 | Llama、Mistral | オープンウェイト |
| AWS環境での利用 | Amazon Nova、Bedrock経由の各モデル | AWS統合 |
| リアルタイム情報 | Grok、Gemini | SNS/Web検索連携 |
ベンチマーク比較
主要ベンチマークでの各モデルの位置づけを示す。スコアは時期やバージョンにより変動するため、傾向の参考として捉える。
| ベンチマーク | 測定対象 | 上位モデル(傾向) |
|---|
| MMLU | 広範な知識・理解力 | GPT-4o、Claude 4 Opus、Gemini 2.5 Pro |
| HumanEval | コード生成 | Claude 4 Sonnet、GPT-4o、Gemini 2.5 Pro |
| SWE-bench | 実践的なソフトウェアエンジニアリング | Claude 4 Opus、Claude 4 Sonnet |
| MATH | 数学的推論 | o3、Gemini 2.5 Pro |
| GPQA | 大学院レベルの科学推論 | o3、Claude 4 Opus |
| Arena Elo | 人間による総合評価(Chatbot Arena) | 時期により変動。最新モデルが上位 |
API利用時の比較
共通的なAPI機能
| 機能 | OpenAI | Anthropic | Google |
|---|
| ストリーミング | SSE | SSE | SSE |
| Function Calling | Yes | Yes(Tool Use) | Yes |
| 画像入力 | Yes | Yes | Yes |
| JSON Mode | Yes | Yes | Yes |
| バッチAPI | Yes | Yes | Yes |
| 埋め込み(Embedding) | Yes | No(Voyage AI推奨) | Yes |
| ファインチューニング | Yes | No | Yes |
SDKの対応言語
| SDK | OpenAI | Anthropic | Google |
|---|
| Python | openai | anthropic | google-genai |
| TypeScript/JS | openai | @anthropic-ai/sdk | @google/genai |
| その他 | Go, .NET, Java | - | Go, Java, .NET |
参考リンク