広告
主要AIモデルのAPI応答速度を比較。平均レスポンスタイムとP99レイテンシを一覧表示します。
| モデル名 | プロバイダ | 平均レイテンシ ↑ | P99レイテンシ |
|---|---|---|---|
Claude Haiku 4 | Anthropic | 120ms | 350ms |
Gemini 2.0 Flash | 150ms | 400ms | |
GPT-4o mini | OpenAI | 180ms | 500ms |
Llama 4 70B | Meta | 280ms | 800ms |
Claude Sonnet 4 | Anthropic | 380ms | 1100ms |
GPT-4o | OpenAI | 450ms | 1200ms |
Gemini 2.5 Pro | 520ms | 1500ms | |
DeepSeek Chat | DeepSeek | 600ms | 2000ms |
表示されているレイテンシ値はAPIの典型的な応答速度の目安です。実際のパフォーマンスはリクエスト内容、リージョン、負荷状況により変動します。平均値は通常のリクエストの応答時間、P99は99パーセンタイル(最も遅いケース)の応答時間を示します。