APIレイテンシランキング

主要AIモデルのAPI応答速度を比較。平均レスポンスタイムとP99レイテンシを一覧表示します。

並び替え:

モデル名	プロバイダ	平均レイテンシ ↑	P99レイテンシ
Claude Haiku 4	Anthropic	120ms	350ms
Gemini 2.0 Flash	Google	150ms	400ms
GPT-4o mini	OpenAI	180ms	500ms
Llama 4 70B	Meta	280ms	800ms
Claude Sonnet 4	Anthropic	380ms	1100ms
GPT-4o	OpenAI	450ms	1200ms
Gemini 2.5 Pro	Google	520ms	1500ms
DeepSeek Chat	DeepSeek	600ms	2000ms

Claude Haiku 4Anthropic

平均レイテンシ

120ms

P99レイテンシ

350ms

Gemini 2.0 FlashGoogle

平均レイテンシ

150ms

P99レイテンシ

400ms

GPT-4o miniOpenAI

平均レイテンシ

180ms

P99レイテンシ

500ms

Llama 4 70BMeta

平均レイテンシ

280ms

P99レイテンシ

800ms

Claude Sonnet 4Anthropic

平均レイテンシ

380ms

P99レイテンシ

1100ms

GPT-4oOpenAI

平均レイテンシ

450ms

P99レイテンシ

1200ms

Gemini 2.5 ProGoogle

平均レイテンシ

520ms

P99レイテンシ

1500ms

DeepSeek ChatDeepSeek

平均レイテンシ

600ms

P99レイテンシ

2000ms

レイテンシデータについて

表示されているレイテンシ値はAPIの典型的な応答速度の目安です。実際のパフォーマンスはリクエスト内容、リージョン、負荷状況により変動します。平均値は通常のリクエストの応答時間、P99は99パーセンタイル（最も遅いケース）の応答時間を示します。

平均レイテンシ

P99レイテンシ