GPT Load 是一个 OpenAI 兼容的 API 负载均衡服务,将请求分发到多个 AI 模型提供商。
分类
GPT Load (AllAI) 目前提供 17 个大模型 API。
速度基准测试平均吞吐 269 tok/s。
GPT Load (AllAI) 是一个 API 聚合平台,提供来自多个供应商的模型。

https://allaiload.dpdns.org| 时间 | 模型 | 速度 | 延迟 |
|---|---|---|---|
| Nov 28, 08:51 AM | x-ai/grok-4.1-fast:free | 87.31 tok/s | 6.31s |
| Nov 28, 08:38 AM | gpt-oss:120b | 141.34 tok/s | 1.35s |
| Nov 28, 08:35 AM | DeepSeek-V3-0324 | 218.28 tok/s | 0.90s |
| Nov 28, 08:34 AM | qwen-3-235b-a22b-instruct-2507 | 842.40 tok/s | 2.10s |
| Nov 28, 08:33 AM | qwen-3-235b-a22b-instruct-2507 | 377.69 tok/s | 1.38s |
| Nov 28, 08:32 AM | models/gemini-2.5-flash | 194.64 tok/s | 7.60s |
| Nov 28, 08:31 AM | Qwen/Qwen3-Next-80B-A3B-Instruct | 173.09 tok/s | 1.54s |
| Nov 28, 08:29 AM | qwen/qwen3-next-80b-a3b-instruct | 149.87 tok/s | 0.78s |
| Nov 28, 08:27 AM | openai/gpt-oss-120b | 205.99 tok/s | 8.90s |
| Nov 28, 08:25 AM | qwen/qwen3-next-80b-a3b-instruct | 158.70 tok/s | 0.80s |