排行榜
基于模型测速与 Provider 健康检查数据的多维排行榜,对比不同 Provider、端点与稳定性表现。
生成首个 Token 的平均时间,越低越好。
| 排名 | Provider | 模型 | 首字延迟 | 平均输出速度 | 次数 |
|---|---|---|---|---|---|
| 1 | qwen/qwen3-coder | 0.05 s 最佳: -最差: 1.20 | 0.28t/s | 25 | |
| 2 | deepseek-v3.2 | 0.27 s 最佳: -最差: 0.73 | 15.50t/s | 5 | |
| 3 |
| THUDM/GLM-4-9B-0414 |
0.28 s 最佳: 0.26最差: 0.32 |
89.85t/s |
| 5 |
| 4 | glm-4-flash-250414 | 0.41 s 最佳: 0.24最差: 0.69 | 39.15t/s | 5 |
| 5 | openai/gpt-oss-120b | 0.46 s 最佳: 0.40最差: 0.55 | 212.52t/s | 5 |
| 6 | institute-of-science-tokyo/llama-3.1-swallow-70b-instruct-v0.1 | 0.50 s 最佳: 0.45最差: 0.62 | 19.06t/s | 5 |
| 7 | glm-4-flash | 0.51 s 最佳: 0.42最差: 0.56 | 27.97t/s | 5 |
| 8 | 英伟达/mistralai/devstral-2-123b-instruct-2512 | 0.55 s 最佳: 0.49最差: 0.68 | 58.22t/s | 5 |
| 9 | llama3.1-8b | 0.58 s 最佳: 0.53最差: 0.66 | 2286.66t/s | 10 |
| 10 | moonshotai/kimi-k2-instruct | 0.60 s 最佳: 0.56最差: 0.63 | 24.50t/s | 5 |
| 11 | Qwen/Qwen2.5-7B-Instruct | 0.61 s 最佳: 0.22最差: 1.16 | 106.01t/s | 5 |
| 12 | qwen-3-235b-a22b-instruct-2507 | 0.63 s 最佳: 0.55最差: 0.75 | 910.42t/s | 5 |
| 13 | Qwen/Qwen2.5-72B-Instruct | 0.65 s 最佳: 0.37最差: 1.23 | 32.99t/s | 5 |
| 14 | zhipu/glm-4v-flash | 0.72 s 最佳: 0.32最差: 2.82 | 47.32t/s | 10 |
| 15 | openai/gpt-oss-20b | 0.77 s 最佳: -最差: 9.67 | 9.08t/s | 30 |
| 16 | zhipu/glm-4-flash | 0.79 s 最佳: 0.46最差: 2.64 | 28.24t/s | 555 |
| 17 | mimo-v2-flash | 0.83 s 最佳: 0.41最差: 1.15 | 110.54t/s | 5 |
| 18 | kimi-k2.5 | 0.88 s 最佳: 0.67最差: 1.24 | 43.53t/s | 5 |
| 19 | qwen-vl-plus-2025-05-07 | 0.88 s 最佳: 0.52最差: 2.22 | 99.19t/s | 5 |
| 20 | qwen/qwen2.5-7b | 0.94 s 最佳: 0.33最差: 4.18 | 87.73t/s | 40 |
| 21 | gpt-5.4 | 1.10 s 最佳: 0.30最差: 2.40 | 25.05t/s | 20 |
| 22 | claude-sonnet-4-6 | 1.12 s 最佳: 0.82最差: 1.50 | 43.57t/s | 5 |
| 23 | Qwen/Qwen3-VL-8B-Instruct | 1.20 s 最佳: 0.35最差: 3.86 | 70.26t/s | 5 |
| 24 | kimi-k2.5 | 1.29 s 最佳: 0.97最差: 1.91 | 1231.67t/s | 5 |
| 25 | deepseek-ai/DeepSeek-V3 | 1.45 s 最佳: 1.07最差: 2.17 | 18.81t/s | 5 |
| 26 | MiniMax-M2.7-highspeed | 1.56 s 最佳: 0.75最差: 3.12 | 48.72t/s | 5 |
| 27 | gpt-5.2-codex | 1.76 s 最佳: 1.49最差: 2.18 | 90.69t/s | 5 |
| 28 | claude-sonnet-4-6 | 1.83 s 最佳: 1.36最差: 2.59 | 85.69t/s | 10 |
| 29 | deepseek-v3.2 | 1.86 s 最佳: 1.34最差: 2.72 | 23.88t/s | 5 |
| 30 | gpt-5.4 | 1.87 s 最佳: 1.31最差: 2.70 | 54.33t/s | 5 |
| 31 | mimo-v2-pro | 1.98 s 最佳: 0.94最差: 4.46 | 64.80t/s | 5 |
| 32 | deepseek-chat | 2.10 s 最佳: 1.70最差: 2.28 | 35.89t/s | 5 |
| 33 | gpt-5.4(high) | 2.17 s 最佳: 1.13最差: 4.93 | 52.01t/s | 10 |
| 34 | gpt-5.4 | 2.17 s 最佳: 1.76最差: 3.12 | 50.94t/s | 5 |
| 35 | claude-opus-4-6 | 2.19 s 最佳: 1.69最差: 2.83 | 112.88t/s | 5 |
| 36 | moonshot-v1-32k | 2.24 s 最佳: 1.70最差: 3.00 | 10.88t/s | 5 |
| 37 | [按量]anti/claude-opus-4-6 | 2.34 s 最佳: 1.98最差: 3.13 | 46.66t/s | 5 |
| 38 | qwen/qwen3.5-122b-a10b | 2.35 s 最佳: 0.29最差: 12.66 | 37.39t/s | 10 |
| 39 | 酒馆-Flash-New | 2.38 s 最佳: 1.53最差: 3.03 | 101.00t/s | 5 |
| 40 | deepseek-ai/DeepSeek-R1-Distill-Qwen-7B | 2.42 s 最佳: 0.43最差: 9.62 | 79.34t/s | 5 |
| 41 | 酒馆-Flash | 2.54 s 最佳: 1.36最差: 4.49 | 55.55t/s | 5 |
| 42 | Translation | 2.56 s 最佳: 1.87最差: 3.24 | 378.97t/s | 5 |
| 43 | anthropic/claude-sonnet-4.6 | 2.59 s 最佳: 2.54最差: 2.64 | 17475.88t/s | 5 |
| 44 | deepseek-ai/DeepSeek-V3.2 | 2.61 s 最佳: 0.71最差: 8.64 | 23.40t/s | 5 |
| 45 | gemini-3-flash | 2.61 s 最佳: 2.54最差: 2.66 | 18164.29t/s | 5 |
| 46 | google/gemini-3-flash | 2.62 s 最佳: 2.55最差: 2.65 | 16435.04t/s | 5 |
| 47 | PaddlePaddle/PaddleOCR-VL-1.5 | 3.03 s 最佳: 0.25最差: 10.27 | 313.91t/s | 5 |
| 48 | grok-4.20-0309-reasoning | 3.13 s 最佳: 1.33最差: 5.74 | 225.06t/s | 5 |
| 49 | stepfun-ai/Step-3.5-Flash | 3.37 s 最佳: 2.54最差: 4.14 | 84.22t/s | 5 |
| 50 | gpt-5.3-codex | 3.50 s 最佳: 2.98最差: 3.97 | 61.35t/s | 5 |