排行榜
基于模型测速与 Provider 健康检查数据的多维排行榜,对比不同 Provider、端点与稳定性表现。
生成首个 Token 的平均时间,越低越好。
| 排名 | Provider | 模型 | 首字延迟 | 平均输出速度 | 次数 |
|---|---|---|---|---|---|
| 1 | qwen/qwen3-coder | 0.05 s 最佳: -最差: 1.88 | 2.48t/s | 35 | |
| 2 | moonshotai/kimi-k2 | 0.16 s 最佳: -最差: 4.47 | 2.03t/s | 75 | |
| 3 |
| glm-4-flashx |
0.24 s 最佳: -最差: 0.64 |
43.17t/s |
| 5 |
| 4 | ministral-3b-2410 | 0.41 s 最佳: 0.35最差: 0.53 | 210.88t/s | 5 |
| 5 | ministral-3b-2410 | 0.41 s 最佳: 0.35最差: 0.53 | 210.88t/s | 5 |
| 6 | zhipu/glm-4v-flash | 0.43 s 最佳: 0.26最差: 1.31 | 53.51t/s | 15 |
| 7 | deepseek-ai/deepseek-v3.1 | 0.45 s 最佳: 0.33最差: 0.89 | 29.04t/s | 10 |
| 8 | qwen/qwen3-next-80b-a3b-instruct | 0.50 s 最佳: 0.41最差: 0.63 | 158.38t/s | 5 |
| 9 | THUDM/glm-4-9b-chat | 0.56 s 最佳: 0.49最差: 0.71 | 71.30t/s | 5 |
| 10 | internlm/internlm2_5-7b-chat | 0.57 s 最佳: 0.54最差: 0.61 | 68.19t/s | 10 |
| 11 | google/gemini-2.0-flash-exp | 0.59 s 最佳: -最差: 4.75 | 51.61t/s | 95 |
| 12 | qwen-3-235b-a22b-instruct-2507 | 0.60 s 最佳: 0.29最差: 1.39 | 703.17t/s | 15 |
| 13 | Qwen/Qwen3-Next-80B-A3B-Instruct | 0.62 s 最佳: 0.54最差: 0.68 | 68.32t/s | 5 |
| 14 | Qwen/Qwen3-VL-8B-Instruct | 0.64 s 最佳: 0.53最差: 0.68 | 142.73t/s | 5 |
| 15 | Qwen3-14B | 0.66 s 最佳: 0.59最差: 0.83 | 22.01t/s | 5 |
| 16 | qwen-3-coder-480b | 0.66 s 最佳: 0.33最差: 1.54 | 648.92t/s | 5 |
| 17 | deepseek/deepseek-r1-0528 | 0.67 s 最佳: -最差: 10.00 | 4.30t/s | 65 |
| 18 | qwen-plus | 0.70 s 最佳: 0.54最差: 1.02 | 47.17t/s | 5 |
| 19 | Qwen/Qwen3-235B | 0.71 s 最佳: 0.58最差: 0.96 | 583.68t/s | 5 |
| 20 | gemini-2.0-flash | 0.74 s 最佳: 0.69最差: 0.80 | 153.26t/s | 5 |
| 21 | qwen/qwen3-vl-32b-instruct | 0.76 s 最佳: 0.48最差: 1.53 | 44.94t/s | 5 |
| 22 | qwen/qwen2.5-7b | 0.80 s 最佳: 0.62最差: 1.53 | 90.79t/s | 25 |
| 23 | zhipu/glm-4-flash | 0.82 s 最佳: 0.36最差: 4.89 | 35.81t/s | 530 |
| 24 | llama-4-scout-17b-16e-instruct | 0.84 s 最佳: 0.80最差: 0.89 | 334.77t/s | 5 |
| 25 | Qwen/Qwen2.5-VL-72B-Instruct | 0.86 s 最佳: 0.74最差: 1.11 | 26.42t/s | 5 |
| 26 | qwen3:32b | 0.88 s 最佳: 0.53最差: 2.24 | 37.26t/s | 5 |
| 27 | qwen3:32b | 0.88 s 最佳: 0.53最差: 2.24 | 37.26t/s | 5 |
| 28 | qwen3:32b | 0.88 s 最佳: 0.53最差: 2.24 | 37.26t/s | 5 |
| 29 | zhipu/glm-4-9b | 0.88 s 最佳: 0.61最差: 1.40 | 58.83t/s | 5 |
| 30 | Qwen/Qwen3-Coder-480B | 0.89 s 最佳: 0.69最差: 1.43 | 552.48t/s | 5 |
| 31 | moonshotai/kimi-k2-instruct-0905 | 0.89 s 最佳: 0.52最差: 2.21 | 216.36t/s | 30 |
| 32 | inclusionAI/Ling-1T | 0.93 s 最佳: 0.79最差: 1.01 | 6.44t/s | 5 |
| 33 | gemini-flash-lite-latest | 0.95 s 最佳: 0.85最差: 1.10 | 326.55t/s | 5 |
| 34 | Qwen/Qwen3-Next-80B-A3B-Instruct | 0.95 s 最佳: 0.69最差: 1.91 | 139.29t/s | 5 |
| 35 | moonshotai/kimi-k2-instruct-0905 | 0.95 s 最佳: 0.77最差: 1.16 | 217.81t/s | 5 |
| 36 | Pro/deepseek-ai/DeepSeek-V3.2-Exp | 0.98 s 最佳: 0.77最差: 1.11 | 24.18t/s | 5 |
| 37 | hunyuan-lite | 0.99 s 最佳: 0.86最差: 1.11 | 133.29t/s | 5 |
| 38 | deepseek-chat | 0.99 s 最佳: 0.70最差: 1.49 | 25.69t/s | 15 |
| 39 | qwen3-vl-flash | 1.00 s 最佳: 0.61最差: 2.50 | 147.58t/s | 5 |
| 40 | qwen-turbo-latest | 1.01 s 最佳: 0.57最差: 2.49 | 84.44t/s | 5 |
| 41 | deepseek-v3-1-250821 | 1.02 s 最佳: 0.88最差: 1.23 | 66.69t/s | 5 |
| 42 | mistral-large-latest | 1.08 s 最佳: 0.42最差: 1.54 | 65.93t/s | 5 |
| 43 | mistral-large-latest | 1.08 s 最佳: 0.42最差: 1.54 | 65.93t/s | 5 |
| 44 | deepseek-ai/DeepSeek-V3.2-Exp | 1.11 s 最佳: 0.87最差: 1.75 | 23.69t/s | 5 |
| 45 | deepseek-ai/DeepSeek-V3 | 1.14 s 最佳: 0.94最差: 1.31 | 23.60t/s | 5 |
| 46 | qwen3-max-2025-09-23 | 1.14 s 最佳: 0.59最差: 2.53 | 24.49t/s | 5 |
| 47 | qwen3-235b-a22b-instruct-2507 | 1.15 s 最佳: 0.57最差: 2.92 | 24.80t/s | 5 |
| 48 | Qwen/Qwen3-14B | 1.19 s 最佳: 0.97最差: 1.68 | 38.30t/s | 5 |
| 49 | openai/gpt-oss-20b | 1.19 s 最佳: -最差: 6.10 | 54.46t/s | 50 |
| 50 | deepseek-chat | 1.19 s 最佳: 0.89最差: 1.61 | 25.22t/s | 10 |