排行榜
基于模型测速与 Provider 健康检查数据的多维排行榜,对比不同 Provider、端点与稳定性表现。
生成首个 Token 的平均时间,越低越好。
| 排名 | Provider | 模型 | 首字延迟 | 平均输出速度 | 次数 |
|---|---|---|---|---|---|
| 1 | Qwen/Qwen2-7B-Instruct | 0.54 s 最佳: 0.44最差: 0.73 | 98.75t/s | 5 | |
| 2 | deepseek/deepseek-v3-0324 | 0.55 s 最佳: 0.53最差: 0.58 | 33.69t/s | 5 | |
| 3 |
| deepseek-ai/DeepSeek-V3 |
0.57 s 最佳: 0.52最差: 0.61 |
19.48t/s |
| 5 |
| 4 | grok-2-1212 | 0.60 s 最佳: 0.45最差: 1.07 | 58.57t/s | 10 |
| 5 | Qwen/Qwen2.5-14B-Instruct | 0.61 s 最佳: 0.46最差: 1.09 | 64.55t/s | 5 |
| 6 | deepseek-ai/DeepSeek-V3-0324-fast | 0.62 s 最佳: 0.57最差: 0.78 | 73.57t/s | 5 |
| 7 | Qwen/QwQ-32B-Preview | 0.62 s 最佳: 0.58最差: 0.72 | 69.75t/s | 5 |
| 8 | Qwen/Qwen2.5-Coder-7B-Instruct | 0.65 s 最佳: 0.45最差: 0.85 | 38.30t/s | 5 |
| 9 | DeepSeek-R1 | 0.67 s 最佳: 0.64最差: 0.69 | 37.13t/s | 5 |
| 10 | deepseek-ai/DeepSeek-V3-0324 | 0.70 s 最佳: 0.53最差: 1.14 | 10.55t/s | 5 |
| 11 | zhipu/glm-4-flash | 0.72 s 最佳: 0.39最差: 1.86 | 35.84t/s | 95 |
| 12 | best-free | 0.74 s 最佳: 0.29最差: 1.98 | 100.39t/s | 5 |
| 13 | Qwen/QwQ-32B-Preview | 0.80 s 最佳: 0.62最差: 0.97 | 70.89t/s | 5 |
| 14 | deepseek-chat | 0.81 s 最佳: 0.67最差: 0.96 | 23.95t/s | 5 |
| 15 | qwen-max-2024-01-07 | 0.82 s 最佳: 0.77最差: 0.92 | 17.48t/s | 5 |
| 16 | qwen-qwq | 0.89 s 最佳: 0.66最差: 1.41 | 26.75t/s | 5 |
| 17 | qwen1.5-7b-chat | 0.89 s 最佳: 0.64最差: 1.84 | 59.96t/s | 10 |
| 18 | ep-20250304104316-qpkbf | 0.90 s 最佳: 0.76最差: 1.12 | 25.49t/s | 5 |
| 19 | qwen-turbo-2024-11-01 | 0.92 s 最佳: 0.79最差: 0.99 | 50.95t/s | 5 |
| 20 | deepseek-chat | 0.93 s 最佳: 0.68最差: 1.42 | 37.51t/s | 5 |
| 21 | zhipu/glm-4v-flash | 0.95 s 最佳: 0.78最差: 1.27 | 77.34t/s | 5 |
| 22 | deepseek-v3-0324 | 0.96 s 最佳: 0.90最差: 1.18 | 36.85t/s | 5 |
| 23 | deepseek-v3-0324 | 0.96 s 最佳: 0.90最差: 1.18 | 36.85t/s | 5 |
| 24 | qwen-plus | 0.97 s 最佳: 0.64最差: 1.95 | 21.50t/s | 5 |
| 25 | gpt-4o | 1.03 s 最佳: 0.68最差: 1.39 | 78.41t/s | 5 |
| 26 | QwQ-32B | 1.09 s 最佳: 0.82最差: 1.73 | 297.86t/s | 5 |
| 27 | gpt-4o | 1.11 s 最佳: 0.84最差: 1.55 | 114.07t/s | 10 |
| 28 | deepseek-chat | 1.12 s 最佳: 0.78最差: 1.39 | 20.87t/s | 5 |
| 29 | Qwen/Qwen2.5-Coder-32B-Instruct | 1.18 s 最佳: 0.63最差: 2.83 | 23.58t/s | 5 |
| 30 | 火山V3 | 1.26 s 最佳: 0.79最差: 2.50 | 38.75t/s | 5 |
| 31 | gpt-4o-mini | 1.27 s 最佳: 0.94最差: 1.49 | 86.04t/s | 5 |
| 32 | ep-20250213224710-j4lcg | 1.27 s 最佳: 0.87最差: 1.58 | 19.99t/s | 5 |
| 33 | qwen2.5-mlx | 1.29 s 最佳: 0.89最差: 2.29 | 12.58t/s | 5 |
| 34 | gemini-2.0-flash | 1.30 s 最佳: 1.14最差: 1.44 | 220.95t/s | 5 |
| 35 | qwq | 1.30 s 最佳: 0.61最差: 3.25 | 26.57t/s | 5 |
| 36 | deepseek/deepseek-v3-turbo | 1.31 s 最佳: 0.68最差: 2.90 | 28.27t/s | 15 |
| 37 | Groq/qwen-qwq-32b | 1.36 s 最佳: 1.05最差: 2.41 | 382.11t/s | 5 |
| 38 | qwen-max-latest | 1.40 s 最佳: 1.19最差: 1.94 | 32.90t/s | 5 |
| 39 | deepseek-ai/DeepSeek-V3 | 1.40 s 最佳: 0.70最差: 3.88 | 17.57t/s | 20 |
| 40 | gpt-3.5-turbo | 1.41 s 最佳: 1.25最差: 1.81 | 121.17t/s | 5 |
| 41 | deepseek-v3-0324 | 1.47 s 最佳: 1.01最差: 1.70 | 33.21t/s | 5 |
| 42 | deepseek-v3-0324 | 1.49 s 最佳: 1.27最差: 1.78 | 24.84t/s | 5 |
| 43 | gpt-4o-2024-11-20 | 1.52 s 最佳: 1.15最差: 1.90 | 88.57t/s | 5 |
| 44 | jinshu-1.5 | 1.59 s 最佳: 1.00最差: 3.68 | 66.48t/s | 10 |
| 45 | grok-3 | 1.59 s 最佳: 1.43最差: 1.92 | 40.75t/s | 5 |
| 46 | jinshu | 1.62 s 最佳: 1.10最差: 3.26 | 56.96t/s | 5 |
| 47 | deepseek-v3-0324 | 1.64 s 最佳: 1.16最差: 1.91 | 20.36t/s | 5 |
| 48 | gpt-4o-mini | 1.64 s 最佳: 1.40最差: 1.93 | 86.37t/s | 5 |
| 49 | gpt-4o | 1.71 s 最佳: 0.85最差: 3.92 | 92.54t/s | 10 |
| 50 | gemini-2.0-pro-exp-02-05 | 1.77 s 最佳: 1.51最差: 2.19 | 49.44t/s | 5 |