排行榜
基于模型测速与 Provider 健康检查数据的多维排行榜,对比不同 Provider、端点与稳定性表现。
生成首个 Token 的平均时间,越低越好。
| 排名 | Provider | 模型 | 首字延迟 | 平均输出速度 | 次数 |
|---|---|---|---|---|---|
| 1 | qwen/qwen3-32b | 0.18 s 最佳: 0.14最差: 0.29 | 310.21t/s | 5 | |
| 2 | llama3.1-8b | 0.19 s 最佳: 0.15最差: 0.21 | 2142.09t/s | 5 | |
| 3 |
| llama-3.3-70b |
0.25 s 最佳: 0.15最差: 0.32 |
1532.55t/s |
| 5 |
| 4 | google/gemini-2.0-flash-exp | 0.28 s 最佳: -最差: 1.67 | 30.41t/s | 25 |
| 5 | openai/gpt-oss-120b | 0.31 s 最佳: 0.25最差: 0.36 | 456.69t/s | 10 |
| 6 | openai/gpt-oss-20b | 0.47 s 最佳: 0.24最差: 0.78 | 755.20t/s | 5 |
| 7 | qwen-flash | 0.50 s 最佳: 0.33最差: 1.10 | 134.43t/s | 10 |
| 8 | gpt-oss-120b | 0.54 s 最佳: 0.25最差: 1.05 | 1920.13t/s | 5 |
| 9 | deepseek-v3.1 | 0.55 s 最佳: 0.40最差: 0.92 | 132.30t/s | 5 |
| 10 | GLM-4-FlashX | 0.57 s 最佳: 0.46最差: 0.95 | 69.04t/s | 5 |
| 11 | anthropic/claude-haiku-4.5 | 0.57 s 最佳: 0.44最差: 0.72 | 98.63t/s | 5 |
| 12 | gemini-2.5-flash-lite | 0.60 s 最佳: 0.52最差: 0.76 | 274.78t/s | 5 |
| 13 | gemini-flash-lite-latest | 0.67 s 最佳: 0.38最差: 0.97 | 369.22t/s | 5 |
| 14 | gemini-2.5-flash-lite-preview-06-17 | 0.70 s 最佳: 0.44最差: 1.61 | 160.85t/s | 5 |
| 15 | deepseek-v3.2 | 0.71 s 最佳: 0.51最差: 1.29 | 27.18t/s | 10 |
| 16 | gpt-4o-mini | 0.73 s 最佳: 0.55最差: 0.96 | 116.21t/s | 10 |
| 17 | tencent/Hunyuan-MT-7B | 0.74 s 最佳: 0.38最差: 1.55 | 55.78t/s | 10 |
| 18 | qwen3-max-preview | 0.77 s 最佳: 0.55最差: 1.56 | 44.58t/s | 5 |
| 19 | openai/gpt-oss-120b | 0.80 s 最佳: 0.52最差: 1.30 | 251.35t/s | 5 |
| 20 | qwen3-32b | 0.81 s 最佳: 0.29最差: 2.11 | 22.93t/s | 5 |
| 21 | moonshotai/kimi-k2-instruct-0905 | 0.83 s 最佳: 0.72最差: 1.06 | 148.30t/s | 5 |
| 22 | deepseek-v3.2-exp | 0.85 s 最佳: 0.64最差: 1.05 | 27.14t/s | 5 |
| 23 | deepseek-v3.2-exp | 0.85 s 最佳: 0.64最差: 1.05 | 27.14t/s | 5 |
| 24 | qwen3-235b-a22b-instruct-2507 | 0.85 s 最佳: 0.55最差: 1.46 | 52.41t/s | 10 |
| 25 | deepseek-v3 | 0.89 s 最佳: 0.69最差: 1.21 | 35.73t/s | 5 |
| 26 | Qwen/Qwen3-32B | 0.91 s 最佳: 0.61最差: 1.86 | 1214.07t/s | 5 |
| 27 | qwen-plus-2025-12-01 | 0.92 s 最佳: 0.63最差: 1.23 | 52.41t/s | 5 |
| 28 | Qwen/Qwen3-8B | 0.96 s 最佳: 0.65最差: 1.73 | 20.90t/s | 5 |
| 29 | gemini-2.0-flash | 1.02 s 最佳: 0.81最差: 1.60 | 181.28t/s | 5 |
| 30 | deepseek-v3-1-terminus | 1.03 s 最佳: 0.76最差: 1.46 | 126.69t/s | 5 |
| 31 | deepseek-v3-1-terminus | 1.03 s 最佳: 0.76最差: 1.46 | 126.69t/s | 5 |
| 32 | gpt-4.1-nano-2025-04-14 | 1.03 s 最佳: 0.71最差: 1.32 | 592.40t/s | 10 |
| 33 | deepseek-v3-1-terminus | 1.05 s 最佳: 0.76最差: 1.40 | 81.58t/s | 5 |
| 34 | qwen/qwen2.5-7b | 1.13 s 最佳: 0.63最差: 2.54 | 96.11t/s | 25 |
| 35 | deepseek-v3-2-251201 | 1.24 s 最佳: 0.59最差: 1.82 | 30.46t/s | 5 |
| 36 | deepseek-v3.2 | 1.25 s 最佳: 0.45最差: 15.32 | 23.49t/s | 30 |
| 37 | zhipu/glm-4-9b | 1.40 s 最佳: 0.84最差: 2.13 | 62.28t/s | 5 |
| 38 | google/gemini-3-flash-preview | 1.45 s 最佳: 0.93最差: 1.83 | 150.13t/s | 5 |
| 39 | gpt-oss-120b | 1.50 s 最佳: 1.27最差: 1.74 | 284.17t/s | 5 |
| 40 | deepseek-r1 | 1.50 s 最佳: 1.17最差: 2.07 | 56.00t/s | 5 |
| 41 | deepseek-v3.2-exp | 1.51 s 最佳: 0.55最差: 4.58 | 29.09t/s | 5 |
| 42 | gemini-2.5-flash-lite | 1.55 s 最佳: 0.85最差: 2.40 | 186.31t/s | 5 |
| 43 | deepseek-chat | 1.56 s 最佳: 0.39最差: 4.50 | 83.34t/s | 5 |
| 44 | zhipu/glm-4-flash | 1.57 s 最佳: 1.02最差: 2.05 | 33.00t/s | 5 |
| 45 | mimo-v2-flash | 1.58 s 最佳: 0.72最差: 4.06 | 102.45t/s | 5 |
| 46 | deepseek-v3-1-terminus | 1.65 s 最佳: 0.47最差: 7.42 | 60.84t/s | 15 |
| 47 | zhipu/glm-4-flash | 1.70 s 最佳: 0.45最差: 20.71 | 32.23t/s | 450 |
| 48 | claude-sonnet-4-5-20250929 | 1.77 s 最佳: 1.29最差: 2.32 | 45.03t/s | 5 |
| 49 | zhipu/glm-4-flash | 1.78 s 最佳: 0.87最差: 4.67 | 35.00t/s | 10 |
| 50 | gemini-2.0-flash | 1.79 s 最佳: 1.07最差: 2.54 | 181.83t/s | 5 |