排行榜
基于模型测速结果的性能排行榜,对比不同 Provider 和端点的模型表现。
生成首个 Token 的平均时间,越低越好。
| 排名 | Provider | 模型 | 首字延迟 | 平均输出速度 | 次数 |
|---|---|---|---|---|---|
| 1 | jimmy | 0.58 s 最佳: 0.42最差: 1.18 | 86213.91t/s | 10 | |
| 2 | jimmy | 0.59 s 最佳: 0.46最差: 1.07 | 101506.95t/s | 5 | |
| 3 |
| zhipu/glm-4-flash |
0.86 s 最佳: 0.47最差: 1.79 |
30.82t/s |
| 30 |
| 4 | qwen/qwen2.5-7b | 0.92 s 最佳: 0.38最差: 2.17 | 90.28t/s | 5 |
| 5 | grok-4.1-expert | 1.05 s 最佳: 0.74最差: 1.53 | 33.09t/s | 5 |
| 6 | nvidia/nemotron-3-nano-30b-a3b | 1.15 s 最佳: 0.66最差: 2.81 | 246.87t/s | 5 |
| 7 | Mimo-v2-Flash | 1.16 s 最佳: 0.32最差: 18.38 | 0.00t/s | 45 |
| 8 | grok-4.1-fast | 1.37 s 最佳: 1.13最差: 1.59 | 99.38t/s | 5 |
| 9 | qwen-3.5-plus | 3.10 s 最佳: 2.54最差: 3.91 | 55.05t/s | 5 |
| 10 | grok-imagine-1.0-fast | 4.80 s 最佳: 3.11最差: 8.20 | 4998.02t/s | 15 |
| 11 | grok-4.1-mini | 7.00 s 最佳: 4.47最差: 11.98 | 73.19t/s | 5 |