排行榜
基于模型测速结果的性能排行榜,对比不同 Provider 和端点的模型表现。
平均每秒输出的 Token 数,越高越好。
| 排名 | Provider | 模型 | 输出速度 | 平均首字延迟 | 次数 |
|---|---|---|---|---|---|
| 1 | jimmy | 101506.95 t/s 最佳: 145658.50最差: 13204.57 | 0.59s | 5 | |
| 2 | jimmy | 86213.91 t/s 最佳: 138352.88最差: 42053.25 | 0.58s | 10 | |
| 3 |
| grok-imagine-1.0-fast |
4998.02 t/s 最佳: 7933.91最差: 1462.69 |
4.80s |
| 15 |
| 4 | nvidia/nemotron-3-nano-30b-a3b | 246.87 t/s 最佳: 299.20最差: 195.73 | 1.15s | 5 |
| 5 | grok-4.1-fast | 99.38 t/s 最佳: 128.20最差: 82.86 | 1.37s | 5 |
| 6 | qwen/qwen2.5-7b | 90.28 t/s 最佳: 110.81最差: 36.90 | 0.92s | 5 |
| 7 | grok-4.1-mini | 73.19 t/s 最佳: 102.55最差: 53.30 | 7.00s | 5 |
| 8 | qwen-3.5-plus | 55.05 t/s 最佳: 65.34最差: 42.13 | 3.10s | 5 |
| 9 | grok-4.1-expert | 33.09 t/s 最佳: 53.89最差: 16.09 | 1.05s | 5 |
| 10 | zhipu/glm-4-flash | 30.82 t/s 最佳: 38.45最差: 22.97 | 0.86s | 30 |
| 11 | Mimo-v2-Flash | 0.00 t/s 最佳: 0.00最差: 0.00 | 1.16s | 45 |