排行榜
基于模型测速结果的性能排行榜,对比不同 Provider 和端点的模型表现。
平均每秒输出的 Token 数,越高越好。
| 排名 | Provider | 模型 | 输出速度 | 平均首字延迟 | 次数 |
|---|---|---|---|---|---|
| 1 | gemini-2.5-flash | 104600.84 t/s 最佳: 115213.03最差: 81275.31 | 19.21s | 5 | |
| 2 | jimmy | 101506.95 t/s 最佳: 145658.50最差: 13204.57 | 0.59s | 5 | |
| 3 |
| jimmy |
86213.91 t/s 最佳: 138352.88最差: 42053.25 |
0.58s |
| 10 |
| 4 | llama3.1-8B | 38588.02 t/s 最佳: 148734.34最差: 4954.13 | 0.52s | 25 |
| 5 | llama3.1-8B | 38588.02 t/s 最佳: 148734.34最差: 4954.13 | 0.52s | 25 |
| 6 | llama3.1-8B | 37444.09 t/s 最佳: 73468.61最差: 4399.22 | 0.39s | 20 |
| 7 | llama3.1-8B | 37444.09 t/s 最佳: 73468.61最差: 4399.22 | 0.39s | 20 |
| 8 | translate-model | 31767.17 t/s 最佳: 48227.39最差: 13109.67 | 1.06s | 5 |
| 9 | gemini-3-pro | 14970.09 t/s 最佳: 17228.53最差: 9361.83 | 3.36s | 5 |
| 10 | [hy-z专线][价格:0.03]假流式/gemini-3-flash-preview | 13458.91 t/s 最佳: 20185.37最差: 10206.45 | 11.56s | 5 |
| 11 | echo | 6152.15 t/s 最佳: 22934.12最差: 506.54 | 0.75s | 15 |
| 12 | DeepSeek-V3.2 | 5418.46 t/s 最佳: 7619.40最差: 18.85 | 1.39s | 15 |
| 13 | grok-imagine-1.0-fast | 4998.02 t/s 最佳: 7933.91最差: 1462.69 | 4.80s | 15 |
| 14 | gemini-2.5-pro | 3661.62 t/s 最佳: 42899.94最差: 59.79 | 25.24s | 25 |
| 15 | gpt-oss-120b | 1796.31 t/s 最佳: 2033.04最差: 1592.31 | 0.49s | 5 |
| 16 | gpt-oss-120b | 1677.82 t/s 最佳: 2010.50最差: 1370.01 | 0.56s | 10 |
| 17 | gpt-oss-120b | 1671.10 t/s 最佳: 2122.88最差: 1222.85 | 0.72s | 20 |
| 18 | gpt-oss-120b | 1671.10 t/s 最佳: 2122.88最差: 1222.85 | 0.72s | 20 |
| 19 | mercury-2 | 1653.71 t/s 最佳: 6228.40最差: 371.89 | 2.50s | 5 |
| 20 | mercury-2 | 1653.71 t/s 最佳: 6228.40最差: 371.89 | 2.50s | 5 |
| 21 | gpt-oss-120b | 1637.28 t/s 最佳: 1932.26最差: 1351.73 | 0.91s | 10 |
| 22 | gpt-oss-120b | 1637.28 t/s 最佳: 1932.26最差: 1351.73 | 0.91s | 10 |
| 23 | llama3.1-8B | 1421.44 t/s 最佳: 2829.11最差: 100.62 | 0.94s | 10 |
| 24 | 快速/llama3.1-8B | 1258.69 t/s 最佳: 2172.93最差: 595.62 | 1.24s | 15 |
| 25 | gpt-oss-120b | 970.77 t/s 最佳: 1257.59最差: 429.54 | 0.94s | 5 |
| 26 | llama3.1-8b | 731.95 t/s 最佳: 1144.52最差: 67.76 | 1.17s | 15 |
| 27 | echo-flash | 685.41 t/s 最佳: 869.81最差: 400.49 | 0.08s | 5 |
| 28 | gemini-3.1-pro-preview | 664.77 t/s 最佳: 2782.93最差: 79.68 | 25.06s | 5 |
| 29 | gemini-2.5-flash | 648.86 t/s 最佳: 4724.09最差: 37.55 | 10.36s | 10 |
| 30 | groq/compound-mini | 477.57 t/s 最佳: 493.59最差: 465.42 | 0.89s | 5 |
| 31 | glm-4.7 | 454.62 t/s 最佳: 735.18最差: 237.51 | 2.87s | 10 |
| 32 | glm-4.7-特别版 | 428.83 t/s 最佳: 542.27最差: 347.54 | 3.12s | 5 |
| 33 | gemini-2.5-flash-lite | 410.62 t/s 最佳: 477.12最差: 272.30 | 2.28s | 5 |
| 34 | tab_flash_lite_preview | 396.29 t/s 最佳: 588.50最差: 268.05 | 1.41s | 5 |
| 35 | inception/mercury | 386.10 t/s 最佳: 525.30最差: 123.95 | 1.26s | 15 |
| 36 | gpt-oss-20b:free | 339.45 t/s 最佳: 571.58最差: 129.16 | 2.51s | 5 |
| 37 | gemini-3.0-flash | 336.24 t/s 最佳: 813.64最差: 4.20 | 12.65s | 5 |
| 38 | 翻译/glm-4.7 | 308.58 t/s 最佳: 391.37最差: 194.72 | 3.72s | 5 |
| 39 | [V]gemini-2.5-flash-lite | 301.65 t/s 最佳: 359.28最差: 270.39 | 1.25s | 5 |
| 40 | ant_gemini-2.5-flash-lite | 290.47 t/s 最佳: 331.25最差: 255.80 | 2.32s | 5 |
| 41 | gemini-2.5-flash-lite | 284.77 t/s 最佳: 335.73最差: 253.26 | 1.37s | 5 |
| 42 | 流式抗截断/gemini-2.5-pro | 281.87 t/s 最佳: 480.57最差: 142.19 | 15.62s | 5 |
| 43 | gemini-2.5-flash | 274.40 t/s 最佳: 416.35最差: 211.94 | 8.21s | 5 |
| 44 | 翻译/标题/OCR模型 | 260.68 t/s 最佳: 316.11最差: 238.96 | 0.91s | 5 |
| 45 | gpt-oss-120b:free | 257.64 t/s 最佳: 894.33最差: 59.62 | 2.50s | 5 |
| 46 | meta/llama-3.2-1b-instruct | 257.24 t/s 最佳: 427.35最差: 147.85 | 5.26s | 10 |
| 47 | gpt-oss-120b-medium | 255.84 t/s 最佳: 323.68最差: 172.21 | 1.45s | 5 |
| 48 | gpt-oss-120b-medium | 255.84 t/s 最佳: 323.68最差: 172.21 | 1.45s | 5 |
| 49 | nvidia/nemotron-3-nano-30b-a3b | 246.87 t/s 最佳: 299.20最差: 195.73 | 1.15s | 5 |
| 50 | deepseek-ai/DeepSeek-R1-0528-fast | 240.66 t/s 最佳: 277.76最差: 196.22 | 1.34s | 5 |