排行榜
基于模型测速与 Provider 健康检查数据的多维排行榜,对比不同 Provider、端点与稳定性表现。
平均每秒输出的 Token 数,越高越好。
| 排名 | Provider | 模型 | 输出速度 | 平均首字延迟 | 次数 |
|---|---|---|---|---|---|
| 1 | gemini-2.5-flash-lite-preview-06-17 | 40187.33 t/s 最佳: 152407.16最差: 6824.77 | 3.48s | 5 | |
| 2 | gemini-2.0-flash-exp | 17860.77 t/s 最佳: 96952.73最差: 127.18 | 1.65s | 10 | |
| 3 |
| gemini-2.0-flash-exp |
17860.77 t/s 最佳: 96952.73最差: 127.18 |
1.65s |
| 10 |
| 4 | claude-3-7-sonnet-all | 3758.84 t/s 最佳: 8213.04最差: 243.43 | 12.74s | 5 |
| 5 | grok-3-mini | 717.78 t/s 最佳: 1677.62最差: 85.59 | 10.30s | 5 |
| 6 | gemini-2.5-flash | 642.40 t/s 最佳: 3012.76最差: 170.97 | 1.91s | 10 |
| 7 | qwen-3-235b-2507 | 625.49 t/s 最佳: 775.84最差: 442.86 | 0.37s | 5 |
| 8 | meta-llama/llama-4-scout-17b-16e-instruct | 444.26 t/s 最佳: 467.28最差: 430.44 | 0.63s | 5 |
| 9 | gpt-3.5-turbo | 426.80 t/s 最佳: 581.90最差: 233.22 | 2.94s | 15 |
| 10 | gemini-2.5-flash-lite-preview-06-17 | 407.69 t/s 最佳: 476.36最差: 339.09 | 0.74s | 5 |
| 11 | gemini-2.5-flash-lite | 390.20 t/s 最佳: 474.51最差: 280.23 | 0.65s | 20 |
| 12 | gemini-2.5-flash-lite-preview-06-17 | 388.26 t/s 最佳: 510.41最差: 292.56 | 0.92s | 5 |
| 13 | gemini-2.5-flash-lite-preview-06-17 | 386.12 t/s 最佳: 472.47最差: 258.67 | 0.78s | 5 |
| 14 | gemini-2.5-flash-lite-preview-06-17 | 381.52 t/s 最佳: 469.44最差: 329.36 | 0.84s | 5 |
| 15 | gemini-2.5-flash-lite | 371.07 t/s 最佳: 461.93最差: 332.48 | 0.66s | 5 |
| 16 | gpt-4.1 | 267.94 t/s 最佳: 432.66最差: 140.34 | 6.12s | 10 |
| 17 | gpt-4o-mini | 265.18 t/s 最佳: 661.86最差: 120.31 | 2.41s | 10 |
| 18 | gemini-2.5-flash | 259.32 t/s 最佳: 398.56最差: 194.35 | 9.28s | 5 |
| 19 | gemini-2.5-flash | 205.58 t/s 最佳: 319.95最差: 152.14 | 9.27s | 5 |
| 20 | gemini-2.5-flash | 205.58 t/s 最佳: 319.95最差: 152.14 | 9.27s | 5 |
| 21 | gemini-2.5-pro | 193.32 t/s 最佳: 461.68最差: 69.96 | 12.42s | 5 |
| 22 | grok-3-mini-fast | 193.21 t/s 最佳: 197.76最差: 184.35 | 2.81s | 5 |
| 23 | 酒馆-Flash | 191.64 t/s 最佳: 229.96最差: 137.38 | 7.74s | 5 |
| 24 | deepseek-ai/DeepSeek-V3-0324-Turbo | 179.62 t/s 最佳: 207.85最差: 148.35 | 0.82s | 5 |
| 25 | gpt-4.1-2025-04-14 | 166.07 t/s 最佳: 248.37最差: 87.23 | 5.27s | 5 |
| 26 | gemini-2.5-flash | 159.34 t/s 最佳: 202.36最差: 122.25 | 11.96s | 5 |
| 27 | gemini-2.0-flash | 154.99 t/s 最佳: 181.22最差: 127.30 | 1.71s | 5 |
| 28 | gemini-2.0-flash | 154.99 t/s 最佳: 181.22最差: 127.30 | 1.71s | 5 |
| 29 | qwen3-0.6b | 151.91 t/s 最佳: 167.30最差: 122.03 | 0.33s | 5 |
| 30 | gemini-2.5-flash | 147.19 t/s 最佳: 232.54最差: 106.02 | 12.62s | 10 |
| 31 | hunyuan-lite | 140.56 t/s 最佳: 146.15最差: 130.68 | 0.90s | 5 |
| 32 | gemini-2.5-flash | 139.81 t/s 最佳: 154.84最差: 130.67 | 12.87s | 5 |
| 33 | gemini-2.5-flash | 139.75 t/s 最佳: 171.48最差: 110.12 | 11.86s | 5 |
| 34 | o4-mini | 139.60 t/s 最佳: 191.08最差: 65.03 | 18.99s | 5 |
| 35 | o4-mini | 139.60 t/s 最佳: 191.08最差: 65.03 | 18.99s | 5 |
| 36 | o4-mini | 139.60 t/s 最佳: 191.08最差: 65.03 | 18.99s | 5 |
| 37 | gpt-4o | 136.68 t/s 最佳: 157.99最差: 101.26 | 0.87s | 5 |
| 38 | qwen3-1.7b | 135.23 t/s 最佳: 141.02最差: 125.43 | 5.33s | 5 |
| 39 | o3 | 134.40 t/s 最佳: 158.15最差: 82.91 | 2.82s | 5 |
| 40 | DeepSeek-V3-0324-80 | 129.14 t/s 最佳: 181.25最差: 86.11 | 0.97s | 5 |
| 41 | gpt-4.1-mini | 126.07 t/s 最佳: 205.91最差: 27.19 | 2.08s | 5 |
| 42 | gpt-4o-ca | 124.83 t/s 最佳: 147.64最差: 106.68 | 1.06s | 5 |
| 43 | google/gemini-2.0-flash-exp | 123.07 t/s 最佳: 145.17最差: 92.57 | 2.06s | 5 |
| 44 | gemini-2.5-flash-nothinking | 122.41 t/s 最佳: 141.94最差: 106.18 | 2.22s | 5 |
| 45 | GLM-4.5-Air | 120.66 t/s 最佳: 151.87最差: 107.69 | 1.08s | 5 |
| 46 | zhipu/glm-4.1v-thinking-flash | 119.79 t/s 最佳: 125.89最差: 114.41 | 6.36s | 5 |
| 47 | o4-mini-high | 118.19 t/s 最佳: 204.39最差: 41.72 | 14.36s | 5 |
| 48 | o4-mini-high | 118.19 t/s 最佳: 204.39最差: 41.72 | 14.36s | 5 |
| 49 | o4-mini-high | 118.19 t/s 最佳: 204.39最差: 41.72 | 14.36s | 5 |
| 50 | grok-3-mini | 114.95 t/s 最佳: 120.62最差: 106.86 | 4.71s | 5 |