排行榜
基于模型测速与 Provider 健康检查数据的多维排行榜,对比不同 Provider、端点与稳定性表现。
平均每秒输出的 Token 数,越高越好。
| 排名 | Provider | 模型 | 输出速度 | 平均首字延迟 | 次数 |
|---|---|---|---|---|---|
| 1 | o3-mini-high | 10126.52 t/s 最佳: 12035.32最差: 6606.85 | 3.47s | 5 | |
| 2 | GPT-4o-Mini | 8515.49 t/s 最佳: 11262.92最差: 4554.94 | 3.41s | 5 | |
| 3 |
| deepseek-v3-0324 |
604.52 t/s 最佳: 2745.61最差: 79.29 |
8.05s |
| 15 |
| 4 | deepseek/deepseek-v3 | 548.45 t/s 最佳: 2288.11最差: 89.93 | 4.82s | 5 |
| 5 | qwen-reasoning | 400.90 t/s 最佳: 421.47最差: 347.00 | 2.67s | 5 |
| 6 | Groq/qwen-qwq-32b | 382.11 t/s 最佳: 432.96最差: 288.56 | 1.36s | 5 |
| 7 | QwQ-32B | 297.86 t/s 最佳: 401.34最差: 36.73 | 1.09s | 5 |
| 8 | gemini-2.0-flash-exp | 231.20 t/s 最佳: 344.84最差: 182.85 | 4.36s | 5 |
| 9 | gemini-2.0-flash | 220.95 t/s 最佳: 319.67最差: 173.39 | 1.30s | 5 |
| 10 | deepseek/deepseek-v3-0324 | 210.47 t/s 最佳: 406.45最差: 31.81 | 4.28s | 5 |
| 11 | claude-3-7-sonnet-20250219 | 179.07 t/s 最佳: 723.79最差: 30.69 | 9.50s | 5 |
| 12 | gemini-2.5-pro-exp-03-25 | 159.02 t/s 最佳: 255.07最差: 107.99 | 17.77s | 5 |
| 13 | openai | 152.10 t/s 最佳: 159.22最差: 142.24 | 2.77s | 5 |
| 14 | openai-large | 121.85 t/s 最佳: 150.26最差: 73.47 | 2.38s | 10 |
| 15 | gemini-2.5-pro-exp-03-25 | 121.26 t/s 最佳: 164.64最差: 83.84 | 16.05s | 5 |
| 16 | gpt-3.5-turbo | 121.17 t/s 最佳: 141.40最差: 101.17 | 1.41s | 5 |
| 17 | gemini | 119.88 t/s 最佳: 150.74最差: 108.77 | 2.53s | 5 |
| 18 | gpt-4o | 114.07 t/s 最佳: 156.04最差: 76.49 | 1.11s | 10 |
| 19 | gpt-4o-mini | 107.18 t/s 最佳: 153.56最差: 84.01 | 2.14s | 5 |
| 20 | best-free | 102.43 t/s 最佳: 134.97最差: 5.30 | 34.49s | 5 |
| 21 | best-free | 100.39 t/s 最佳: 126.04最差: 5.60 | 0.74s | 5 |
| 22 | Qwen/Qwen2-7B-Instruct | 98.75 t/s 最佳: 100.45最差: 95.18 | 0.54s | 5 |
| 23 | gpt-4o | 92.54 t/s 最佳: 129.53最差: 34.60 | 1.71s | 10 |
| 24 | gpt-4o-2024-11-20 | 88.57 t/s 最佳: 158.92最差: 42.12 | 1.52s | 5 |
| 25 | gpt-4o-mini | 86.37 t/s 最佳: 107.93最差: 69.76 | 1.64s | 5 |
| 26 | gpt-4o-mini | 86.04 t/s 最佳: 116.56最差: 48.78 | 1.27s | 5 |
| 27 | gpt-4o-2024-11-20 | 84.77 t/s 最佳: 132.15最差: 38.25 | 3.24s | 5 |
| 28 | gpt-4o | 78.41 t/s 最佳: 147.24最差: 47.66 | 1.03s | 5 |
| 29 | zhipu/glm-4v-flash | 77.34 t/s 最佳: 96.33最差: 53.61 | 0.95s | 5 |
| 30 | deepseek-ai/DeepSeek-V3-0324-fast | 73.57 t/s 最佳: 78.88最差: 63.78 | 0.62s | 5 |
| 31 | Qwen/QwQ-32B-Preview | 70.89 t/s 最佳: 73.33最差: 67.64 | 0.80s | 5 |
| 32 | Qwen/QwQ-32B-Preview | 69.75 t/s 最佳: 73.71最差: 67.36 | 0.62s | 5 |
| 33 | deepseek-ai/DeepSeek-R1-Distill-Qwen-14B | 67.68 t/s 最佳: 81.31最差: 42.45 | 10.66s | 5 |
| 34 | jinshu-1.5 | 66.48 t/s 最佳: 122.84最差: 27.30 | 1.59s | 10 |
| 35 | Qwen/Qwen2.5-14B-Instruct | 64.55 t/s 最佳: 94.18最差: 34.42 | 0.61s | 5 |
| 36 | gpt-4o | 63.64 t/s 最佳: 115.28最差: 15.34 | 1.81s | 10 |
| 37 | claude-3-7-sonnet-20250219 | 62.66 t/s 最佳: 79.75最差: 47.90 | 2.52s | 5 |
| 38 | qwen1.5-7b-chat | 59.96 t/s 最佳: 61.92最差: 57.43 | 0.89s | 10 |
| 39 | grok-2-1212 | 58.57 t/s 最佳: 68.84最差: 51.94 | 0.60s | 10 |
| 40 | deepseek-ai/DeepSeek-R1-Distill-Qwen-7B | 58.20 t/s 最佳: 82.47最差: 31.09 | 12.80s | 10 |
| 41 | deepseek-ai/DeepSeek-R1-Distill-Qwen-7B | 57.75 t/s 最佳: 72.45最差: 40.70 | 12.05s | 5 |
| 42 | jinshu | 56.96 t/s 最佳: 99.10最差: 31.21 | 1.62s | 5 |
| 43 | claude-3-7-sonnet-20250219 | 55.56 t/s 最佳: 72.49最差: 43.44 | 3.51s | 5 |
| 44 | claude-3-7-sonnet-20250219 | 54.37 t/s 最佳: 63.89最差: 43.64 | 6.92s | 5 |
| 45 | qwen-turbo-2024-11-01 | 50.95 t/s 最佳: 52.56最差: 46.88 | 0.92s | 5 |
| 46 | grok-3 | 49.76 t/s 最佳: 56.49最差: 39.24 | 1.90s | 5 |
| 47 | gemini-2.0-pro-exp-02-05 | 49.44 t/s 最佳: 57.33最差: 42.76 | 1.77s | 5 |
| 48 | 火山R1-32B | 48.09 t/s 最佳: 54.28最差: 31.01 | 22.59s | 5 |
| 49 | deepseek-r1:7b | 45.86 t/s 最佳: 71.52最差: 0.82 | 4.31s | 65 |
| 50 | qwq-plus-latest | 43.91 t/s 最佳: 49.41最差: 36.58 | 19.49s | 5 |