排行榜
基于模型测速与 Provider 健康检查数据的多维排行榜,对比不同 Provider、端点与稳定性表现。
平均每秒输出的 Token 数,越高越好。
| 排名 | Provider | 模型 | 输出速度 | 平均首字延迟 | 次数 |
|---|---|---|---|---|---|
| 1 | gemini-2.5-flash-lite-preview-06-17 | 228523.98 t/s 最佳: 275494.22最差: 167422.60 | 4.79s | 5 | |
| 2 | gemini-2.5-pro | 226468.01 t/s 最佳: 266694.80最差: 184690.62 | 29.88s | 5 | |
| 3 |
| gpt-5-mini |
155739.72 t/s 最佳: 241216.90最差: 72339.91 |
12.30s |
| 5 |
| 4 | gemini-2.5-flash-lite-search | 115243.74 t/s 最佳: 159414.00最差: 77574.79 | 8.28s | 5 |
| 5 | gemini-2.5-flash | 17911.37 t/s 最佳: 28154.49最差: 5924.55 | 14.53s | 5 |
| 6 | gemini-2.5-pro-search | 12441.96 t/s 最佳: 32439.33最差: 0.00 | 16.06s | 5 |
| 7 | gemini-2.5-pro-non-thinking | 10648.97 t/s 最佳: 29606.26最差: 0.00 | 10.79s | 10 |
| 8 | gemini-2.5-flash-lite | 5461.52 t/s 最佳: 8519.16最差: 1500.97 | 3.24s | 5 |
| 9 | evil | 1475.97 t/s 最佳: 2603.89最差: 43.96 | 0.81s | 25 |
| 10 | gpt-oss-120b | 771.04 t/s 最佳: 1060.54最差: 537.86 | 0.96s | 5 |
| 11 | qwen-3-32b | 571.61 t/s 最佳: 721.99最差: 420.20 | 1.10s | 5 |
| 12 | qwen-3-32b-turbo | 515.39 t/s 最佳: 574.61最差: 367.72 | 2.33s | 5 |
| 13 | qwen | 514.50 t/s 最佳: 1204.31最差: 50.42 | 1.89s | 5 |
| 14 | gemini-2.5-flash-lite-preview-06-17 | 401.84 t/s 最佳: 448.51最差: 330.74 | 0.61s | 5 |
| 15 | google/gemini-2.5-flash-lite | 363.58 t/s 最佳: 410.21最差: 288.92 | 1.42s | 5 |
| 16 | allam-2-7b | 337.15 t/s 最佳: 517.78最差: 19.95 | 0.27s | 5 |
| 17 | gemini-2.5-flash-lite | 335.31 t/s 最佳: 358.52最差: 315.00 | 0.52s | 5 |
| 18 | gemini-2.5-flash-lite | 296.41 t/s 最佳: 355.10最差: 175.06 | 1.49s | 5 |
| 19 | qwen-3-235b-a22b-instruct-2507 | 271.04 t/s 最佳: 361.74最差: 127.90 | 1.09s | 10 |
| 20 | deepseek/deepseek-v3-0324 | 263.53 t/s 最佳: 3035.26最差: 18.19 | 5.14s | 95 |
| 21 | p-openai-fast | 254.97 t/s 最佳: 281.16最差: 228.06 | 1.55s | 5 |
| 22 | openai-roblox | 248.43 t/s 最佳: 280.07最差: 235.96 | 3.76s | 5 |
| 23 | gpt-5-nano | 247.78 t/s 最佳: 258.42最差: 232.59 | 6.22s | 5 |
| 24 | openai/gpt-oss-120b:novita | 240.32 t/s 最佳: 265.38最差: 202.19 | 1.26s | 5 |
| 25 | openai/gpt-oss-120b:novita | 240.32 t/s 最佳: 265.38最差: 202.19 | 1.26s | 5 |
| 26 | openai/gpt-oss-20b | 239.61 t/s 最佳: 250.77最差: 211.54 | 10.88s | 5 |
| 27 | gpt-oss-120b | 236.16 t/s 最佳: 248.43最差: 199.06 | 1.55s | 5 |
| 28 | o4-mini | 231.62 t/s 最佳: 471.98最差: 115.12 | 9.23s | 5 |
| 29 | openai/gpt-oss-120b | 231.52 t/s 最佳: 241.58最差: 203.33 | 1.87s | 5 |
| 30 | gpt-oss-20b | 229.65 t/s 最佳: 278.43最差: 156.94 | 1.77s | 10 |
| 31 | [503]gemini-flash-lite | 229.64 t/s 最佳: 308.20最差: 158.99 | 2.17s | 5 |
| 32 | p-gemini | 228.63 t/s 最佳: 339.95最差: 140.29 | 2.82s | 5 |
| 33 | openai/gpt-oss-120b | 225.67 t/s 最佳: 241.37最差: 198.53 | 0.92s | 5 |
| 34 | openai/gpt-oss-120b | 225.67 t/s 最佳: 241.37最差: 198.53 | 0.92s | 5 |
| 35 | openai | 225.32 t/s 最佳: 277.36最差: 192.03 | 2.40s | 5 |
| 36 | p-openai | 223.10 t/s 最佳: 241.57最差: 186.17 | 1.54s | 5 |
| 37 | gemini-2.5-flash-lite-ts | 214.83 t/s 最佳: 293.14最差: 158.86 | 1.17s | 5 |
| 38 | Qwen/Qwen3-235B-A22B | 209.58 t/s 最佳: 707.69最差: 40.33 | 1.62s | 15 |
| 39 | gemini-2.5-flash | 208.59 t/s 最佳: 276.67最差: 166.48 | 8.73s | 5 |
| 40 | gemini-2.5-flash | 207.67 t/s 最佳: 455.94最差: 96.71 | 6.78s | 5 |
| 41 | [503]gemini-flash | 199.70 t/s 最佳: 241.45最差: 180.76 | 10.04s | 5 |
| 42 | (gold)gemini-2.5-flash | 192.64 t/s 最佳: 208.66最差: 167.20 | 9.01s | 5 |
| 43 | gemini-2.5-flash-cheap | 187.61 t/s 最佳: 234.57最差: 149.06 | 8.15s | 5 |
| 44 | models/gemini-2.5-flash | 184.25 t/s 最佳: 203.81最差: 159.14 | 8.26s | 5 |
| 45 | gemini-2.5-flash-nothinking | 174.04 t/s 最佳: 198.57最差: 143.55 | 0.82s | 5 |
| 46 | gemini-2.5-pro-thinking | 165.57 t/s 最佳: 405.64最差: 90.66 | 4.10s | 5 |
| 47 | minicpm4-8b:latest | 159.84 t/s 最佳: 170.29最差: 153.79 | 0.96s | 5 |
| 48 | minicpm4-8b:latest | 159.84 t/s 最佳: 170.29最差: 153.79 | 0.96s | 5 |
| 49 | openai/gpt-oss-20b:novita | 155.67 t/s 最佳: 191.01最差: 132.06 | 3.56s | 5 |
| 50 | openai/gpt-oss-20b:novita | 155.67 t/s 最佳: 191.01最差: 132.06 | 3.56s | 5 |