排行榜
基于模型测速与 Provider 健康检查数据的多维排行榜,对比不同 Provider、端点与稳定性表现。
平均每秒输出的 Token 数,越高越好。
| 排名 | Provider | 模型 | 输出速度 | 平均首字延迟 | 次数 |
|---|---|---|---|---|---|
| 1 | jimmy | 89773.31 t/s 最佳: 145658.50最差: 13204.57 | 0.63s | 10 | |
| 2 | jimmy | 76101.33 t/s 最佳: 138352.88最差: 15563.41 | 0.60s | 15 | |
| 3 |
| gpt-5-high |
62438.11 t/s 最佳: 123417.05最差: 182.61 |
14.27s |
| 5 |
| 4 | minimax/minimax-m2.5:free | 42367.74 t/s 最佳: 110596.73最差: 123.85 | 15.41s | 5 |
| 5 | kilo-auto/free | 42116.89 t/s 最佳: 141870.06最差: 99.41 | 14.36s | 10 |
| 6 | claude-opus-4-6 | 35523.93 t/s 最佳: 97038.07最差: 40.92 | 10.21s | 10 |
| 7 | claude-opus-4-6 | 35283.10 t/s 最佳: 73526.11最差: 0.00 | 9.02s | 10 |
| 8 | kilo/minimax-m2.5 | 18859.22 t/s 最佳: 31447.63最差: 45.10 | 9.38s | 5 |
| 9 | llama3.1-8B | 17820.14 t/s 最佳: 41610.30最差: 1523.25 | 0.42s | 85 |
| 10 | llama3.1-8B | 17820.14 t/s 最佳: 41610.30最差: 1523.25 | 0.42s | 85 |
| 11 | translate-model | 15990.56 t/s 最佳: 48227.39最差: 161.10 | 1.25s | 10 |
| 12 | llama3.1-8B | 14956.18 t/s 最佳: 23028.86最差: 4292.03 | 1.60s | 15 |
| 13 | claude-opus-4-6 | 14565.00 t/s 最佳: 25852.70最差: 41.37 | 7.95s | 10 |
| 14 | claude-sonnet-4-6 | 13044.40 t/s 最佳: 39948.79最差: 0.00 | 5.86s | 10 |
| 15 | llama3.1-8B | 12425.64 t/s 最佳: 170331.58最差: 335.19 | 0.43s | 240 |
| 16 | claude-sonnet-4-5-20250929 | 12401.37 t/s 最佳: 27448.31最差: 0.00 | 7.46s | 20 |
| 17 | anthropic/claude-sonnet-4.6 | 11506.04 t/s 最佳: 44409.41最差: 36.75 | 3.12s | 10 |
| 18 | grok-imagine-1.0-fast | 4998.02 t/s 最佳: 7933.91最差: 1462.69 | 4.80s | 15 |
| 19 | anthropic/claude-sonnet-4.6 | 4641.90 t/s 最佳: 25206.38最差: 39.10 | 3.45s | 10 |
| 20 | claude-sonnet-4-5-20250929 | 4552.11 t/s 最佳: 23856.21最差: 38.64 | 3.17s | 10 |
| 21 | claude-haiku-4-5-20251001 | 3615.46 t/s 最佳: 17553.74最差: 153.66 | 4.65s | 10 |
| 22 | llama3.1-8b | 2301.73 t/s 最佳: 2860.23最差: 1596.67 | 0.38s | 10 |
| 23 | llama3.1-8b | 1910.78 t/s 最佳: 2242.04最差: 1101.22 | 0.43s | 5 |
| 24 | gpt-oss-120b | 1467.36 t/s 最佳: 1785.19最差: 1053.27 | 0.82s | 5 |
| 25 | claude-sonnet-4-20250514 | 1414.76 t/s 最佳: 2664.12最差: 764.55 | 2.70s | 10 |
| 26 | claude-sonnet-4-5-20250929 | 1336.95 t/s 最佳: 1962.60最差: 838.68 | 4.09s | 5 |
| 27 | gpt-oss-120b | 1319.02 t/s 最佳: 2371.72最差: 640.36 | 0.61s | 10 |
| 28 | kimi-k2.5 | 1268.36 t/s 最佳: 2318.76最差: 489.30 | 2.12s | 35 |
| 29 | gemini-2.5-flash-lite-preview-09-2025-thinking | 1220.53 t/s 最佳: 2646.27最差: 359.25 | 7.20s | 5 |
| 30 | claude-3-5-sonnet-20241022 | 1068.52 t/s 最佳: 2033.08最差: 461.35 | 2.74s | 10 |
| 31 | qwen-3-235b-a22b-instruct-2507 | 910.44 t/s 最佳: 1417.04最差: 592.53 | 0.50s | 5 |
| 32 | qwen-3-235b | 878.97 t/s 最佳: 1762.38最差: 523.26 | 1.62s | 5 |
| 33 | openai/gpt-oss-safeguard-20b | 869.93 t/s 最佳: 1144.67最差: 637.27 | 0.67s | 5 |
| 34 | claude-3-5-sonnet-20241022 | 839.26 t/s 最佳: 1803.13最差: 338.25 | 2.68s | 5 |
| 35 | nvidia/llama-3.1-nemoguard-8b-content-safety | 628.67 t/s 最佳: 1583.25最差: 7.99 | 1.03s | 5 |
| 36 | gpt-oss-safeguard-20b | 610.97 t/s 最佳: 953.66最差: 394.19 | 0.63s | 5 |
| 37 | qwen-opus:latest | 522.69 t/s 最佳: 2309.67最差: 49.88 | 7.59s | 5 |
| 38 | 酒馆-Teller | 509.57 t/s 最佳: 963.76最差: 323.85 | 14.47s | 5 |
| 39 | gpt-5 | 490.00 t/s 最佳: 719.34最差: 118.57 | 13.34s | 10 |
| 40 | gpt-5-codex | 465.66 t/s 最佳: 793.38最差: 175.13 | 3.30s | 5 |
| 41 | gemini-3.1-pro-preview | 462.04 t/s 最佳: 1827.55最差: 82.45 | 23.27s | 5 |
| 42 | qwen2.5:1.5b | 435.32 t/s 最佳: 480.86最差: 273.41 | 1.63s | 5 |
| 43 | qwen2.5:1.5b | 435.32 t/s 最佳: 480.86最差: 273.41 | 1.63s | 5 |
| 44 | qwen2.5:1.5b | 435.32 t/s 最佳: 480.86最差: 273.41 | 1.63s | 5 |
| 45 | CPA/gpt-5.4-mini | 430.22 t/s 最佳: 858.15最差: 167.01 | 3.41s | 5 |
| 46 | gpt-5.2-codex | 404.70 t/s 最佳: 1706.85最差: 53.60 | 4.71s | 5 |
| 47 | gpt-5-codex | 402.13 t/s 最佳: 592.56最差: 149.00 | 2.22s | 5 |
| 48 | gpt-5.4-mini | 382.82 t/s 最佳: 727.09最差: 129.16 | 4.49s | 5 |
| 49 | qwen3.5-0.8b | 354.52 t/s 最佳: 369.51最差: 319.73 | 0.82s | 10 |
| 50 | qwen3.5-0.8b | 354.52 t/s 最佳: 369.51最差: 319.73 | 0.82s | 10 |