API 提供商性能测试结果
模型名称 | 测试次数 | 平均输出速度 | 平均首字延迟 |
---|---|---|---|
allam-2-7b | 5 | 337.15 t/s | 0.27s |
gemini-2.5-flash-lite-ts | 5 | 214.83 t/s | 1.17s |
lgai/exaone-3-5-32b-instruct | 5 | 100.84 t/s | 1.08s |
Qwen/Qwen3-32B-FP8 | 5 | 75.12 t/s | 1.01s |
总测试次数
19.95 - 517.78 t/s
0.23 - 2.31s
最近测试时间
allam-2-7b
测试次数: 5
337.15 t/s
平均速度
gemini-2.5-flash-lite-ts
测试次数: 5
214.83 t/s
平均速度
lgai/exaone-3-5-32b-instruct
测试次数: 5
100.84 t/s
平均速度
Qwen/Qwen3-32B-FP8
测试次数: 5
75.12 t/s
平均速度
测试时间 | 模型 | 平均输出速度 | 平均首字延迟 | 总令牌数 |
---|---|---|---|---|
8/9/2025, 8:16:15 AM | gemini-2.5-flash-lite-ts | 214.83 t/s | 1.17s | 4875 |
8/9/2025, 8:14:54 AM | lgai/exaone-3-5-32b-instruct | 100.84 t/s | 1.08s | 2953 |
8/9/2025, 8:11:07 AM | Qwen/Qwen3-32B-FP8 | 75.12 t/s | 1.01s | 5706 |
8/9/2025, 8:10:29 AM | allam-2-7b | 337.15 t/s | 0.27s | 1842 |