router.huggingface.co

API 提供商性能测试结果

主机地址router.huggingface.co
支持模型7 个
支持的模型
7 个模型
模型名称测试次数平均输出速度平均首字延迟
moonshotai/Kimi-K2-Instruct:novita
5
48.81 t/s
1.21s
openai/gpt-oss-120b
5
225.67 t/s
0.92s
openai/gpt-oss-120b:novita
5
240.32 t/s
1.26s
openai/gpt-oss-20b:novita
5
155.67 t/s
3.56s
Qwen/Qwen3-235B-A22B:novita
5
34.12 t/s
1.12s
Qwen/Qwen3-Coder-480B-A35B-Instruct:novita
5
63.59 t/s
1.06s
zai-org/GLM-4.5:novita
5
35.36 t/s
1.39s
总测试次数
35

总测试次数

平均输出速度
114.79 t/s

26.37 - 265.38 t/s

平均首字延迟
1.50s

0.63 - 8.91s

最后测试时间
8/19/2025, 7:25:23 AM

最近测试时间

热门模型性能排行
1

openai/gpt-oss-120b:novita

测试次数: 5

240.32 t/s

平均速度

2

openai/gpt-oss-120b

测试次数: 5

225.67 t/s

平均速度

3

openai/gpt-oss-20b:novita

测试次数: 5

155.67 t/s

平均速度

4

Qwen/Qwen3-Coder-480B-A35B-Instruct:novita

测试次数: 5

63.59 t/s

平均速度

5

moonshotai/Kimi-K2-Instruct:novita

测试次数: 5

48.81 t/s

平均速度

最近测试记录
7 条记录
测试时间模型平均输出速度平均首字延迟总令牌数
8/19/2025, 7:25:23 AM
openai/gpt-oss-120b
225.67 t/s
0.92s
5630
8/13/2025, 3:29:37 PM
moonshotai/Kimi-K2-Instruct:novita
48.81 t/s
1.21s
2423
8/13/2025, 3:26:54 PM
Qwen/Qwen3-Coder-480B-A35B-Instruct:novita
63.59 t/s
1.06s
1772
8/13/2025, 2:45:43 PM
openai/gpt-oss-20b:novita
155.67 t/s
3.56s
4701
8/13/2025, 2:41:25 PM
openai/gpt-oss-120b:novita
240.32 t/s
1.26s
7011
8/13/2025, 2:35:13 PM
zai-org/GLM-4.5:novita
35.36 t/s
1.39s
5178
8/13/2025, 3:46:09 AM
Qwen/Qwen3-235B-A22B:novita
34.12 t/s
1.12s
3072