router.huggingface.co

API 提供商性能测试结果

主机地址router.huggingface.co

支持模型7 个

支持的模型

7 个模型

模型名称	测试次数	平均输出速度	平均首字延迟
moonshotai/Kimi-K2-Instruct:novita	5	48.81 t/s	1.21s
openai/gpt-oss-120b	5	225.67 t/s	0.92s
openai/gpt-oss-120b:novita	5	240.32 t/s	1.26s
openai/gpt-oss-20b:novita	5	155.67 t/s	3.56s
Qwen/Qwen3-235B-A22B:novita	5	34.12 t/s	1.12s
Qwen/Qwen3-Coder-480B-A35B-Instruct:novita	5	63.59 t/s	1.06s
zai-org/GLM-4.5:novita	5	35.36 t/s	1.39s

总测试次数

35

总测试次数

平均输出速度

114.79 t/s

26.37 - 265.38 t/s

平均首字延迟

1.50s

0.63 - 8.91s

最后测试时间

8/19/2025, 7:25:23 AM

最近测试时间

热门模型性能排行

1

openai/gpt-oss-120b:novita

测试次数: 5

240.32 t/s

平均速度

2

openai/gpt-oss-120b

测试次数: 5

225.67 t/s

平均速度

3

openai/gpt-oss-20b:novita

测试次数: 5

155.67 t/s

平均速度

4

Qwen/Qwen3-Coder-480B-A35B-Instruct:novita

测试次数: 5

63.59 t/s

平均速度

5

moonshotai/Kimi-K2-Instruct:novita

测试次数: 5

48.81 t/s

平均速度

最近测试记录

7 条记录

测试时间	模型	平均输出速度	平均首字延迟	总令牌数
8/19/2025, 7:25:23 AM	openai/gpt-oss-120b	225.67 t/s	0.92s	5630
8/13/2025, 3:29:37 PM	moonshotai/Kimi-K2-Instruct:novita	48.81 t/s	1.21s	2423
8/13/2025, 3:26:54 PM	Qwen/Qwen3-Coder-480B-A35B-Instruct:novita	63.59 t/s	1.06s	1772
8/13/2025, 2:45:43 PM	openai/gpt-oss-20b:novita	155.67 t/s	3.56s	4701
8/13/2025, 2:41:25 PM	openai/gpt-oss-120b:novita	240.32 t/s	1.26s	7011
8/13/2025, 2:35:13 PM	zai-org/GLM-4.5:novita	35.36 t/s	1.39s	5178
8/13/2025, 3:46:09 AM	Qwen/Qwen3-235B-A22B:novita	34.12 t/s	1.12s	3072