New API

API 提供商性能测试结果

主机地址ai.081007.xyz

支持模型11 个

支持的模型

11 个模型

模型名称	测试次数	平均输出速度	平均首字延迟
Qwen3-235B-A22B	10	40.69 t/s	7.58s
gpt-oss-20b	10	229.65 t/s	1.77s
DeepSeek-V3-0324	5	49.39 t/s	17.04s
doubao-1.6	5	46.33 t/s	19.62s
gemini-2.5-flash	5	208.59 t/s	8.73s
gemini-2.5-pro	5	16.08 t/s	14.26s
GLM-4.5-Air	5	64.75 t/s	3.72s
kimi-k2-instruct	5	41.95 t/s	1.62s
command-a-03-2025	5	120.65 t/s	0.52s
ST-dolphin-mistral-24b-未经审查	5	27.10 t/s	1.83s
DeepSeek-R1-0528	5	34.88 t/s	13.67s

总测试次数

65

总测试次数

平均输出速度

88.49 t/s

0.00 - 278.43 t/s

平均首字延迟

7.67s

0.42 - 72.73s

最后测试时间

8/13/2025, 2:30:25 PM

最近测试时间

热门模型性能排行

1

gpt-oss-20b

测试次数: 10

229.65 t/s

平均速度

2

gemini-2.5-flash

测试次数: 5

208.59 t/s

平均速度

3

command-a-03-2025

测试次数: 5

120.65 t/s

平均速度

4

GLM-4.5-Air

测试次数: 5

64.75 t/s

平均速度

5

DeepSeek-V3-0324

测试次数: 5

49.39 t/s

平均速度

最近测试记录

10 条记录

测试时间	模型	平均输出速度	平均首字延迟	总令牌数
8/13/2025, 2:30:25 PM	Qwen3-235B-A22B	31.46 t/s	1.49s	2958
8/13/2025, 2:26:57 PM	gemini-2.5-flash	208.59 t/s	8.73s	4660
8/13/2025, 2:24:48 PM	gemini-2.5-pro	16.08 t/s	14.26s	1139
8/13/2025, 2:05:45 PM	kimi-k2-instruct	41.95 t/s	1.62s	3619
8/13/2025, 1:59:03 PM	Qwen3-235B-A22B	49.92 t/s	13.66s	4712
8/13/2025, 1:55:09 PM	DeepSeek-R1-0528	34.88 t/s	13.67s	4582
8/13/2025, 1:52:32 PM	DeepSeek-V3-0324	49.39 t/s	17.04s	2489
8/13/2025, 1:51:42 PM	gpt-oss-20b	218.16 t/s	1.74s	4371
8/13/2025, 1:45:03 PM	ST-dolphin-mistral-24b-未经审查	27.10 t/s	1.83s	2040
8/13/2025, 1:42:23 PM	GLM-4.5-Air	64.75 t/s	3.72s	5391