基于 Canonical 模型表,查看跨提供商的覆盖与性能概览。
当前显示 1-24 / 36 个模型
Qwen3
提供商
34
变体
85
平均速度
27.18 t/s
首字延迟
24.52 秒
测试
7,255
QwQ
13
19
28.86 t/s
26.73 秒
6,588
glm-4
21
50
36.81 t/s
1.25 秒
5,185
DeepSeek-V3
65
96
721.22 t/s
3.36 秒
950
qwen2
11
56
59.67 t/s
1.23 秒
490
Qwen2.5
45
50.52 t/s
1.34 秒
405
test
26
138.96 t/s
2.40 秒
194
deepseek-v3.1
16
3269.13 t/s
2.03 秒
175
gpt-oss
15
296.95 t/s
4.08 秒
165
glm-4.5
14
20
49.80 t/s
9.95 秒
145
llama-4
8
303.97 t/s
0.82 秒
105
qwen3-coder
12
97.16 t/s
2.41 秒
70
qwen3-next
7
145.19 t/s
1.14 秒
qwen2.5-coder
3
51.20 t/s
0.68 秒
60
qwen2.5-vl
40.03 t/s
1.56 秒
55
Qwen3-VL
4
5
64.27 t/s
12.99 秒
40
DeepSeek-V3.2
26.73 t/s
2.06 秒
glm-4.1v-thinking
2
108.16 t/s
7.48 秒
internlm2
68.06 t/s
0.61 秒
30
llama-3.3
770.59 t/s
0.46 秒
qwen2-vl
1
69.34 t/s
0.85 秒
phi-4
53.44 t/s
1.03 秒
GLM-4.6
84.59 t/s
2.28 秒
10
deepseek-v2
15.51 t/s
0.96 秒