这个比较为什么能收录？

它至少有 6 个可验证比较点，并且两个模型都有价格或测速数据。

没有数据的指标会不会编？

不会。没有 LMSpeed 数据的指标不会出现在这份报告里。

LM Speed

GPT-5.4 vs Grok 3：价格速度对比 | LMSpeed

返回模型目录

数据点: 78

Model compare

GPT-5.4 vs Grok 3

GPT-5.4 和 Grok 3 的结论先放在这里，方便先判断是否值得继续看明细。

模型 A

GPT-5.4

OpenAI

领先

模型 B

Grok 3

grok-3

对照

Key Takeaways

综合加权结果：GPT-5.4。Benchmark 能力分类占 80%，价格、API 性能和可用性占 20%。

结论

GPT-5.4

GPT-5.4 当前综合加权更高；模型 A / B 得分为 92 对 8。

证据覆盖

78 个数据点

包含 9 个 benchmark、1 个 audit 样本和 6 个 provider 样本。

选择依据

优先看 GPT-5.4

下方图表把 16 组高信号样本拆开，便于核对速度、跑分和安全分。

切换对比模型

左右两边都可以换成其他模型，页面会打开新的 LMSpeed 对比 URL。

模型 A模型 B

对比总表

这份报告只使用 LMSpeed 已有数据：GPT-5.4 和 Grok 3 的价格、测速聚合、第三方跑分与共同服务商样本。

综合领先	领先	对照
综合加权得分	92.0 分	8.0 分
Benchmark 分类领先	3 类	0 类
运营维度优势	平均速度、免费服务商、服务商覆盖	最低输入价格、首 token 延迟
上下文窗口	1.1M tokens	暂无数据
最大输出	128K tokens	暂无数据
模态	输入文本图像文件输出文本

模型元信息

Model compare	GPT-5.4	Grok 3
开发者	OpenAI	暂无数据
发布日期	2026年3月	暂无数据
参数量	暂无数据	暂无数据
Tokenizer	GPT	暂无数据
知识截止	暂无数据	暂无数据
OpenRouter ID	openai/gpt-5.4	暂无数据
来源链接	暂无数据	暂无数据

跑分对比

来自 LMSpeed 同步的第三方 benchmark profile；只展示两个模型都有数值的指标。

分类能力对比

按 0-100 分对比 benchmark 分类表现；点击分类可以聚焦查看差距。

模型 A 覆盖: 7 / 8
模型 B 覆盖: 3 / 8
共同覆盖: 3 个共同分类

平均分

GPT-5.4

57.4

平均分

Grok 3

48.1

Agents

GPT-5.4

GPT-5.456.5

Grok 3-

代码

GPT-5.4 领先 14.9

GPT-5.463

Grok 348.1

推理

GPT-5.4 领先 8.0

GPT-5.456.7

Grok 348.7

知识

GPT-5.4

GPT-5.459.9

Grok 3-

数学

GPT-5.4 领先 10.2

GPT-5.457.6

Grok 347.4

多语言

暂无数据

GPT-5.4-

Grok 3-

多模态

GPT-5.4

GPT-5.453.7

Grok 3-

指令遵循

GPT-5.4

GPT-5.454.3

Grok 3-

专业跑分明细

按具体 benchmark 指标对比两个模型，展示来源、排名覆盖、置信度、误差和评测日期等上下文。

能力组

综合reported

BenchLM overall score

来源GPT-5.4

GPT-5.4

领先

67.0

排名 #19/84 · confidence 3 · 评测日期 2026-03-05

+23.0

Grok 3

44.0

排名 #72/84 · confidence 1 · 评测日期 2025-02-19

价格verified

Input price

来源GPT-5.4 (Non-reasoning)

GPT-5.4

领先

$2.50/M

排名 #131/162 · confidence 4

+$1.50/M

Grok 3

$4.00/M

排名 #144/162 · confidence 4

价格verified

Blended price

来源GPT-5.4 (Non-reasoning)

GPT-5.4

领先

$5.63/M

排名 #135/162 · confidence 4

+$2.38/M

Grok 3

$8.00/M

排名 #146/162 · confidence 4

价格verified

Output price

来源GPT-5.4 (Non-reasoning)

GPT-5.4

领先

$15.00/M

排名 #136/162 · confidence 4

+$5.00/M

Grok 3

$20.00/M

排名 #146/162 · confidence 4

推理verified

HLE

来源GPT-5.4 (Non-reasoning)

GPT-5.4

领先

10.6%

排名 #91/187 · confidence 4

+5.5%

Grok 3

5.1%

排名 #135/187 · confidence 4

推理verified

GPQA

来源GPT-5.4 (Non-reasoning)

GPT-5.4

领先

74.8%

排名 #96/188 · confidence 4

+5.5%

Grok 3

69.3%

排名 #116/188 · confidence 4

代码verified

SciCode

来源GPT-5.4 (Non-reasoning)

GPT-5.4

领先

47.1%

排名 #24/185 · confidence 4

+10.3%

Grok 3

36.8%

排名 #97/185 · confidence 4

数学reported

FrontierMath v2 (Tiers 1-3)

来源GPT-5.4

GPT-5.4

领先

47.6

排名 #7/47 · confidence 3 · 评测日期 2026-03-05

+43.8

Grok 3

3.8

排名 #41/47 · confidence 1 · 评测日期 2025-02-19

数学reported

BenchLM Math score

来源GPT-5.4

GPT-5.4

领先

65.9

排名 #17/56 · confidence 3 · 评测日期 2026-03-05

+38.8

Grok 3

27.1

排名 #49/56 · confidence 1 · 评测日期 2025-02-19

API audit 对比

来自共同 provider 的最近完成 audit，展示四个安全/完整性分组分数和报告入口。

Provider	GPT-5.4	Grok 3
胜出方: GPT-5.4	GPT-5.4 gpt-5.4 Audit 分数 93 1008486100	Grok 3 grok-3 暂无 audit

Provider 数据样本

把同一 provider 的测速聚合和 input/output 价格放进同一行，便于判断实际 API 表现和迁移成本。

Provider	GPT-5.4	Grok 3
50 次测试	GPT-5.4 speed / latency 50 tok/s / 7305ms input / output 暂无数据	Grok 3 speed / latency N/A / N/A input / output 暂无数据
25 次测试	GPT-5.4 speed / latency N/A / N/A input / output 暂无数据	Grok 3 speed / latency 39 tok/s / 2642ms input / output 暂无数据
20 次测试	GPT-5.4 speed / latency 49 tok/s / 5435ms input / output 暂无数据	Grok 3 speed / latency N/A / N/A input / output 暂无数据
15 次测试	GPT-5.4 speed / latency 41 tok/s / 6581ms input / output 暂无数据	Grok 3 speed / latency N/A / N/A input / output 暂无数据
10 次测试	GPT-5.4 speed / latency 51 tok/s / 2526ms input / output 暂无数据	Grok 3 speed / latency N/A / N/A input / output 暂无数据
	GPT-5.4 gpt-5.4 speed / latency 暂无数据 input / output $0/request	Grok 3 grok-3 speed / latency 暂无数据 input / output $0/request

GPT-5.4 vs Grok 3

GPT-5.4

Grok 3

Key Takeaways

切换对比模型

对比总表

模型元信息

什么时候选哪个模型

跑分对比

分类能力对比

Agents

代码

推理

知识

数学

多语言

多模态

指令遵循

专业跑分明细

BenchLM overall score

Input price

Blended price

Output price

HLE

GPQA

SciCode

FrontierMath v2 (Tiers 1-3)

BenchLM Math score

API audit 对比

Provider 数据样本

FAQ

对比总表

模型元信息

什么时候选哪个模型

跑分对比

分类能力对比

Agents

代码

推理

知识

数学

多语言

多模态

指令遵循

专业跑分明细

BenchLM overall score

Input price

Blended price

Output price

HLE

GPQA

SciCode

FrontierMath v2 (Tiers 1-3)

BenchLM Math score

API audit 对比

Provider 数据样本

FAQ

相关 Compare 报告