这个比较为什么能收录？

它至少有 6 个可验证比较点，并且两个模型都有价格或测速数据。

没有数据的指标会不会编？

不会。没有 LMSpeed 数据的指标不会出现在这份报告里。

LM Speed

Claude Sonnet 4 vs GPT-5：价格速度对比 | LMSpeed

返回模型目录

数据点: 112

Model compare

Claude Sonnet 4 vs GPT-5

Claude Sonnet 4 和 GPT-5 的结论先放在这里，方便先判断是否值得继续看明细。

模型 A

Claude Sonnet 4

Anthropic

对照

模型 B

GPT-5

OpenAI

领先

Key Takeaways

综合加权结果：GPT-5。Benchmark 能力分类占 80%，价格、API 性能和可用性占 20%。

结论

GPT-5

GPT-5 当前综合加权更高；模型 A / B 得分为 17.3 对 82.7。

证据覆盖

112 个数据点

包含 23 个 benchmark、0 个 audit 样本和 7 个 provider 样本。

选择依据

优先看 GPT-5

下方图表把 30 组高信号样本拆开，便于核对速度、跑分和安全分。

切换对比模型

左右两边都可以换成其他模型，页面会打开新的 LMSpeed 对比 URL。

模型 A模型 B

对比总表

这份报告只使用 LMSpeed 已有数据：Claude Sonnet 4 和 GPT-5 的价格、测速聚合、第三方跑分与共同服务商样本。

综合领先	对照	领先
综合加权得分	17.3 分	82.7 分
Benchmark 分类领先	1 类	5 类
运营维度优势	首 token 延迟	最低输入价格、平均速度、免费服务商、服务商覆盖
上下文窗口	1M tokens	400K tokens
最大输出	64K tokens	128K tokens
模态	输入图像文本文件输出文本

模型元信息

Model compare	Claude Sonnet 4	GPT-5
开发者	Anthropic	OpenAI
发布日期	2025年5月	2025年8月
参数量	暂无数据	暂无数据
Tokenizer	Claude	GPT
知识截止	2025-01-31	2024-09-30
OpenRouter ID	anthropic/claude-sonnet-4	openai/gpt-5
来源链接	暂无数据	暂无数据

跑分对比

来自 LMSpeed 同步的第三方 benchmark profile；只展示两个模型都有数值的指标。

分类能力对比

按 0-100 分对比 benchmark 分类表现；点击分类可以聚焦查看差距。

模型 A 覆盖: 6 / 8
模型 B 覆盖: 6 / 8
共同覆盖: 6 个共同分类

平均分

Claude Sonnet 4

47.9

平均分

GPT-5

51.9

Agents

GPT-5 领先 1.1

Claude Sonnet 444.6

GPT-545.7

代码

GPT-5 领先 2.3

Claude Sonnet 446.8

GPT-549.1

推理

GPT-5 领先 3.9

Claude Sonnet 448

GPT-551.9

知识

Claude Sonnet 4 领先 0.2

Claude Sonnet 450.1

GPT-549.9

数学

GPT-5 领先 8.6

Claude Sonnet 453

GPT-561.6

多语言

暂无数据

Claude Sonnet 4-

GPT-5-

多模态

暂无数据

Claude Sonnet 4-

GPT-5-

指令遵循

GPT-5 领先 8.0

Claude Sonnet 445.1

GPT-553.1

专业跑分明细

按具体 benchmark 指标对比两个模型，展示来源、排名覆盖、置信度、误差和评测日期等上下文。

能力组

价格verified

Input price

来源Claude 4 Sonnet (Non-reasoning)

Claude Sonnet 4

$3.00/M

排名 #137/162 · confidence 4

+$1.75/M

GPT-5

领先

$1.25/M

排名 #107/162 · confidence 4

价格verified

Blended price

来源Claude 4 Sonnet (Non-reasoning)

Claude Sonnet 4

$6.00/M

排名 #137/162 · confidence 4

+$2.56/M

GPT-5

领先

$3.44/M

排名 #117/162 · confidence 4

价格verified

Output price

来源Claude 4 Sonnet (Non-reasoning)

Claude Sonnet 4

$15.00/M

排名 #136/162 · confidence 4

+$5.00/M

GPT-5

领先

$10.00/M

排名 #120/162 · confidence 4

推理reported

AA-LCR

来源Claude 4 Sonnet

Claude Sonnet 4

44.3

排名 #73/89 · confidence 1 · 评测日期 2025-05-01

+31.3

GPT-5

领先

75.6

排名 #2/89 · confidence 1 · 评测日期 2025-08-07

推理reported

CritPt

来源Claude 4 Sonnet

Claude Sonnet 4

1.1

排名 #54/73 · confidence 1 · 评测日期 2025-05-01

+4.6

GPT-5

领先

5.7

排名 #30/73 · confidence 1 · 评测日期 2025-08-07

推理verified

MMLU-Pro

来源Claude 4 Sonnet (Non-reasoning)

Claude Sonnet 4

领先

83.7%

排名 #32/125 · confidence 4

+3.1%

GPT-5

80.6%

排名 #57/125 · confidence 4

推理verified

GPQA

来源Claude 4 Sonnet (Non-reasoning)

Claude Sonnet 4

领先

68.3%

排名 #117/188 · confidence 4

+1.0%

GPT-5

67.3%

排名 #121/188 · confidence 4

推理verified

HLE

来源Claude 4 Sonnet (Non-reasoning)

Claude Sonnet 4

4.0%

排名 #162/187 · confidence 4

+1.4%

GPT-5

领先

5.4%

排名 #132/187 · confidence 4

代码reported

AA-SciCode

来源Claude 4 Sonnet

Claude Sonnet 4

37.3

排名 #71/96 · confidence 1 · 评测日期 2025-05-01

+5.6

GPT-5

领先

42.9

排名 #46/96 · confidence 1 · 评测日期 2025-08-07

代码verified

LiveCodeBench

来源Claude 4 Sonnet (Non-reasoning)

Claude Sonnet 4

44.9%

排名 #66/115 · confidence 4

+10.9%

GPT-5

领先

55.8%

排名 #49/115 · confidence 4

代码verified

SciCode

来源Claude 4 Sonnet (Non-reasoning)

Claude Sonnet 4

37.3%

排名 #94/185 · confidence 4

+1.5%

GPT-5

领先

38.8%

排名 #83/185 · confidence 4

数学verified

MATH-500

来源Claude 4 Sonnet (Non-reasoning)

Claude Sonnet 4

领先

93.4%

排名 #26/74 · confidence 4

+7.3%

GPT-5

86.1%

排名 #42/74 · confidence 4

数学verified

AIME

来源Claude 4 Sonnet (Non-reasoning)

Claude Sonnet 4

领先

40.7%

排名 #33/68 · confidence 4

+4.0%

GPT-5

36.7%

排名 #35/68 · confidence 4

知识reported

AA-Omniscience Accuracy

来源Claude 4 Sonnet

Claude Sonnet 4

22.4

排名 #68/90 · confidence 1 · 评测日期 2025-05-01

+18.3

GPT-5

领先

40.7

排名 #20/90 · confidence 1 · 评测日期 2025-08-07

知识reported

AA-Omniscience Hallucination Rate

来源Claude 4 Sonnet

Claude Sonnet 4

40.8

排名 #73/90 · confidence 1 · 评测日期 2025-05-01

+41.3

GPT-5

领先

82.1

排名 #31/90 · confidence 1 · 评测日期 2025-08-07

知识reported

AA-HLE

来源Claude 4 Sonnet

Claude Sonnet 4

4.0

排名 #89/96 · confidence 1 · 评测日期 2025-05-01

+22.5

GPT-5

领先

26.5

排名 #39/96 · confidence 1 · 评测日期 2025-08-07

知识reported

AA-GPQA Diamond

来源Claude 4 Sonnet

Claude Sonnet 4

68.3

排名 #76/96 · confidence 1 · 评测日期 2025-05-01

+17.1

GPT-5

领先

85.4

排名 #45/96 · confidence 1 · 评测日期 2025-08-07

知识reported

Artificial Analysis Intelligence Index

来源Claude 4 Sonnet

Claude Sonnet 4

25.5

排名 #64/99 · confidence 1 · 评测日期 2025-05-01

+9.2

GPT-5

领先

34.7

排名 #48/99 · confidence 1 · 评测日期 2025-08-07

多模态reported

AA-MMMU-Pro

来源Claude 4 Sonnet

Claude Sonnet 4

62.4

排名 #47/57 · confidence 1 · 评测日期 2025-05-01

+11.8

GPT-5

领先

74.2

排名 #32/57 · confidence 1 · 评测日期 2025-08-07

多模态reported

Design Arena Website

来源Claude 4 Sonnet

Claude Sonnet 4

1175.0

排名 #49/66 · confidence 1 · 评测日期 2025-05-01

+39.0

GPT-5

领先

1214.0

排名 #40/66 · confidence 1 · 评测日期 2025-08-07

指令遵循reported

AA-IFBench

来源Claude 4 Sonnet

Claude Sonnet 4

45.4

排名 #60/86 · confidence 1 · 评测日期 2025-05-01

+27.7

GPT-5

领先

73.1

排名 #29/86 · confidence 1 · 评测日期 2025-08-07

Agentsreported

JobBench

来源Claude 4 Sonnet

Claude Sonnet 4

领先

18.4

排名 #15/20 · confidence 1 · 评测日期 2025-05-01

+9.9

GPT-5

8.5

排名 #20/20 · confidence 1 · 评测日期 2025-08-07

Agentsreported

τ²-bench results

来源Claude 4 Sonnet

Claude Sonnet 4

52.3

排名 #67/84 · confidence 1 · 评测日期 2025-05-01

+32.5

GPT-5

领先

84.8

排名 #44/84 · confidence 1 · 评测日期 2025-08-07

API audit 对比

来自共同 provider 的最近完成 audit，展示四个安全/完整性分组分数和报告入口。

Provider	Claude Sonnet 4	GPT-5
暂无共同 provider 的已完成 audit。

Provider 数据样本

把同一 provider 的测速聚合和 input/output 价格放进同一行，便于判断实际 API 表现和迁移成本。

Provider	Claude Sonnet 4	GPT-5
20 次测试	Claude Sonnet 4 speed / latency N/A / N/A input / output 暂无数据	GPT-5 speed / latency 95 tok/s / 1234ms input / output 暂无数据
5 次测试	Claude Sonnet 4 speed / latency N/A / N/A input / output 暂无数据	GPT-5 speed / latency 45 tok/s / 3704ms input / output 暂无数据
5 次测试	Claude Sonnet 4 speed / latency N/A / N/A input / output 暂无数据	GPT-5 speed / latency 46 tok/s / 6577ms input / output 暂无数据
5 次测试	Claude Sonnet 4 speed / latency N/A / N/A input / output 暂无数据	GPT-5 speed / latency 102 tok/s / 948ms input / output 暂无数据
5 次测试	Claude Sonnet 4 speed / latency N/A / N/A input / output 暂无数据	GPT-5 speed / latency 131 tok/s / 743ms input / output 暂无数据
	Claude Sonnet 4 claude-sonnet-4 speed / latency 暂无数据 input / output $0.164/M/$0.822/M	GPT-5 gpt-5 speed / latency 暂无数据 input / output $0/M
	Claude Sonnet 4 claude-sonnet-4-20250514 speed / latency 暂无数据 input / output $0/request	GPT-5 gpt-5-all speed / latency 暂无数据 input / output $0/request

对比总表

模型元信息

什么时候选哪个模型

跑分对比

分类能力对比

Agents

代码

推理

知识

数学

多语言

多模态

指令遵循

专业跑分明细

Input price

Blended price

Output price

AA-LCR

CritPt

MMLU-Pro

GPQA

HLE

AA-SciCode

LiveCodeBench

SciCode

MATH-500

AIME

AA-Omniscience Accuracy

AA-Omniscience Hallucination Rate

AA-HLE

AA-GPQA Diamond

Artificial Analysis Intelligence Index

AA-MMMU-Pro

Design Arena Website

AA-IFBench

JobBench

τ²-bench results

API audit 对比

Provider 数据样本

FAQ

相关 Compare 报告