这个比较为什么能收录？

它至少有 6 个可验证比较点，并且两个模型都有价格或测速数据。

没有数据的指标会不会编？

不会。没有 LMSpeed 数据的指标不会出现在这份报告里。

LM Speed

Claude Opus 4.6 vs GPT-5.1：价格速度对比 | LMSpeed

返回模型目录

数据点: 116

Model compare

Claude Opus 4.6 vs GPT-5.1

Claude Opus 4.6 和 GPT-5.1 的结论先放在这里，方便先判断是否值得继续看明细。

模型 A

Claude Opus 4.6

Anthropic

领先

模型 B

GPT-5.1

OpenAI

对照

Key Takeaways

综合加权结果：Claude Opus 4.6。Benchmark 能力分类占 80%，价格、API 性能和可用性占 20%。

结论

Claude Opus 4.6

Claude Opus 4.6 当前综合加权更高；模型 A / B 得分为 61.3 对 38.7。

证据覆盖

116 个数据点

包含 26 个 benchmark、0 个 audit 样本和 7 个 provider 样本。

选择依据

优先看 Claude Opus 4.6

下方图表把 33 组高信号样本拆开，便于核对速度、跑分和安全分。

切换对比模型

左右两边都可以换成其他模型，页面会打开新的 LMSpeed 对比 URL。

模型 A模型 B

对比总表

这份报告只使用 LMSpeed 已有数据：Claude Opus 4.6 和 GPT-5.1 的价格、测速聚合、第三方跑分与共同服务商样本。

综合领先	领先	对照
综合加权得分	61.3 分	38.7 分
Benchmark 分类领先	4 类	2 类
运营维度优势	最低输入价格、服务商覆盖	平均速度、首 token 延迟、免费服务商
上下文窗口	1M tokens	400K tokens
最大输出	128K tokens	128K tokens
模态	输入文本图像文件输出文本

模型元信息

Model compare	Claude Opus 4.6	GPT-5.1
开发者	Anthropic	OpenAI
发布日期	2026年2月	2025年11月
参数量	暂无数据	暂无数据
Tokenizer	Claude	GPT
知识截止	暂无数据	暂无数据
OpenRouter ID	anthropic/claude-opus-4.6	openai/gpt-5.1
来源链接	暂无数据	暂无数据

跑分对比

来自 LMSpeed 同步的第三方 benchmark profile；只展示两个模型都有数值的指标。

分类能力对比

按 0-100 分对比 benchmark 分类表现；点击分类可以聚焦查看差距。

模型 A 覆盖: 8 / 8
模型 B 覆盖: 6 / 8
共同覆盖: 6 个共同分类

平均分

Claude Opus 4.6

53.4

平均分

GPT-5.1

Agents

Claude Opus 4.6 领先 7.5

Claude Opus 4.655.6

GPT-5.148.1

代码

Claude Opus 4.6 领先 10.2

Claude Opus 4.659.4

GPT-5.149.2

推理

Claude Opus 4.6 领先 1.2

Claude Opus 4.653.9

GPT-5.152.7

知识

GPT-5.1 领先 0.2

Claude Opus 4.653.7

GPT-5.153.9

数学

Claude Opus 4.6 领先 2.5

Claude Opus 4.656.5

GPT-5.154

多语言

Claude Opus 4.6

Claude Opus 4.654

GPT-5.1-

多模态

Claude Opus 4.6

Claude Opus 4.649

GPT-5.1-

指令遵循

GPT-5.1 领先 9.1

Claude Opus 4.644.8

GPT-5.153.9

专业跑分明细

按具体 benchmark 指标对比两个模型，展示来源、排名覆盖、置信度、误差和评测日期等上下文。

能力组

综合reported

BenchLM overall score

来源Claude Opus 4.6

Claude Opus 4.6

领先

68.0

排名 #17/84 · confidence 3 · 评测日期 2026-02-01

+12.0

GPT-5.1

56.0

排名 #41/84 · confidence 1 · 评测日期 2025-11-13

价格verified

Input price

来源Claude Opus 4.6 (Non-reasoning, High Effort)

Claude Opus 4.6

$5.00/M

排名 #146/162 · confidence 4

+$3.75/M

GPT-5.1

领先

$1.25/M

排名 #107/162 · confidence 4

价格verified

Blended price

来源Claude Opus 4.6 (Non-reasoning, High Effort)

Claude Opus 4.6

$10.00/M

排名 #147/162 · confidence 4

+$6.56/M

GPT-5.1

领先

$3.44/M

排名 #117/162 · confidence 4

价格verified

Output price

来源Claude Opus 4.6 (Non-reasoning, High Effort)

Claude Opus 4.6

$25.00/M

排名 #147/162 · confidence 4

+$15.00/M

GPT-5.1

领先

$10.00/M

排名 #120/162 · confidence 4

推理reported

AA-LCR

来源Claude Opus 4.6

Claude Opus 4.6

58.3

排名 #62/89 · confidence 3 · 评测日期 2026-02-01

+16.7

GPT-5.1

领先

75.0

排名 #3/89 · confidence 1 · 评测日期 2025-11-13

推理reported

MMLU-Pro

来源Claude Opus 4.6

Claude Opus 4.6

82.0%

排名 #47/125 · confidence 3 · 评测日期 2026-02-01

+5.0%

GPT-5.1

领先

87.0%

排名 #12/125 · confidence 4

推理verified

GPQA

来源Claude Opus 4.6 (Non-reasoning, High Effort)

Claude Opus 4.6

84.0%

排名 #53/188 · confidence 4

+3.3%

GPT-5.1

领先

87.3%

排名 #33/188 · confidence 4

推理reported

CritPt

来源Claude Opus 4.6

Claude Opus 4.6

2.8

排名 #43/73 · confidence 3 · 评测日期 2026-02-01

+2.1

GPT-5.1

领先

4.9

排名 #34/73 · confidence 1 · 评测日期 2025-11-13

推理verified

HLE

来源Claude Opus 4.6 (Non-reasoning, High Effort)

Claude Opus 4.6

18.6%

排名 #62/187 · confidence 4

+7.9%

GPT-5.1

领先

26.5%

排名 #40/187 · confidence 4

代码reported

Vibe Code Bench

来源Claude Opus 4.6

Claude Opus 4.6

领先

57.6

排名 #5/33 · confidence 3 · 评测日期 2026-02-01

+33.0

GPT-5.1

24.6

排名 #18/33 · confidence 1 · 评测日期 2025-11-13

代码verified

SciCode

来源Claude Opus 4.6 (Non-reasoning, High Effort)

Claude Opus 4.6

领先

45.7%

排名 #33/185 · confidence 4

+2.4%

GPT-5.1

43.3%

排名 #42/185 · confidence 4

代码reported

AA-SciCode

来源Claude Opus 4.6

Claude Opus 4.6

领先

45.7

排名 #37/96 · confidence 3 · 评测日期 2026-02-01

+2.4

GPT-5.1

43.3

排名 #45/96 · confidence 1 · 评测日期 2025-11-13

数学reported

FrontierMath v2 (Tier 4)

来源Claude Opus 4.6

Claude Opus 4.6

领先

22.9

排名 #10/35 · confidence 3 · 评测日期 2026-02-01

+10.4

GPT-5.1

12.5

排名 #16/35 · confidence 1 · 评测日期 2025-11-13

数学reported

FrontierMath v2 (Tiers 1-3)

来源Claude Opus 4.6

Claude Opus 4.6

领先

40.7

排名 #10/47 · confidence 3 · 评测日期 2026-02-01

+9.7

GPT-5.1

31.0

排名 #19/47 · confidence 1 · 评测日期 2025-11-13

数学reported

BenchLM Math score

来源Claude Opus 4.6

Claude Opus 4.6

领先

59.8

排名 #22/56 · confidence 3 · 评测日期 2026-02-01

+9.9

GPT-5.1

49.9

排名 #30/56 · confidence 1 · 评测日期 2025-11-13

知识reported

AA-Omniscience Accuracy

来源Claude Opus 4.6

Claude Opus 4.6

领先

45.2

排名 #15/90 · confidence 3 · 评测日期 2026-02-01

+7.6

GPT-5.1

37.6

排名 #31/90 · confidence 1 · 评测日期 2025-11-13

知识reported

AA-Omniscience Index

来源Claude Opus 4.6

Claude Opus 4.6

3.5

排名 #23/29 · confidence 3 · 评测日期 2026-02-01

+2.1

GPT-5.1

领先

5.6

排名 #19/29 · confidence 1 · 评测日期 2025-11-13

知识reported

AA-GPQA Diamond

来源Claude Opus 4.6

Claude Opus 4.6

84.0

排名 #52/96 · confidence 3 · 评测日期 2026-02-01

+3.3

GPT-5.1

领先

87.3

排名 #36/96 · confidence 1 · 评测日期 2025-11-13

知识reported

AA-HLE

来源Claude Opus 4.6

Claude Opus 4.6

18.6

排名 #56/96 · confidence 3 · 评测日期 2026-02-01

+7.9

GPT-5.1

领先

26.5

排名 #39/96 · confidence 1 · 评测日期 2025-11-13

知识reported

Artificial Analysis Intelligence Index

来源Claude Opus 4.6

Claude Opus 4.6

领先

37.8

排名 #39/99 · confidence 3 · 评测日期 2026-02-01

+0.9

GPT-5.1

36.9

排名 #42/99 · confidence 1 · 评测日期 2025-11-13

知识reported

AA-Omniscience Hallucination Rate

来源Claude Opus 4.6

Claude Opus 4.6

领先

76.0

排名 #44/90 · confidence 3 · 评测日期 2026-02-01

+24.7

GPT-5.1

51.3

排名 #65/90 · confidence 1 · 评测日期 2025-11-13

多模态reported

Design Arena Website

来源Claude Opus 4.6

Claude Opus 4.6

领先

1325.0

排名 #4/66 · confidence 3 · 评测日期 2026-02-01

+108.0

GPT-5.1

1217.0

排名 #39/66 · confidence 1 · 评测日期 2025-11-13

多模态reported

AA-MMMU-Pro

来源Claude Opus 4.6

Claude Opus 4.6

72.5

排名 #36/57 · confidence 3 · 评测日期 2026-02-01

+3.0

GPT-5.1

领先

75.5

排名 #23/57 · confidence 1 · 评测日期 2025-11-13

指令遵循reported

AA-IFBench

来源Claude Opus 4.6

Claude Opus 4.6

44.6

排名 #61/86 · confidence 3 · 评测日期 2026-02-01

+28.3

GPT-5.1

领先

72.9

排名 #30/86 · confidence 1 · 评测日期 2025-11-13

Agentsreported

Gert Labs

来源Claude Opus 4.6

Claude Opus 4.6

领先

61.9

排名 #10/50 · confidence 3 · 评测日期 2026-02-01

+20.6

GPT-5.1

41.2

排名 #35/50 · confidence 1 · 评测日期 2025-11-13

Agentsreported

τ²-bench results

来源Claude Opus 4.6

Claude Opus 4.6

领先

84.8

排名 #44/84 · confidence 3 · 评测日期 2026-02-01

+2.9

GPT-5.1

81.9

排名 #52/84 · confidence 1 · 评测日期 2025-11-13

API audit 对比

来自共同 provider 的最近完成 audit，展示四个安全/完整性分组分数和报告入口。

Provider	Claude Opus 4.6	GPT-5.1
暂无共同 provider 的已完成 audit。

Provider 数据样本

把同一 provider 的测速聚合和 input/output 价格放进同一行，便于判断实际 API 表现和迁移成本。

Provider	Claude Opus 4.6	GPT-5.1
20 次测试	Claude Opus 4.6 speed / latency 42 tok/s / 2282ms input / output 暂无数据	GPT-5.1 speed / latency N/A / N/A input / output 暂无数据
15 次测试	Claude Opus 4.6 speed / latency 57 tok/s / 3926ms input / output 暂无数据	GPT-5.1 speed / latency N/A / N/A input / output 暂无数据
12 次测试	Claude Opus 4.6 speed / latency 24 tok/s / 7946ms input / output 暂无数据	GPT-5.1 speed / latency 139 tok/s / 1654ms input / output 暂无数据
10 次测试	Claude Opus 4.6 speed / latency N/A / N/A input / output 暂无数据	GPT-5.1 speed / latency 137 tok/s / 3299ms input / output 暂无数据
10 次测试	Claude Opus 4.6 speed / latency 84 tok/s / 3916ms input / output 暂无数据	GPT-5.1 speed / latency N/A / N/A input / output 暂无数据
	Claude Opus 4.6 claude-opus-4-6 speed / latency 暂无数据 input / output $0/request	GPT-5.1 gpt-5.1-chat-latest speed / latency 暂无数据 input / output $0/request
	Claude Opus 4.6 claude-opus-4-6-c speed / latency 暂无数据 input / output $0.0082/request	GPT-5.1 gpt-5.1-chat-latest speed / latency 暂无数据 input / output $1.16/M

对比总表

模型元信息

什么时候选哪个模型

跑分对比

分类能力对比

Agents

代码

推理

知识

数学

多语言

多模态

指令遵循

专业跑分明细

BenchLM overall score

Input price

Blended price

Output price

AA-LCR

MMLU-Pro

GPQA

CritPt

HLE

Vibe Code Bench

SciCode

AA-SciCode

FrontierMath v2 (Tier 4)

FrontierMath v2 (Tiers 1-3)

BenchLM Math score

AA-Omniscience Accuracy

AA-Omniscience Index

AA-GPQA Diamond

AA-HLE

Artificial Analysis Intelligence Index

AA-Omniscience Hallucination Rate

Design Arena Website

AA-MMMU-Pro

AA-IFBench

Gert Labs

τ²-bench results

API audit 对比

Provider 数据样本

FAQ

相关 Compare 报告