这个比较为什么能收录？

它至少有 6 个可验证比较点，并且两个模型都有价格或测速数据。

没有数据的指标会不会编？

不会。没有 LMSpeed 数据的指标不会出现在这份报告里。

LM Speed

Gemini 2.5 Pro vs GPT-4o：价格速度对比 | LMSpeed

返回模型目录

数据点: 110

Model compare

Gemini 2.5 Pro vs GPT-4o

Gemini 2.5 Pro 和 GPT-4o 的结论先放在这里，方便先判断是否值得继续看明细。

模型 A

Gemini 2.5 Pro

Google

领先

模型 B

GPT-4o

OpenAI

对照

Key Takeaways

综合加权结果：Gemini 2.5 Pro。Benchmark 能力分类占 80%，价格、API 性能和可用性占 20%。

结论

Gemini 2.5 Pro

Gemini 2.5 Pro 当前综合加权更高；模型 A / B 得分为 69.3 对 30.7。

证据覆盖

110 个数据点

包含 22 个 benchmark、0 个 audit 样本和 7 个 provider 样本。

选择依据

优先看 Gemini 2.5 Pro

下方图表把 29 组高信号样本拆开，便于核对速度、跑分和安全分。

切换对比模型

左右两边都可以换成其他模型，页面会打开新的 LMSpeed 对比 URL。

模型 A模型 B

对比总表

这份报告只使用 LMSpeed 已有数据：Gemini 2.5 Pro 和 GPT-4o 的价格、测速聚合、第三方跑分与共同服务商样本。

综合领先	领先	对照
综合加权得分	69.3 分	30.7 分
Benchmark 分类领先	4 类	2 类
运营维度优势	最低输入价格、平均速度、免费服务商、服务商覆盖	首 token 延迟
上下文窗口	1.0M tokens	128K tokens
最大输出	65.5K tokens	16.4K tokens
模态	输入文本图像文件音频video 输出

模型元信息

Model compare	Gemini 2.5 Pro	GPT-4o
开发者	Google	OpenAI
发布日期	2025年6月	2024年11月
参数量	暂无数据	暂无数据
Tokenizer	Gemini	GPT
知识截止	2025-01-31	2023-10-31
OpenRouter ID	google/gemini-2.5-pro	openai/gpt-4o
来源链接	暂无数据	暂无数据

跑分对比

来自 LMSpeed 同步的第三方 benchmark profile；只展示两个模型都有数值的指标。

分类能力对比

按 0-100 分对比 benchmark 分类表现；点击分类可以聚焦查看差距。

模型 A 覆盖: 6 / 8
模型 B 覆盖: 6 / 8
共同覆盖: 6 个共同分类

平均分

Gemini 2.5 Pro

46.3

平均分

GPT-4o

43.2

Agents

Gemini 2.5 Pro 领先 4.9

Gemini 2.5 Pro44

GPT-4o39.1

代码

GPT-4o 领先 7.1

Gemini 2.5 Pro39.2

GPT-4o46.3

推理

Gemini 2.5 Pro 领先 14.9

Gemini 2.5 Pro55.4

GPT-4o40.5

知识

GPT-4o 领先 13.0

Gemini 2.5 Pro36.7

GPT-4o49.7

数学

Gemini 2.5 Pro 领先 14.0

Gemini 2.5 Pro56.2

GPT-4o42.2

多语言

暂无数据

Gemini 2.5 Pro-

GPT-4o-

多模态

暂无数据

Gemini 2.5 Pro-

GPT-4o-

指令遵循

Gemini 2.5 Pro 领先 4.6

Gemini 2.5 Pro46.1

GPT-4o41.5

专业跑分明细

按具体 benchmark 指标对比两个模型，展示来源、排名覆盖、置信度、误差和评测日期等上下文。

能力组

综合reported

BenchLM overall score

来源Gemini 2.5 Pro

Gemini 2.5 Pro

43.0

排名 #76/84 · confidence 1 · 评测日期 2025-03-01

0.0

GPT-4o

43.0

排名 #76/84 · confidence 1 · 评测日期 2024-05-13

价格verified

Input price

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

$1.25/M

排名 #107/162 · confidence 4

+$1.25/M

GPT-4o

$2.50/M

排名 #131/162 · confidence 4

价格verified

Blended price

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

$3.44/M

排名 #117/162 · confidence 4

+$0.937/M

GPT-4o

$4.38/M

排名 #127/162 · confidence 4

价格verified

Output price

来源Gemini 2.5 Pro

Gemini 2.5 Pro

$10.00/M

排名 #120/162 · confidence 4

$0.0000/M

GPT-4o

$10.00/M

排名 #120/162 · confidence 4

推理verified

MMLU-Pro

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

86.2%

排名 #15/125 · confidence 4

+11.4%

GPT-4o

74.8%

排名 #90/125 · confidence 4

推理verified

GPQA

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

84.4%

排名 #49/188 · confidence 4

+30.1%

GPT-4o

54.3%

排名 #156/188 · confidence 4

推理verified

HLE

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

21.1%

排名 #53/187 · confidence 4

+17.8%

GPT-4o

3.3%

排名 #180/187 · confidence 4

代码verified

LiveCodeBench

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

80.1%

排名 #18/115 · confidence 4

+49.2%

GPT-4o

30.9%

排名 #88/115 · confidence 4

代码verified

SciCode

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

42.8%

排名 #44/185 · confidence 4

+9.5%

GPT-4o

33.3%

排名 #120/185 · confidence 4

代码reported

AA-SciCode

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

42.8

排名 #47/96 · confidence 1 · 评测日期 2025-03-01

+9.5

GPT-4o

33.3

排名 #80/96 · confidence 1 · 评测日期 2024-05-13

数学verified

AIME

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

88.7%

排名 #5/68 · confidence 4

+73.7%

GPT-4o

15.0%

排名 #50/68 · confidence 4

数学verified

MATH-500

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

96.7%

排名 #15/74 · confidence 4

+20.8%

GPT-4o

75.9%

排名 #56/74 · confidence 4

数学reported

FrontierMath v2 (Tiers 1-3)

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

14.1

排名 #32/47 · confidence 1 · 评测日期 2025-03-01

+13.8

GPT-4o

0.3

排名 #47/47 · confidence 1 · 评测日期 2024-05-13

数学reported

BenchLM Math score

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

35.5

排名 #40/56 · confidence 1 · 评测日期 2025-03-01

+10.1

GPT-4o

25.4

排名 #54/56 · confidence 1 · 评测日期 2024-05-13

知识reported

AA-Omniscience Hallucination Rate

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

87.4

排名 #19/90 · confidence 1 · 评测日期 2025-03-01

+49.5

GPT-4o

37.9

排名 #75/90 · confidence 1 · 评测日期 2024-05-13

知识reported

AA-Omniscience Accuracy

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

39.0

排名 #25/90 · confidence 1 · 评测日期 2025-03-01

+19.3

GPT-4o

19.7

排名 #75/90 · confidence 1 · 评测日期 2024-05-13

知识reported

AA-GPQA Diamond

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

84.4

排名 #49/96 · confidence 1 · 评测日期 2025-03-01

+30.1

GPT-4o

54.3

排名 #91/96 · confidence 1 · 评测日期 2024-05-13

知识reported

AA-HLE

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

21.1

排名 #50/96 · confidence 1 · 评测日期 2025-03-01

+17.8

GPT-4o

3.3

排名 #94/96 · confidence 1 · 评测日期 2024-05-13

知识reported

Artificial Analysis Intelligence Index

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

25.8

排名 #63/99 · confidence 1 · 评测日期 2025-03-01

+14.6

GPT-4o

11.2

排名 #90/99 · confidence 1 · 评测日期 2024-05-13

多模态reported

Design Arena Website

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

1197.0

排名 #45/66 · confidence 1 · 评测日期 2025-03-01

+336.0

GPT-4o

861.0

排名 #65/66 · confidence 1 · 评测日期 2024-05-13

指令遵循reported

AA-IFBench

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

48.7

排名 #59/86 · confidence 1 · 评测日期 2025-03-01

+14.4

GPT-4o

34.3

排名 #82/86 · confidence 1 · 评测日期 2024-05-13

Agentsreported

τ²-bench results

来源Gemini 2.5 Pro

Gemini 2.5 Pro

领先

54.1

排名 #65/84 · confidence 1 · 评测日期 2025-03-01

+29.0

GPT-4o

25.1

排名 #75/84 · confidence 1 · 评测日期 2024-05-13

API audit 对比

来自共同 provider 的最近完成 audit，展示四个安全/完整性分组分数和报告入口。

Provider	Gemini 2.5 Pro	GPT-4o
暂无共同 provider 的已完成 audit。

Provider 数据样本

把同一 provider 的测速聚合和 input/output 价格放进同一行，便于判断实际 API 表现和迁移成本。

Provider	Gemini 2.5 Pro	GPT-4o
40 次测试	Gemini 2.5 Pro speed / latency 48 tok/s / 23637ms input / output 暂无数据	GPT-4o speed / latency 57 tok/s / 3381ms input / output 暂无数据
20 次测试	Gemini 2.5 Pro speed / latency 103 tok/s / 16912ms input / output 暂无数据	GPT-4o speed / latency 99 tok/s / 2367ms input / output 暂无数据
20 次测试	Gemini 2.5 Pro speed / latency N/A / N/A input / output 暂无数据	GPT-4o speed / latency 88 tok/s / 1593ms input / output 暂无数据
5 次测试	Gemini 2.5 Pro speed / latency 92 tok/s / 16347ms input / output 暂无数据	GPT-4o speed / latency N/A / N/A input / output 暂无数据
5 次测试	Gemini 2.5 Pro speed / latency N/A / N/A input / output 暂无数据	GPT-4o speed / latency 48 tok/s / 13138ms input / output 暂无数据
	Gemini 2.5 Pro gemini-2.5-pro speed / latency 暂无数据 input / output $0.103/M/$0.822/M	GPT-4o gpt-4o speed / latency 暂无数据 input / output $0/M
	Gemini 2.5 Pro gemini-2.5-pro speed / latency 暂无数据 input / output $0/request	GPT-4o gpt-4o-2024-05-13 speed / latency 暂无数据 input / output $0/request

能力	文本输入图像输入文件输入音频输入文本输出工具调用结构化输出JSON 模式推理	文本输入图像输入文件输入文本输出工具调用结构化输出JSON 模式联网搜索

对比总表

模型元信息

什么时候选哪个模型

跑分对比

分类能力对比

Agents

代码

推理

知识

数学

多语言

多模态

指令遵循

专业跑分明细

BenchLM overall score

Input price

Blended price

Output price

MMLU-Pro

GPQA

HLE

LiveCodeBench

SciCode

AA-SciCode

AIME

MATH-500

FrontierMath v2 (Tiers 1-3)

BenchLM Math score

AA-Omniscience Hallucination Rate

AA-Omniscience Accuracy

AA-GPQA Diamond

AA-HLE

Artificial Analysis Intelligence Index

Design Arena Website

AA-IFBench

τ²-bench results

API audit 对比

Provider 数据样本

FAQ

相关 Compare 报告