这个比较为什么能收录？

它至少有 6 个可验证比较点，并且两个模型都有价格或测速数据。

没有数据的指标会不会编？

不会。没有 LMSpeed 数据的指标不会出现在这份报告里。

LM Speed

Gemini 2.5 Flash vs GPT-5.4：价格速度对比 | LMSpeed

返回模型目录

数据点: 124

Model compare

Gemini 2.5 Flash vs GPT-5.4

Gemini 2.5 Flash 和 GPT-5.4 的结论先放在这里，方便先判断是否值得继续看明细。

模型 A

Gemini 2.5 Flash

Google

对照

模型 B

GPT-5.4

OpenAI

领先

Key Takeaways

综合加权结果：GPT-5.4。Benchmark 能力分类占 80%，价格、API 性能和可用性占 20%。

结论

GPT-5.4

GPT-5.4 当前综合加权更高；模型 A / B 得分为 12 对 88。

证据覆盖

124 个数据点

包含 22 个 benchmark、3 个 audit 样本和 8 个 provider 样本。

选择依据

优先看 GPT-5.4

下方图表把 33 组高信号样本拆开，便于核对速度、跑分和安全分。

切换对比模型

左右两边都可以换成其他模型，页面会打开新的 LMSpeed 对比 URL。

模型 A模型 B

对比总表

这份报告只使用 LMSpeed 已有数据：Gemini 2.5 Flash 和 GPT-5.4 的价格、测速聚合、第三方跑分与共同服务商样本。

综合领先	对照	领先
综合加权得分	12.0 分	88.0 分
Benchmark 分类领先	0 类	6 类
运营维度优势	最低输入价格、平均速度、免费服务商	首 token 延迟、服务商覆盖
上下文窗口	1.0M tokens	1.1M tokens
最大输出	65.5K tokens	128K tokens
模态	输入文件图像文本音频video 输出

模型元信息

Model compare	Gemini 2.5 Flash	GPT-5.4
开发者	Google	OpenAI
发布日期	2025年6月	2026年3月
参数量	暂无数据	暂无数据
Tokenizer	Gemini	GPT
知识截止	2025-01-31	暂无数据
OpenRouter ID	google/gemini-2.5-flash	openai/gpt-5.4
来源链接	暂无数据	暂无数据

跑分对比

来自 LMSpeed 同步的第三方 benchmark profile；只展示两个模型都有数值的指标。

分类能力对比

按 0-100 分对比 benchmark 分类表现；点击分类可以聚焦查看差距。

模型 A 覆盖: 6 / 8
模型 B 覆盖: 7 / 8
共同覆盖: 6 个共同分类

平均分

Gemini 2.5 Flash

45.4

平均分

GPT-5.4

57.4

Agents

GPT-5.4 领先 20.2

Gemini 2.5 Flash36.3

GPT-5.456.5

代码

GPT-5.4 领先 11.9

Gemini 2.5 Flash51.1

GPT-5.463

推理

GPT-5.4 领先 7.2

Gemini 2.5 Flash49.5

GPT-5.456.7

知识

GPT-5.4 领先 18.1

Gemini 2.5 Flash41.8

GPT-5.459.9

数学

GPT-5.4 领先 6.8

Gemini 2.5 Flash50.8

GPT-5.457.6

多语言

暂无数据

Gemini 2.5 Flash-

GPT-5.4-

多模态

GPT-5.4

Gemini 2.5 Flash-

GPT-5.453.7

指令遵循

GPT-5.4 领先 11.2

Gemini 2.5 Flash43.1

GPT-5.454.3

专业跑分明细

按具体 benchmark 指标对比两个模型，展示来源、排名覆盖、置信度、误差和评测日期等上下文。

能力组

综合reported

BenchLM overall score

来源Gemini 2.5 Flash

Gemini 2.5 Flash

45.0

排名 #68/84 · confidence 1 · 评测日期 2025-06-17

+22.0

GPT-5.4

领先

67.0

排名 #19/84 · confidence 3 · 评测日期 2026-03-05

价格verified

Input price

来源Gemini 2.5 Flash (Reasoning)

Gemini 2.5 Flash

领先

$0.300/M

排名 #46/162 · confidence 4

+$2.20/M

GPT-5.4

$2.50/M

排名 #131/162 · confidence 4

价格verified

Blended price

来源Gemini 2.5 Flash (Reasoning)

Gemini 2.5 Flash

领先

$0.850/M

排名 #67/162 · confidence 4

+$4.78/M

GPT-5.4

$5.63/M

排名 #135/162 · confidence 4

价格verified

Output price

来源Gemini 2.5 Flash (Reasoning)

Gemini 2.5 Flash

领先

$2.50/M

排名 #75/162 · confidence 4

+$12.50/M

GPT-5.4

$15.00/M

排名 #136/162 · confidence 4

推理reported

AA-LCR

来源Gemini 2.5 Flash

Gemini 2.5 Flash

45.9

排名 #72/89 · confidence 1 · 评测日期 2025-06-17

+28.1

GPT-5.4

领先

74.0

排名 #6/89 · confidence 3 · 评测日期 2026-03-05

推理reported

CritPt

来源Gemini 2.5 Flash

Gemini 2.5 Flash

1.4

排名 #50/73 · confidence 1 · 评测日期 2025-06-17

+22.0

GPT-5.4

领先

23.4

排名 #7/73 · confidence 3 · 评测日期 2026-03-05

推理verified

GPQA

来源Gemini 2.5 Flash (Reasoning)

Gemini 2.5 Flash

领先

79.0%

排名 #76/188 · confidence 4

+4.2%

GPT-5.4

74.8%

排名 #96/188 · confidence 4

推理verified

HLE

来源Gemini 2.5 Flash (Reasoning)

Gemini 2.5 Flash

领先

11.1%

排名 #89/187 · confidence 4

+0.5%

GPT-5.4

10.6%

排名 #91/187 · confidence 4

代码reported

AA-SciCode

来源Gemini 2.5 Flash

Gemini 2.5 Flash

29.1

排名 #88/96 · confidence 1 · 评测日期 2025-06-17

+27.5

GPT-5.4

领先

56.6

排名 #4/96 · confidence 3 · 评测日期 2026-03-05

代码verified

SciCode

来源Gemini 2.5 Flash (Reasoning)

Gemini 2.5 Flash

39.4%

排名 #80/185 · confidence 4

+7.7%

GPT-5.4

领先

47.1%

排名 #24/185 · confidence 4

数学reported

FrontierMath v2 (Tiers 1-3)

来源Gemini 2.5 Flash

Gemini 2.5 Flash

4.8

排名 #38/47 · confidence 1 · 评测日期 2025-06-17

+42.8

GPT-5.4

领先

47.6

排名 #7/47 · confidence 3 · 评测日期 2026-03-05

数学reported

FrontierMath v2 (Tier 4)

来源Gemini 2.5 Flash

Gemini 2.5 Flash

4.2

排名 #23/35 · confidence 1 · 评测日期 2025-06-17

+22.9

GPT-5.4

领先

27.1

排名 #8/35 · confidence 3 · 评测日期 2026-03-05

数学reported

BenchLM Math score

来源Gemini 2.5 Flash

Gemini 2.5 Flash

29.1

排名 #44/56 · confidence 1 · 评测日期 2025-06-17

+36.8

GPT-5.4

领先

65.9

排名 #17/56 · confidence 3 · 评测日期 2026-03-05

知识reported

AA-Omniscience Hallucination Rate

来源Gemini 2.5 Flash

Gemini 2.5 Flash

领先

93.3

排名 #6/90 · confidence 1 · 评测日期 2025-06-17

+4.7

GPT-5.4

88.6

排名 #18/90 · confidence 3 · 评测日期 2026-03-05

知识reported

AA-HLE

来源Gemini 2.5 Flash

Gemini 2.5 Flash

5.1

排名 #79/96 · confidence 1 · 评测日期 2025-06-17

+36.5

GPT-5.4

领先

41.6

排名 #8/96 · confidence 3 · 评测日期 2026-03-05

知识reported

AA-Omniscience Accuracy

来源Gemini 2.5 Flash

Gemini 2.5 Flash

26.5

排名 #51/90 · confidence 1 · 评测日期 2025-06-17

+23.5

GPT-5.4

领先

50.0

排名 #9/90 · confidence 3 · 评测日期 2026-03-05

知识reported

Artificial Analysis Intelligence Index

来源Gemini 2.5 Flash

Gemini 2.5 Flash

14.1

排名 #86/99 · confidence 1 · 评测日期 2025-06-17

+37.3

GPT-5.4

领先

51.4

排名 #10/99 · confidence 3 · 评测日期 2026-03-05

知识reported

AA-GPQA Diamond

来源Gemini 2.5 Flash

Gemini 2.5 Flash

68.3

排名 #76/96 · confidence 1 · 评测日期 2025-06-17

+23.7

GPT-5.4

领先

92.0

排名 #11/96 · confidence 3 · 评测日期 2026-03-05

多模态reported

AA-MMMU-Pro

来源Gemini 2.5 Flash

Gemini 2.5 Flash

65.5

排名 #43/57 · confidence 1 · 评测日期 2025-06-17

+12.9

GPT-5.4

领先

78.4

排名 #16/57 · confidence 3 · 评测日期 2026-03-05

多模态reported

Design Arena Website

来源Gemini 2.5 Flash

Gemini 2.5 Flash

1140.0

排名 #55/66 · confidence 1 · 评测日期 2025-06-17

+105.0

GPT-5.4

领先

1245.0

排名 #32/66 · confidence 3 · 评测日期 2026-03-05

指令遵循reported

AA-IFBench

来源Gemini 2.5 Flash

Gemini 2.5 Flash

39.0

排名 #74/86 · confidence 1 · 评测日期 2025-06-17

+34.9

GPT-5.4

领先

73.9

排名 #24/86 · confidence 3 · 评测日期 2026-03-05

Agentsreported

τ²-bench results

来源Gemini 2.5 Flash

Gemini 2.5 Flash

14.9

排名 #84/84 · confidence 1 · 评测日期 2025-06-17

+72.2

GPT-5.4

领先

87.1

排名 #37/84 · confidence 3 · 评测日期 2026-03-05

API audit 对比

来自共同 provider 的最近完成 audit，展示四个安全/完整性分组分数和报告入口。

Provider	Gemini 2.5 Flash	GPT-5.4
胜出方: GPT-5.4	Gemini 2.5 Flash gemini-2.5-flash 暂无 audit	GPT-5.4 gpt-5.4 Audit 分数 100 100100100100
胜出方: GPT-5.4	Gemini 2.5 Flash gemini-2.5-flash 暂无 audit	GPT-5.4 gpt-5.4 Audit 分数 93 1008486100
胜出方: GPT-5.4	Gemini 2.5 Flash gemini-2.5-flash 暂无 audit	GPT-5.4 gpt-5.4 Audit 分数 90 1008476100

Provider 数据样本

把同一 provider 的测速聚合和 input/output 价格放进同一行，便于判断实际 API 表现和迁移成本。

Provider	Gemini 2.5 Flash	GPT-5.4
50 次测试	Gemini 2.5 Flash speed / latency N/A / N/A input / output 暂无数据	GPT-5.4 speed / latency 50 tok/s / 7305ms input / output 暂无数据
25 次测试	Gemini 2.5 Flash speed / latency 139 tok/s / 4002ms input / output 暂无数据	GPT-5.4 speed / latency N/A / N/A input / output 暂无数据
10 次测试	Gemini 2.5 Flash speed / latency N/A / N/A input / output 暂无数据	GPT-5.4 speed / latency 51 tok/s / 2526ms input / output 暂无数据
10 次测试	Gemini 2.5 Flash speed / latency 54 tok/s / 10365ms input / output 暂无数据	GPT-5.4 speed / latency N/A / N/A input / output 暂无数据
10 次测试	Gemini 2.5 Flash speed / latency N/A / N/A input / output 暂无数据	GPT-5.4 speed / latency 51 tok/s / 1443ms input / output 暂无数据
	Gemini 2.5 Flash gemini-2.5-flash speed / latency 暂无数据 input / output $0/M/$0/M	GPT-5.4 gpt-5.4 speed / latency 暂无数据 input / output $0.240/M
	Gemini 2.5 Flash gemini-2.5-flash speed / latency 暂无数据 input / output $0/M/$0/M	GPT-5.4 gpt-5.4 speed / latency 暂无数据 input / output $0/M
	Gemini 2.5 Flash gemini-2.5-flash speed / latency 暂无数据 input / output $0/request	GPT-5.4 gpt-5.4 speed / latency 暂无数据 input / output $0/request

能力	文本输入图像输入文件输入音频输入文本输出工具调用结构化输出JSON 模式推理	文本输入图像输入文件输入文本输出工具调用结构化输出JSON 模式推理

对比总表

模型元信息

什么时候选哪个模型

跑分对比

分类能力对比

Agents

代码

推理

知识

数学

多语言

多模态

指令遵循

专业跑分明细

BenchLM overall score

Input price

Blended price

Output price

AA-LCR

CritPt

GPQA

HLE

AA-SciCode

SciCode

FrontierMath v2 (Tiers 1-3)

FrontierMath v2 (Tier 4)

BenchLM Math score

AA-Omniscience Hallucination Rate

AA-HLE

AA-Omniscience Accuracy

Artificial Analysis Intelligence Index

AA-GPQA Diamond

AA-MMMU-Pro

Design Arena Website

AA-IFBench

τ²-bench results

API audit 对比

Provider 数据样本

FAQ

相关 Compare 报告