数据点: 87
Gemini 2.5 Pro 和 GPT-4o 的结论先放在这里,方便先判断是否值得继续看明细。
结论
Gemini 2.5 Pro
Gemini 2.5 Pro 当前更占优,可验证指标为 4 对 2。
证据覆盖
87 个数据点
包含 8 个 benchmark、1 个 audit 样本和 9 个 provider 样本。
选择依据
优先看 Gemini 2.5 Pro
下方图表把 18 组高信号样本拆开,便于核对速度、跑分和安全分。
Model compare Gemini 2.5 Pro vs GPT-4ogemini-2-5-pro-vs-gpt-4o | 模型 A Gemini 2.5 Pro | 模型 B GPT-4o |
|---|---|---|
| 综合领先 | 领先 | 对照 |
| 可验证指标胜出 | 4 项 | 2 项 |
| 优势维度 | 最低输入价格、平均速度、免费服务商、服务商覆盖 | 首 token 延迟、近期测试数 |
来自 LMSpeed 同步的第三方 benchmark profile;只展示两个模型都有数值的指标。
| 指标 | Gemini 2.5 Pro | GPT-4o |
|---|---|---|
| AIME | 88.7%#6 | 15.0% |
来自共同 provider 的最近完成 audit,展示四个安全/完整性分组分数和报告入口。
| Provider | Gemini 2.5 Pro | GPT-4o |
|---|---|---|
胜出方: GPT-4o | Gemini 2.5 Pro gemini-2.5-pro 暂无 audit | GPT-4o gpt-4o Audit 分数 76 |
把同一 provider 的测速聚合和 input/output 价格放进同一行,便于判断实际 API 表现和迁移成本。
| Provider | Gemini 2.5 Pro | GPT-4o |
|---|---|---|
40 次测试 | Gemini 2.5 Pro speed / latency 48 tok/s / 23637ms input / output 暂无数据 | GPT-4o |
这份报告只使用 LMSpeed 已有数据:Gemini 2.5 Pro 和 GPT-4o 的价格、测速聚合、第三方跑分与共同服务商样本。
| 建议 | Gemini 2.5 Pro | GPT-4o |
|---|---|---|
| 什么时候选哪个模型 | Gemini 2.5 Pro Gemini 2.5 Pro 更适合优先看 最低输入价格、平均速度、免费服务商、服务商覆盖 的场景。 | GPT-4o GPT-4o 更适合优先看 首 token 延迟、近期测试数 的场景。 |
TL;DR:Gemini 2.5 Pro 在本页 87 个可验证数据点中更占优,包含价格、速度、延迟、跑分和服务商样本。
从 Gemini 2.5 Pro vs GPT-4o 继续查看附近模型的横向对比,这些页面都有足够的 LMSpeed 可验证数据。
| 模型元信息 | Gemini 2.5 Pro 的上下文为 1.0M tokens;主要信号:文本输入, 图像输入, 文件输入, 音频输入。 | GPT-4o 的上下文为 128K tokens;主要信号:文本输入, 图像输入, 文件输入, 文本输出。 |
|---|---|---|
| 开发者 | OpenAI | |
| 上下文窗口 | 1.0M tokens | 128K tokens |
| 最大输出 | 65.5K tokens | 16.4K tokens |
| 发布日期 | 2025年6月 | 2024年11月 |
| 模态 | 输入 文本图像文件音频video 输出 文本 | 输入 文本图像文件 输出 文本 |
| 能力 | 文本输入图像输入文件输入音频输入文本输出工具调用结构化输出JSON 模式推理 | 文本输入图像输入文件输入文本输出工具调用结构化输出JSON 模式 |
| 参数量 | 暂无数据 | 暂无数据 |
| Tokenizer | Gemini | GPT |
| 知识截止 | 2025-01-31 | 2023-10-31 |
| OpenRouter ID | google/gemini-2.5-pro | openai/gpt-4o-2024-11-20 |
| 来源链接 | 暂无数据 | 暂无数据 |
| Time to first answer token | 23.08 s#77 | 0.51 s#8 |
|---|
| Time to first token | 23.08 s#97 | 0.51 s#11 |
|---|
| MMLU-Pro | 86.2%#12 | 74.8%#58 |
|---|
| MATH-500 | 96.7%#16 | 75.9%#47 |
|---|
| LiveCodeBench | 80.1%#18 | 30.9%#78 |
|---|
| Input price | $1.25/M#30 | $2.50/M#37 |
|---|
| SciCode | 42.8%#32 | 33.3%#82 |
|---|
speed / latency
57 tok/s / 3381ms
input / output
暂无数据
MN API20 次测试 | Gemini 2.5 Pro speed / latency 103 tok/s / 16912ms input / output 暂无数据 | GPT-4o speed / latency 99 tok/s / 2367ms input / output 暂无数据 |
|---|
速创API20 次测试 | Gemini 2.5 Pro speed / latency N/A / N/A input / output 暂无数据 | GPT-4o speed / latency 88 tok/s / 1593ms input / output 暂无数据 |
|---|
DeepRouter5 次测试 | Gemini 2.5 Pro speed / latency 92 tok/s / 16347ms input / output 暂无数据 | GPT-4o speed / latency N/A / N/A input / output 暂无数据 |
|---|
KFCV505 次测试 | Gemini 2.5 Pro speed / latency N/A / N/A input / output 暂无数据 | GPT-4o speed / latency 48 tok/s / 13138ms input / output 暂无数据 |
|---|
Gemini 2.5 Pro gemini-2.5-pro speed / latency 暂无数据 input / output $0.0006/M / $0.0050/M | GPT-4o gpt-4o speed / latency 暂无数据 input / output $0.0013/M / $0.0050/M |
Gemini 2.5 Pro gemini-2.5-pro speed / latency 暂无数据 input / output $0.0006/M / $0.0050/M | GPT-4o gpt-4o speed / latency 暂无数据 input / output $0.0013/M / $0.0050/M |
Gemini 2.5 Pro gemini-2.5-pro-maxthinking-c speed / latency 暂无数据 input / output $0.011/M / $0.011/M | GPT-4o gpt-4o speed / latency 暂无数据 input / output $0.342/M / $1.37/M |
Gemini 2.5 Pro gemini-2.5-pro speed / latency 暂无数据 input / output $0.014/M / $0.904/M | GPT-4o gpt-4o speed / latency 暂无数据 input / output $0.068/M / $0.349/M |
排名基于社区提交的测试数据与定期健康探测,仅供参考,非官方数据。