数据点: 79
GPT-5.2 和 Grok 4.20 的结论先放在这里,方便先判断是否值得继续看明细。
结论
接近持平
接近持平 当前更占优,可验证指标为 3 对 3。
证据覆盖
79 个数据点
包含 8 个 benchmark、0 个 audit 样本和 8 个 provider 样本。
选择依据
接近持平
下方图表把 16 组高信号样本拆开,便于核对速度、跑分和安全分。
Model compare GPT-5.2 vs Grok 4.20gpt-5-2-vs-grok-4-20 | 模型 A GPT-5.2 | 模型 B Grok 4.20 |
|---|---|---|
| 综合领先 | 接近持平 | 接近持平 |
| 可验证指标胜出 | 3 项 | 3 项 |
| 优势维度 | 首 token 延迟、服务商覆盖、近期测试数 | 最低输入价格、平均速度、免费服务商 |
来自 LMSpeed 同步的第三方 benchmark profile;只展示两个模型都有数值的指标。
| 指标 | GPT-5.2 | Grok 4.20 |
|---|---|---|
| GPQA | 90.3%#9 | 91.1% |
来自共同 provider 的最近完成 audit,展示四个安全/完整性分组分数和报告入口。
| Provider | GPT-5.2 | Grok 4.20 |
|---|---|---|
| 暂无共同 provider 的已完成 audit。 | ||
把同一 provider 的测速聚合和 input/output 价格放进同一行,便于判断实际 API 表现和迁移成本。
| Provider | GPT-5.2 | Grok 4.20 |
|---|---|---|
45 次测试 | GPT-5.2 speed / latency 52 tok/s / 2671ms input / output 暂无数据 | Grok 4.20 |
这份报告只使用 LMSpeed 已有数据:GPT-5.2 和 Grok 4.20 的价格、测速聚合、第三方跑分与共同服务商样本。
| 建议 | GPT-5.2 | Grok 4.20 |
|---|---|---|
| 什么时候选哪个模型 | GPT-5.2 GPT-5.2 更适合优先看 首 token 延迟、服务商覆盖、近期测试数 的场景。 | Grok 4.20 Grok 4.20 更适合优先看 最低输入价格、平均速度、免费服务商 的场景。 |
TL;DR:接近持平 在本页 79 个可验证数据点中更占优,包含价格、速度、延迟、跑分和服务商样本。
从 GPT-5.2 vs Grok 4.20 继续查看附近模型的横向对比,这些页面都有足够的 LMSpeed 可验证数据。
| 模型元信息 | GPT-5.2 的上下文为 128K tokens;主要信号:文本输入, 图像输入, 文件输入, 文本输出。 | Grok 4.20 的上下文为 2M tokens;主要信号:文本输入, 图像输入, 文件输入, 文本输出。 |
|---|---|---|
| 开发者 | OpenAI | 暂无数据 |
| 上下文窗口 | 128K tokens | 2M tokens |
| 最大输出 | 16.4K tokens | 暂无数据 |
| 发布日期 | 2025年12月 | 2026年3月 |
| 模态 | 输入 文件图像文本 输出 文本 | 输入 文本图像文件 输出 文本 |
| 能力 | 文本输入图像输入文件输入文本输出工具调用结构化输出JSON 模式 | 文本输入图像输入文件输入文本输出工具调用结构化输出JSON 模式推理 |
| 参数量 | 暂无数据 | 暂无数据 |
| Tokenizer | GPT | Grok |
| 知识截止 | 暂无数据 | 2025-09-01 |
| OpenRouter ID | openai/gpt-5.2-chat | x-ai/grok-4.20 |
| 来源链接 | 暂无数据 | 暂无数据 |
| HLE | 35.4%#9 | 32.2%#12 |
|---|
| SciCode | 52.1%#9 | 45.6%#21 |
|---|
| Output speed | 72.8 tok/s#71 | 178.5 tok/s#16 |
|---|
| Input price | $1.75/M#35 | $2.00/M#36 |
|---|
| Output price | $14.00/M#43 | $6.00/M#38 |
|---|
| Blended price | $4.81/M#62 | $3.00/M#56 |
|---|
| Time to first answer token | 115.69 s#109 | 13.54 s#64 |
|---|
speed / latency
67 tok/s / 1296ms
input / output
暂无数据
BUZZ20 次测试 | GPT-5.2 speed / latency 64 tok/s / 3553ms input / output 暂无数据 | Grok 4.20 speed / latency 103 tok/s / 9875ms input / output 暂无数据 |
|---|
6345ywz API10 次测试 | GPT-5.2 gpt-5.2 speed / latency N/A / N/A input / output $0.034/M / $0.274/M | Grok 4.20 grok-4.20-fast speed / latency 82 tok/s / 10813ms input / output $0.274/M / $0.548/M |
|---|
Good HIDNS10 次测试 | GPT-5.2 speed / latency 57 tok/s / 1904ms input / output 暂无数据 | Grok 4.20 speed / latency 41 tok/s / 1129ms input / output 暂无数据 |
|---|
小水管 API10 次测试 | GPT-5.2 speed / latency 71 tok/s / 2893ms input / output 暂无数据 | Grok 4.20 speed / latency 55 tok/s / 1168ms input / output 暂无数据 |
|---|
GPT-5.2 gpt-5.2-openai-compact speed / latency 暂无数据 input / output $75.00/M / $600.00/M | Grok 4.20 grok-4.20-beta speed / latency 暂无数据 input / output $0/M / $0/M |
GPT-5.2 gpt-5.2 speed / latency 暂无数据 input / output $12.78/M / $102.20/M | Grok 4.20 grok-4.20-fast speed / latency 暂无数据 input / output $0/M / $0/M |
GPT-5.2 gpt-5.2 speed / latency 暂无数据 input / output $0.0027/M / $0.0027/M | Grok 4.20 grok-4.20-fast speed / latency 暂无数据 input / output $0.274/M / $0.822/M |
排名基于社区提交的测试数据与定期健康探测,仅供参考,非官方数据。