数据点: 68
DeepSeek V3.1 和 GPT-5.4 的结论先放在这里,方便先判断是否值得继续看明细。
结论
接近持平
接近持平 当前更占优,可验证指标为 3 对 3。
证据覆盖
68 个数据点
包含 6 个 benchmark、0 个 audit 样本和 10 个 provider 样本。
选择依据
接近持平
下方图表把 16 组高信号样本拆开,便于核对速度、跑分和安全分。
Model compare DeepSeek V3.1 vs GPT-5.4deepseek-v3-1-vs-gpt-5-4 | 模型 A DeepSeek V3.1 | 模型 B GPT-5.4 |
|---|---|---|
| 综合领先 | 接近持平 | 接近持平 |
| 可验证指标胜出 | 3 项 | 3 项 |
| 优势维度 | 平均速度、首 token 延迟、免费服务商 | 最低输入价格、服务商覆盖、近期测试数 |
| 模型元信息 | 这个模型暂时没有 OpenRouter 元信息。 | GPT-5.4 的上下文为 1.1M tokens;主要信号:文本输入, 图像输入, 文件输入, 文本输出。 |
| 开发者 | DeepSeek | OpenAI |
| 上下文窗口 | 暂无数据 | 1.1M tokens |
| 最大输出 | 暂无数据 | 128K tokens |
| 发布日期 | 暂无数据 | 2026年3月 |
| 模态 | 暂无数据 | 输入 文本图像文件 输出 文本 |
| 能力 | 暂无 | 文本输入图像输入文件输入文本输出工具调用结构化输出JSON 模式推理 |
| 参数量 | 暂无数据 | 暂无数据 |
| Tokenizer | 暂无数据 | GPT |
| 知识截止 | 暂无数据 | 暂无数据 |
| OpenRouter ID | 暂无数据 | openai/gpt-5.4 |
| 来源链接 | 暂无数据 | 暂无数据 |
来自 LMSpeed 同步的第三方 benchmark profile;只展示两个模型都有数值的指标。
| 指标 | DeepSeek V3.1 | GPT-5.4 |
|---|---|---|
| GPQA | 73.5%#73 | 92.0%#3 |
| SciCode | 36.7%#68 | 56.6%#3 |
| HLE | 6.3%#80 | 41.6%#4 |
| Input price | $0.555/M#20 | $2.50/M#37 |
| Output price | $1.67/M#22 | $15.00/M#44 |
| Blended price | $0.834/M#34 | $5.63/M#63 |
来自共同 provider 的最近完成 audit,展示四个安全/完整性分组分数和报告入口。
| Provider | DeepSeek V3.1 | GPT-5.4 |
|---|---|---|
| 暂无共同 provider 的已完成 audit。 | ||
把同一 provider 的测速聚合和 input/output 价格放进同一行,便于判断实际 API 表现和迁移成本。
| Provider | DeepSeek V3.1 | GPT-5.4 |
|---|---|---|
天宫造物50 次测试 | DeepSeek V3.1 speed / latency N/A / N/A input / output 暂无数据 | GPT-5.4 speed / latency 50 tok/s / 7305ms input / output 暂无数据 |
6345ywz API40 次测试 | DeepSeek V3.1 speed / latency 267 tok/s / 845ms input / output 暂无数据 | GPT-5.4 speed / latency 41 tok/s / 6581ms input / output 暂无数据 |
SkyAI31 次测试 | DeepSeek V3.1 speed / latency 68 tok/s / 3024ms input / output 暂无数据 | GPT-5.4 speed / latency N/A / N/A input / output 暂无数据 |
星见雅 API20 次测试 | DeepSeek V3.1 speed / latency N/A / N/A input / output 暂无数据 | GPT-5.4 speed / latency 49 tok/s / 5435ms input / output 暂无数据 |
Fengsili API10 次测试 | DeepSeek V3.1 speed / latency N/A / N/A input / output 暂无数据 | GPT-5.4 speed / latency 88 tok/s / 6075ms input / output 暂无数据 |
DeepSeek V3.1 deepseek-v3.1 speed / latency 暂无数据 input / output $0.010/M / $0.010/M | GPT-5.4 gpt-5.4-high speed / latency 暂无数据 input / output $0.050/M / $0.050/M | |
DeepSeek V3.1 deepseek-v3.1 speed / latency 暂无数据 input / output $0.038/M / $0.115/M | GPT-5.4 gpt-5.4 speed / latency 暂无数据 input / output $0.171/M / $1.03/M | |
DeepSeek V3.1 deepseek-v3.1-250821 speed / latency 暂无数据 input / output $0.049/M / $0.147/M | GPT-5.4 gpt-5.4 speed / latency 暂无数据 input / output $0.429/M / $3.43/M | |
DeepSeek V3.1 deepseek-v3.1 speed / latency 暂无数据 input / output $0.050/M / $0.050/M | GPT-5.4 gpt-5.4 speed / latency 暂无数据 input / output $0.400/M / $2.40/M | |
DeepSeek V3.1 deepseek-v3.1 speed / latency 暂无数据 input / output $0.164/M / $0.493/M | GPT-5.4 gpt-5.4-xhigh speed / latency 暂无数据 input / output $0.103/M / $0.616/M |
这份报告只使用 LMSpeed 已有数据:DeepSeek V3.1 和 GPT-5.4 的价格、测速聚合、第三方跑分与共同服务商样本。
| 建议 | DeepSeek V3.1 | GPT-5.4 |
|---|---|---|
| 什么时候选哪个模型 | DeepSeek V3.1 DeepSeek V3.1 更适合优先看 平均速度、首 token 延迟、免费服务商 的场景。 | GPT-5.4 GPT-5.4 更适合优先看 最低输入价格、服务商覆盖、近期测试数 的场景。 |
TL;DR:接近持平 在本页 68 个可验证数据点中更占优,包含价格、速度、延迟、跑分和服务商样本。
从 DeepSeek V3.1 vs GPT-5.4 继续查看附近模型的横向对比,这些页面都有足够的 LMSpeed 可验证数据。
排名基于社区提交的测试数据与定期健康探测,仅供参考,非官方数据。