数据点: 83
DeepSeek V3.2 和 GPT-OSS 的结论先放在这里,方便先判断是否值得继续看明细。
结论
GPT-OSS
GPT-OSS 当前更占优,可验证指标为 2 对 3。
证据覆盖
83 个数据点
包含 8 个 benchmark、0 个 audit 样本和 8 个 provider 样本。
选择依据
优先看 GPT-OSS
下方图表把 16 组高信号样本拆开,便于核对速度、跑分和安全分。
Model compare DeepSeek V3.2 vs GPT-OSSdeepseek-v3-2-vs-gpt-oss | 模型 A DeepSeek V3.2 | 模型 B GPT-OSS |
|---|---|---|
| 综合领先 | 对照 | 领先 |
| 可验证指标胜出 | 2 项 | 3 项 |
| 优势维度 | 服务商覆盖、近期测试数 | 平均速度、首 token 延迟、免费服务商 |
来自 LMSpeed 同步的第三方 benchmark profile;只展示两个模型都有数值的指标。
| 指标 | DeepSeek V3.2 | GPT-OSS |
|---|---|---|
| Output price | $1.60/M#21 | $0.200/M |
来自共同 provider 的最近完成 audit,展示四个安全/完整性分组分数和报告入口。
| Provider | DeepSeek V3.2 | GPT-OSS |
|---|---|---|
| 暂无共同 provider 的已完成 audit。 | ||
把同一 provider 的测速聚合和 input/output 价格放进同一行,便于判断实际 API 表现和迁移成本。
| Provider | DeepSeek V3.2 | GPT-OSS |
|---|---|---|
115 次测试 | DeepSeek V3.2 speed / latency 18 tok/s / 4488ms input / output 暂无数据 | GPT-OSS |
这份报告只使用 LMSpeed 已有数据:DeepSeek V3.2 和 GPT-OSS 的价格、测速聚合、第三方跑分与共同服务商样本。
| 建议 | DeepSeek V3.2 | GPT-OSS |
|---|---|---|
| 什么时候选哪个模型 | DeepSeek V3.2 DeepSeek V3.2 更适合优先看 服务商覆盖、近期测试数 的场景。 | GPT-OSS GPT-OSS 更适合优先看 平均速度、首 token 延迟、免费服务商 的场景。 |
TL;DR:GPT-OSS 在本页 83 个可验证数据点中更占优,包含价格、速度、延迟、跑分和服务商样本。
从 DeepSeek V3.2 vs GPT-OSS 继续查看附近模型的横向对比,这些页面都有足够的 LMSpeed 可验证数据。
| 模型元信息 | DeepSeek V3.2 的上下文为 131.1K tokens;主要信号:文本输入, 文本输出, 工具调用, 结构化输出。 | GPT-OSS 的上下文为 131.1K tokens;主要信号:文本输入, 文本输出, 工具调用, 推理。 |
|---|---|---|
| 开发者 | DeepSeek | 暂无数据 |
| 上下文窗口 | 131.1K tokens | 131.1K tokens |
| 最大输出 | 64K tokens | 131.1K tokens |
| 发布日期 | 2025年12月 | 2025年8月 |
| 模态 | 输入 文本 输出 文本 | 输入 文本 输出 文本 |
| 能力 | 文本输入文本输出工具调用结构化输出JSON 模式推理 | 文本输入文本输出工具调用推理 |
| 参数量 | 暂无数据 | 120B |
| Tokenizer | DeepSeek | GPT |
| 知识截止 | 暂无数据 | 2024-06-30 |
| OpenRouter ID | deepseek/deepseek-v3.2 | openai/gpt-oss-120b:free |
| 来源链接 | 暂无数据 | 暂无数据 |
| Blended price | $0.775/M#31 | $0.095/M#4 |
|---|
| Input price | $0.500/M#18 | $0.060/M#4 |
|---|
| MMLU-Pro | 83.7%#23 | 71.8%#64 |
|---|
| LiveCodeBench | 59.3%#43 | 65.2%#36 |
|---|
| SciCode | 38.7%#54 | 34.0%#79 |
|---|
| HLE | 10.5%#64 | 5.1%#86 |
|---|
| GPQA | 75.1%#68 | 61.1%#102 |
|---|
speed / latency
154 tok/s / 963ms
input / output
暂无数据
云智API80 次测试 | DeepSeek V3.2 speed / latency 29 tok/s / 3036ms input / output 暂无数据 | GPT-OSS speed / latency N/A / N/A input / output 暂无数据 |
|---|
素墨API45 次测试 | DeepSeek V3.2 speed / latency 22 tok/s / 5987ms input / output 暂无数据 | GPT-OSS speed / latency 347 tok/s / 2670ms input / output 暂无数据 |
|---|
6345ywz API40 次测试 | DeepSeek V3.2 speed / latency 227 tok/s / 1884ms input / output 暂无数据 | GPT-OSS speed / latency 127 tok/s / 787ms input / output 暂无数据 |
|---|
OpenRouter40 次测试 | DeepSeek V3.2 speed / latency N/A / N/A input / output 暂无数据 | GPT-OSS speed / latency 41 tok/s / 2851ms input / output 暂无数据 |
|---|
DeepSeek V3.2 deepseek-ai/deepseek-v3.2 speed / latency 暂无数据 input / output $0/M / $0/M | GPT-OSS openai/gpt-oss-120b speed / latency 暂无数据 input / output $0.039/M / $0.190/M |
DeepSeek V3.2 linuxdo/deepseek-v3.2-chat speed / latency 暂无数据 input / output $0/M / $0/M | GPT-OSS openai/gpt-oss-20b speed / latency 暂无数据 input / output $0/M / $0/M |
DeepSeek V3.2 deepseek-ai/deepseek-v3.2 speed / latency 暂无数据 input / output $0/M / $0/M | GPT-OSS openai/gpt-oss-20b speed / latency 暂无数据 input / output $0/M / $0/M |
排名基于社区提交的测试数据与定期健康探测,仅供参考,非官方数据。