数据点: 80
Claude Opus 4.6 和 DeepSeek V3.1 Terminus 的结论先放在这里,方便先判断是否值得继续看明细。
结论
接近持平
接近持平 当前更占优,可验证指标为 3 对 3。
证据覆盖
80 个数据点
包含 7 个 benchmark、0 个 audit 样本和 8 个 provider 样本。
选择依据
接近持平
下方图表把 15 组高信号样本拆开,便于核对速度、跑分和安全分。
左右两边都可以换成其他模型,页面会打开新的 LMSpeed 对比 URL。
选择其他模型后会打开新的对比页。
Model compare Claude Opus 4.6 vs DeepSeek V3.1 Terminusclaude-opus-4-6-vs-deepseek-v3-1-terminus | 模型 A Claude Opus 4.6 | 模型 B DeepSeek V3.1 Terminus |
|---|---|---|
| 综合领先 | 接近持平 | 接近持平 |
| 可验证指标胜出 | 3 项 | 3 项 |
| 优势维度 | 最低输入价格、服务商覆盖、近期测试数 | 平均速度、首 token 延迟、免费服务商 |
| 模型元信息 | Claude Opus 4.6 的上下文为 1M tokens;主要信号:文本输入, 图像输入, 文件输入, 文本输出。 | DeepSeek V3.1 Terminus 的上下文为 163.8K tokens;主要信号:文本输入, 文本输出, 工具调用, 结构化输出。 |
| 开发者 | Anthropic | DeepSeek |
| 上下文窗口 | 1M tokens | 163.8K tokens |
| 最大输出 | 128K tokens | 32.8K tokens |
| 发布日期 | 2026年4月 | 2025年9月 |
| 模态 | 输入 文本图像文件 输出 文本 | 输入 文本 输出 文本 |
| 能力 | 文本输入图像输入文件输入文本输出工具调用结构化输出JSON 模式推理 | 文本输入文本输出工具调用结构化输出JSON 模式推理 |
| 参数量 | 暂无数据 | 暂无数据 |
| Tokenizer | Claude | DeepSeek |
| 知识截止 | 暂无数据 | 2025-03-31 |
| OpenRouter ID | anthropic/claude-opus-4.6-fast | deepseek/deepseek-v3.1-terminus |
| 来源链接 | 暂无数据 | 暂无数据 |
来自 LMSpeed 同步的第三方 benchmark profile;只展示两个模型都有数值的指标。
按 0-100 分对比 benchmark 分类表现;点击分类可以聚焦查看差距。
平均分
Claude Opus 4.6
65.8
平均分
DeepSeek V3.1 Terminus
49.1
当前分类
代码
Claude Opus 4.6 领先 18.9
按具体 benchmark 指标对比两个模型,展示来源、排名覆盖、置信度、误差和评测日期等上下文。
Claude Opus 4.6
$10.00/M
排名 #84/96 · confidence 4
DeepSeek V3.1 Terminus
领先$0.453/M
排名 #22/96 · confidence 4
Claude Opus 4.6
$5.00/M
排名 #84/96 · confidence 4
DeepSeek V3.1 Terminus
领先$0.270/M
排名 #24/96 · confidence 4
Claude Opus 4.6
$25.00/M
排名 #84/96 · confidence 4
DeepSeek V3.1 Terminus
领先$1.00/M
排名 #25/96 · confidence 4
Claude Opus 4.6
82.0%
排名 #31/74 · confidence 4 · 评测日期 2026-02-01
DeepSeek V3.1 Terminus
领先83.6%
排名 #27/74 · confidence 4
Claude Opus 4.6
领先84.0%
排名 #33/104 · confidence 4
DeepSeek V3.1 Terminus
75.1%
排名 #58/104 · confidence 4
Claude Opus 4.6
领先18.6%
排名 #41/104 · confidence 4
DeepSeek V3.1 Terminus
8.4%
排名 #58/104 · confidence 4
Claude Opus 4.6
领先45.7%
排名 #23/102 · confidence 4
DeepSeek V3.1 Terminus
32.1%
排名 #78/102 · confidence 4
来自共同 provider 的最近完成 audit,展示四个安全/完整性分组分数和报告入口。
| Provider | Claude Opus 4.6 | DeepSeek V3.1 Terminus |
|---|---|---|
| 暂无共同 provider 的已完成 audit。 | ||
把同一 provider 的测速聚合和 input/output 价格放进同一行,便于判断实际 API 表现和迁移成本。
| Provider | Claude Opus 4.6 | DeepSeek V3.1 Terminus |
|---|---|---|
Rnglg2 API15 次测试 | Claude Opus 4.6 speed / latency 57 tok/s / 3926ms input / output 暂无数据 | DeepSeek V3.1 Terminus speed / latency N/A / N/A input / output 暂无数据 |
6i2 API5 次测试 | Claude Opus 4.6 speed / latency 280 tok/s / 3242ms input / output 暂无数据 | DeepSeek V3.1 Terminus speed / latency N/A / N/A input / output 暂无数据 |
EasyMore5 次测试 | Claude Opus 4.6 speed / latency 27 tok/s / 15402ms input / output 暂无数据 | DeepSeek V3.1 Terminus speed / latency N/A / N/A input / output 暂无数据 |
小水管 API5 次测试 | Claude Opus 4.6 speed / latency 45 tok/s / 6167ms input / output 暂无数据 | DeepSeek V3.1 Terminus speed / latency N/A / N/A input / output 暂无数据 |
素墨API5 次测试 | Claude Opus 4.6 speed / latency 47 tok/s / 2344ms input / output 暂无数据 | DeepSeek V3.1 Terminus speed / latency N/A / N/A input / output 暂无数据 |
Claude Opus 4.6 claude-opus-4-6-thinking speed / latency 暂无数据 input / output $5.00/M / $25.00/M | DeepSeek V3.1 Terminus deepseek-v3.1-terminus speed / latency 暂无数据 input / output $0.010/M / $0.010/M | |
Claude Opus 4.6 claude-opus-4-6-thinking speed / latency 暂无数据 input / output $0.342/M / $1.71/M | DeepSeek V3.1 Terminus deepseek-v3.1-terminus speed / latency 暂无数据 input / output $0.018/M / $0.068/M | |
Claude Opus 4.6 claude-opus-4-6 speed / latency 暂无数据 input / output $0.040/M / $0.200/M | DeepSeek V3.1 Terminus deepseek-v3.1-terminus speed / latency 暂无数据 input / output $0.020/M / $0.040/M |
这份报告只使用 LMSpeed 已有数据:Claude Opus 4.6 和 DeepSeek V3.1 Terminus 的价格、测速聚合、第三方跑分与共同服务商样本。
| 建议 | Claude Opus 4.6 | DeepSeek V3.1 Terminus |
|---|---|---|
| 什么时候选哪个模型 | Claude Opus 4.6 Claude Opus 4.6 更适合优先看 最低输入价格、服务商覆盖、近期测试数 的场景。 | DeepSeek V3.1 Terminus DeepSeek V3.1 Terminus 更适合优先看 平均速度、首 token 延迟、免费服务商 的场景。 |
TL;DR:接近持平 在本页 80 个可验证数据点中更占优,包含价格、速度、延迟、跑分和服务商样本。
从 Claude Opus 4.6 vs DeepSeek V3.1 Terminus 继续查看附近模型的横向对比,这些页面都有足够的 LMSpeed 可验证数据。
排名基于社区提交的测试数据与定期健康探测,仅供参考,非官方数据。