数据点: 99
Claude Opus 4.6 和 DeepSeek V4 Flash 的结论先放在这里,方便先判断是否值得继续看明细。
结论
DeepSeek V4 Flash
DeepSeek V4 Flash 当前更占优,可验证指标为 2 对 4。
证据覆盖
99 个数据点
包含 8 个 benchmark、6 个 audit 样本和 8 个 provider 样本。
选择依据
优先看 DeepSeek V4 Flash
下方图表把 22 组高信号样本拆开,便于核对速度、跑分和安全分。
Model compare Claude Opus 4.6 vs DeepSeek V4 Flashclaude-opus-4-6-vs-deepseek-v4-flash | 模型 A Claude Opus 4.6 | 模型 B DeepSeek V4 Flash |
|---|---|---|
| 综合领先 | 对照 | 领先 |
| 可验证指标胜出 | 2 项 | 4 项 |
| 优势维度 | 首 token 延迟、服务商覆盖 | 最低输入价格、平均速度、免费服务商、近期测试数 |
| 模型元信息 | 这个模型暂时没有 OpenRouter 元信息。 | 这个模型暂时没有 OpenRouter 元信息。 |
| 开发者 | Anthropic | DeepSeek |
| 上下文窗口 | 暂无数据 | 暂无数据 |
| 最大输出 | 暂无数据 | 暂无数据 |
| 发布日期 | 暂无数据 | 暂无数据 |
| 模态 | 暂无数据 | 暂无数据 |
| 能力 | 暂无 | 暂无 |
| 参数量 | 暂无数据 | 暂无数据 |
| Tokenizer | 暂无数据 | 暂无数据 |
| 知识截止 | 暂无数据 | 暂无数据 |
| OpenRouter ID | 暂无数据 | 暂无数据 |
| 来源链接 | 暂无数据 | 暂无数据 |
来自 LMSpeed 同步的第三方 benchmark profile;只展示两个模型都有数值的指标。
| 指标 | Claude Opus 4.6 | DeepSeek V4 Flash |
|---|---|---|
| Output price | $25.00/M#46 | $0.280/M#4 |
| Input price | $6.25/M#41 | $0.140/M#8 |
| Blended price | $10.94/M#67 | $0.175/M#10 |
| GPQA | 84.0%#38 | 89.4%#11 |
| HLE | 18.6%#43 | 32.1%#13 |
| SciCode | 45.7%#20 | 44.9%#23 |
| Time to first answer token | 1.32 s#33 | 61.38 s#99 |
| Time to first token | 1.32 s#54 | 0.98 s#37 |
来自共同 provider 的最近完成 audit,展示四个安全/完整性分组分数和报告入口。
| Provider | Claude Opus 4.6 | DeepSeek V4 Flash |
|---|---|---|
VSLLM胜出方: Claude Opus 4.6 | Claude Opus 4.6 claude-opus-4-6 Audit 分数 94 76100100100 | DeepSeek V4 Flash deepseek-v4-flash-free 暂无 audit |
速创API胜出方: DeepSeek V4 Flash | Claude Opus 4.6 claude-opus-4-6 暂无 audit | DeepSeek V4 Flash deepseek-v4-flash Audit 分数 92 10068100100 |
Cuz AI胜出方: Claude Opus 4.6 | Claude Opus 4.6 claude-opus-4-6 Audit 分数 89 56100100100 | DeepSeek V4 Flash deepseek-v4-flash 暂无 audit |
Yuan API胜出方: Claude Opus 4.6 | Claude Opus 4.6 claude-opus-4-6 Audit 分数 89 56100100100 | DeepSeek V4 Flash deepseek-v4-flash 暂无 audit |
MyDamoxing胜出方: DeepSeek V4 Flash | Claude Opus 4.6 claude-opus-4-6 暂无 audit | DeepSeek V4 Flash deepseek-v4-flash Audit 分数 84 787584100 |
小水管 API胜出方: Claude Opus 4.6 | Claude Opus 4.6 claude-opus-4-6 Audit 分数 84 728480100 | DeepSeek V4 Flash deepseek-v4-flash Audit 分数 81 727280100 |
把同一 provider 的测速聚合和 input/output 价格放进同一行,便于判断实际 API 表现和迁移成本。
| Provider | Claude Opus 4.6 | DeepSeek V4 Flash |
|---|---|---|
小水管 API25 次测试 | Claude Opus 4.6 claude-opus-4-6 speed / latency 45 tok/s / 6167ms input / output $0/M / $0/M | DeepSeek V4 Flash sensenova/deepseek-v4-flash speed / latency 83 tok/s / 5114ms input / output $0/M / $0/M |
钠 API25 次测试 | Claude Opus 4.6 speed / latency 42 tok/s / 2282ms input / output 暂无数据 | DeepSeek V4 Flash speed / latency 85 tok/s / 6387ms input / output 暂无数据 |
OpenCode20 次测试 | Claude Opus 4.6 speed / latency N/A / N/A input / output 暂无数据 | DeepSeek V4 Flash speed / latency 55 tok/s / 31496ms input / output 暂无数据 |
6i2 API15 次测试 | Claude Opus 4.6 speed / latency 280 tok/s / 3242ms input / output 暂无数据 | DeepSeek V4 Flash speed / latency 307 tok/s / 3427ms input / output 暂无数据 |
Rnglg2 API15 次测试 | Claude Opus 4.6 speed / latency 57 tok/s / 3926ms input / output 暂无数据 | DeepSeek V4 Flash speed / latency N/A / N/A input / output 暂无数据 |
Claude Opus 4.6 claude-opus-4.6 speed / latency 暂无数据 input / output $0/M / $0/M | DeepSeek V4 Flash deepseek-v4-flash speed / latency 暂无数据 input / output $0.140/M / $0.280/M | |
Claude Opus 4.6 claude-opus-4-6 speed / latency 暂无数据 input / output $0.685/M / $3.42/M | DeepSeek V4 Flash deepseek-v4-flash speed / latency 暂无数据 input / output $0.0012/M / $0.0012/M | |
Claude Opus 4.6 claude-opus-4-6-thinking speed / latency 暂无数据 input / output $0.342/M / $1.71/M | DeepSeek V4 Flash deepseek-v4-flash speed / latency 暂无数据 input / output $0.012/M / $0.024/M |
这份报告只使用 LMSpeed 已有数据:Claude Opus 4.6 和 DeepSeek V4 Flash 的价格、测速聚合、第三方跑分与共同服务商样本。
| 建议 | Claude Opus 4.6 | DeepSeek V4 Flash |
|---|---|---|
| 什么时候选哪个模型 | Claude Opus 4.6 Claude Opus 4.6 更适合优先看 首 token 延迟、服务商覆盖 的场景。 | DeepSeek V4 Flash DeepSeek V4 Flash 更适合优先看 最低输入价格、平均速度、免费服务商、近期测试数 的场景。 |
TL;DR:DeepSeek V4 Flash 在本页 99 个可验证数据点中更占优,包含价格、速度、延迟、跑分和服务商样本。
从 Claude Opus 4.6 vs DeepSeek V4 Flash 继续查看附近模型的横向对比,这些页面都有足够的 LMSpeed 可验证数据。
排名基于社区提交的测试数据与定期健康探测,仅供参考,非官方数据。