数据点: 79
DeepSeek R1 和 Kimi K2.5 的结论先放在这里,方便先判断是否值得继续看明细。
结论
Kimi K2.5
Kimi K2.5 当前更占优,可验证指标为 2 对 4。
证据覆盖
79 个数据点
包含 6 个 benchmark、0 个 audit 样本和 8 个 provider 样本。
选择依据
优先看 Kimi K2.5
下方图表把 14 组高信号样本拆开,便于核对速度、跑分和安全分。
Model compare DeepSeek R1 vs Kimi K2.5deepseek-r1-vs-kimi-k2-5 | 模型 A DeepSeek R1 | 模型 B Kimi K2.5 |
|---|---|---|
| 综合领先 | 对照 | 领先 |
| 可验证指标胜出 | 2 项 | 4 项 |
| 优势维度 | 首 token 延迟、近期测试数 | 最低输入价格、平均速度、免费服务商、服务商覆盖 |
来自 LMSpeed 同步的第三方 benchmark profile;只展示两个模型都有数值的指标。
| 指标 | DeepSeek R1 | Kimi K2.5 |
|---|---|---|
| HLE | 14.9%#52 | 29.4% |
来自共同 provider 的最近完成 audit,展示四个安全/完整性分组分数和报告入口。
| Provider | DeepSeek R1 | Kimi K2.5 |
|---|---|---|
| 暂无共同 provider 的已完成 audit。 | ||
把同一 provider 的测速聚合和 input/output 价格放进同一行,便于判断实际 API 表现和迁移成本。
| Provider | DeepSeek R1 | Kimi K2.5 |
|---|---|---|
150 次测试 | DeepSeek R1 speed / latency 25 tok/s / 38312ms input / output 暂无数据 | Kimi K2.5 |
这份报告只使用 LMSpeed 已有数据:DeepSeek R1 和 Kimi K2.5 的价格、测速聚合、第三方跑分与共同服务商样本。
| 建议 | DeepSeek R1 | Kimi K2.5 |
|---|---|---|
| 什么时候选哪个模型 | DeepSeek R1 DeepSeek R1 更适合优先看 首 token 延迟、近期测试数 的场景。 | Kimi K2.5 Kimi K2.5 更适合优先看 最低输入价格、平均速度、免费服务商、服务商覆盖 的场景。 |
TL;DR:Kimi K2.5 在本页 79 个可验证数据点中更占优,包含价格、速度、延迟、跑分和服务商样本。
从 DeepSeek R1 vs Kimi K2.5 继续查看附近模型的横向对比,这些页面都有足够的 LMSpeed 可验证数据。
| 模型元信息 | DeepSeek R1 的上下文为 163.8K tokens;主要信号:文本输入, 文本输出, 工具调用, 结构化输出。 | Kimi K2.5 的上下文为 262.1K tokens;主要信号:文本输入, 图像输入, 文本输出, 工具调用。 |
|---|---|---|
| 开发者 | DeepSeek | Moonshot AI |
| 上下文窗口 | 163.8K tokens | 262.1K tokens |
| 最大输出 | 32.8K tokens | 262.1K tokens |
| 发布日期 | 2025年5月 | 2026年1月 |
| 模态 | 输入 文本 输出 文本 | 输入 文本图像 输出 文本 |
| 能力 | 文本输入文本输出工具调用结构化输出JSON 模式推理 | 文本输入图像输入文本输出工具调用结构化输出JSON 模式推理 |
| 参数量 | 暂无数据 | 暂无数据 |
| Tokenizer | DeepSeek | Other |
| 知识截止 | 2025-03-31 | 暂无数据 |
| OpenRouter ID | deepseek/deepseek-r1-0528 | moonshotai/kimi-k2.5 |
| 来源链接 | 暂无数据 | 暂无数据 |
| SciCode | 40.3%#45 | 49.0%#14 |
|---|
| GPQA | 81.3%#51 | 87.9%#16 |
|---|
| Input price | $1.35/M#31 | $0.580/M#21 |
|---|
| Output price | $4.20/M#32 | $3.00/M#28 |
|---|
| Blended price | $2.06/M#52 | $1.19/M#43 |
|---|
speed / latency
45 tok/s / 2058ms
input / output
暂无数据
Tencent60 次测试 | DeepSeek R1 speed / latency 13 tok/s / 54820ms input / output 暂无数据 | Kimi K2.5 speed / latency 41 tok/s / 14388ms input / output 暂无数据 |
|---|
Gitee AI50 次测试 | DeepSeek R1 speed / latency 32 tok/s / 21696ms input / output 暂无数据 | Kimi K2.5 speed / latency N/A / N/A input / output 暂无数据 |
|---|
火山引擎 Ark50 次测试 | DeepSeek R1 speed / latency 29 tok/s / 27766ms input / output 暂无数据 | Kimi K2.5 speed / latency 18 tok/s / 25450ms input / output 暂无数据 |
|---|
NVIDIA NIM35 次测试 | DeepSeek R1 speed / latency 88 tok/s / 8956ms input / output 暂无数据 | Kimi K2.5 speed / latency 48 tok/s / 18528ms input / output 暂无数据 |
|---|
DeepSeek R1 deepseek-ai/deepseek-r1-0528 speed / latency 暂无数据 input / output $0/M / $0/M | Kimi K2.5 moonshotai/kimi-k2.5 speed / latency 暂无数据 input / output $0.300/M / $1.90/M |
DeepSeek R1 deepseek-r1-0528 speed / latency 暂无数据 input / output $0.010/M / $0.010/M | Kimi K2.5 moonshotai/kimi-k2.5 speed / latency 暂无数据 input / output $0.010/M / $0.010/M |
DeepSeek R1 deepseek-r1 speed / latency 暂无数据 input / output $0.010/M / $0.010/M | Kimi K2.5 kimi-k2.5 speed / latency 暂无数据 input / output $0.010/M / $0.010/M |
排名基于社区提交的测试数据与定期健康探测,仅供参考,非官方数据。