数据点: 71
GPT-4o Mini 和 o1 Mini 的结论先放在这里,方便先判断是否值得继续看明细。
结论
GPT-4o Mini
GPT-4o Mini 当前更占优,可验证指标为 5 对 0。
证据覆盖
71 个数据点
包含 7 个 benchmark、0 个 audit 样本和 9 个 provider 样本。
选择依据
优先看 GPT-4o Mini
下方图表把 16 组高信号样本拆开,便于核对速度、跑分和安全分。
Model compare GPT-4o Mini vs o1 Minigpt-4o-mini-vs-o1-mini | 模型 A GPT-4o Mini | 模型 B o1 Mini |
|---|---|---|
| 综合领先 | 领先 | 对照 |
| 可验证指标胜出 | 5 项 | 0 项 |
| 优势维度 | 最低输入价格、平均速度、首 token 延迟、服务商覆盖、近期测试数 | 暂无数据 |
来自 LMSpeed 同步的第三方 benchmark profile;只展示两个模型都有数值的指标。
| 指标 | GPT-4o Mini | o1 Mini |
|---|---|---|
| MATH-500 | 78.9%#44 | 94.4% |
来自共同 provider 的最近完成 audit,展示四个安全/完整性分组分数和报告入口。
| Provider | GPT-4o Mini | o1 Mini |
|---|---|---|
| 暂无共同 provider 的已完成 audit。 | ||
把同一 provider 的测速聚合和 input/output 价格放进同一行,便于判断实际 API 表现和迁移成本。
| Provider | GPT-4o Mini | o1 Mini |
|---|---|---|
10 次测试 | GPT-4o Mini speed / latency 84 tok/s / 5980ms input / output 暂无数据 | o1 Mini |
这份报告只使用 LMSpeed 已有数据:GPT-4o Mini 和 o1 Mini 的价格、测速聚合、第三方跑分与共同服务商样本。
| 建议 | GPT-4o Mini | o1 Mini |
|---|---|---|
| 什么时候选哪个模型 | GPT-4o Mini GPT-4o Mini 更适合优先看 最低输入价格、平均速度、首 token 延迟、服务商覆盖、近期测试数 的场景。 | o1 Mini o1 Mini 没有在当前可验证指标中明显胜出,建议结合具体服务商价格再看。 |
TL;DR:GPT-4o Mini 在本页 71 个可验证数据点中更占优,包含价格、速度、延迟、跑分和服务商样本。
从 GPT-4o Mini vs o1 Mini 继续查看附近模型的横向对比,这些页面都有足够的 LMSpeed 可验证数据。
| 模型元信息 | GPT-4o Mini 的上下文为 128K tokens;主要信号:文本输入, 图像输入, 文件输入, 文本输出。 | 这个模型暂时没有 OpenRouter 元信息。 |
|---|---|---|
| 开发者 | OpenAI | OpenAI |
| 上下文窗口 | 128K tokens | 暂无数据 |
| 最大输出 | 16.4K tokens | 暂无数据 |
| 发布日期 | 2024年7月 | 暂无数据 |
| 模态 | 输入 文本图像文件 输出 文本 | 暂无数据 |
| 能力 | 文本输入图像输入文件输入文本输出工具调用结构化输出JSON 模式联网搜索 | 暂无 |
| 参数量 | 暂无数据 | 暂无数据 |
| Tokenizer | GPT | 暂无数据 |
| 知识截止 | 2023-10-31 | 暂无数据 |
| OpenRouter ID | openai/gpt-4o-mini-2024-07-18 | 暂无数据 |
| 来源链接 | 暂无数据 | 暂无数据 |
| AIME | 11.7%#44 | 60.3%#22 |
|---|
| LiveCodeBench | 23.4%#88 | 57.6%#46 |
|---|
| MMLU-Pro | 64.8%#72 | 74.2%#60 |
|---|
| SciCode | 22.9%#109 | 32.3%#84 |
|---|
| HLE | 4.0%#95 | 4.9%#88 |
|---|
| GPQA | 42.6%#128 | 60.3%#103 |
|---|
speed / latency
N/A / N/A
input / output
暂无数据
ZEN-AI VIP2 次测试 | GPT-4o Mini gpt-4o-mini speed / latency 83 tok/s / 1341ms input / output $0.0062/M / $0.025/M | o1 Mini o1-mini-2024-09-12 speed / latency N/A / N/A input / output $0.045/M / $0.181/M |
|---|
42公益站0 次测试 | GPT-4o Mini speed / latency N/A / N/A input / output 暂无数据 | o1 Mini speed / latency N/A / N/A input / output 暂无数据 |
|---|
AAAI0 次测试 | GPT-4o Mini speed / latency N/A / N/A input / output 暂无数据 | o1 Mini speed / latency N/A / N/A input / output 暂无数据 |
|---|
AASS API0 次测试 | GPT-4o Mini speed / latency N/A / N/A input / output 暂无数据 | o1 Mini speed / latency N/A / N/A input / output 暂无数据 |
|---|
GPT-4o Mini gpt-4o-mini speed / latency 暂无数据 input / output $0.0014/M / $0.0014/M | o1 Mini o1-mini-2024-09-12 speed / latency 暂无数据 input / output $0.151/M / $0.603/M |
GPT-4o Mini gpt-4o-mini speed / latency 暂无数据 input / output $0.0014/M / $0.0014/M | o1 Mini o1-mini-2024-09-12 speed / latency 暂无数据 input / output $0.151/M / $0.603/M |
GPT-4o Mini gpt-4o-mini speed / latency 暂无数据 input / output $0.0021/M / $0.0021/M | o1 Mini o1-mini-2024-09-12 speed / latency 暂无数据 input / output $0.226/M / $0.904/M |
GPT-4o Mini gpt-4o-mini speed / latency 暂无数据 input / output $0.0027/M / $0.0027/M | o1 Mini o1-mini-2024-09-12 speed / latency 暂无数据 input / output $0.301/M / $1.21/M |
排名基于社区提交的测试数据与定期健康探测,仅供参考,非官方数据。