数据点: 83
GPT-5 和 Qwen3 的结论先放在这里,方便先判断是否值得继续看明细。
结论
接近持平
接近持平 当前更占优,可验证指标为 3 对 3。
证据覆盖
83 个数据点
包含 8 个 benchmark、0 个 audit 样本和 9 个 provider 样本。
选择依据
接近持平
下方图表把 17 组高信号样本拆开,便于核对速度、跑分和安全分。
Model compare GPT-5 vs Qwen3gpt-5-vs-qwen3 | 模型 A GPT-5 | 模型 B Qwen3 |
|---|---|---|
| 综合领先 | 接近持平 | 接近持平 |
| 可验证指标胜出 | 3 项 | 3 项 |
| 优势维度 | 最低输入价格、首 token 延迟、服务商覆盖 | 平均速度、免费服务商、近期测试数 |
| 模型元信息 | GPT-5 的上下文为 128K tokens;主要信号:文本输入, 图像输入, 文件输入, 文本输出。 | Qwen3 的上下文为 262.1K tokens;主要信号:文本输入, 文本输出, 工具调用, 结构化输出。 |
| 开发者 | OpenAI | 暂无数据 |
| 上下文窗口 | 128K tokens | 262.1K tokens |
| 最大输出 | 16.4K tokens | 16.4K tokens |
| 发布日期 | 2025年8月 | 2025年7月 |
| 模态 | 输入 文件图像文本 输出 文本 | 输入 文本 输出 文本 |
| 能力 | 文本输入图像输入文件输入文本输出结构化输出JSON 模式 | 文本输入文本输出工具调用结构化输出JSON 模式 |
| 参数量 | 暂无数据 | 235B / 22B active |
| Tokenizer | GPT | Qwen3 |
| 知识截止 | 2024-09-30 | 2025-06-30 |
| OpenRouter ID | openai/gpt-5-chat | qwen/qwen3-235b-a22b-2507 |
| 来源链接 | 暂无数据 | 暂无数据 |
来自 LMSpeed 同步的第三方 benchmark profile;只展示两个模型都有数值的指标。
| 指标 | GPT-5 | Qwen3 |
|---|---|---|
| AIME | 95.7%#1 | 72.7%#15 |
| MATH-500 | 99.4%#1 | 97.5%#11 |
| Output price | $10.00/M#41 | $0.400/M#6 |
| MMLU-Pro | 87.1%#7 | 77.7%#51 |
| Input price | $1.25/M#30 | $0.150/M#9 |
| LiveCodeBench | 84.6%#11 | 51.5%#54 |
| Blended price | $3.44/M#58 | $0.213/M#12 |
| HLE | 26.5%#24 | 6.8%#79 |
来自共同 provider 的最近完成 audit,展示四个安全/完整性分组分数和报告入口。
| Provider | GPT-5 | Qwen3 |
|---|---|---|
| 暂无共同 provider 的已完成 audit。 | ||
把同一 provider 的测速聚合和 input/output 价格放进同一行,便于判断实际 API 表现和迁移成本。
| Provider | GPT-5 | Qwen3 |
|---|---|---|
OpenRouter65 次测试 | GPT-5 speed / latency N/A / N/A input / output 暂无数据 | Qwen3 speed / latency 88 tok/s / 14234ms input / output 暂无数据 |
SWT-API35 次测试 | GPT-5 gpt-5 speed / latency N/A / N/A input / output $0.0006/M / $0.0050/M | Qwen3 qwen3-8b speed / latency 39 tok/s / 15961ms input / output $0.037/M / $0.037/M |
V-API20 次测试 | GPT-5 speed / latency 95 tok/s / 1234ms input / output 暂无数据 | Qwen3 speed / latency N/A / N/A input / output 暂无数据 |
N1N10 次测试 | GPT-5 speed / latency 102 tok/s / 948ms input / output 暂无数据 | Qwen3 speed / latency 79 tok/s / 10008ms input / output 暂无数据 |
EasyMore5 次测试 | GPT-5 speed / latency 46 tok/s / 6577ms input / output 暂无数据 | Qwen3 speed / latency N/A / N/A input / output 暂无数据 |
GPT-5 gpt-5 speed / latency 暂无数据 input / output $0.147/M / $1.17/M | Qwen3 qwen3-235b speed / latency 暂无数据 input / output $0/M / $0/M | |
GPT-5 gpt-5 speed / latency 暂无数据 input / output $0.0006/M / $0.0050/M | Qwen3 qwen3-8b speed / latency 暂无数据 input / output $0.037/M / $0.037/M | |
GPT-5 gpt-5 speed / latency 暂无数据 input / output $0.010/M / $0.010/M | Qwen3 qwen3-32b speed / latency 暂无数据 input / output $0.0010/M / $0.0010/M | |
GPT-5 gpt-5 speed / latency 暂无数据 input / output $0.0027/M / $0.0027/M | Qwen3 qwen3:32b speed / latency 暂无数据 input / output $10.27/M / $10.27/M |
这份报告只使用 LMSpeed 已有数据:GPT-5 和 Qwen3 的价格、测速聚合、第三方跑分与共同服务商样本。
| 建议 | GPT-5 | Qwen3 |
|---|---|---|
| 什么时候选哪个模型 | GPT-5 GPT-5 更适合优先看 最低输入价格、首 token 延迟、服务商覆盖 的场景。 | Qwen3 Qwen3 更适合优先看 平均速度、免费服务商、近期测试数 的场景。 |
TL;DR:接近持平 在本页 83 个可验证数据点中更占优,包含价格、速度、延迟、跑分和服务商样本。
从 GPT-5 vs Qwen3 继续查看附近模型的横向对比,这些页面都有足够的 LMSpeed 可验证数据。
排名基于社区提交的测试数据与定期健康探测,仅供参考,非官方数据。