Groq 支持的模型与速度基准 | LMSpeed

Groq

Groq通过其LPU架构和GroqCloud平台提供快速且低成本的AI推理服务。

分类

国家/地区美国免费试用

GPT-OSS Qwen3 GLM-4.5 Air

Groq 目前提供 5 个大模型 API。

速度基准测试平均吞吐 324 tok/s。

Groq interface preview

平均速度238.35 tok/s

延迟5.65 s

总测试数45

模型数5

更新于12/8/2025

创建时间12/8/2025

API 地址

api.groq.com

支持的模型

模型	速度	延迟	测试数
openai/gpt-oss-20b	755.20 tok/s	0.47s	5
openai/gpt-oss-120b	456.69 tok/s	0.31s	10
qwen/qwen3-32b	310.21 tok/s	0.18s	5
glm-4.5-air	76.86 tok/s	8.82s	5
free:Qwen3-30B-A3B	22.38 tok/s	10.19s	20