LM Speed
首页
免费 API
排行榜
提供商
文档
提交
切换模式
切换语言
LM Speed
Groq 支持的模型与速度基准 | LMSpeed
Groq
Groq通过其LPU架构和GroqCloud平台提供快速且低成本的AI推理服务。
分类
国家/地区
美国
免费试用
OpenAI
GPT-OSS
Qwen
Qwen3
ChatGLM
GLM-4.5 Air
Groq 目前提供 5 个大模型 API。
速度基准测试平均吞吐 324 tok/s。
平均速度
238.35 tok/s
延迟
5.65 s
总测试数
45
模型数
5
更新于
12/8/2025
创建时间
12/8/2025
网站
API 地址
api.groq.com
概览
性能
5
价格
测试记录
9
嵌入
支持的模型
分享
模型
速度
延迟
测试数
OpenAI
openai/gpt-oss-20b
755.20 tok/s
0.47
s
5
OpenAI
openai/gpt-oss-120b
456.69 tok/s
0.31
s
10
Qwen
qwen/qwen3-32b
310.21 tok/s
0.18
s
5
ChatGLM
glm-4.5-air
76.86 tok/s
8.82
s
5
Qwen
free:Qwen3-30B-A3B
22.38 tok/s
10.19
s
20