Groq

Name: Groq
Rating: 5.0 (45 reviews)

Groq provides fast and low-cost AI inference through its LPU architecture and GroqCloud platform.

Categories

Groq offers 5 LLM API models.

Speed benchmark average: 324 tok/s.

Avg Speed238.35 tok/s

Latency5.65 s

Total Tests45

Models5

Updated12/8/2025

Created At12/8/2025

Recent Test Records

Time	Model	Speed	Latency
Dec 16, 11:17 AM	openai/gpt-oss-120b	446.44 tok/s	0.34s
Dec 12, 12:40 AM	qwen/qwen3-32b	310.21 tok/s	0.18s
Dec 12, 12:39 AM	openai/gpt-oss-20b	755.20 tok/s	0.47s
Dec 12, 12:38 AM	openai/gpt-oss-120b	466.94 tok/s	0.28s
Dec 8, 06:30 AM	free:Qwen3-30B-A3B	18.89 tok/s	12.00s
Dec 8, 06:24 AM	free:Qwen3-30B-A3B	23.01 tok/s	7.66s
Dec 8, 06:24 AM	free:Qwen3-30B-A3B	19.23 tok/s	4.74s
Dec 8, 06:22 AM	glm-4.5-air	76.86 tok/s	8.82s
Dec 8, 06:22 AM	free:Qwen3-30B-A3B	28.39 tok/s	16.37s