Leaderboard

LMSpeed Latency Leaderboard

Name: Aug 2025 LLM Model Latency Leaderboard | LMSpeed
Creator: LMSpeed
License: https://creativecommons.org/licenses/by/4.0/

Multi-dimensional rankings based on model speed tests and provider health checks. Compare providers, endpoints, and reliability at a glance.

Average time to first token. Lower is better for responsiveness.

ArchiveAug 2025

Fairness Notice

To ensure fairness, the system uses AI-powered detection. Suspicious data or cheating will be flagged and removed from the leaderboard.

Top performerRanked

Aug 2025

Rank	Provider	Model	First Token Latency	Avg tokens per second	Total Tests
1		google/gemma-3-27b-it	0.20 s Best: 0.15Worst: 0.29	62.41t/s	5
2		01-ai/yi-large	0.22 s Best: 0.19Worst: 0.32	43.74t/s	5