Leaderboard

LMSpeed Latency Leaderboard

Name: Sep 2025 LLM Model Latency Leaderboard | LMSpeed
Creator: LMSpeed
License: https://creativecommons.org/licenses/by/4.0/

Multi-dimensional rankings based on model speed tests and provider health checks. Compare providers, endpoints, and reliability at a glance.

Average time to first token. Lower is better for responsiveness.

ArchiveSep 2025

Fairness Notice

To ensure fairness, the system uses AI-powered detection. Suspicious data or cheating will be flagged and removed from the leaderboard.

Top performerRanked

Sep 2025

Rank	Provider	Model	First Token Latency	Avg tokens per second	Total Tests
1		google/gemma-2-27b-it	0.22 s Best: 0.19Worst: 0.35	43.48t/s	5
2		deepseek-v3.1	0.30 s Best: 0.27Worst: 0.34	57.51t/s	5