LogoLMSpeed
  • Главная
  • Бесплатные
  • Модели
  • Провайдеры
  • Документация
LogoLMSpeed
LogoLMSpeed

Лучший инструмент для проверки скорости API

GitHubGitHubTwitterX (Twitter)Email
Продукт
  • Возможности
  • Цены
  • FAQ
Рейтинги
  • Обзор
  • Рейтинг скорости
  • Рейтинг задержки
  • Рейтинг стабильности
  • Цены моделей
  • Скорость моделей
  • Reasoning
  • Coding
Модели
  • Все модели
  • GPT
  • Claude
  • Gemini
  • DeepSeek
  • Llama
  • Qwen
Бесплатные модели
  • Все бесплатные модели
  • Бесплатный GPT
  • Бесплатный Claude
  • Бесплатный Gemini
  • Бесплатный DeepSeek
  • Бесплатный Llama
  • Бесплатный Qwen
Ресурсы
  • Тест скорости
  • Каталог провайдеров
  • Документация
Правовая информация
  • Политика cookie
  • Политика конфиденциальности
  • Условия использования
© 2026 LMSpeed All Rights Reserved.Made by Nexmoe with ❤️

Библиотека моделей

Просматривайте канонические модели у различных провайдеров с показателями производительности и охвата.

Видимые модели
302
Активные модели
302
Охваченные провайдеры
583
Варианты моделей
31311
Показано 1–24 из 302 моделей

ClaudeClaude Opus 4.8

Anthropic Claude Opus 4.8 is Anthropic frontier model for complex reasoning, long-horizon agentic coding, and professional knowledge work, with a 1M-token context window and adaptive thinking support.

Цена входных данных+1 бесплатных

От $0.030/M

Ср. скорость

—

Первый токен

—

Провайдеры

94

QwenQwen-72B

Qwen-72B is a 72-billion-parameter language model in Alibaba Cloud's Qwen (Tongyi Qianwen) family, designed for multilingual instruction following, reasoning, and general-purpose text generation.

Цена входных данных

От $2.64/M

Ср. скорость

—

Первый токен

—

Провайдеры

15

QwenQwen3 Instruct

Alibaba Qwen3 Instruct is an instruction-tuned variant in the Qwen series, optimized for following instructions and conversational tasks.

Цена входных данных

От $0.010/M

Ср. скорость

—

Первый токен

—

Провайдеры

7

DeepSeekDeepSeek V4 Pro

DeepSeek V4 Pro is a large language model in the DeepSeek series, offering advanced reasoning, code generation, and multimodal capabilities.

Цена входных данных+9 бесплатных

От $0.0007/M

Ср. скорость

43 т/с

Первый токен

8.47с

Провайдеры

192

DeepSeekDeepSeek V4 Flash

DeepSeek V4 Flash is a fast, cost-efficient language model in the DeepSeek V4 family, optimized for low-latency chat, coding assistance, and high-throughput API workloads while retaining strong reasoning quality.

Цена входных данных+9 бесплатных

От $0.0007/M

Ср. скорость

71 т/с

Первый токен

5.80с

Провайдеры

197

MiMo-V2.5-TTS-VoiceDesign

Xiaomi MiMo-V2.5-TTS-VoiceDesign is the voice-design variant of MiMo-V2.5-TTS on the Xiaomi MiMo API platform, enabling custom voice creation through stylistic prompts. Pricing: free during the limited-time launch period (0x token consumption).

Цена входных данных+1 бесплатных

От $0.0071/M

Ср. скорость

—

Первый токен

—

Провайдеры

39

MiMo-V2.5-TTS-VoiceClone

Xiaomi MiMo-V2.5-TTS-VoiceClone is the voice-cloning variant of MiMo-V2.5-TTS on the Xiaomi MiMo API platform, enabling speech synthesis with cloned target voices. Pricing: free during the limited-time launch period (0x token consumption).

Цена входных данных+1 бесплатных

От $0.0071/M

Ср. скорость

—

Первый токен

—

Провайдеры

42

MiMo-V2.5-TTS

Xiaomi MiMo-V2.5-TTS is the text-to-speech model in the V2.5 series on the Xiaomi MiMo API platform, providing high-quality speech synthesis. Pricing: free during the limited-time launch period (0x token consumption).

Цена входных данных+1 бесплатных

От $0.0071/M

Ср. скорость

—

Первый токен

—

Провайдеры

42

MiMo-V2.5

Xiaomi MiMo-V2.5 is a native omnimodal sparse MoE model (310B total, 15B active) with unified text, image, video, and audio understanding, built on the MiMo-V2-Flash backbone with dedicated vision and audio encoders. It supports up to 1M tokens of context, strong agentic workflows, and open weights on Hugging Face.

Цена входных данных+1 бесплатных

От $0.0040/M

Ср. скорость

84 т/с

Первый токен

3.09с

Провайдеры

96

QwenQwen3 Instant

Alibaba Qwen3 Instant is a fast and efficient language model in the Qwen series, optimized for quick responses and high throughput.

Цена входных данных

От $0.010/M

Ср. скорость

—

Первый токен

—

Провайдеры

3

MiMo-V2.5-Pro

Xiaomi MiMo-V2.5-Pro is a large open-source language model in the MiMo series, offering advanced reasoning and general-purpose capabilities.

Цена входных данных+1 бесплатных

От $0.0000/M

Ср. скорость

47 т/с

Первый токен

5.85с

Провайдеры

100

MiniMax M2 Her

MiniMax M2 Her is a character-focused dialogue model in the MiniMax M2 family, tuned for roleplay, persona consistency, and emotionally expressive conversational responses.

Цена входных данных

От $1.03/M

Ср. скорость

—

Первый токен

—

Провайдеры

4

MiMo-V2-TTS

Xiaomi MiMo-V2-TTS is a text-to-speech model in the MiMo series, optimized for natural speech synthesis and voice generation tasks.

Цена входных данных+4 бесплатных

От $0.0071/M

Ср. скорость

—

Первый токен

—

Провайдеры

39

ClaudeClaude Opus 4.7 Max

Anthropic Claude Opus 4.7 Max is a high-capability language model in the Claude series, offering enhanced reasoning, code generation, and multimodal capabilities.

Цена входных данных

От $0.0014/M

Ср. скорость

—

Первый токен

—

Провайдеры

24

ClaudeClaude Opus 4.7

Anthropic Claude Opus 4.7 targets frontier-level analysis, complex coding, and autonomous workflows that require deep multi-step reasoning.

Цена входных данных+2 бесплатных

От $0.0014/M

Ср. скорость

43 т/с

Первый токен

3.90с

Провайдеры

191

DeepSeekDeepSeek V4

DeepSeek V4 is a large language model in the DeepSeek series, offering advanced reasoning, code generation, and multimodal capabilities.

Цена входных данных

От $0.050/M

Ср. скорость

47 т/с

Первый токен

2.49с

Провайдеры

12

QwenQwen1.8B Long Context

Alibaba Qwen1.8B Long Context is a compact language model in the Qwen series, optimized for low-latency responses and efficient inference.

Цена входных данных

От $0.050/M

Ср. скорость

—

Первый токен

—

Провайдеры

16

QwenQwen1.8B

Alibaba Qwen1.8B is a compact language model in the Qwen series, optimized for low-latency responses and efficient inference.

Цена входных данных

От $0.050/M

Ср. скорость

—

Первый токен

—

Провайдеры

16

MetaAIAion RP Llama 3.1

Aion RP Llama 3.1 is a roleplay-tuned variant in the Aion series, optimized for character-driven dialogue and creative writing.

Цена входных данных

От $0.401/M

Ср. скорость

—

Первый токен

—

Провайдеры

6

MetaAIHermes 3 Llama 3.1

Nous Research Hermes 3 is a generalist instruct model fine-tuned on Meta Llama 3.1, with strong reasoning, roleplay, multi-turn chat, tool calling, and structured JSON output.

Цена входных данных+1 бесплатных

От $0.0050/M

Ср. скорость

—

Первый токен

—

Провайдеры

24

LFM 2.5 1.2B Instruct

LFM 2.5 1.2B Instruct is a compact language model in the LFM series, optimized for low-latency responses and efficient inference.

Цена входных данных+2 бесплатных

От $0.0010/M

Ср. скорость

—

Первый токен

—

Провайдеры

20

MetaAILlama 3.1

Meta Llama 3.1 extends the Llama 3 family with stronger reasoning, tool use, and long-context support across 8B to 405B scales.

Цена входных данных

От $0.0007/M

Ср. скорость

—

Первый токен

—

Провайдеры

28

MetaAILlama 3.3

Meta Llama 3.3 is an updated Llama 3 open model with improved instruction following, multilingual support, and efficient inference.

Цена входных данных

От $1.03/M

Ср. скорость

985 т/с

Первый токен

0.45с

Провайдеры

14

MetaAIMeta Llama 3.3 Instruct

Meta Llama 3.3 Instruct is an instruction-tuned variant in the Llama series, optimized for following instructions and conversational tasks.

Цена входных данных

От $1.00/M

Ср. скорость

48 т/с

Первый токен

0.93с

Провайдеры

5

  • 1
  • 2
  • 3
  • 12
  • 13
+69 ещё
+5 ещё
+144 ещё
Jun 6
+147 ещё
Jun 8
+20 ещё
+23 ещё
+23 ещё
+70 ещё
Jun 8
+75 ещё
Jun 8
+21 ещё
+12 ещё
+142 ещё
Jun 4
+5 ещё
Apr 20
+9 ещё
+9 ещё
+12 ещё
+7 ещё
+15 ещё
+1 ещё
Dec 25
Feb 24