Просматривайте канонические модели у различных провайдеров с показателями производительности и охвата.
Aion RP Llama 3.1 is a roleplay-tuned variant in the Aion series, optimized for character-driven dialogue and creative writing.
Цена входных данных
От $0.401/M
Ср. скорость
—
Первый токен
—
Провайдеры
6
Nous Research Hermes 3 is a generalist instruct model fine-tuned on Meta Llama 3.1, with strong reasoning, roleplay, multi-turn chat, tool calling, and structured JSON output.
Цена входных данных+1 бесплатных
От $0.0050/M
Ср. скорость
—
Первый токен
—
Провайдеры
24
Meta Llama 3.1 extends the Llama 3 family with stronger reasoning, tool use, and long-context support across 8B to 405B scales.
Цена входных данных
От $0.0007/M
Ср. скорость
—
Первый токен
—
Провайдеры
28
Meta Llama 3.3 is an updated Llama 3 open model with improved instruction following, multilingual support, and efficient inference.
Цена входных данных
От $1.03/M
Ср. скорость
985 т/с
Первый токен
0.45с
Провайдеры
14
Meta Llama 3.3 Instruct is an instruction-tuned variant in the Llama series, optimized for following instructions and conversational tasks.
Цена входных данных
От $1.00/M
Ср. скорость
48 т/с
Первый токен
0.93с
Провайдеры
5
Dracarys Llama 3.1 Instruct is an instruction-tuned variant, optimized for following instructions and conversational tasks.
Цена входных данных+3 бесплатных
От $0.010/M
Ср. скорость
18 т/с
Первый токен
0.59с
Провайдеры
25
Usdcode Llama 3.1 Instruct is an instruction-tuned variant, optimized for following instructions and conversational tasks.
Цена входных данных+1 бесплатных
От $0.010/M
Ср. скорость
—
Первый токен
—
Провайдеры
9
Meta Llama 3.1 Instruct is an instruction-tuned variant in the Llama series, optimized for following instructions and conversational tasks.
Цена входных данных
От $0.0014/M
Ср. скорость
—
Первый токен
—
Провайдеры
11
Meta Llama 3.3 Instruct Turbo is a fast and efficient language model in the Llama series, optimized for quick responses and high throughput.
Цена входных данных
От $75.00/M
Ср. скорость
—
Первый токен
—
Провайдеры
3
Meta Llama 3.1 Instruct Turbo is a fast and efficient language model in the Llama series, optimized for quick responses and high throughput.
Цена входных данных
От $0.073/M
Ср. скорость
—
Первый токен
—
Провайдеры
4
Meta Llama 3.2 Nemoretriever 300m Embed v1 is an embedding model, designed for generating vector representations of text for retrieval and semantic search.
Цена входных данных+1 бесплатных
От $0.0010/M
Ср. скорость
—
Первый токен
—
Провайдеры
20
MiniMax M2.7 is a large language model in the MiniMax series, offering advanced reasoning, code generation, and multimodal capabilities.
Цена входных данных+7 бесплатных
От $0.0001/M
Ср. скорость
172 т/с
Первый токен
7.50с
Провайдеры
182
Google Gemini 3 Flash is a fast and efficient language model in the Gemini series, optimized for quick responses and high throughput.
Цена входных данных+4 бесплатных
От $0.0001/M
Ср. скорость
144 т/с
Первый токен
8.07с
Провайдеры
208
Meta Llama 4 Scout is a large language model in the Llama series, offering advanced reasoning, code generation, and multimodal capabilities.
Цена входных данных
От $0.010/M
Ср. скорость
75 т/с
Первый токен
1.62с
Провайдеры
40
Zhipu GLM-5 is Zhipu flagship GLM series model with enhanced reasoning, agent capabilities, and strong performance on Chinese enterprise and coding scenarios.
Цена входных данных+3 бесплатных
От $0.0001/M
Ср. скорость
46 т/с
Первый токен
22.00с
Провайдеры
203
MiniMax M2.5 is MiniMax's flagship text model for coding and agents, with SOTA-level programming and agentic performance, improved token efficiency, and fast high-TPS API deployment.
Цена входных данных+7 бесплатных
От $0.0007/M
Ср. скорость
57 т/с
Первый токен
9.85с
Провайдеры
203