Просматривайте канонические модели у различных провайдеров с показателями производительности и охвата.
Google Gemini 2.0 Flash Live 001 is a realtime audio model in the Gemini series, supporting low-latency speech and conversational interactions.
Цена входных данных
От $0.200/M
Ср. скорость
—
Первый токен
—
Провайдеры
5
Xiaomi MiMo-V2-Omni is the omnimodal model in the V2 series on the Xiaomi MiMo API platform, supporting text, image, video, and audio understanding within a unified architecture. Pricing: 1x token consumption (baseline).
Цена входных данных+2 бесплатных
От $0.014/M
Ср. скорость
83 т/с
Первый токен
3.43с
Провайдеры
70
OpenAI GPT-3.5 Net is a language model in the GPT-3.5 series, offering general-purpose reasoning, code generation, and multimodal capabilities.
Цена входных данных
От $10.27/M
Ср. скорость
—
Первый токен
—
Провайдеры
5
MiniMax M2.5 HighSpeed is a fast and efficient language model in the MiniMax series, optimized for quick responses and high throughput.
Цена входных данных
От $0.0001/M
Ср. скорость
59 т/с
Первый токен
6.38с
Провайдеры
36
DeepSeek Prover v2 is a reasoning model in the DeepSeek series, designed for complex reasoning, problem-solving, and analytical tasks.
Цена входных данных+1 бесплатных
От $1.00/M
Ср. скорость
—
Первый токен
—
Провайдеры
10
Google Gemini Pro Vision is a multimodal vision-language model in the Gemini series, supporting both text and image understanding.
Цена входных данных
От $0.274/M
Ср. скорость
—
Первый токен
—
Провайдеры
5
Zhipu AI GLM-4V Flash is a multimodal vision-language model in the GLM series, supporting both text and image understanding.
Цена входных данных+1 бесплатных
От $0.010/M
Ср. скорость
56 т/с
Первый токен
0.62с
Провайдеры
19
Google Gemini Live 2.5 Flash is a realtime audio model in the Gemini series, supporting low-latency speech and conversational interactions.
Цена входных данных
От $1.47/M
Ср. скорость
—
Первый токен
—
Провайдеры
4
Colosseum Instruct is an instruction-tuned language model, optimized for following instructions and conversational tasks.
Цена входных данных
От $0.010/M
Ср. скорость
—
Первый токен
—
Провайдеры
7
Arctic Embed L is an embedding model, designed for generating vector representations of text for retrieval and semantic search.
Цена входных данных+1 бесплатных
От $0.010/M
Ср. скорость
—
Первый токен
—
Провайдеры
21
A multimodal vision-language model by Amazon in the Nova series.
Цена входных данных
От $5.00/M
Ср. скорость
—
Первый токен
—
Провайдеры
8
Zhipu AI GLM-4.1v Thinking FlashX is a reasoning model in the GLM series, designed for complex reasoning, problem-solving, and analytical tasks.
Цена входных данных
От $0.016/M
Ср. скорость
—
Первый токен
—
Провайдеры
16
Alibaba Qwen3.5 Max is a high-capability language model in the Qwen series, offering enhanced reasoning, code generation, and multimodal capabilities.
Цена входных данных+1 бесплатных
От $0.086/M
Ср. скорость
31 т/с
Первый токен
29.33с
Провайдеры
14
Alibaba Qwen3.5 Plus Thinking is a reasoning-focused variant in the Qwen series, designed for complex reasoning and problem-solving tasks.
Цена входных данных+1 бесплатных
От $0.010/M
Ср. скорость
—
Первый токен
—
Провайдеры
16
Microsoft Phi 3.5 MoE Instruct is a mixture-of-experts instruction-tuned variant in the Phi series, optimized for following instructions and conversational tasks.
Цена входных данных+2 бесплатных
От $0.010/M
Ср. скорость
—
Первый токен
—
Провайдеры
19
Zhipu GLM-4.5 X is an enhanced GLM-4.5 variant focused on higher reasoning quality and tool-augmented workflows.
Цена входных данных
От $0.548/M
Ср. скорость
69 т/с
Первый токен
12.39с
Провайдеры
29
A fast and efficient language model by Alibaba in the Qwen 3.5 series.
Цена входных данных+2 бесплатных
От $0.010/M
Ср. скорость
115 т/с
Первый токен
7.92с
Провайдеры
67
Anthropic Claude 3 Haiku is optimized for speed and scale in customer support, routing, and low-latency chat applications.
Цена входных данных
От $0.021/M
Ср. скорость
—
Первый токен
—
Провайдеры
21
IBM Granite 4.0 H Micro is a compact language model in the Granite series, optimized for quick responses and high throughput.
Цена входных данных
От $0.034/M
Ср. скорость
—
Первый токен
—
Провайдеры
10
Anthropic Claude Opus 4.6 Max is a high-capability language model in the Claude series, offering enhanced reasoning, code generation, and multimodal capabilities.
Цена входных данных
От $0.0014/M
Ср. скорость
—
Первый токен
—
Провайдеры
22
Italia Instruct is an instruction-tuned language model, optimized for following instructions and conversational tasks.
Цена входных данных
От $0.010/M
Ср. скорость
36 т/с
Первый токен
0.49с
Провайдеры
10
MiniMax M2.1 HighSpeed is a fast and efficient language model in the MiniMax series, optimized for quick responses and high throughput.
Цена входных данных
От $0.575/M
Ср. скорость
—
Первый токен
—
Провайдеры
23
Moonshot AI Kimi K2 Turbo is a fast and efficient language model in the Kimi series, optimized for quick responses and high throughput.
Цена входных данных
От $1.10/M
Ср. скорость
83 т/с
Первый токен
3.73с
Провайдеры
14
Zhipu AI GLM-4 Flash is a fast and efficient language model in the GLM series, optimized for quick responses and high throughput.
Цена входных данных+9 бесплатных
От $0.0000/M
Ср. скорость
31 т/с
Первый токен
0.92с
Провайдеры
62