Многомерные рейтинги на основе тестов скорости моделей, проверок работоспособности провайдеров и стандартных тестов моделей. Сравнивайте провайдеров, эндпоинты, модели и надёжность с первого взгляда.
Ранжируется по медианному времени до первого токена (устойчиво к выбросам). Чем ниже — тем лучше отзывчивость.
Рейтинги основаны на тестах, предоставленных сообществом, и периодических зондах работоспособности. Носит рекомендательный характер, не является официальными данными.
| Место | Провайдер | Модель | Задержка первого токена | Среднее количество токенов в секунду | Обновлено | Всего тестов |
|---|---|---|---|---|---|---|
1NEW | 0.18 с Лучший: 0.16Худший: 0.27 | 451.62т/с | 5 | |||
21 |
101.03т/с |
10 |
31 | SiliconFlowapi.siliconflow.cn | tencent/Hunyuan-MT-7B | 0.24 с Лучший: 0.21Худший: 0.31 | 67.44т/с | 10 |
4NEW | SiliconFlowapi.siliconflow.cn | Qwen/Qwen2.5-7B-Instruct | 0.25 с Лучший: 0.23Худший: 1.16 | 102.35т/с | 5 |
5NEW | SiliconFlowapi.siliconflow.cn | THUDM/GLM-4-9B-0414 | 0.28 с Лучший: 0.26Худший: 0.31 | 90.65т/с | 5 |
6NEW | NVIDIA NIMintegrate.api.nvidia.com | microsoft/phi-4-multimodal-instruct | 0.29 с Лучший: 0.27Худший: 0.37 | 78.70т/с | 5 |
736 | SiliconFlowapi.siliconflow.cn | THUDM/GLM-4-9B-0414 | 0.31 с Лучший: 0.29Худший: 0.84 | 58.52т/с | 5 |
8NEW | RenRen APIllm.whitedream.top | [自营]llama3.1-8B | 0.34 с Лучший: 0.32Худший: 0.90 | 1740.49т/с | 5 |
923 | K Koru APInew.api.koru.ink | llama3.1-8B | 0.39 с Лучший: 0.37Худший: 1.02 | 1023.95т/с | 20 |
10NEW | 智谱 AIopen.bigmodel.cn | glm-4-flash-250414 | 0.40 с Лучший: 0.25Худший: 0.64 | 39.66т/с | 5 |
11NEW | NVIDIA NIMintegrate.api.nvidia.com | deepseek-ai/deepseek-v4-flash | 0.40 с Лучший: 0.38Худший: 0.50 | 53.95т/с | 5 |
123 | A AI Toolsplatform.aitools.cfd | zhipu/glm-4v-flash | 0.43 с Лучший: 0.34Худший: 0.93 | 53.58т/с | 55 |
1331 | NVIDIA NIMintegrate.api.nvidia.com | qwen/qwen3.5-122b-a10b | 0.43 с Лучший: 0.26Худший: 10.51 | 45.43т/с | 30 |
14NEW | ModelGateai.rehiy.wang | qwen3.9-35b-a3b | 0.44 с Лучший: 0.44Худший: 0.50 | 275.81т/с | 5 |
15NEW | ModelGateai.rehiy.wang | gemma-4-e2b-it | 0.45 с Лучший: 0.43Худший: 1.62 | 275.18т/с | 10 |
16NEW | SiliconFlowapi.siliconflow.cn | Qwen/Qwen2.5-72B-Instruct | 0.45 с Лучший: 0.38Худший: 1.14 | 33.09т/с | 5 |
17NEW | NVIDIA NIMintegrate.api.nvidia.com | deepseek-ai/deepseek-v4-flash | 0.47 с Лучший: 0.30Худший: 1.23 | 32.73т/с | 10 |
182 | NVIDIA NIMintegrate.api.nvidia.com | institute-of-science-tokyo/llama-3.1-swallow-70b-instruct-v0.1 | 0.47 с Лучший: 0.46Худший: 0.60 | 19.06т/с | 5 |
191 | SiliconFlowapi.siliconflow.cn | deepseek-ai/DeepSeek-R1-Distill-Qwen-7B | 0.52 с Лучший: 0.43Худший: 7.91 | 83.02т/с | 5 |
20NEW | 智谱 AIopen.bigmodel.cn | glm-4-flash | 0.55 с Лучший: 0.44Худший: 0.56 | 30.05т/с | 5 |
21NEW | X Xiaomimimo APIapi.xiaomimimo.com | mimo-v2-flash | 0.55 с Лучший: 0.41Худший: 1.27 | 113.12т/с | 20 |
22NEW | 阿里云百炼 DashScopedashscope.aliyuncs.com | qwen-vl-plus-2025-05-07 | 0.56 с Лучший: 0.52Худший: 1.90 | 98.97т/с | 5 |
23NEW | Completionswww.completions.me | claude-opus-4.6 | 0.56 с Лучший: 0.55Худший: 2.29 | 35.73т/с | 5 |
24NEW | Completionswww.completions.me | gpt-5.4 | 0.56 с Лучший: 0.55Худший: 0.56 | 35.66т/с | 5 |
25NEW | Completionswww.completions.me | claude-sonnet-4 | 0.56 с Лучший: 0.55Худший: 2.20 | 35.50т/с | 5 |
26NEW | SiliconFlowapi.siliconflow.cn | Qwen/Qwen3-VL-8B-Instruct | 0.56 с Лучший: 0.36Худший: 3.25 | 59.05т/с | 5 |
276 | NVIDIA NIMintegrate.api.nvidia.com | minimaxai/minimax-m2.5 | 0.57 с Лучший: 0.24Худший: 8.71 | 72.75т/с | 25 |
28NEW | Supabase AI Proxyttknrllwjndwdtycqqfv.supabase.co | llama3.1-8b | 0.58 с Лучший: 0.53Худший: 0.64 | 2365.78т/с | 10 |
29NEW | A AI Toolsplatform.aitools.cfd | qwen/qwen2.5-7b | 0.59 с Лучший: 0.35Худший: 2.00 | 95.64т/с | 5 |
309 | A AI Toolsplatform.aitools.cfd | qwen/qwen2.5-7b | 0.61 с Лучший: 0.34Худший: 2.37 | 94.52т/с | 95 |
314 | NVIDIA NIMintegrate.api.nvidia.com | moonshotai/kimi-k2-instruct | 0.61 с Лучший: 0.56Худший: 0.63 | 23.70т/с | 5 |
32NEW | Supabase AI Proxyttknrllwjndwdtycqqfv.supabase.co | qwen-3-235b-a22b-instruct-2507 | 0.62 с Лучший: 0.55Худший: 0.72 | 855.05т/с | 5 |
333 | NVIDIA NIMintegrate.api.nvidia.com | openai/gpt-oss-120b | 0.64 с Лучший: 0.40Худший: 1.00 | 141.66т/с | 35 |
34NEW | 阿里云百炼 DashScopedashscope.aliyuncs.com | qwen-math-turbo | 0.65 с Лучший: 0.62Худший: 2.48 | 48.90т/с | 5 |
35NEW | NVIDIA NIMintegrate.api.nvidia.com | nvidia/nemotron-3-nano-30b-a3b | 0.68 с Лучший: 0.31Худший: 2.57 | 196.22т/с | 20 |
36NEW | A AI Toolsplatform.aitools.cfd | zhipu/glm-4-flash | 0.68 с Лучший: 0.51Худший: 1.63 | 29.48т/с | 1970 |
37NEW | X Xiaomimimo APIapi.xiaomimimo.com | mimo-v2-omni | 0.68 с Лучший: 0.66Худший: 3.17 | 102.00т/с | 5 |
38NEW | NVIDIA NIMintegrate.api.nvidia.com | nvidia/nemotron-3-nano-omni-30b-a3b-reasoning | 0.69 с Лучший: 0.47Худший: 0.84 | 272.64т/с | 10 |
39NEW | 心流apis.iflow.cn | deepseek-v3.2 | 0.69 с Лучший: 0.65Худший: 0.72 | 38.75т/с | 2 |
40NEW | OfoxAIapi.ofox.ai | moonshotai/kimi-k2.5 | 0.71 с Лучший: 0.65Худший: 1.75 | 37.88т/с | 5 |
41NEW | 温 温云sxtuyxrxcgim.ap-northeast-1.clawcloudrun.com | moonshotai/kimi-k2-instruct-0905 | 0.74 с Лучший: 0.70Худший: 1.10 | 65.70т/с | 10 |
42NEW | QYES AIai.qyes.top | GLM-4-Flash-250414 | 0.74 с Лучший: 0.58Худший: 1.39 | 38.40т/с | 10 |
43NEW | G GankInterview LLMllm.gankinterview.com | gemini-2.5-flash-lite | 0.77 с Лучший: 0.61Худший: 1.51 | 257.02т/с | 15 |
44NEW | G Gemmagemma.san.baby | gemma-4-e2b-it | 0.79 с Лучший: 0.77Худший: 0.82 | 82.66т/с | 5 |
45NEW | XShuLab Sub2APIapi.xshulab.com | gpt-5.4-mini | 0.80 с Лучший: 0.63Худший: 1.54 | 162.55т/с | 10 |
46NEW | XShuLab Sub2APIapi.xshulab.com | gpt-5.1 | 0.80 с Лучший: 0.76Худший: 1.39 | 153.60т/с | 5 |
47NEW | 词元流动tokenflux.dev | gpt-5.4 | 0.81 с Лучший: 0.71Худший: 0.85 | 46.78т/с | 5 |
48NEW | ModelGateai.rehiy.wang | Claude-Opus-5.0 | 0.83 с Лучший: 0.45Худший: 1.65 | 139.40т/с | 5 |
49NEW | K Koru APInew.api.koru.ink | mercury-2 | 0.86 с Лучший: 0.60Худший: 1.35 | 515.10т/с | 20 |
50NEW | 巨量APIapi.yidvps.cn | kimi-k2.5 | 0.88 с Лучший: 0.68Худший: 1.17 | 43.25т/с | 5 |