Многомерные рейтинги на основе тестов скорости моделей, проверок работоспособности провайдеров и стандартных тестов моделей. Сравнивайте провайдеров, эндпоинты, модели и надёжность с первого взгляда.
Ранжируется по медианному времени до первого токена (устойчиво к выбросам). Чем ниже — тем лучше отзывчивость.
Рейтинги основаны на тестах, предоставленных сообществом, и периодических зондах работоспособности. Носит рекомендательный характер, не является официальными данными.
| Место | Провайдер | Модель | Задержка первого токена | Среднее количество токенов в секунду | Обновлено | Всего тестов |
|---|---|---|---|---|---|---|
1NEW | 0.18 с Лучший: 0.16Худший: 0.36 | 52.14т/с | 5 | |||
2NEW |
NVIDIA NIMintegrate.api.nvidia.com |
| google/gemma-3-27b-it |
0.19 с Лучший: 0.16Худший: 0.27 |
62.58т/с |
5 |
3NEW | NVIDIA NIMintegrate.api.nvidia.com | meta/llama-3.1-70b-instruct | 0.20 с Лучший: 0.18Худший: 0.36 | 50.52т/с | 5 |
4NEW | NVIDIA NIMintegrate.api.nvidia.com | 01-ai/yi-large | 0.20 с Лучший: 0.19Худший: 0.30 | 42.69т/с | 5 |
5NEW | NVIDIA NIMintegrate.api.nvidia.com | mistralai/mixtral-8x22b-instruct-v0.1 | 0.21 с Лучший: 0.18Худший: 0.30 | 90.52т/с | 5 |
6NEW | NVIDIA NIMintegrate.api.nvidia.com | google/gemma-2-27b-it | 0.23 с Лучший: 0.21Худший: 0.31 | 43.39т/с | 5 |
7NEW | 智谱 AIopen.bigmodel.cn | glm-z1-flash | 0.23 с Лучший: 0.21Худший: 0.32 | 135.27т/с | 5 |
8NEW | NVIDIA NIMintegrate.api.nvidia.com | ai21labs/jamba-1.5-large-instruct | 0.26 с Лучший: 0.23Худший: 0.46 | 55.85т/с | 10 |
9NEW | 3 352287 APIoneapi.352287.xyz | allam-2-7b | 0.29 с Лучший: 0.24Худший: 0.30 | 451.35т/с | 4 |
10NEW | A AI Toolsplatform.aitools.cfd | zhipu/glm-4v-flash | 0.30 с Лучший: 0.29Худший: 1.77 | 50.90т/с | 5 |
11NEW | surtext.pollinations.ai | evil | 0.32 с Лучший: 0.29Худший: 2.53 | 1432.48т/с | 25 |
12NEW | I Imerji LLMllm.imerji.cn | Qwen/Qwen3-Coder-30B-A3B-Instruct-FP8 | 0.32 с Лучший: 0.31Худший: 0.50 | 88.82т/с | 5 |
13NEW | L LLM PMintegrate.api.nvidia.com | moonshotai/kimi-k2-instruct | 0.33 с Лучший: 0.32Худший: 0.54 | 51.85т/с | 5 |
14NEW | NVIDIA NIMintegrate.api.nvidia.com | microsoft/phi-4-mini-flash-reasoning | 0.35 с Лучший: 0.32Худший: 0.83 | 74.62т/с | 5 |
15NEW | F Fitue APIopen.bigmodel.cn | glm-4-flash | 0.38 с Лучший: 0.29Худший: 0.68 | 36.38т/с | 10 |
16NEW | NVIDIA NIMintegrate.api.nvidia.com | mistralai/mistral-small-24b-instruct | 0.39 с Лучший: 0.37Худший: 0.91 | 29.40т/с | 10 |
17NEW | 共绩算力d08011731-minicpm4-8blatest-2824-9z9f7zk2-11434.550c.cloud | minicpm4-8b:latest | 0.40 с Лучший: 0.40Худший: 2.63 | 155.35т/с | 5 |
18NEW | Mistral AIapi.mistral.ai | mistral-medium-latest | 0.41 с Лучший: 0.39Худший: 0.60 | 61.78т/с | 5 |
19NEW | NVIDIA NIMintegrate.api.nvidia.com | microsoft/phi-3-medium-128k-instruct | 0.41 с Лучший: 0.39Худший: 0.90 | 17.35т/с | 5 |
20NEW | Mineai.081007.xyz | command-a-03-2025 | 0.43 с Лучший: 0.42Худший: 0.78 | 128.37т/с | 5 |
21NEW | NVIDIA NIMintegrate.api.nvidia.com | deepseek-ai/deepseek-r1-distill-qwen-32b | 0.44 с Лучший: 0.43Худший: 1.06 | 33.92т/с | 5 |
22NEW | 讯飞星火maas-api.cn-huabei-1.xf-yun.com | xop3qwen1b7 | 0.47 с Лучший: 0.46Худший: 2.02 | 51.03т/с | 5 |
23NEW | C CloseAI Asia Proxyapi.openai-proxy.org | gpt-4.1-2025-04-14 | 0.49 с Лучший: 0.43Худший: 0.53 | 100.11т/с | 5 |
24NEW | S SkyAIapi.yuegle.com | gemini-2.5-flash-lite | 0.53 с Лучший: 0.48Худший: 0.55 | 336.02т/с | 5 |
2511 | 联 联无所AIapi.siliconflow.cn | Qwen/Qwen2-7B-Instruct | 0.53 с Лучший: 0.50Худший: 0.56 | 63.11т/с | 5 |
266 | SiliconFlowapi.siliconflow.cn | THUDM/glm-4-9b-chat | 0.53 с Лучший: 0.52Худший: 0.66 | 81.72т/с | 5 |
27NEW | X666 APIvip.undyingapi.com | gpt-4o-mini | 0.56 с Лучший: 0.46Худший: 2.55 | 70.45т/с | 5 |
281 | 算了么 APIplatform.aitools.cfd | zhipu/glm-4-flash | 0.58 с Лучший: 0.44Худший: 1.39 | 35.70т/с | 1320 |
29NEW | A Awa1api.awa1.fun | qwen3-coder-30b-a3b-instruct | 0.59 с Лучший: 0.50Худший: 1.07 | 112.71т/с | 5 |
30NEW | Yuegleapi.yuegle.com | gemini-2.5-flash-lite-preview-06-17 | 0.59 с Лучший: 0.56Худший: 0.66 | 402.62т/с | 5 |
3114 | A ALMZBH APIapi.suanli.cn | QwQ-32B | 0.61 с Лучший: 0.59Худший: 0.70 | 30.41т/с | 5 |
32NEW | 阿里云百炼 DashScopedashscope.aliyuncs.com | qwen-turbo-latest | 0.62 с Лучший: 0.61Худший: 2.23 | 44.31т/с | 5 |
33NEW | 阿里云百炼 DashScopedashscope.aliyuncs.com | tongyi-intent-detect-v3 | 0.64 с Лучший: 0.61Худший: 1.56 | 91.42т/с | 5 |
34NEW | 阿里云百炼 DashScopedashscope.aliyuncs.com | qwen-vl-plus | 0.66 с Лучший: 0.55Худший: 2.49 | 70.09т/с | 15 |
35NEW | 3 352287 Test APIoneapi.352287.xyz | lgai/exaone-3-5-32b-instruct | 0.67 с Лучший: 0.62Худший: 2.08 | 101.19т/с | 5 |
361 | 小智APIdashscope.aliyuncs.com | qwen3-coder-plus | 0.68 с Лучший: 0.60Худший: 2.15 | 45.43т/с | 5 |
37NEW | 阿里云百炼 DashScopedashscope.aliyuncs.com | qwen-flash | 0.68 с Лучший: 0.64Худший: 2.16 | 99.93т/с | 5 |
38NEW | F Fanyi 963312api.lhyb.dpdns.org | qwen-3-235b-a22b-instruct-2507 | 0.72 с Лучший: 0.62Худший: 2.74 | 281.64т/с | 10 |
391 | H Haruiwww.sophnet.com | DeepSeek-v3 | 0.73 с Лучший: 0.44Худший: 1.38 | 24.84т/с | 20 |
40NEW | SiliconFlowapi.siliconflow.cn | Qwen/Qwen3-235B-A22B-Instruct-2507 | 0.73 с Лучший: 0.67Худший: 0.85 | 15.07т/с | 5 |
41NEW | SiliconFlowapi.siliconflow.cn | Qwen/Qwen2.5-7B-Instruct | 0.73 с Лучший: 0.62Худший: 12.73 | 19.11т/с | 5 |
42NEW | Yuegleapi.yuegle.com | Qwen/Qwen3-235B-A22B-Instruct-2507-FP8 | 0.74 с Лучший: 0.64Худший: 0.74 | 63.67т/с | 5 |
43NEW | SWT-APIgemini.nkbpal.cn | gemini-2.5-flash-nothinking | 0.75 с Лучший: 0.66Худший: 1.15 | 185.48т/с | 5 |
44NEW | 阿里云百炼 DashScopedashscope.aliyuncs.com | qwen-vl-max | 0.75 с Лучший: 0.67Худший: 2.32 | 25.45т/с | 5 |
45NEW | Undy APIvip.undyingapi.com | gpt-5-chat | 0.75 с Лучший: 0.64Худший: 0.84 | 132.45т/с | 5 |
4616 | 阿里云百炼 DashScopedashscope.aliyuncs.com | qwen-plus-latest | 0.75 с Лучший: 0.68Худший: 1.83 | 29.81т/с | 10 |
47NEW | 阿里云百炼 DashScopedashscope.aliyuncs.com | qwen-flash-2025-07-28 | 0.78 с Лучший: 0.60Худший: 3.31 | 93.96т/с | 5 |
48NEW | SWT-APItbai.xin | gpt-4.1-nano | 0.79 с Лучший: 0.58Худший: 1.08 | 126.41т/с | 5 |
49NEW | A AI Toolsplatform.aitools.cfd | zhipu/glm-4-9b | 0.80 с Лучший: 0.70Худший: 1.17 | 75.95т/с | 5 |
50NEW | V-APIgemini.nkbpal.cn | gpt-4.1-nano-2025-04-14 | 0.81 с Лучший: 0.60Худший: 1.44 | 105.61т/с | 5 |