
ModelScope(魔搭社区)提供开源 AI 模型推理 API 访问,兼容 OpenAI API 格式。
分类
ModelScope 目前提供 18 个大模型 API。
速度基准测试平均吞吐 58 tok/s。
ModelScope 是一个 API 聚合平台,提供来自多个供应商的模型。

api-inference.modelscope.cnms-ens-1f4a9445-d0e7.api-inference.modelscope.cnms-ens-327b7543-e27c.api-inference.modelscope.cnms-ens-51815792-b22c.api-inference.modelscope.cn| 时间 | 模型 | 速度 | 延迟 |
|---|---|---|---|
| Mar 30, 04:09 AM | kgiser/gpu_gpt_5 | 26.05 tok/s | 1.11s |
| Mar 30, 03:24 AM | kgiser/gpu_gpt_5 | 30.59 tok/s | 1.17s |
| Mar 30, 03:16 AM | TeichAI/Qwen3-30B-A3B-Thinking-2507-Claude-4.5-Sonnet-High-Reasoning-Distill-GGUF | 13.07 tok/s | 2.17s |
| Mar 30, 02:41 AM | Qwen/QVQ-72B-Preview | 44.75 tok/s | 1.16s |
| Mar 30, 02:39 AM | Qwen/Qwen3-Coder-480B-A35B-Instruct | 61.17 tok/s | 0.94s |
| Mar 30, 02:37 AM | moonshotai/Kimi-K2.5 | 43.12 tok/s | 1.11s |
| Mar 30, 02:32 AM | MiniMax/MiniMax-M2.5 | 52.75 tok/s | 7.49s |
| Mar 26, 07:23 AM | deepseek-ai/DeepSeek-V3.2 | 29.48 tok/s | 1.88s |
| Mar 24, 10:21 AM | Qwen/Qwen3-4B | 126.44 tok/s | 4.27s |
| Mar 8, 03:28 AM | Qwen/QVQ-72B-Preview | 45.09 tok/s | 1.15s |