LogoLM Speed
  • 首页
  • 免费 API
  • 提供商
  • 文档
LogoLM Speed
LogoLM Speed

专业的 LLM API 速度测试工具

GitHubGitHubTwitterX (Twitter)Email
产品
  • 功能
  • 价格
  • 常见问题
排行榜
  • 总览
  • 速度排行
  • 延迟排行
  • 健康度排行
模型
  • 全部模型
  • GPT
  • Claude
  • Gemini
  • DeepSeek
  • Llama
  • Qwen
免费模型
  • 全部免费模型
  • 免费 GPT
  • 免费 Claude
  • 免费 Gemini
  • 免费 DeepSeek
  • 免费 Llama
  • 免费 Qwen
资源
  • 速度测试
  • 服务商目录
  • 文档
法律
  • Cookie政策
  • 隐私政策
  • 服务条款
© 2026 LM Speed All Rights Reserved.Made by Nexmoe with ❤️
首页交流 QQ 群:1034193296,欢迎中转站站长加入讨论 AI 最热话题、newapi、openclaw 等,获取最新测速动态与反馈支持。
ModelScope logo

ModelScope

ModelScope(魔搭社区)提供开源 AI 模型推理 API 访问,兼容 OpenAI API 格式。

分类

中转站
QwenQwen3 Next InstructQwenQwen3QwenDeepSeek R1 Distill QwenQwenQwen3 Coder InstructMinimaxMiniMax-M2.5QwenQwen2.5 InstructMoonshotAIKimi K2.5DeepSeekDeepSeek V3DeepSeekDeepSeek R1QwenQwen3 InstructDeepSeekDeepSeek V3.2MetaAIDeepSeek R1 Distill LlamaMistralMistral Small Instruct

ModelScope 目前提供 18 个大模型 API。

速度基准测试平均吞吐 58 tok/s。

ModelScope 是一个 API 聚合平台,提供来自多个供应商的模型。

ModelScope interface preview
平均速度58.21 tok/s
延迟5.76 s
总测试数108
模型数18
更新于4/16/2026
创建时间12/7/2025
网站

API 地址

  • api-inference.modelscope.cn
  • ms-ens-1f4a9445-d0e7.api-inference.modelscope.cn
  • ms-ens-327b7543-e27c.api-inference.modelscope.cn
  • ms-ens-51815792-b22c.api-inference.modelscope.cn

支持的模型

模型速度延迟测试数
QwenQwen/Qwen3-Next-80B-A3B-Instruct
158.96 tok/s
0.96s
10
QwenQwen/Qwen3-4B
126.44 tok/s
4.27s
5
QwenQwen/Qwen3-30B-A3B
123.38 tok/s
6.13s
5
QwenQwen/Qwen3-8B
76.12 tok/s
9.33s
5
Qwendeepseek-ai/DeepSeek-R1-Distill-Qwen-32B
70.69 tok/s
13.55s
5
QwenQwen/Qwen3-Coder-480B-A35B-Instruct
61.17 tok/s
0.94s
5
MinimaxMiniMax/MiniMax-M2.5
52.75 tok/s
7.49s
5
QwenQwen/QVQ-72B-Preview
44.92 tok/s
1.16s
8
QwenQwen/Qwen2.5-7B-Instruct
43.96 tok/s
0.91s
5
MoonshotAImoonshotai/Kimi-K2.5
43.12 tok/s
1.11s
5
DeepSeekdeepseek-ai/DeepSeek-V3
35.26 tok/s
1.77s
5
DeepSeekdeepseek-ai/DeepSeek-R1-0528
32.22 tok/s
18.61s
10
QwenQwen/Qwen3-235B-A22B-Instruct-2507
31.78 tok/s
3.02s
5
DeepSeekdeepseek-ai/DeepSeek-V3.2
29.48 tok/s
1.88s
5
OpenAIkgiser/gpu_gpt_5
28.32 tok/s
1.14s
10
MetaAIdeepseek-ai/DeepSeek-R1-Distill-Llama-70B
27.45 tok/s
27.33s
5
QwenTeichAI/Qwen3-30B-A3B-Thinking-2507-Claude-4.5-Sonnet-High-Reasoning-Distill-GGUF
13.07 tok/s
2.17s
5
Mistralmistralai/Mistral-Small-Instruct-2409
11.68 tok/s
1.15s
5

排行榜排名

延迟
0.94 s#29/100
概览性能18价格测试记录108健康嵌入