LogoLM Speed
  • 首页
  • 免费 API
  • 提供商
  • 文档
LogoLM Speed
LogoLM Speed

专业的 LLM API 速度测试工具

GitHubGitHubTwitterX (Twitter)Email
产品
  • 功能
  • 价格
  • 常见问题
排行榜
  • 总览
  • 速度排行
  • 延迟排行
  • 健康度排行
模型
  • 全部模型
  • GPT
  • Claude
  • Gemini
  • DeepSeek
  • Llama
  • Qwen
免费模型
  • 全部免费模型
  • 免费 GPT
  • 免费 Claude
  • 免费 Gemini
  • 免费 DeepSeek
  • 免费 Llama
  • 免费 Qwen
资源
  • 速度测试
  • 服务商目录
  • 文档
法律
  • Cookie政策
  • 隐私政策
  • 服务条款
© 2026 LM Speed All Rights Reserved.Made by Nexmoe with ❤️
首页交流 QQ 群:1034193296,欢迎中转站站长加入讨论 AI 最热话题、newapi、openclaw 等,获取最新测速动态与反馈支持。
SiliconFlow logo

SiliconFlow

基于开源模型提供高性价比的生成式AI云服务,支持文本对话、图像生成、视频生成和语音合成。

分类

国家/地区中国官方 API
ChatGLMGLM-Z1QwenDeepSeek R1 Distill Qwen 1 5bQwenQwen3 Omni InstructQwenQwen3 VL InstructQwenQwen3 5GeminiRing Flash 2.0QwenQwen3 Next InstructGeminiStep 3.5 FlashQwenQwen2 InstructQwenQwen3ChatGLMGLM-4ChatGLMGLM-4.7ChatGLMGLM-4.5VQwenDeepSeek R1 Distill QwenMinimaxMiniMax-M2.5QwenQwen2.5 Coder InstructChatGLMGLM-4.1v ThinkingQwenQwen2.5 InstructHunyuanHunyuan MtChatGLMGLM-4.6ChatGLMGLM-4.5 AirQwenDeepSeek R1 0528 Qwen3ChatGLMGLM-5MoonshotAIKimi K2.5QwenQwen3 Coder InstructDeepSeekDeepSeek V3.1 TerminusDeepSeekDeepSeek V3.1DeepSeekDeepSeek V3.2QwenQwen2.5 VL InstructMetaAIDeepSeek R1 Distill LlamaDeepSeekDeepSeek V3MoonshotAIKimi K2 InstructQwenQwen3 InstructDeepSeekDeepSeek R1DeepSeekDeepSeek V2.5

SiliconFlow 目前提供 67 个大模型 API。

速度基准测试平均吞吐 46 tok/s。

SiliconFlow interface preview
平均速度45.81 tok/s
延迟13.05 s
总测试数1197
模型数67
更新于4/17/2026
创建时间8/13/2025
网站

API 地址

  • 历史推断 / 未验证
    https://account.siliconflow.cn
  • 历史推断 / 未验证
    https://cloud.siliconflow.cn
  • 历史推断 / 未验证
    https://cloud.siliconflow.com
  • 历史推断 / 未验证
    https://api.siliconflow.cn
  • 历史推断 / 未验证
    https://api.siliconflow.com

支持的模型

模型速度延迟测试数
PaddlePaddle/PaddleOCR-VL-1.5
279.58 tok/s
4.15s
3
ChatGLMTHUDM/GLM-Z1-9B-0414
176.03 tok/s
13.40s
24
Qwendeepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
142.95 tok/s
4.47s
5
QwenQwen/Qwen3-Omni-30B-A3B-Instruct
128.77 tok/s
0.47s
5
QwenQwen/Qwen3-VL-8B-Instruct
106.50 tok/s
0.92s
10
QwenQwen/Qwen3.5-4B
91.28 tok/s
23.54s
5
GeminiinclusionAI/Ring-flash-2.0
89.88 tok/s
6.43s
5
QwenQwen/Qwen3-Next-80B-A3B-Instruct
86.82 tok/s
0.62s
10
Geministepfun-ai/Step-3.5-Flash
84.22 tok/s
3.37s
5
QwenQwen/Qwen2-7B-Instruct
81.93 tok/s
0.57s
25
QwenQwen/Qwen3-14B
78.64 tok/s
9.81s
5
ChatGLMPro/THUDM/glm-4-9b-chat
76.25 tok/s
0.63s
10
ChatGLMTHUDM/glm-4-9b-chat
75.38 tok/s
0.59s
15
ChatGLMzai-org/GLM-4.7
74.72 tok/s
16.10s
5
ChatGLMzai-org/GLM-4.5V
73.00 tok/s
6.15s
10
Qwendeepseek-ai/DeepSeek-R1-Distill-Qwen-7B
72.09 tok/s
8.93s
30
ChatGLMTHUDM/GLM-4-9B-0414
71.99 tok/s
0.95s
15
MinimaxPro/MiniMaxAI/MiniMax-M2.5
71.37 tok/s
9.63s
25
QwenPro/Qwen/Qwen2-7B-Instruct
71.29 tok/s
0.56s
5
QwenQwen/QwQ-32B-Preview
69.75 tok/s
0.62s
5
当前仅显示 20 / 67 个模型。

排行榜排名

速度
83.1 tokens/s#29/100
延迟
0.24 s#2/100
概览性能67价格测试记录1197健康嵌入