SiliconFlow

国家/地区中国推理云

基于开源模型提供高性价比的生成式AI云服务，支持文本对话、图像生成、视频生成和语音合成。

SiliconFlow 目前提供 182 个大模型 API。

速度基准测试平均吞吐 53 tok/s。

平均速度52.70 tok/s

延迟11.06 s

更新于4/22/2026

创建时间8/13/2025

网站

API 地址

cloud.siliconflow.cn
cloud.siliconflow.com
api.siliconflow.cn
api.siliconflow.com

支持的模型

模型	速度	延迟	测试数
deepseek-ai/DeepSeek-V3.2	21.71 tok/s	5.54s	55
deepseek-ai/DeepSeek-V4-Flash	46.14 tok/s	12.04s	20
deepseek-ai/deepseek-v4-flash	38.38 tok/s	0.49s	5
Qwen/Qwen3.5-4B	95.56 tok/s	16.29s	10
Qwen/Qwen3-8B	22.51 tok/s	9.04s	15
tencent/Hunyuan-MT-7B	46.56 tok/s	1.32s	25
MiniMaxAI/MiniMax-M2.5	54.74 tok/s	7.54s	5
Pro/zai-org/GLM-4.7	62.27 tok/s	16.76s	30
Pro/moonshotai/Kimi-K2.6	73.39 tok/s	15.12s	5
Pro/zai-org/GLM-5.1	49.60 tok/s	9.04s	10
Qwen/Qwen3.6-35B-A3B	115.76 tok/s	8.56s	15
Pro/moonshotai/Kimi-K2.5	44.57 tok/s	14.30s	10
deepseek-ai/DeepSeek-V3	14.93 tok/s	2.66s	30
THUDM/GLM-4-9B-0414	71.99 tok/s	0.95s	15
ByteDance-Seed/Seed-OSS-36B-Instruct	61.62 tok/s	12.78s	5
inclusionAI/Ring-flash-2.0	89.88 tok/s	6.43s	5
Qwen/Qwen3.5-27B	34.21 tok/s	33.63s	5
PaddlePaddle/PaddleOCR-VL-1.5	279.58 tok/s	4.15s	3
stepfun-ai/Step-3.5-Flash	84.22 tok/s	3.37s	5
Qwen/Qwen3.5-397B-A17B	32.76 tok/s	29.36s	15

当前仅显示 20 / 59 个模型。

可用模型列表

共 123 个可用模型（最后更新：6/3/2026）

BAAI/bge-large-en-v1.5BAAI/bge-large-zh-v1.5BAAI/bge-m3BAAI/bge-reranker-v2-m3ByteDance-Seed/Seed-OSS-36B-InstructFunAudioLLM/CosyVoice2-0.5BFunAudioLLM/SenseVoiceSmallIndexTeam/IndexTTS-2Kwai-Kolors/KolorsKwaipilot/KAT-DevLoRA/Qwen/Qwen2.5-14B-InstructLoRA/Qwen/Qwen2.5-32B-InstructLoRA/Qwen/Qwen2.5-72B-InstructLoRA/Qwen/Qwen2.5-7B-InstructMiniMaxAI/MiniMax-M2.5PaddlePaddle/PaddleOCR-VLPaddlePaddle/PaddleOCR-VL-1.5Pro/BAAI/bge-m3Pro/BAAI/bge-reranker-v2-m3Pro/MiniMaxAI/MiniMax-M2.5

当前仅显示 20 / 123 个模型。

SiliconFlow

API 地址

支持的模型

可用模型列表

SiliconFlow

API 地址

排行榜排名

支持的模型

可用模型列表

排行榜排名