LM Speed
首页
免费 API
排行榜
分类
模型
文档
切换语言
社区交流
加入 LMSpeed QQ 群
欢迎加入交流测速动态与反馈支持,群号:
QQ:
1034193296
复制群号
llama.cpp - 大语言模型速度测试 | LM Speed
平均速度
44.59 t/s
延迟
0.87 s
总测试数
5
模型数
1
更新于
3/16/2026
创建时间
3/15/2026
网站
A
llama.cpp
Visit llama.cpp
llama.cpp 是一个开源推理引擎,用于在本地高效运行大型语言模型,针对 CPU 和 GPU 性能进行了优化。
提供商介绍
Embed
关于 llama.cpp
Qwen
Qwen3
健康检查
99%
近期可用性
历史记录 (72 条)
过去
现在
支持的模型
分享
模型
速度
延迟
测试数
Qwen3.5-35B-A3B-Q4_K_M.gguf
44.59 t/s
0.87
s
5
最近测试记录
分享
时间
模型
速度
延迟
Mar 15, 01:02 PM
Qwen3.5-35B-A3B-Q4_K_M.gguf
44.59 t/s
0.87
s