首页
免费 API
分类
模型
文档

社区交流

加入 LMSpeed QQ 群

欢迎加入交流测速动态与反馈支持，群号：

QQ:1034193296

LM Speed

专业的 LLM API 速度测试工具

GitHub Twitter Email

产品

功能
价格
常见问题
文档

法律

Cookie政策
隐私政策
服务条款

© 2026 LM Speed All Rights Reserved.Made by Nexmoe with ❤️

llama.cpp - 大语言模型速度测试 | LM Speed

平均速度44.59 t/s

延迟0.87 s

总测试数5

模型数1

更新于3/16/2026

创建时间3/15/2026

A

llama.cpp

Visit llama.cpp

llama.cpp 是一个开源推理引擎，用于在本地高效运行大型语言模型，针对 CPU 和 GPU 性能进行了优化。

关于 llama.cpp

健康检查

99%近期可用性

历史记录 (72 条)

过去现在

支持的模型

模型	速度	延迟	测试数
Qwen3.5-35B-A3B-Q4_K_M.gguf	44.59 t/s	0.87s	5

最近测试记录

时间	模型	速度	延迟
Mar 15, 01:02 PM	Qwen3.5-35B-A3B-Q4_K_M.gguf	44.59 t/s	0.87s