对比各提供商的免费 Llama API 速度、延迟和可用性。
| 模型 | 服务商 | 速度 |
|---|
| 延迟 |
|---|
| 测试 |
|---|
deepseek-ai/deepseek-r1-distill-llama-8bDeepSeek免费 | N/A | N/A | 0 | |
deepseek-r1-distill-llama-8bMeta免费 | N/A | N/A | 0 | |
工具调用开源128KDracarys Llama 3.1 Instruct is an instruction-tuned variant, optimized for following instructions and conversational tasks. | N/A | N/A | 0 | |
llama-nemotron-embed-vl-1b-v2Meta免费 视觉嵌入8KNVIDIA 推出的多模态文档嵌入模型,约 1.7B 参数(Llama 3.2 1B 语言骨干 + SigLIP2 400M 视觉编码器),输出 2048 维向量,专为视觉文档检索和多模态 RAG 优化,支持文本查询与文档图像匹配。 | N/A | N/A | 0 | |
nvidia/llama-3.1-nemotron-ultra-253b-v1Meta免费 | N/A | N/A | 0 | |
nvidia/llama-3.3-nemotron-super-49b-v1Meta免费 | N/A | N/A | 0 | |
nvidia/llama-nemotron-embed-vl-1b-v2Meta免费 | N/A | N/A | 0 | |
Meta免费 Nous Research Hermes 3 is a generalist instruct model fine-tuned on Meta Llama 3.1, with strong reasoning, roleplay, multi-turn chat, tool calling, and structured JSON output. | N/A | N/A | 0 | |
Meta免费 Meta Llama 3.2 Nemoretriever 300m Embed v1 is an embedding model, designed for generating vector representations of text for retrieval and semantic search. | N/A | N/A | 0 | |
Nvidia免费 Usdcode Llama 3.1 Instruct is an instruction-tuned variant, optimized for following instructions and conversational tasks. | N/A | N/A | 0 | |
llama-3.1-70b-instructMeta免费 工具调用开源128KMeta 最新的 Llama 3.1 系列模型提供了多种规模和版本。此 70B 指令微调版本针对高质量对话场景进行了优化,展现出强大的性能表现。 | N/A | N/A | 0 | |
llama-3.1-8b-instructMeta免费 工具调用开源128KMeta Llama 3.1 多语言大语言模型系列,指令微调文本模型针对多语言对话用例进行了优化,在常见行业基准测试中表现优异。 | N/A | N/A | 0 | |
llama-3.1-nemoguard-8b-content-safetyMeta免费 开源4KNVIDIA 基于 Llama-3.1-8B-Instruct 微调的内容安全审核模型,约 8B 参数,4K 上下文窗口,支持 23 种风险类别分类,可集成 NeMo Guardrails 安全护栏框架。 | N/A | N/A | 0 | |
llama-3.1-nemotron-nano-8b-v1Meta免费 工具调用开源128KNVIDIA 基于 Meta Llama-3.1-8B-Instruct 后训练优化的推理模型,8B 参数,128K 上下文,通过多阶段 SFT 和强化学习提升数学、代码、推理和工具调用能力,支持推理模式开关,可在单张 RTX GPU 上运行。 | N/A | N/A | 0 | |
llama-3.1-nemotron-nano-vl-8b-v1Meta免费 工具调用视觉开源128Kllama-3.1-nemotron-nano-vl-8b-v1 是 NVIDIA 基于 Llama-3.1-8B 开发的 8B 参数视觉语言模型,配备 C-RADIOv2-H 视觉编码器,支持 16K 上下文和最多 4 张图片输入,擅长文档智能和 OCR 任务。 | N/A | N/A | 0 | |
llama-3.2-11b-vision-instructMeta免费 视觉开源128KLlama 3.2-Vision 指令微调模型,针对视觉识别、图像推理、字幕生成和回答图像相关问题进行了优化。 | N/A | N/A | 0 | |
llama-3.2-1b-instructMeta免费 工具调用开源128KLlama 3.2 指令微调文本模型,针对多语言对话用例进行了优化,包括 agent 检索和摘要任务。 | N/A | N/A | 0 | |
llama-3.2-3b-instructMeta免费 工具调用开源128KLlama 3.2 指令微调文本模型,针对多语言对话用例进行了优化,包括 agent 检索和摘要任务。 | N/A | N/A | 0 | |
llama-3.2-90b-vision-instructNvidia免费 工具调用视觉开源128KMeta 开源的多模态视觉语言模型,约 90B(88.8B)参数,128K 上下文窗口,支持文本和图像输入,擅长视觉推理、文档分析和图像理解任务。 | N/A | N/A | 0 | |
llama-3.3-70b-instructNvidia免费 工具调用开源128KMeta Llama 3.3 是一款多语言大语言模型(LLM),为 700 亿参数的预训练与指令微调生成式模型(文本输入/文本输出)。Llama 3.3 指令微调纯文本模型性能出色。 | N/A | N/A | 0 | |
llama-3.3-nemotron-super-49b-v1.5Nvidia免费 工具调用推理128KLlama-3.3-Nemotron-Super-49B-v1.5 是一款 490 亿参数的英语推理/对话模型,基于 Meta 的 Llama-3.3-70B-Instruct 派生,支持 128K 上下文。通过 SFT 在数学、代码、科学等领域进行了智能体工作流(RAG、工具调用)的后训练。 | N/A | N/A | 0 | |
llama-4-maverick-17b-128e-instructMeta免费 工具调用视觉文件开源Meta Llama 4 系列的多模态 MoE 模型,总参数约 400B、激活参数 17B(128 专家),上下文窗口最高 1M token,支持文本+图像输入,擅长推理、编码和多语言任务。 | N/A | N/A | 0 | |
llama-guard-4-12bMeta免费 开源128KLlama Guard 4 是基于 Llama 4 Scout 衍生的多模态预训练模型,针对内容安全分类进行了微调。与先前版本类似,可用于对 LLM 输入和输出中的内容进行分类。 | N/A | N/A | 0 | |
meta-llama/llama-3.2-3b-instruct:freeMeta免费 | N/A | N/A | 0 |
LMSpeed 追踪了来自 59 家提供商的 37 个免费 Llama API 模型。所有速度和延迟数据均来自真实 API 测试,定期更新。