免费 Llama API - 119 个模型，对比速度与延迟

模型	服务商	速度	延迟
nvidia/llama-3.1-nemotron-ultra-253b-v1Meta免费	91VIP API 初叶🍂Furry API AI Claw API +1 更多收起 Mitchll-API	N/A	N/A
llama-nemotron-embed-vl-1b-v2Meta免费	梦德 API Dext API Koyeb AI Gateway	N/A	N/A
nvidia/llama-nemotron-embed-vl-1b-v2Meta免费	+1 更多收起	N/A	N/A
nvidia/llama-3.3-nemotron-super-49b-v1Meta免费		N/A	N/A
nvidia/llama-3.2-nemoretriever-1b-vlm-embed-v1Meta免费		N/A	N/A
nvidia/llama-nemotron-embed-vl-1b-v2:freeMeta免费		N/A	N/A
meta/llama-4-maverick-17b-128e-instructMeta免费		N/A	N/A
codellama-70bMeta免费		N/A	N/A
deepseek-r1-distill-llama-8bDeepSeek免费		N/A	N/A
llama-2-70bMeta免费		N/A	N/A
llama-2-7bMeta免费		N/A	N/A
llama-2-7b-chat-fp16Meta免费		N/A	N/A
llama-3-70bMeta免费		N/A	N/A
llama-3-8bMeta免费		N/A	N/A
llama-3.1-70b-instruct-fp8-fastMeta免费		N/A	N/A
llama-3.1-8b-instruct-fp8Meta免费		N/A	N/A
llama-3.1-8b-instruct-fp8-fastMeta免费		N/A	N/A
llama-3.1-nemoguard-8b-content-safetyMeta免费		N/A	N/A
llama-3.1-nemoguard-8b-topic-controlMeta免费		N/A	N/A
llama-3.1-nemotron-51b-instructMeta免费		N/A	N/A
llama-3.1-nemotron-70b-instructMeta免费		N/A	N/A
llama-3.1-nemotron-nano-8b-v1Meta免费		N/A	N/A
llama-3.1-nemotron-nano-vl-8b-v1Meta免费		N/A	N/A
llama-3.1-nemotron-safety-guard-8b-v3Meta免费		N/A	N/A
llama-3.1-nemotron-ultra-253b-v1Meta免费		N/A	N/A
llama-3.2-90b-vision-instructMeta免费	+1 更多收起	N/A	N/A
llama-3.2-nemoretriever-1b-vlm-embed-v1Meta免费		N/A	N/A
llama-3.2-nv-embedqa-1b-v1Meta免费		N/A	N/A
llama-3.3-70b-instruct-fp8-fastMeta免费		N/A	N/A
llama-3.3-nemotron-super-49b-v1Meta免费		N/A	N/A
llama-guard-3-8bMeta免费		N/A	N/A
llama-nemotron-embed-1b-v2Meta免费		N/A	N/A
llama2-70bMeta免费		N/A	N/A
llama3-chatqa-1.5-70bMeta免费		N/A	N/A
meta/codellama-70bMeta免费		N/A	N/A
meta/llama-3.1-70b-instructMeta免费		N/A	N/A
meta/llama-3.1-8b-instructMeta免费		N/A	N/A
meta/llama-3.2-11b-vision-instructMeta免费		N/A	N/A
meta/llama-3.2-1b-instructMeta免费		N/A	N/A
meta/llama-3.2-3b-instructMeta免费		N/A	N/A
meta/llama-3.2-90b-vision-instructMeta免费		N/A	N/A
meta/llama-3.3-70b-instructMeta免费		N/A	N/A
meta/llama-guard-4-12bMeta免费		N/A	N/A
meta/llama2-70bMeta免费		N/A	N/A
nvidia/llama-3.1-nemoguard-8b-content-safetyMeta免费		N/A	N/A
nvidia/llama-3.1-nemoguard-8b-topic-controlMeta免费		N/A	N/A
nvidia/llama-3.1-nemotron-51b-instructMeta免费		N/A	N/A
nvidia/llama-3.1-nemotron-70b-instructMeta免费		N/A	N/A
nvidia/llama-3.1-nemotron-nano-8b-v1Meta免费		N/A	N/A
nvidia/llama-3.1-nemotron-nano-vl-8b-v1Meta免费		N/A	N/A
nvidia/llama-3.1-nemotron-safety-guard-8b-v3Meta免费		N/A	N/A
nvidia/llama-3.2-nv-embedqa-1b-v1Meta免费		N/A	N/A
nvidia/llama-3.3-nemotron-super-49b-v1.5Meta免费		N/A	N/A
nvidia/llama-nemotron-embed-1b-v2Meta免费		N/A	N/A
nvidia/llama3-chatqa-1.5-70bMeta免费		N/A	N/A
meta-llama/llama-3.3-70b-instruct:freeMeta免费		N/A	N/A
meta-llama/llama-3.2-3b-instruct:freeMeta免费		N/A	N/A
Meta免费 ToolsVision131.1KLlama 4 Maverick 17B Instruct (128E) is a high-capacity multimodal language model from Meta, built on a mixture-of-experts (MoE) architecture with 128 experts and 17 billion active parameters per forward...	+1 更多收起	N/A	N/A
llama-3.1-70b-instructMeta免费		N/A	N/A
llama-3.2-nv-embedqa-1b-v2Meta免费		N/A	N/A

其他模型系列