NVIDIA NIM 通过 NVIDIA 云基础设施提供优化的 AI 模型推理 API,支持大语言模型、视觉和向量模型。
分类
NVIDIA NIM 目前提供 42 个大模型 API。
速度基准测试平均吞吐 63 tok/s。
NVIDIA NIM 是一个 API 聚合平台,提供来自多个供应商的模型。
https://www.nvidia.com
https://integrate.api.nvidia.com