共绩算力平台上的 Ollama 实例,通过 OpenAI 兼容 API 提供开源模型推理服务。
共绩算力 (Ollama) 目前提供 2 个大模型 API。
速度基准测试平均吞吐 170 tok/s。
open-webuiollama-2505270856-285-kqffkflp-11434.550c.cloud