基于 llama.cpp 的自托管 AI API 端点,提供开源大语言模型访问。
分类
429496 AI 目前提供 1 个大模型 API。
速度基准测试平均吞吐 45 tok/s。
ai.429496.xyz