AI模型聚合平台,提供统一API接口访问多种大语言模型,支持负载均衡和成本优化功能。
TokenPony(小马算力)是一个AI模型聚合服务平台,提供兼容OpenAI和Claude规范的统一API接口。开发者可以通过单个端点访问多种大语言模型,平台支持负载均衡和成本优化功能。
平台提供的主要模型包括:
- Deepseek-v3-0324:增强推理能力,适用于数学和编程任务
- qwen3-coder-480b:4500亿参数代码生成模型,支持多语言编程
- kimi-k2-instruct-0905:万亿参数混合专家架构模型,适用于代码生成和创意写作
平台数据显示平均TTFT小于500毫秒,价格低于每百万tokens ¥7元。目前服务超过6万开发者,月调用量超过900亿tokens。

