为MBZUAI-IFM/K2-Think模型提供API代理服务,具备令牌管理和负载均衡功能。
分类
K2Think 目前提供 2 个大模型 API。
速度基准测试平均吞吐 226 tok/s。
k2t.shiho.top