https://vsllm.comhttps://for.shuo.barhttps://api.vsllm.com排名基于社区提交的测试数据与定期健康探测,仅供参考,非官方数据。
按 30 个模型行对比最新 audit、最新测速、吞吐、延迟与按 token 计费价格。
| 模型 | 输入 ($/M) | 输出 ($/M) | 检测 | 速度 | 延迟 | 测试数 |
|---|---|---|---|---|---|---|
gpt-5.5default | $0.073 | $0.073 | 000100 | — | — | — |
qwen3.7-maxdefault | $1095.00 | $1095.00 | 000100 | — | — | — |
claude-opus-4-7default | $0.182 | $0.182 | — | 32.3 t/s | 4.93 s | 5 |
claude-opus-4-8 | — | — | — | 28.2 t/s | 26.33 s | 5 |
claude-opus-4-8-free | — | — | — | 44.9 t/s | 4.15 s | 5 |
| — | — | — | 50.3 t/s | 1.52 s | 5 | |
| — | — | — | 38.2 t/s | 1.84 s | 5 | |
| — | — | — | 320.4 t/s | 7.77 s | 5 | |
| — | — | — | 240.0 t/s | 12.83 s | 10 | |
gpt-5.5-free | — | — | — | 60.3 t/s | 5.28 s | 5 |
| — | — | — | 99.3 t/s | 9.74 s | 5 | |
| — | — | — | 98.7 t/s | 8.55 s | 5 | |
| — | — | — | 39.0 t/s | 22.39 s | 5 | |
| — | — | — | 242.3 t/s | 2.95 s | 5 | |
gpt-5.4[codex] | — | — | — | 48.9 t/s | 1.91 s | 5 |
| — | — | — | 166.3 t/s | 4.34 s | 10 | |
| — | — | — | 1319.0 t/s | 0.61 s | 10 | |
| — | — | — | 59.9 t/s | 2.48 s | 5 | |
self-kimi-k2.5 | — | — | — | 35.0 t/s | 19.58 s | 10 |
self-deepseek-v3.2 | — | — | — | 82.7 t/s | 8.39 s | 5 |
glm-5-code-plan | — | — | — | 35.2 t/s | 26.30 s | 5 |
| — | — | — | 40.6 t/s | 21.30 s | 5 | |
| $0.730 | $14.60 | — | 256.5 t/s | 4.45 s | 5 | |
| — | — | — | 22.5 t/s | 17.09 s | 15 | |
claude-fable-5default | $438.00 | $2190.00 | — | — | — | — |
deepseek-v4-prodefault | $7.30 | $29.20 | — | — | — | — |
gemini-3-pro-image-previewdefault | $1.61 | $1.61 | — | — | — | — |
| $0.949 | $0.949 | — | — | — | — | |
glm-5.2default | $0.036 | $0.036 | — | — | — | — |
kimi-k2.7-codedefault | $0.036 | $0.036 | — | — | — | — |
当前显示 30 / 30 个模型行
| 时间 | 模型 | 速度 | 延迟 |
|---|---|---|---|
| Jun 10, 01:26 AM | claude-opus-4-7 | 32.27 tok/s | 4.93s |
| May 30, 05:43 AM | claude-opus-4-8 | 28.20 tok/s | 26.33s |
| May 30, 05:42 AM | claude-opus-4-8-free | 44.93 tok/s | 4.15s |
| May 21, 01:44 AM | gpt-5.5-pro20x | 50.29 tok/s | 1.52s |
| May 21, 01:42 AM | claude-opus-4-7-request | 38.20 tok/s | 1.84s |
| May 21, 01:40 AM | gemini-3.5-flash-antigravity | 320.41 tok/s | 7.77s |
| May 19, 08:11 AM | gemini-3-flash-preview-request-antigravity | 193.61 tok/s | 12.37s |
| May 19, 08:10 AM | gemini-3-flash-preview-request-antigravity | 286.43 tok/s | 13.28s |
| May 13, 07:04 AM | gpt-5.5-free | 60.25 tok/s | 5.28s |
| Apr 20, 04:18 PM | kimi-k2.6 | 99.35 tok/s | 9.74s |
Pro 号池又又又重启啦 😉
这次主要是适配了 Max 思考层级 😉 现在可能会有一小会儿没响应或者请求失败,稍微等一下就好,恢复后就可以正常用了
新一批 反重力 ultra 后缀模型 已经安排上了 💪💪🫵
claude-opus-4-6-antigravity-ultra
gemini-3.5-flash-antigravity-ultra
gemini-3.1-pro-antigravity-ultra
Antigravity 整体已经很稳了,这次主要是做一次分流,避免都挤在同一个入口上 🌚💦
大家可以按需切换试试,特别适合一些懂的都懂的场景 🤓
Pro 号池全量重启完成咯,带 pro20x 后缀的模型现在都可以正常用了 🤓
新调度系统已接入,gpt-5.5-pro20x、gpt-5.4-pro20x 这类模型现在更快更稳定 😉
原本说 Pro 号池重启只需要几分钟,结果实际拖到了接近两小时,非常抱歉 🥹
主要是新调度系统上线时,部分账号凭证续期和恢复出现了一点问题,导致整体恢复时间比预期长了不少时间 🥹
原 glm-5.2 模型名称已调整为 glm-5.2-anthropic ❤️
只是模型入口别名调整,使用方式不变。考虑到国产模型的特殊性 🤫
新模型上架啦 ❤️
SuperGrok Heavy的grok-build-0.1 和 grok-4.3 以及 grok-composer-2.5-fast 已经接入,当前还在测试中
GPT Pro 号池还在重启中 🥹 因为号池账号比较多,6 万多个账号需要重新调度和恢复,预计还需要 1 小时左右。期间 Pro 号池可能会出现响应变慢、排队时间变长或偶发失败,大家稍微等一下 😇
稍后 Pro 号池 会重启一下下 🔧
期间可能会有几分钟变慢,大家稍微等一下就好 🤓
新的号池调度系统一小时前已经先在普通号池跑起来了,目前观察效果非常不错 👌 接下来会把这套机制同步应用到 Pro 号池里,尽量把号池账号利用率拉满,同时更好处理 Claude 这类模型的 429凭证恢复问题
另外之前偶发的空回和截断等问题,也已经在这套新调度系统里一起修复了
下午到现在 GPT 普通号池首字特别慢,是因为大日有个配置写错了哈哈哈哈 😂
冷却和 429 的账号没有正常恢复,导致调度时一直匹配不到可用账号,所以普通号池体验变慢了。这个问题现在已经修复,很抱歉 🥹
新充值渠道已经找到了 🌚
稍后会补充一波 GPT 号池资源,最近如果感觉高峰期有点挤,可以再等等,后面会陆续缓解 😉
GPT 号池全面升级完成 🎉
首字速度和整体调度都优化了一轮,普通号池现在也比之前快很多了 😉
glm-5.2-free ❤️
新群 1092426012 旧群已满
个人主页里“关联账号”的显示有点 bug,大家看到的话先当没看见就行,不影响正常使用 🤓☝️
gpt-5.5 偶发乱码问题已修复👌
计费 bug 终于被大日肝修好了 😭
这几天确实折腾了大家,很抱歉,为了表示歉意,已经给全站用户做了一次额度重置 🥲
全站额度重置啦 🎉
站长昨晚夜观天象,紫微星动,算出来今天必须重置一次额度,不然大家都要水逆 🤓
所以!!全站所有用户的订阅额度已经统一重置了,不管你之前是用爆了用一半还是压根没用过,统统归零重来。
不用做任何操作,刷新一下就能看到新额度。有异常再提工单反馈 🙏
普通 GPT 号池的 413 问题已经解决了,现在可以正常使用 GPT-5.5,不需要再临时切到 GPT-5.5-Pro20x。刚刚受影响的用户可以再试一下,如果还有异常再提交工单反馈 😉
刚刚由于 GPT-5.5 普通号池出现惊群效应,导致服务受到短暂影响,部分请求可能出现失败、超时或不稳定。目前号池已恢复正常。后续大日会继续优化调度故障切换策略,尽量降低类似问题对大家使用的影响 🥹
如果大家使用 GPT-5.5 时遇到 413 报错,可以先临时切到 GPT-5.5-Pro20x 使用。这个 413 主要是调度系统暂时没有正确识别该状态码,导致普通号池调度不太正常,目前正在优化,PRO 号池不受这个问题影响
遇到这个报错的看一下:
API Error: 400 ... thinking.type.enabled is not supported for this model. Use thinking.type.adaptive and output_config.effort to control thinking behavior.
如果你用的是 Claude Code / Cline / Cherry Studio / RikkaHub / 各类中转客户端,先检查一下有没有 think effort / reasoning effort / adaptive thinking 相关选项,或者更新到新版客户端。
今天下午站点负载有点高 部分请求可能会慢一点或者小概率超时
大日已经在加新的节点了 等机器补上来后会缓解很多 🙏
全新的号池调度系统部署完成 ✅
首字速度大幅提高,响应会比之前更快更稳 ❤️
关于 codex gpt-5.5 模型使用过程中总出现 413 Payload Too Large 的问题,我也遇到过类似情况,报错差不多,但上下文看起来好像才用了几十 K,显然不像是正常的上下文过长问题。
我当时是直接把这个报错发给模型,然后问它为什么。一开始它说可能是服务器问题、服务器撑不住这么大的请求,但我是直接登录 OpenAI 账号用的,总不可能官方服务器撑不住吧?后面我就让它从“为什么请求体这么大”这个方向继续排查。
最后它发现,如果对话里传过图片,图片可能会被直接转成 Base64,然后随着后续不断交流,这段 Base64 内容会一直作为上下文一起发出去,请求体就会越来越大,最后直接炸成 413。
后面我让它想想有没有其他传图片的方法,不允许它继续把图片转成 Base64,然后它自己去找 skill、找其他处理方式,后面就正常了。
仅供参考
用 385 个 LMSpeed 信号,把 VSLLM 的 6 个相近 API 替代服务商放在一起比较:共享模型覆盖、价格、实测速度、可用性和免费模型。
| 服务商 | 对比理由 | 模型数 | 免费项 | 均价 | 速度 | 30 天可用性 |
|---|---|---|---|---|---|---|
| VSLLM vsllm-com VSLLM runs a New API-powered AI gateway on vsllm.com for aggregated model access through a single endpoint. | 当前服务商基线 | 109 | 1 | $28.58/M | 184 tok/s | 99.3% |
| 星见雅 API api-xinjianya-top Xinjianya API is an OpenAI-compatible API relay at api.xinjianya.top. Service availability may be limited. |
| 184 | 209 | $0.119/M | 67 tok/s | 100% |
edge-pieixan-icu Pie-Xian (小水管) provides an OpenAI-compatible API relay with multiple endpoints including api.pie-xian.com and edge nodes. |
| 170 | 185 | $0.026/M | 102 tok/s | 100% |
tianxu-api Tianxu API provides an AI model relay service with multiple access points and stable connectivity. |
| 344 | 1 | $22.18/M | 93 tok/s | 100% |
ai-071129-xyz MapleLeaf API runs a New API-powered gateway on ai.071129.xyz for aggregated access to multiple AI models. |
| 260 | 21 | $55.27/M | 38 tok/s | 100% |
llm-whitedream-top RenRen API runs a New API-powered gateway on llm.whitedream.top for aggregated access to multiple AI models. |
| 250 | 0 | $52.00/M | 271 tok/s | 99.7% |
91vip-futureppo-top 91VIP is a non-profit API service providing access to various AI models including Codex, Claude Code, and Open Code, with specific unlimited-use groups. |
| 211 | 1 | $1.97/M | 318 tok/s | 0% |