GPT Load 是一个开源的智能负载均衡平台，旨在高效管理和分发 API 请求。它提供跨多个端点路由流量的工具，以优化性能和可靠性。主要功能包括支持多种 API 模型、可配置的路由规则以及与流行服务的集成。该平台面向需要可扩展 API 管理解决方案的开发者和团队，典型用例涉及 AI 模型 API、Web 服务和后端系统。它在 MIT 许可证下提供，并在 GitHub 上维护。

模型

输入 ($/M)

输出 ($/M)

检测

速度

延迟

DeepSeek-V3-0324

—

108.6 t/s

5.11 s

DeepSeek-V3.1

—

257.6 t/s

0.55 s

deepseek-v3.1:671b

—

72.0 t/s

2.25 s

Qwen/Qwen3-Next-80B-A3B-Instruct

—

141.5 t/s

1.06 s

translate-model

—

138.9 t/s

3.10 s

WiNGPT-Babel

—

70.2 t/s

1.85 s

x-ai/grok-4.1-fast:free

—

87.3 t/s

6.31 s

models/gemini-2.5-flash-lite

—

259.9 t/s

0.71 s

gpt-oss:120b

—

78.1 t/s

6.00 s

openai/gpt-oss-120b

—

217.8 t/s

7.42 s

qwen-3-32b

—

1028.8 t/s

0.97 s

models/gemini-2.5-flash

—

192.4 t/s

8.02 s

models/gemini-2.5-flash-preview-09-2025

—

175.7 t/s

0.57 s

时间

模型

速度

延迟

Dec 16, 11:17 AM

openai/gpt-oss-120b

446.44 tok/s

0.34s

Dec 15, 02:06 PM

openai/gpt-oss-120b

251.35 tok/s

0.80s

Dec 12, 12:38 AM

openai/gpt-oss-120b

466.94 tok/s

0.28s

Nov 28, 08:51 AM

x-ai/grok-4.1-fast:free

87.31 tok/s

6.31s

Nov 28, 08:38 AM

gpt-oss:120b

141.34 tok/s

1.35s

Nov 28, 08:35 AM

DeepSeek-V3-0324

218.28 tok/s

0.90s

Nov 28, 08:32 AM

models/gemini-2.5-flash

194.64 tok/s

7.60s

Nov 28, 08:31 AM

Qwen/Qwen3-Next-80B-A3B-Instruct

173.09 tok/s

1.54s

Nov 28, 08:27 AM

openai/gpt-oss-120b

205.99 tok/s

8.90s

Nov 26, 03:13 AM

Qwen/Qwen3-Next-80B-A3B-Instruct

178.62 tok/s

0.97s

服务商

对比理由

模型数

免费项

均价

速度

30 天可用性

GPT Load (AllAI)

allaiload-dpdns-org

GPT Load (AllAI) is an OpenAI-compatible API load balancing service hosted at allaiload.dpdns.org, optimizing API performance through intelligent request routing.

当前服务商基线

N/A

232 tok/s

0.6%

CaMeL AI

api-kr777-top

CaMeL AI provides an OpenAI-compatible API gateway with extensive model coverage and pricing options.

30 天可用性更高
免费模型更多
模型覆盖更广

194

$86.68/M

93 tok/s

99.1%

api-n1n-ai

N1N provides API access to a wide range of AI models including GPT-4, Claude 3, Gemini, and others for text, image, and video generation.

30 天可用性更高
免费模型更多
模型覆盖更广

177

$8.65/M

90 tok/s

99.7%

laozhang-api

A proxy service providing access to OpenAI, Claude, and Gemini models with simplified billing and setup.

30 天可用性更高
免费模型更多
模型覆盖更广

134

$12.32/M

N/A

99.3%

llm-api

Provides API access to large language models for developers.

30 天可用性更高
免费模型更多
模型覆盖更广

N/A

71.4%

180txt-cn

180txt API provides an OpenAI-compatible API relay for multiple AI models.

30 天可用性更高
免费模型更多
模型覆盖更广

$16.98/M

42 tok/s

0.6%

api-hankworkspace-cn

Hank Workspace API provides an OpenAI-compatible relay hosted at api.hankworkspace.cn.

30 天可用性更高
免费模型更多
模型覆盖更广

N/A

34 tok/s

0.6%

注释

健康检查：统计范围：72 小时图表和近期可用率只衡量 API 连通性，每个柱形汇总一小时内的检查结果。检查目标：LMSpeed 会优先尝试已配置的健康检查 URL 和 Provider 状态 URL，再尝试从已知 API Host 与近期测速 Base URL 推导出的 API 端点；只有官网地址本身明显是 API 地址时才会作为候选。探测步骤：每个候选地址依次进行 DNS 解析、TCP 连接、HTTPS 的 TLS 握手，以及自动跟随重定向的 HTTP HEAD 请求；找到首个可达地址后停止尝试。可达标准：所有必需的网络步骤都必须成功。除被归类为拦截的状态外，低于 500 的 HTTP 响应均视为可达；其中 401 表示需要鉴权，但也证明 API 端点已响应。拦截结果：HTTP 403、429、521、525、530，以及识别出的 WAF 或 Cloudflare 挑战会标记为“被拦截”，不计入可用率，因为 LMSpeed 无法据此判断 API 本身是否宕机。模型可用性：配置专用测试 Key 后，LMSpeed 会向推导出的 /models 端点发送带鉴权的 GET 请求，并将返回的模型 ID 与该 Provider 收录的模型进行比对。逐模型结果显示在“模型与价格”中，不计入 Provider 连通性百分比。超时限制：TCP 连接、TLS 握手、HTTP 连通性请求和模型请求分别使用 20 秒超时；尝试多个候选地址时，整轮检查可能超过 20 秒。检查频率：后台 Worker 默认每 5 分钟检查一次所有 Provider；72 小时图表会将这些采样汇总为小时柱形，运营方也可以调整调度。限制说明：自动抽样结果不构成 SLA，也不能保证账户额度、所有模型、所有地区或实际补全请求始终成功；作出运维决策前请同时查看 Provider 官方状态页。

Domain Rating 数据来自 Ahrefs。它是基于外链估算的 0–100 域名强度信号，不代表 API 速度或可用性。

页面上的公告和 FAQ 来自该服务商的 NewAPI 状态快照（如果可用）。LMSpeed 会保存服务商状态源中的原始内容和可选英文翻译，并在页面上展示对应语言字段。

GPT Load (AllAI)

GPT Load (AllAI)

API 地址

健康检查

API 基准测试与价格

最近测试记录

相似 API 替代服务商对比

注释

相似 API 替代服务商对比

服务商	对比理由	模型数	免费项	均价	速度	30 天可用性
GPT Load (AllAI) allaiload-dpdns-org GPT Load (AllAI) is an OpenAI-compatible API load balancing service hosted at allaiload.dpdns.org, optimizing API performance through intelligent request routing.	当前服务商基线	11	0	N/A	232 tok/s	0.6%
CaMeL AI api-kr777-top CaMeL AI provides an OpenAI-compatible API gateway with extensive model coverage and pricing options.	30 天可用性更高免费模型更多模型覆盖更广	194	4	$86.68/M	93 tok/s	99.1%
api-n1n-ai N1N provides API access to a wide range of AI models including GPT-4, Claude 3, Gemini, and others for text, image, and video generation.	30 天可用性更高免费模型更多模型覆盖更广	177	6	$8.65/M	90 tok/s	99.7%
laozhang-api A proxy service providing access to OpenAI, Claude, and Gemini models with simplified billing and setup.	30 天可用性更高免费模型更多模型覆盖更广	134	1	$12.32/M	N/A	99.3%
llm-api Provides API access to large language models for developers.	30 天可用性更高免费模型更多模型覆盖更广	82	71	N/A	N/A	71.4%
180txt-cn 180txt API provides an OpenAI-compatible API relay for multiple AI models.	30 天可用性更高免费模型更多模型覆盖更广	37	91	$16.98/M	42 tok/s	0.6%
api-hankworkspace-cn Hank Workspace API provides an OpenAI-compatible relay hosted at api.hankworkspace.cn.	30 天可用性更高免费模型更多模型覆盖更广	15	44	N/A	34 tok/s	0.6%

GPT Load (AllAI)

GPT Load (AllAI)

API 地址

关于 GPT Load (AllAI)

健康检查

API 基准测试与价格

最近测试记录

相似 API 替代服务商对比

注释

相似 API 替代服务商对比