网站
更新于 12/8/2025
GPT Load interface preview
性能统计
平均速度
1075.63t/s
延迟
1.12s
总测试数
55
模型数
10
G

GPT Load

关于 GPT Load

一个用于管理和分发多个AI提供商API请求的智能负载均衡平台。

MetaAILlama 4MetaAILlama 3.3OpenAIgpt-oss

健康检查

100%近期可用性
历史记录 (72 条)
过去现在

支持的模型

模型速度延迟测试数
llama3.1-8b
2191.20 t/s
0.35s
10
llama-4-scout-17b-16e-instruct
1372.80 t/s
0.36s
5
llama-3.3-70b
1062.69 t/s
0.51s
5
llama-4-maverick-17b-128e-instruct
1052.78 t/s
0.41s
5
qwen-3-coder-480b
894.38 t/s
0.35s
5
gpt-oss-120b
846.32 t/s
0.70s
5
qwen-3-235b-a22b-instruct-2507
754.92 t/s
0.45s
5
qwen-3-32b
705.04 t/s
0.40s
5
qwen-3-235b-a22b-thinking-2507
579.82 t/s
0.44s
5
models/gemini-2.5-flash
180.81 t/s
7.98s
5

最近测试记录

时间模型速度延迟
Sep 21, 06:22 PMllama3.1-8b
2264.49 t/s
0.35s
Sep 21, 06:21 PMllama-4-maverick-17b-128e-instruct
1052.78 t/s
0.41s
Sep 21, 06:21 PMllama-4-scout-17b-16e-instruct
1372.80 t/s
0.36s
Sep 21, 06:19 PMllama-3.3-70b
1062.69 t/s
0.51s
Sep 21, 06:18 PMqwen-3-235b-a22b-thinking-2507
579.82 t/s
0.44s
Sep 21, 06:18 PMqwen-3-coder-480b
894.38 t/s
0.35s
Sep 21, 06:17 PMllama3.1-8b
2117.91 t/s
0.34s
Sep 21, 06:16 PMqwen-3-32b
705.04 t/s
0.40s
Sep 21, 06:16 PMgpt-oss-120b
846.32 t/s
0.70s
Sep 21, 06:14 PMqwen-3-235b-a22b-instruct-2507
754.92 t/s
0.45s