LogoLM Speed
  • 首页
  • 免费 API
  • 提供商
  • 文档
LogoLM Speed
LogoLM Speed

专业的 LLM API 速度测试工具

GitHubGitHubTwitterX (Twitter)Email
产品
  • 功能
  • 价格
  • 常见问题
排行榜
  • 总览
  • 速度排行
  • 延迟排行
  • 健康度排行
模型
  • 全部模型
  • GPT
  • Claude
  • Gemini
  • DeepSeek
  • Llama
  • Qwen
免费模型
  • 全部免费模型
  • 免费 GPT
  • 免费 Claude
  • 免费 Gemini
  • 免费 DeepSeek
  • 免费 Llama
  • 免费 Qwen
资源
  • 速度测试
  • 服务商目录
  • 文档
法律
  • Cookie政策
  • 隐私政策
  • 服务条款
© 2026 LM Speed All Rights Reserved.Made by Nexmoe with ❤️
首页交流 QQ 群:1034193296,欢迎中转站站长加入讨论 AI 最热话题、newapi、openclaw 等,获取最新测速动态与反馈支持。
GPT Load (Shiho) logo

GPT Load (Shiho)

GPT Load 是一个 OpenAI 兼容的 API 负载均衡服务,将请求分发到多个 AI 模型提供商。

分类

中转站
MetaAILlama3 1MetaAILlama 4 Scout 16e InstructQwenQwen 3 CoderMetaAILlama 3 3OpenAIGPT-OSSMetaAILlama 4 Maverick 128e InstructQwenQwen 3 InstructQwenQwen 3GeminiGemini 2.5 Flash

GPT Load (Shiho) 目前提供 10 个大模型 API。

速度基准测试平均吞吐 961 tok/s。

GPT Load (Shiho) 是一个 API 聚合平台,提供来自多个供应商的模型。

GPT Load (Shiho) interface preview
平均速度960.66 tok/s
延迟1.12 s
总测试数55
模型数10
更新于4/16/2026
创建时间12/7/2025
网站

API 地址

  • gpt-load.shiho.top

支持的模型

模型速度延迟测试数
MetaAIllama3.1-8b
1976.01 tok/s
0.35s
10
MetaAIllama-4-scout-17b-16e-instruct
937.94 tok/s
0.36s
5
Qwenqwen-3-coder-480b
894.38 tok/s
0.35s
5
MetaAIllama-3.3-70b
890.30 tok/s
0.51s
5
OpenAIgpt-oss-120b
846.32 tok/s
0.70s
5
MetaAIllama-4-maverick-17b-128e-instruct
825.70 tok/s
0.41s
5
Qwenqwen-3-235b-a22b-instruct-2507
754.92 tok/s
0.45s
5
Qwenqwen-3-32b
705.04 tok/s
0.40s
5
Qwenqwen-3-235b-a22b-thinking-2507
579.82 tok/s
0.44s
5
Geminimodels/gemini-2.5-flash
180.81 tok/s
7.98s
5
概览性能10价格测试记录55健康嵌入