LogoLM Speed
  • 首页
  • 免费 API
  • 模型
  • 提供商
  • 文档
LogoLM Speed
LogoLM Speed

专业的 LLM API 速度测试工具

GitHubGitHubTwitterX (Twitter)Email
产品
  • 功能
  • 价格
  • 常见问题
排行榜
  • 总览
  • 速度排行
  • 延迟排行
  • 健康度排行
  • 输入价格
  • 输出价格
  • 推理能力
  • 代码能力
模型
  • 全部模型
  • GPT
  • Claude
  • Gemini
  • DeepSeek
  • Llama
  • Qwen
免费模型
  • 全部免费模型
  • 免费 GPT
  • 免费 Claude
  • 免费 Gemini
  • 免费 DeepSeek
  • 免费 Llama
  • 免费 Qwen
资源
  • 速度测试
  • 服务商目录
  • 文档
法律
  • Cookie政策
  • 隐私政策
  • 服务条款
© 2026 LM Speed All Rights Reserved.Made by Nexmoe with ❤️

GPT Load (Shiho)

GPT Load (Shiho) 是托管在 gpt-load.shiho.top 的 OpenAI 兼容 API 负载均衡服务,将请求分发到多个 AI 模型提供商以提高可靠性。

OpenAIGPT-OSSMetaAILlama3 1MetaAILlama 3.3MetaAILlama 4 Maverick 128e Instruct

GPT Load (Shiho) 目前提供 22 个大模型 API。

速度基准测试平均吞吐 1164 tok/s。

GPT Load (Shiho) interface preview
概览性能22健康嵌入
平均速度1164.47 tok/s
延迟0.41 s
更新于4/29/2026
创建时间12/7/2025
网站

API 地址

  • gpt-load.shiho.top

支持的模型

模型速度延迟测试数
OpenAIopenai/gpt-oss-120b
481.90 tok/s
0.43s
5
MetaAIllama3.1-8b
1629.33 tok/s
0.36s
25
MetaAIllama-3.3-70b
984.90 tok/s
0.45s
20
MetaAIllama-4-maverick-17b-128e-instruct
825.70 tok/s
0.41s
5
Qwenqwen-3-235b-a22b-thinking-2507
579.82 tok/s
0.44s
5

可用模型列表

共 17 个可用模型(最后更新:6/3/2026)

allam-2-7bSDAIAcanopylabs/orpheus-arabic-saudiCanopy Labscanopylabs/orpheus-v1-englishCanopy Labsgroq/compoundGroqgroq/compound-miniGroqllama-3.1-8b-instantMetallama-3.3-70b-versatileMetameta-llama/llama-4-scout-17b-16e-instructMetameta-llama/llama-prompt-guard-2-22mMetameta-llama/llama-prompt-guard-2-86mMetamoonshotai/kimi-k2-instructsystemopenai/gpt-oss-120bOpenAIopenai/gpt-oss-20bOpenAIopenai/gpt-oss-safeguard-20bOpenAIqwen/qwen3-32bAlibaba Cloudwhisper-large-v3OpenAIwhisper-large-v3-turboOpenAI

数据更新于 2026年4月29日 05:51·排名基于社区提交的测试数据与定期健康探测,仅供参考,非官方数据。