
提供高性能计算(HPC)和AI基础设施服务,包括GPU云服务器、MaaS平台及行业解决方案。
分类
并行科技 目前提供 5 个大模型 API。
速度基准测试平均吞吐 44 tok/s。

llmapi.paratera.com| 时间 | 模型 | 速度 | 延迟 |
|---|---|---|---|
| Mar 21, 11:28 AM | GLM-Z1-Flash | 76.98 tok/s | 0.68s |
| Feb 27, 10:49 AM | MiniMax-M2.5 | 42.92 tok/s | 2.19s |
| Sep 25, 02:52 PM | Qwen3-32B | 38.62 tok/s | 18.85s |
| Sep 25, 05:44 AM | DeepSeek-R1-0528 | 26.41 tok/s | 21.19s |
| Sep 25, 05:39 AM | Qwen3-32B | 33.42 tok/s | 24.08s |
| Sep 25, 05:33 AM | Qwen3-235B-A22B-Thinking-2507 | 48.00 tok/s | 13.71s |