统一的API网关,通过单一接口提供对多种大型语言模型和AI服务的访问。
| 模型 | 速度 | 延迟 | 测试数 |
|---|---|---|---|
| gemini-2.0-flash | 163.32 t/s | 0.59s | 5 |
| DeepSeek-V3-Fast | 79.64 t/s | 0.89s | 5 |
| Qwen/Qwen2.5-72B-Instruct | 32.01 t/s | 1.03s | 10 |
| Qwen/Qwen2.5-72B-Instruct | 32.01 t/s | 1.03s | 10 |
| DeepSeek-V3 | 29.76 t/s | 1.44s | 5 |
| 时间 | 模型 | 速度 | 延迟 |
|---|---|---|---|
| Sep 13, 12:54 PM | Qwen/Qwen2.5-72B-Instruct | 32.44 t/s | 1.01s |
| Sep 13, 12:52 PM | Qwen/Qwen2.5-72B-Instruct | 31.58 t/s | 1.05s |
| Sep 13, 12:49 PM | gemini-2.0-flash | 163.32 t/s | 0.59s |
| Sep 13, 12:46 PM | DeepSeek-V3-Fast | 79.64 t/s | 0.89s |
| Sep 13, 12:43 PM | DeepSeek-V3 | 29.76 t/s | 1.44s |