精准测量 AI 模型的 TTFT、TPS 和并发性能

专业的 LLM 性能基准测试工具

为开发者打造的 LLM 性能测试软件。对比多模型的首字延迟 (TTFT)、每秒 Token 数 (TPS) 和响应延迟。通过实时并发测试优化您的 AI 基础设施。

TTFT0ms

TPS0/s

Tokens0

AI Response:

精确测量推理速度和延迟，优化用户体验。

模拟多用户同时访问，测试系统的稳定性和吞吐量 (RPS)。

直观对比 GPT-4, Claude 3, Llama 3 及本地模型的性能差异。

LLM Benchmarking Metrics