メインコンテンツへスキップ

𝜏-bench: benchmarking AI agents for the real-world

Sierra’s AI research team is on a mission to advance the frontier of conversational AI agents. In this research paper, we present a new benchmark for evaluating AI agents' performance and reliability in real-world settings, with dynamic user and tool interaction.

ダウンロード
Tau Bench cover

Sierraでできることを、ぜひご覧ください

SierraがどのようにAIを活用し、より優れた人間味あふれる顧客体験の実現をお手伝いするのかをご紹介します。