Ir al contenido principal

𝜏-bench: benchmarking AI agents for the real-world

Sierra’s AI research team is on a mission to advance the frontier of conversational AI agents. In this research paper, we present a new benchmark for evaluating AI agents' performance and reliability in real-world settings, with dynamic user and tool interaction.

Descargar
Tau Bench cover

Descubra lo que Sierra puede hacer por usted

Descubra cómo Sierra puede ayudar a su empresa a crear experiencias de cliente mejores y más humanas con IA.