מה צריך לדעת לפני
שתתחיל

מתחיל 9 June 2026 08:30

נגמר 9 June 2026

00 ימים
00 שעות
00 דקות
00 שניות
course image

Introducing Terminal-Bench - Evaluating LLM Agents in Realistic Terminal Settings

Discover Terminal-Bench, a challenging benchmark for evaluating LLM agents in real-world terminal environments, addressing gaps in current agent evaluation methods.
Anyscale via YouTube

Anyscale

6076 קורסים


31 minutes

שדרוג אופציונלי זמין

Not Specified

התקדמות בקצב שלך

Free Video

שדרוג אופציונלי זמין

סקירה כללית

Discover Terminal-Bench, a challenging benchmark for evaluating LLM agents in real-world terminal environments, addressing gaps in current agent evaluation methods.


נושאים

Artificial Intelligence