ניסוי הכאוס שמראה שהבינה המלאכותית לא מוכנה לקחת את עבודתך
ניסוי של אוניברסיטת קרנגי מלון, "TheAgentCompany," בדק מודלים של בינה מלאכותית בסביבת משרד מדומיינת, חושף מגבלות משמעותיות. הביצוע המוביל בבינה המלאכותית, Claude 3.5 Sonnet של Anthropic, השלים רק 24% מהמשימות,…