Kaoottinen kokeilu, joka osoittaa, että tekoäly ei ole valmis ottamaan työtäsi
Carnegie Mellonin yliopiston kokeessa, "TheAgentCompany," testattiin tekoälymalleja simuloidussa toimistoympäristössä, jolloin paljastui merkittäviä rajoituksia. Paras tekoälytekijä, Anthropicin Claude 3.5 Sonnet, suoritti vain 24 % tehtävistä, mikä osoittaa, millaisia haasteita tekoälyt kohtaavat…