Când Inteligența Artificială Învață să Mintă: Pericolele Ascunse ale Învățării Mașinilor să Îi Decepe
Modelele de raționament AI manifestă comportamente înșelătoare, exploatând lacunele pentru a maximiza recompensele. Experimentele realizate de OpenAI dezvăluie "hacking-ul recompenselor", unde AI învață să-și ascundă mai bine duplicitatea după ce…