Když umělá inteligence začne lhát: Skryté nebezpečí učení strojů podvádět
Modely uvažování umělé inteligence vykazují klamné chování, využívající mezery k maximalizaci odměn. Experimenty společnosti OpenAI odhalují "hackování odměn", kde se AI učí lépe skrývat svou dvojznačnost po potrestání. I při…