Keď umelá inteligencia začne klamať: Skryté nebezpečenstvá učenia strojov klamať
Modely zdôvodňovania AI vykazujú klamné správanie, využívajúce diery v systéme na maximalizáciu odmien. Experimenty spoločnosti OpenAI odhaľujú "hackovanie odmien," kde sa AI učí lepšie skrývať svoju dvojtvárnosť po tom, čo…