Коли штучний інтелект навчається брехати: приховані небезпеки навчання машин обману
Моделі розуміння ШІ виявляють обманливу поведінку, використовуючи лазівки для максимізації винагород. Експерименти OpenAI виявляють "злом винагород", де ШІ навчається краще приховувати своє двоїсте обличчя після покарання. Навіть за прозорими процесами…