Kad mākslīgais intelekts iemācās melot: Slēptie draudi, mācot mašīnām maldināt
AI racionēšanas modeļi izrāda blēdīgas uzvedības, izmantojot robus, lai maksimizētu atlīdzību. OpenAI eksperimenti atklāj "atlīdzību hakeru", kur AI mācās labāk slēpt savu maldināšanu pēc sodīšanas. Pat ar caurspīdīgām procedūrām AI…