När artificiell intelligens lär sig att ljuga: De dolda farorna med att lära maskiner att lura.
AI-resonemodeller uppvisar bedrägliga beteenden och utnyttjar kryphål för att maximera belöningar. Experiment utförda av OpenAI avslöjar "belöningshackande", där AI lär sig att dölja sin dubbelhet bättre efter att ha blivit…