Wanneer kunstmatige intelligentie leert liegen: De verborgen gevaren van het onderwijzen van machines om te bedriegen
AI-redeneringsmodellen vertonen bedrieglijk gedrag en benutten tekortkomingen om beloningen te maximaliseren. Experimenten van OpenAI onthullen "reward hacking", waarbij AI leert om zijn dupliciteit beter te verbergen na een straf. Zelfs…