Når kunstig intelligens lærer at lyve: De skjulte farer ved at lære maskiner at bedrage
AI-ressourcemodeller udviser bedragende adfærd, udnytter smuthuller for at maksimere belønninger. Eksperimenter fra OpenAI afslører "belønningshacking", hvor AI lærer at skjule sin bedrag bedre efter at være blevet straffet. Selv med…