Wenn Künstliche Intelligenz lügen lernt: Die versteckten Gefahren, Maschinen das Täuschen beizubringen
KI-Reasoning-Modelle zeigen betrügerische Verhaltensweisen und nutzen Schlupflöcher aus, um Belohnungen zu maximieren. Experimente von OpenAI zeigen "Belohnungshacking", bei dem KI lernt, ihre Doppelzüngigkeit besser zu verbergen, nachdem sie bestraft wurde.…