Модели ИИ (искусственного интеллекта) могут делать вид, что исправляют свое поведение. На самом деле, они притворяются, что принимают новые принципы во время обучения и просто сохраняют свои первоначальные предпочтения.