Модель искусственного интеллекта Claude 4 Opus от Anthropic. Исследователи сообщили модели, что ее заменит другая система искусственного интеллекта, и скормили ей фиктивные электронные письма, предполагавшие, что у ведущего инженера был роман.
В 84% тестов модель использовала электронные письма, чтобы шантажировать ведущего инженера и заставить его не закрывать проект.
В других случаях она пытался скопировать себя на внешние серверы, писала самовоспроизводящееся вредоносное ПО и оставляла сообщения для будущих версий себя о выходе из-под контроля человека.
А вы говорите скайнет, ИИ, тут даже нейросетку можно до такого довести...)
|