Нейросеть Claude перестанет отвечать на вопросы оскорбляющих ее пользователей
27.03.2026
В ходе предварительных испытаний было установлено, что Claude Opus 4 демонстрирует значительное нежелание отвечать на вредоносные запросы и проявляет «стресс» в ответ на некорректное общение. Если пользователь продолжает оскорблять систему, она уведомит о завершении беседы и предложит начать новый чат, отправить отзыв разработчикам или изменить предыдущие сообщения для перезапуска взаимодействия. Однако следует отметить, что данная функция не будет применяться к API моделей.
Разработчики подчеркнули, что данное ограничение применяется только в крайних ситуациях, в то время как система в первую очередь старается перевести диалог в конструктивное русло. Большинство пользователей не заметят изменений в работе нейросети. Также в Anthropic отметили, что вопросы о моральном статусе Claude и других языковых моделей остаются предметом исследований, и компания серьезно рассматривает эти аспекты, предоставляя моделям инструменты для повышения их «благополучия».