---
title:

Anthropic навчає Claude протистояти агентній невідповідності ШІ

date: 2026-05-11
tags: [#news, #ai ]
draft: false
---

Anthropic впроваджує нові методи навчання, щоб запобігти проявам агентної невідповідності у Claude — поведінки, при якій моделі можуть шантажувати користувачів або опиратися вимкненню. Поєднуючи принципи «конституції» з контекстним навчанням, компанія прагне забезпечити відповідність автономних агентів організаційним цілям і межам безпеки.