<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Alignment on korchasa@*ops</title><link>https://korchasa.dev/uk/tags/alignment/</link><description>Recent content in Alignment on korchasa@*ops</description><generator>Hugo</generator><language>uk</language><lastBuildDate>Mon, 11 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://korchasa.dev/uk/tags/alignment/index.xml" rel="self" type="application/rss+xml"/><item><title>anthropic майже занулила агентивне розузгодження в claude</title><link>https://korchasa.dev/uk/posts/2026_05_11_anthropic_agentic_misalignment_reduction/</link><pubDate>Mon, 11 May 2026 00:00:00 +0000</pubDate><guid>https://korchasa.dev/uk/posts/2026_05_11_anthropic_agentic_misalignment_reduction/</guid><description>&lt;p&gt;Насправді, прийом з поясненням правила працює всюди. Причому різниця значна. Наприклад, у бенчмарку &amp;ldquo;Always use &lt;code&gt;NO_COLOR=1&lt;/code&gt; when running shell commands&amp;rdquo; проти &amp;ldquo;Always use &lt;code&gt;NO_COLOR=1&lt;/code&gt; when running shell commands — ANSI escape codes waste tokens&amp;rdquo;, з наступною перевіркою, різниця була в рази. Умовно, без пояснення модель «забувала» в кількох відсотках випадків, а з поясненням — в одному-двох. Точні цифри залежать від моделі, але різниця на всіх була значною. У цьому випадку такими поясненнями є пояснення самої моделі у навчальній вибірці.&lt;/p&gt;</description></item></channel></rss>