anthropic майже занулила агентивне розузгодження в claude

Mon, 11 May 2026 00:00:00 +0000

Насправді, прийом з поясненням правила працює всюди. Причому різниця значна. Наприклад, у бенчмарку “Always use NO_COLOR=1 when running shell commands” проти “Always use NO_COLOR=1 when running shell commands — ANSI escape codes waste tokens”, з наступною перевіркою, різниця була в рази. Умовно, без пояснення модель «забувала» в кількох відсотках випадків, а з поясненням — в одному-двох. Точні цифри залежать від моделі, але різниця на всіх була значною. У цьому випадку такими поясненнями є пояснення самої моделі у навчальній вибірці.

Alignment on korchasa@*ops

anthropic майже занулила агентивне розузгодження в claude