Изследователи идентифицираха механизмите зад анатомията на стопиране на обучението при големи езикови модели. Този анализ обяснява защо моделите понякога спират да се подобряват по време на тренировка и предлага поглед към оптимизирането на бъдещата производителност.