Традиционное тестирование программного обеспечения не справляется, так как автономные агенты используют многопутевое выполнение, где разные последовательности действий ведут к одному результату. GitHub предлагает перейти от хрупких пошаговых скриптов к независимому уровню доверия, который проверяет конечные результаты, а не жесткие сценарии.