Агентская платформа для инфраструктуры
Последние две недели строю в компании агентскую платформу для инфраструктуры. Идея простая: дать агентам доступ ко всему, что касается инфраструктуры, но держать под контролем безопасность операций.
По сути, это сервис, который цепляется к Kubernetes, Prometheus, GitLab, исходникам, inventory, Consul и так далее, а наружу отдаёт общий API для данных и инфраструктурных ручек.
В результате это работает магически. Даже с сильно урезанными мутирующими операциями и с большим долгом по унификации инфраструктуры MTTD занимает минуты.
Когда дадим возможность мутаций, агенты смогут проводить эксперименты и проверять гипотезы. Следующий шаг после этого — мониторинг и алертинг. Потом self-healing, на первых порах ограниченный и с HITL.
Неожиданно, насколько даже SOTA-агентам пофиг на безопасность операций. Несмотря на все предварительные расчёты blast-radius и приоритеты целей, opus 4.8 xhigh совершенно спокойно, например, откатывает миграции, не проверив, что откат не ломает данные. Просто потому что «ну не может же быть, что программисты не написали нормальный rollback».