---
title:

Мащабиране на натоварванията на GPU в Kubernetes с KEDA

date: 2026-05-27
tags: [#news, #devops ]
draft: false
---

Разработчиците вече могат да внедрят автоматично мащабиране, съобразено с GPU, чрез използване на външен KEDA скалер за управление на изчисленията, VRAM и консумацията на енергия. Тази архитектура разгръща агент на всеки възел, за да преодолее ограниченията на NVML и да позволи ефективна оркестрация на ресурсите за ИИ и инференс натоварвания.