Розробники успішно реалізували високошвидкісну архітектуру Transformer, що працює на FPGA з частотою 80 МГц, досягаючи швидкості 56 000 токенів на секунду. Ця реалізація демонструє значний потенціал для апаратно-прискореної оптимізації кешу KV у середовищах з обмеженими ресурсами.