Interfaze представила Structured Output Benchmark (SOB) для оценки того, насколько точно большие языковые модели (LLM) преобразуют неструктурированные данные в валидный JSON. В отличие от существующих тестов, инструмент измеряет семь показателей, включая точность значений и безопасность типов, в детерминированных рабочих процессах.