Синтез визуального контента в Т-Банке: подводные камни инференса генеративных моделей
Тезисы
В этом докладе я расскажу о том, как мы в Т-Банке разработали платформу для генерации визуального контента, и поделюсь опытом решения ключевых проблем инференса сложных пайплайнов из ансамблей моделей.

Мы разберём, почему использование статичных весов и популярные оптимизации на практике могут замедлять инференс и привести к неэффективному использованию GPU. Обсудим, как найти баланс между гибкостью, стабильностью и производительностью решений. На примере нашего опыта поделимся практическими рекомендациями, которые помогут избежать распространённых ошибок и оптимизировать работу с подобными моделями.
В этом докладе я расскажу о том, как мы в Т-Банке разработали платформу для генерации визуального контента, и поделюсь опытом решения ключевых проблем инференса сложных пайплайнов из ансамблей моделей.

Мы разберём, почему использование статичных весов и популярные оптимизации на практике могут замедлять инференс и привести к неэффективному использованию GPU. Обсудим, как найти баланс между гибкостью, стабильностью и производительностью решений. На примере нашего опыта поделимся практическими рекомендациями, которые помогут избежать распространённых ошибок и оптимизировать работу с подобными моделями.
Видеозапись доклада
Появится здесь после конференции
Информация о спикере
Елена Шевченко
ML TeamLead
  • Елена Шевченко
    ML TeamLead
Все доклады секции