В докладе будет представлен подход к генерации фотореалистичного многокамерного видео для имитации данных сенсорной системы автономного транспорта с использованием современных диффузионных моделей. Метод воспроизводит реалистичные видео на основе структурного описания сцены (траектории агентов, конфигурация дорожной инфраструктуры, погодные условия и время суток). Такой подход позволяет быстро и воспроизводимо тестировать и улучшать алгоритмы восприятия и планирования, проигрывая широкий спектр сценариев в виртуальной среде симулятора.