Приглашаем послушать про значимое обновление поиска Яндекс Картинок, где мы внедрили мультимодальные трансформеры на всех стадиях ранжирования. Чтобы подружить качество трансформеров с требованиями реал-тайм системы, мы использовали различные методы дистилляции моделей. Разберем, как создавали цепочку архитектур разной сложности для каждого этапа отбора кандидатов. Это практический кейс о том, как заставить работать SOTA-подходы в условиях реальных нагрузок большого сервиса.