Никита Сидоров. Метрики и бенчмарки для оценки генеративных текстовых моделей

Метрики и бенчмарки для оценки генеративных текстовых моделей

Тезисы

Доклад про автоматические и ручные методы оценки генеративных моделей, как работать с ними при множественном сравнении различных моделей. Также рассмотрим, какие бывают открытые бенчмарки для мультимодальных и текстовых инструктивных моделей. Рассмотрим пример пайплайна по созданию локального бенчмарка с использованием LLM.

Слушатели смогут понять, как эфективнее выбирать генеративные модели, и познакомятся с методами создания и валидации датасетов для оценки их качества на своих задачах.

Видеозапись доклада

Появится здесь после конференции

Информация о спикере

Никита Сидоров

Руководитель направления, SberDevices

Senior RnD MLE в команде NLP RnD GigaChat

Никита Сидоров

Руководитель направления, SberDevices

Senior RnD MLE в команде NLP RnD GigaChat

Все доклады секции