Метрики и бенчмарки для оценки генеративных текстовых моделей
Тезисы
Доклад про автоматические и ручные методы оценки генеративных моделей, как работать с ними при множественном сравнении различных моделей. Также рассмотрим, какие бывают открытые бенчмарки для мультимодальных и текстовых инструктивных моделей. Рассмотрим пример пайплайна по созданию локального бенчмарка с использованием LLM.

Слушатели смогут понять, как эфективнее выбирать генеративные модели, и познакомятся с методами создания и валидации датасетов для оценки их качества на своих задачах.
Доклад про автоматические и ручные методы оценки генеративных моделей, как работать с ними при множественном сравнении различных моделей. Также рассмотрим, какие бывают открытые бенчмарки для мультимодальных и текстовых инструктивных моделей. Рассмотрим пример пайплайна по созданию локального бенчмарка с использованием LLM.

Слушатели смогут понять, как эфективнее выбирать генеративные модели, и познакомятся с методами создания и валидации датасетов для оценки их качества на своих задачах.
Видеозапись доклада
Появится здесь после конференции
Информация о спикере
Никита Сидоров
Руководитель направления, SberDevices
Senior RnD MLE в команде NLP RnD GigaChat
  • Никита Сидоров
    Руководитель направления, SberDevices
    Senior RnD MLE в команде NLP RnD GigaChat
Все доклады секции