Как машинка лучшие практики в звонках искала
Тезисы
Расскажу, что мы придумали, чтобы автоматически искать в звонках новые вызовы рынка, как это работает, и почему оно работает именно так. А именно расскажу:
  • В чем специфика звонковых данных
  • Как мы векторизуем и кластеризуем короткие тексты и почему делаем это именно так
  • Почему в нашем случае токен — это не слово, а реплика
  • И как мы пришли к тому, чтобы смотреть на конкретные слои и головы трансформера

Доклад рассчитан на Data Scientist'ов, работающих в области NLP, и всех сочувствующих красивым визуализациям. Слушатели:
  • Узнают тонкости препроцессинга, векторизации и кластеризации звонковых данных
  • На конкретных примерах увидят, почему для этого выбираются конкретные модели и алгоритмы
  • На более высоком уровне поймут устройство механизма внимания в трансформерах и научатся тонко настраивать его под свои задачи
  • Узнают о том, что вообще может происходить в разных головах и слоях трансформера, какие там есть паттерны, как их искать и как использовать
Расскажу, что мы придумали, чтобы автоматически искать в звонках новые вызовы рынка, как это работает, и почему оно работает именно так. А именно расскажу:
  • В чем специфика звонковых данных
  • Как мы векторизуем и кластеризуем короткие тексты и почему делаем это именно так
  • Почему в нашем случае токен — это не слово, а реплика
  • И как мы пришли к тому, чтобы смотреть на конкретные слои и головы трансформера

Доклад рассчитан на Data Scientist'ов, работающих в области NLP, и всех сочувствующих красивым визуализациям. Слушатели:
  • Узнают тонкости препроцессинга, векторизации и кластеризации звонковых данных
  • На конкретных примерах увидят, почему для этого выбираются конкретные модели и алгоритмы
  • На более высоком уровне поймут устройство механизма внимания в трансформерах и научатся тонко настраивать его под свои задачи
  • Узнают о том, что вообще может происходить в разных головах и слоях трансформера, какие там есть паттерны, как их искать и как использовать
Видеозапись доклада
Появится здесь после конференции
Информация о спикере
Елизавета Пушкарева
Data Scientist, Точка
Работаю в Точке над задачами речевой аналитики.
Победитель ряда хакатонов, AIIJC (Artificial intelligence international Junior Contest), двух международных и ряда всероссийских научно-инженерных проектных конкурсов, молодёжного акселератора "ЮнIT Урал".

Выступления:
Абонент временно доступен — PiterPy 2022
Про тренды 2022 в NLP — PiterPy 2022
Data Dojo Новогодняя ML-тренировка
Новогодний митап AI-Academy
Как создать свой первый стартап в 17 лет? Академия ИИ

GitHub: Digitaljay - Overview
LinkedIn: https://www.linkedin.com/in/digitaljay/
Все доклады секции