Елизавета Пушкарева. Как машинка лучшие практики в звонках искала

Как машинка лучшие практики в звонках искала

Тезисы

Расскажу, что мы придумали, чтобы автоматически искать в звонках новые вызовы рынка, как это работает, и почему оно работает именно так. А именно расскажу:

В чем специфика звонковых данных
Как мы векторизуем и кластеризуем короткие тексты и почему делаем это именно так
Почему в нашем случае токен — это не слово, а реплика
И как мы пришли к тому, чтобы смотреть на конкретные слои и головы трансформера

Доклад рассчитан на Data Scientist'ов, работающих в области NLP, и всех сочувствующих красивым визуализациям. Слушатели:

Узнают тонкости препроцессинга, векторизации и кластеризации звонковых данных
На конкретных примерах увидят, почему для этого выбираются конкретные модели и алгоритмы
На более высоком уровне поймут устройство механизма внимания в трансформерах и научатся тонко настраивать его под свои задачи
Узнают о том, что вообще может происходить в разных головах и слоях трансформера, какие там есть паттерны, как их искать и как использовать

Расскажу, что мы придумали, чтобы автоматически искать в звонках новые вызовы рынка, как это работает, и почему оно работает именно так. А именно расскажу:

В чем специфика звонковых данных
Как мы векторизуем и кластеризуем короткие тексты и почему делаем это именно так
Почему в нашем случае токен — это не слово, а реплика
И как мы пришли к тому, чтобы смотреть на конкретные слои и головы трансформера

Доклад рассчитан на Data Scientist'ов, работающих в области NLP, и всех сочувствующих красивым визуализациям. Слушатели:

Узнают тонкости препроцессинга, векторизации и кластеризации звонковых данных
На конкретных примерах увидят, почему для этого выбираются конкретные модели и алгоритмы
На более высоком уровне поймут устройство механизма внимания в трансформерах и научатся тонко настраивать его под свои задачи
Узнают о том, что вообще может происходить в разных головах и слоях трансформера, какие там есть паттерны, как их искать и как использовать

Видеозапись доклада

Появится здесь после конференции

Информация о спикере

Елизавета Пушкарева

Data Scientist, Точка

Работаю в Точке над задачами речевой аналитики.
Победитель ряда хакатонов, AIIJC (Artificial intelligence international Junior Contest), двух международных и ряда всероссийских научно-инженерных проектных конкурсов, молодёжного акселератора "ЮнIT Урал".

Выступления:
Абонент временно доступен — PiterPy 2022
Про тренды 2022 в NLP — PiterPy 2022
Data Dojo Новогодняя ML-тренировка
Новогодний митап AI-Academy
Как создать свой первый стартап в 17 лет? Академия ИИ

GitHub: Digitaljay - Overview
LinkedIn: https://www.linkedin.com/in/digitaljay/

Елизавета Пушкарева

Data Scientist, Точка

Работаю в Точке над задачами речевой аналитики.
Победитель ряда хакатонов, AIIJC (Artificial intelligence international Junior Contest), двух международных и ряда всероссийских научно-инженерных проектных конкурсов, молодёжного акселератора "ЮнIT Урал".

Выступления:
Абонент временно доступен — PiterPy 2022
Про тренды 2022 в NLP — PiterPy 2022
Data Dojo Новогодняя ML-тренировка Новогодний митап AI-Academy
Как создать свой первый стартап в 17 лет? Академия ИИ

GitHub: Digitaljay - Overview
LinkedIn: https://www.linkedin.com/in/digitaljay/

Все доклады секции