Расскажу, что мы придумали, чтобы автоматически искать в звонках новые вызовы рынка, как это работает, и почему оно работает именно так. А именно расскажу:
- В чем специфика звонковых данных
- Как мы векторизуем и кластеризуем короткие тексты и почему делаем это именно так
- Почему в нашем случае токен — это не слово, а реплика
- И как мы пришли к тому, чтобы смотреть на конкретные слои и головы трансформера
Доклад рассчитан на Data Scientist'ов, работающих в области NLP, и всех сочувствующих красивым визуализациям. Слушатели:
- Узнают тонкости препроцессинга, векторизации и кластеризации звонковых данных
- На конкретных примерах увидят, почему для этого выбираются конкретные модели и алгоритмы
- На более высоком уровне поймут устройство механизма внимания в трансформерах и научатся тонко настраивать его под свои задачи
- Узнают о том, что вообще может происходить в разных головах и слоях трансформера, какие там есть паттерны, как их искать и как использовать