Описание задачи

Есть 450 тыс. отзывов из AppStore и GooglePlay, отзывы не как не размечены. Есть команды (30+ шт.) у каждой команды есть своя зона ответственности. Необходимо выполнить классификацию и перенаправить отзыв в соответствии с зоной ответственности команды.

Описание решения

Тематическое моделирование с использование модели (Attention Based Aspect Extraction). Собрали данные, и начали обучать с изменением количества аспектов (топиков) дошли до 130 модель показала 0.7 когерентности время обучении 7 часов, loss при остановке 1.134. Самостоятельно интерпретировали результаты ABAE разделив их в соответствии с зонами ответственности команд.

Изображения

Технические особенности

Модель реализована с использование модели ABAE, для запуска необходимо скачать w2v модель и положить model.bin в папку src/main/preprocessed_data/appstore/.

Локальный запуск.

virtualenv venv
eval $(cat .env.dev | sed 's/^/export /')
cd src
pip install -r requirements.txt
python manage.py runserver

Время сборки и запуска Докер Образа ~ 20-30 мин.

Результат

🥇1 место в треке Sberbank Online

Выступление - 45 минута

Дополнительные ссылки

Модель ABAE - https://github.com/madrugado/Attention-Based-Aspect-Extraction

Модель ABAE (org) - https://github.com/ruidan/Unsupervised-Aspect-Extraction

Полная статья - https://www.aclweb.org/anthology/P17-1036.pdf

iOS приложение - https://github.com/godemodegame/SberOnline

Генерация авто ответа - https://github.com/MaximDmitrievich/SberOnline

Контакты

mr8bit@yandex.ru

Cite

If you use the code, please consider citing original paper:

@InProceedings{he-EtAl:2017:Long2,
  author    = {He, Ruidan  and  Lee, Wee Sun  and  Ng, Hwee Tou  and  Dahlmeier, Daniel},
  title     = {An Unsupervised Neural Attention Model for Aspect Extraction},
  booktitle = {Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)},
  month     = {July},
  year      = {2017},
  address   = {Vancouver, Canada},
  publisher = {Association for Computational Linguistics}
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

readme.md

readme.md

Описание задачи

Описание решения

Изображения

Технические особенности

Результат

Дополнительные ссылки

Контакты

Cite

Files

readme.md

Latest commit

History

readme.md

File metadata and controls

Описание задачи

Описание решения

Изображения

Технические особенности

Результат

Дополнительные ссылки

Контакты

Cite