Skip to content

Latest commit

 

History

History
64 lines (46 loc) · 2.94 KB

readme.md

File metadata and controls

64 lines (46 loc) · 2.94 KB

Описание задачи

Есть 450 тыс. отзывов из AppStore и GooglePlay, отзывы не как не размечены. Есть команды (30+ шт.) у каждой команды есть своя зона ответственности. Необходимо выполнить классификацию и перенаправить отзыв в соответствии с зоной ответственности команды.

Описание решения

Тематическое моделирование с использование модели (Attention Based Aspect Extraction). Собрали данные, и начали обучать с изменением количества аспектов (топиков) дошли до 130 модель показала 0.7 когерентности время обучении 7 часов, loss при остановке 1.134. Самостоятельно интерпретировали результаты ABAE разделив их в соответствии с зонами ответственности команд.

Изображения

Ввод

Результат

Технические особенности

Модель реализована с использование модели ABAE, для запуска необходимо скачать w2v модель и положить model.bin в папку src/main/preprocessed_data/appstore/.

Локальный запуск.

virtualenv venv
eval $(cat .env.dev | sed 's/^/export /')
cd src
pip install -r requirements.txt
python manage.py runserver

Время сборки и запуска Докер Образа ~ 20-30 мин.

Результат

🥇1 место в треке Sberbank Online

Выступление - 45 минута

Дополнительные ссылки

Модель ABAE - https://github.com/madrugado/Attention-Based-Aspect-Extraction

Модель ABAE (org) - https://github.com/ruidan/Unsupervised-Aspect-Extraction

Полная статья - https://www.aclweb.org/anthology/P17-1036.pdf

iOS приложение - https://github.com/godemodegame/SberOnline

Генерация авто ответа - https://github.com/MaximDmitrievich/SberOnline

Контакты

[email protected]

Cite

If you use the code, please consider citing original paper:

@InProceedings{he-EtAl:2017:Long2,
  author    = {He, Ruidan  and  Lee, Wee Sun  and  Ng, Hwee Tou  and  Dahlmeier, Daniel},
  title     = {An Unsupervised Neural Attention Model for Aspect Extraction},
  booktitle = {Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)},
  month     = {July},
  year      = {2017},
  address   = {Vancouver, Canada},
  publisher = {Association for Computational Linguistics}
}