Skip to content

Latest commit

 

History

History
37 lines (28 loc) · 2.15 KB

README.md

File metadata and controls

37 lines (28 loc) · 2.15 KB

Проект

Реализация

  • проведён анализ данных
  • построена модель прогноза доходов полученных от налогов физических лиц и организаций
  • разработан прототип сайта принимающий данные по СЭР
  • разработан телеграм-бот

Стек технологий

  • flask, docker, python, numpy, pandas, sklearn, catboost, telegram

Анализ данных в папке notebooks:

  • EDA_budget.ipynb - первичный анализ данных по расходам и доходам бюджета
  • EDA_socio-economic.ipynb - углубленный анализ данных СЭР (расчёт корреляций)
  • extract_features.ipynb - очистка и обработка данных по СЭР
  • extract_target.ipynb - очистка и обработка данных по фактическим доходам бюджета
  • model.ipynb - построение, анализ и сравнение моделей прогноза
  • model-class.ipynb - реализация класса с ансамблем моделей (стэкинг) (на первом уровне использованы модели Linear, Ridge, ARIMA, CatBoost, а в качестве мета-модели Ridge)

Исходные тексты модели прогноза в папке src

Реализация веб сервиса в папке budget

Установка с помощью Docker

Реализация телеграм бота в папке telegram bot

Прототив сервиса доступно по адресу:
@budgethackersbot (прототип)

Команда проекта

Сергей Земсков - analytics, DA, ML
Анастасия Казакова - programming
Иван Бушуев - analytics, communication
Кристина Иванова - UX дизайнер
Юлия Леснова - analytics