Skip to content

Подготовка данных для машинного обучения. Работа с выбросами, отсутствующими значениями и категориальными признаками.

License

Notifications You must be signed in to change notification settings

Komarov-Dmitry/Feature-Engineering

Repository files navigation

Feature-Engineering

Подготовка данных для машинного обучения. Работа с выбросами, отсутствующими значениями и категориальными признаками.

Этот проект посвящён подготовке данных, с акцентом на обработку выбросов, отсутствующих значений и категориальных признаков. Нашей основной целью является создание чистых и удобных для анализа наборов данных, которые могут быть эффективно использованы в алгоритмах машинного обучения.

📌 Цели Проекта

  1. Обработка Выбросов: Идентификация и обработка выбросов для улучшения модели.

  2. Заполнение Пропущенных Значений: Применение различных стратегий для работы с отсутствующими данными, таких как среднее, мода, медиана и использование моделирования.

  3. Обработка Категориальных Признаков: Преобразование категориальных данных в числовой формат с использованием таких методов, как кодирование one hot и label encoding.

🛠️ Инструменты и Технологии

  • Язык программирования: Python
  • Библиотеки:
    • pandas: для манипуляции и очистки данных
    • numpy: для численных вычислений
    • scikit-learn: для предобработки данных
    • matplotlib и seaborn: для визуализации данных

📊 Методы и Подходы

  • Обработка Выбросов:

    • Использование методов межквартильного размаха (IQR).
  • Заполнение, Удаление Пропущенных Значений:

    • Выбор стратегии заполнения на основе анализа данных.
  • Обработка Категориальных Признаков:

    • Применение различных методов кодирования категориальных данных.

📝 Заключение

Подготовка данных — критически важный этап процесса машинного обучения.

About

Подготовка данных для машинного обучения. Работа с выбросами, отсутствующими значениями и категориальными признаками.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published