Проект: Классификация и Регрессия с использованием Случайных Лесов

Описание проекта

Данный проект посвящен изучению алгоритма Случайных Лесов (Random Forest) как для задач классификации, так и для регрессии. Мы также проводим сравнительный анализ различных методов регрессии, чтобы понять их эффективность в решении задачи предсказания.

Содержание

Часть 1: Классификация с использованием случайных лесов
Часть 2: Регрессия с использованием случайных лесов
Сравнительный анализ методов регрессии
Заключение

Часть 1: Классификация с использованием случайных лесов

Данные

Мы используем набор данных "Palmer Penguins" для классификации видов пингвинов на основе их физических атрибутов. Данные содержат следующие переменные:

species: разновидности пингвинов (Chinstrap, Adélie, Gentoo)
culmen_length_mm: длина клюва (мм)
culmen_depth_mm: высота клюва (мм)
flipper_length_mm: длина крыла (мм)
body_mass_g: масса тела (г)
island: название острова
sex: пол пингвина

Цель

Создать модель классификации, которая поможет определять вид пингвина на основе его физических атрибутов, упрощая работу исследователей без привлечения опытного биолога.

Исследование гиперпараметров

Мы исследуем влияние гиперпараметров случайного леса, таких как количество деревьев (Number of Estimators), и визуализируем зависимость ошибок от количества деревьев.

Часть 2: Регрессия с использованием случайных лесов

Данные

Используются данные буровой компании для предсказания плотности камня по отраженному сигналу на различных частотах. Это помогает в оптимизации замены буровых головок.

Цель

Определить наиболее эффективную модель регрессии для предсказания изменения плотности камня.

Сравнительный анализ методов регрессии

Для выполнения задачи регрессии были использованы следующие модели:

Линейная регрессия
Полиномиальная регрессия
Пайплайн для степеней полинома
Регрессия KNN
Деревья решений для регрессии
Метод опорных векторов для регрессии
Случайные леса для регрессии
Градиентный бустинг
Adaboost

Мы сравниваем производительность каждой модели, оценивая их точность и ошибки на тестовых данных.

Заключение

В проекте были изучены возможности алгоритма случайных лесов для классификации и регрессии. Сравнительный анализ различных методов регрессии позволил выявить их сильные и слабые стороны в контексте специфической задачи.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Проект: Классификация и Регрессия с использованием Случайных Лесов

Описание проекта

Содержание

Часть 1: Классификация с использованием случайных лесов

Данные

Цель

Исследование гиперпараметров

Часть 2: Регрессия с использованием случайных лесов

Данные

Цель

Сравнительный анализ методов регрессии

Заключение

Files

README.md

Latest commit

History

README.md

File metadata and controls

Проект: Классификация и Регрессия с использованием Случайных Лесов

Описание проекта

Содержание

Часть 1: Классификация с использованием случайных лесов

Данные

Цель

Исследование гиперпараметров

Часть 2: Регрессия с использованием случайных лесов

Данные

Цель

Сравнительный анализ методов регрессии

Заключение