Прогнозирование количества заказов такси на следующий час

Описание проекта

Компания "Жёлтый путь" собрала исторические данные о заказах такси в аэропортах. Цель проекта - разработать модель для прогнозирования количества заказов такси на следующий час, чтобы привлекать больше водителей в периоды пиковой нагрузки.

Целевая метрика: RMSE на тестовой выборке должна быть не более 48.

Структура проекта

  1. Подготовка данных
    • Загрузка и ресемплинг данных по часам
    • Исследование временного ряда (тренды, сезонность)
    • Создание признаков (лаги, скользящие статистики и др.)
  2. Анализ данных
    • Визуализация временного ряда
    • Разведочный анализ (EDA)
    • Проверка на стационарность
  3. Построение и оценка моделей
    • Линейная регрессия
    • Решающие деревья
    • Градиентный бустинг (CatBoost, LightGBM)
    • Подбор гиперпараметров
    • Оценка качества моделей
  4. Выводы и рекомендации
    • Выбор лучшей модели
    • Интерпретация результатов
    • Рекомендации по использованию

Используемые технологии

Ключевые этапы

  1. Загрузка и предварительная обработка данных
  2. Генерация признаков для временного ряда
  3. Разделение данных на обучающую и тестовую выборки
  4. Обучение и оценка различных моделей
  5. Подбор гиперпараметров с кросс-валидацией
  6. Анализ результатов и выбор лучшей модели