-
Лаговые переменные и их правильное использование. Избегаем data leakage в финансовых моделях
В трейдинге и количественном анализе существует ряд ошибок, которые могут полностью уничтожить потенциальную прибыльность модели. Одна из таких — неправильное использование лаговых переменных, она приводит к утечке данных (data leakage). Эта проблема особенно критична в финансовых моделях, где требуется быстрая реакция на изменения рынка. В отличие от многих других областей машинного обучения, где порядок наблюдений…
-
Метод главных компонент (PCA) и факторный анализ (FA) данных
В современном мире анализа данных мы постоянно сталкиваемся с проблемой «проклятия размерности» — ситуацией, когда количество признаков в датасете становится настолько большим, что традиционные методы анализа начинают давать сбои. Метод главных компонент (Principal Component Analysis, PCA) и факторный анализ (Factor Analysis, FA) представляют собой два фундаментальных подхода к решению этой проблемы, каждый из которых имеет…
-
Прогнозирование трафика и конверсий сайта с помощью Catboost
За последние годы я реализовал множество проектов по прогнозированию метрик веб-сайтов, и могу с уверенностью сказать, что алгоритм CatBoost от Яндекса произвел настоящую революцию в этой области. В данной статье я поделюсь своим опытом использования CatBoost для создания точных прогнозов трафика и конверсий, а также расскажу о тонкостях работы с этим инструментом на реальных данных…
-
Как предсказать отток клиентов с помощью машинного обучения
Клиентский отток — это одна из ключевых проблем современного бизнеса, особенно для компаний, работающих по модели подписки или регулярных продаж. В этой статье я поделюсь своим опытом и расскажу, как построить эффективную модель машинного обучения для предсказания оттока. Почему прогнозирование оттока так важно? Привлечение нового клиента обходится бизнесу в 5-25 раз дороже, чем удержание существующего.…
-
Продвинутые методы предиктивной аналитики с глубокими нейронными сетями
В современном мире данные стали новой нефтью, а способность предсказывать будущие тенденции на их основе – критически важным конкурентным преимуществом. За последние несколько лет я реализовал десятки проектов в области предиктивной аналитики с использованием глубокого обучения и нейронных сетей, и сегодня хочу поделиться своим опытом и знаниями в этой захватывающей области. Преимущества deep learning в…
-
Создание ML-модели прогноза действий пользователей интернет-магазина и рекомендательной системы
Сегодня в электронной коммерции успех бизнеса во-многом зависит от способности предугадывать потребности клиентов и предлагать им именно то, что они ищут. И, как показал опыт, правильно реализованные модели могут значительно повысить конверсию, увеличить средний чек и улучшить лояльность клиентов. В этой статье я поделюсь своим опытом и знаниями о том, как создать ML-модель прогноза действий…