-
Важность признаков полученных из ML-моделей (Feature Importance)
Важность признаков (Feature Importance) — инструмент для понимания того, какие переменные вносят наибольший вклад в предсказания модели. Методы оценки важности признаков решают несколько практических задач: отбор релевантных предикторов, детекцию утечек данных, снижение размерности для ускорения инференса. Выбор метода зависит от типа модели, структуры данных и требований к интерпретируемости. Разные подходы к оценке важности дают разные…
-
Настройки градиентного бустинга. Гиперпараметры бустинговых ML-моделей
Градиентный бустинг занимает особое место в арсенале финансовых аналитиков. В отличие от примитивных методов вроде линейной регрессии или банальных индикаторов технического анализа, бустинговые алгоритмы способны улавливать сложные нелинейные зависимости в данных, что особенно важно при работе с финансовыми временными рядами. Однако их эффективность напрямую зависит от корректной настройки множества гиперпараметров, каждый из которых влияет на…
-
Вероятностные модели для прогнозирования цен биржевых активов
В этой статье я хочу поделиться своим подходом к использованию вероятностных моделей для прогнозирования цен активов. Мы разберем, почему традиционные методы часто подводят, какие подходы применяют профессионалы в хедж-фондах, и как вы можете использовать Python для реализации таких моделей. Моя цель — создать подробное руководство, которое будет полезно как для профессионалов в области data science,…
-
Изучаем опционы на Netflix: комплексный анализ и стратегии
Стоимость акций Netflix, одного из мировых лидеров стриминговой индустрии, перешагнула отметку в $1000 и демонстрирует значительную волатильность, что делает этот актив привлекательным инструментом для опционной торговли. Как специалист в области анализа данных и количественных исследований, я решил провести исследование опционов на Netflix, возможных стратегий торговли и поделиться с вами его результатами. Типы опционов на Netflix…
-
Классические методы предиктивной аналитики
Предиктивная аналитика — это область анализа данных, которая использует статистические алгоритмы, машинное обучение и методы искусственного интеллекта для прогнозирования будущих событий или поведения на основе исторических данных. Эта дисциплина находится на стыке статистики, информатики и бизнес-аналитики, что делает ее чрезвычайно мощным инструментом для принятия решений в различных отраслях. Основная идея предиктивной аналитики заключается в том,…
-
Создание ML-модели прогноза действий пользователей интернет-магазина и рекомендательной системы
Сегодня в электронной коммерции успех бизнеса во-многом зависит от способности предугадывать потребности клиентов и предлагать им именно то, что они ищут. И, как показал опыт, правильно реализованные модели могут значительно повысить конверсию, увеличить средний чек и улучшить лояльность клиентов. В этой статье я поделюсь своим опытом и знаниями о том, как создать ML-модель прогноза действий…
-
Прогнозирование трафика и конверсий сайта с помощью XGBoost
Являясь экспертом в области анализа данных и машинного обучения, я часто сталкиваюсь с задачами прогнозов в веб-аналитике. Одна из наиболее интересных и важных задач — это прогнозирование трафика и конверсий сайта. В этой статье я хочу поделиться своим опытом использования алгоритма XGBoost для решения этой задачи. Почему важно прогнозировать трафик и конверсии сайта? Прежде чем…
-
Прогнозирование конверсии посетителей интернет-магазина в покупателей с помощью машинного обучения
В этой статье я расскажу о своем опыте работы с анализом и прогнозированием конверсий веб-сайта в рамках моего участия в соревнованиях Kaggle Data Challenge. Всем участникам соревнования предлагалось решить одну проблему — повысить конверсию веб-сайта и тем самым повысить выручку онлайн-бизнеса. Легенда проекта такова: Владельцы интернет-магазина ювелирных изделий столкнулись с тем, что больше трафика не…