-
Анализ временных рядов с помощью нейросетей: полный обзор подходов
Анализ временных рядов — одна из наиболее частых задач, с которой сталкиваются аналитики и дата-саентисты: трафик сайтов, экономические показатели, продажи и спрос, биржевые котировки, потребление электроэнергии, датчики IoT, медицинские сигналы… Все это временные ряды. Несмотря на то, что эта область очень хорошо изучена, моделирование и прогнозирование временных рядов по-прежнему остается одной из наиболее сложных задач.…
-
Прогнозирование динамики фьючерсов с XGBoost
Градиентный бустинг XGBoost занял устойчивое место в арсенале квант-аналитиков не случайно. На табличных данных с нелинейными зависимостями он стабильно превосходит линейные модели, а по скорости обучения и интерпретируемости выигрывает у нейросетей. Фьючерсные данные — именно тот тип данных, где эти преимущества реализуются в полной мере: высокая размерность признаков, нелинейные взаимодействия между ними, шум, превышающий сигнал…
-
Современные методы STL декомпозиции (STL Decomposition)
STL (Seasonal and Trend decomposition using Loess) — один из фундаментальных инструментов анализа временных рядов. Метод разделяет ряд на три компоненты: тренд, сезонность и остаток. Это позволяет анализировать каждую составляющую независимо, строить более точные прогнозы и выделять аномалии. С момента публикации оригинальной работы Cleveland et al. (1990) метод существенно развился. Современные расширения снимают большинство ограничений…
-
Библиотека Greykite в Python: установка, настройка и практические примеры прогнозирования рядов
Greykite — библиотека для прогнозирования временных рядов с открытым исходным кодом, разработанная командой LinkedIn и выпущенная в 2021 году. Основу составляет алгоритм Silverkite — быстрая аддитивная модель, построенная на ridge-регрессии с богатым набором фич: тренд, сезонность, праздники, взаимодействия между компонентами. В отличие от большинства библиотек прогнозирования, Greykite дает полный контроль над структурой модели без необходимости…
-
Градиентный бустинг: концепция и механизм работы
Градиентный бустинг относится к семейству ансамблевых методов машинного обучения, где финальное предсказание формируется как взвешенная сумма предсказаний множества слабых моделей. Ключевое отличие от других ансамблевых подходов — последовательное обучение, при котором каждая новая модель корректирует ошибки предыдущих. Алгоритм строит композицию из простых моделей (чаще всего деревьев решений малой глубины), добавляя их итеративно и минимизируя функцию…
-
Долгосрочное прогнозирование динамики облигаций с помощью ансамбля статистических моделей
Долгосрочное прогнозирование динамики облигаций — одна из самых сложных задач финансовой аналитики. На горизонтах в 12 месяцев и более даже относительно стабильные рынки перестают вести себя «гладко»: усиливается влияние макроэкономических факторов, процентных ставок, медленных структурных сдвигов и поведенческих эффектов, что приводит к асимметричным реакциям на риски. В таких условиях многие модели машинного обучения формируют смещенные…
-
Прогнозирование временных рядов с xLSTM
Классические модели прогнозирования временных рядов, такие как градиентный бустинг, хорошо работают на табличных данных и с короткими историческими окнами. Однако при анализе длинных последовательностей и рядов с взаимозависимыми признаками их эффективность драматически падает. В таких случаях стоит присмотреться к нейронным сетям, так как они лучше моделируют сложные временные зависимости. Одним из интересных решений в этой…
-
Модель ETS для прогнозирования временных рядов
Экспоненциальное сглаживание остается одним из надежных методов прогнозирования временных рядов в количественном анализе. Модель ETS (Error, Trend, Seasonality) представляет формализованную версию этого подхода через представление в пространстве состояний. Метод обеспечивает баланс между простотой реализации и качеством прогнозов для данных с выраженной трендовой и сезонной структурой.. ETS работает через рекурсивное обновление компонентов модели: уровня, тренда и…
-
Обучение baseline моделей для временных рядов: инжиниринг признаков, регуляризация, оценка качества
Бейзлайн (baseline) — это простая стартовая модель, определяющая минимально приемлемый уровень качества следующих ML-моделей. Если другие модели с более сложной архитектурой выдают метрики хуже бейзлайна, значит, их применение неоправданно. Нередко так бывает, что линейная регрессия с правильными признаками превосходит нейросеть со слабой подготовкой данных. А градиентный бустинг с грамотной регуляризацией обходит LSTM на горизонте прогноза…
-
Чем отличается финансовый ML от других видов машинного обучения
Машинное обучение в финансах работает с данными, которые принципиально отличаются от изображений, текстов или табличных данных из других отраслей. Финансовые временные ряды нестационарны, зашумлены и подвержены частым структурным изменениям. Эти особенности требуют специфических подходов к моделированию, валидации и оценке качества. Сегодня стало модно подавать любые данные в трансформеры, большие языковые модели. Однако этот подход, как…