-
Скользящие оконные функции в Pandas
Скользящие оконные функции решают фундаментальную задачу анализа временных рядов: извлечение локальных паттернов из последовательных данных. Метод основан на применении агрегирующих операций к подмножествам наблюдений фиксированного размера, которые последовательно сдвигаются вдоль временной оси. Библиотека Pandas предоставляет три типа окон для работы с временными рядами: rolling — фиксированный размер; expanding — растущее от начала; exponentially weighted —…
-
Автоматизация заполнения пропусков на основе сравнения 14 методов
Пропуски в данных или NaN — это одна из самых частых проблем, с которой сталкиваются аналитики. И мало эти пропуски найти, важно еще правильно поработать с ними. Библиотека pandas предлагает множество методов замены пропусков, но на практике нередко возникает другой вопрос: а какой метод лучше выбрать, чтобы не исказить данные и сохранить их изначальный смысл…
-
Собственные числа и собственные векторы в финансах: разложения PCA и SVD
Анализ главных компонент (PCA) — один из популярных способов изучения взаимосвязей между доходностями активов и их оценке в финансовом анализе. Метод основан на разложении ковариационной матрицы доходностей: собственные векторы определяют направления факторов, а собственные числа показывают, сколько дисперсии объясняет каждый фактор. PCA позволяет выделить доминирующие источники совместной изменчивости и отделить систематический риск от несистематического. Практическое…
-
Прогнозирование временных рядов с xLSTM
Классические модели прогнозирования временных рядов, такие как градиентный бустинг, хорошо работают на табличных данных и с короткими историческими окнами. Однако при анализе длинных последовательностей и рядов с взаимозависимыми признаками их эффективность драматически падает. В таких случаях стоит присмотреться к нейронным сетям, так как они лучше моделируют сложные временные зависимости. Одним из интересных решений в этой…
-
Скорость и ускорение в последовательностях временных рядов. Методы расчета
В анализе временных рядов скорость показывает, как быстро изменяется значение показателя во времени, а ускорение — насколько стремительно меняется сама скорость. По сути, это первая и вторая производные функции по времени, которые в дискретных данных приближенно рассчитывают как разности между последовательными значениями. В алгоритмическом трейдинге эти метрики применяются для детекции разворотов тренда, измерения волатильности режима…
-
Wavelet-анализ финансовых данных: преобразование Фурье vs вейвлеты, многомасштабный анализ волатильности
Финансовые временные ряды нестационарны: волатильность меняется, тренды возникают и исчезают, корреляции нестабильны. Классический частотный анализ предполагает постоянство частотных компонент во времени, что противоречит природе рыночных данных. Вейвлет-преобразование решает эту проблему через одновременный анализ во временной и частотной областях. Эта статья сравнивает подходы Фурье и вейвлетов к анализу финансовых данных, объясняет механику вейвлет-преобразования и показывает практическое…
-
Модель ETS для прогнозирования временных рядов
Экспоненциальное сглаживание остается одним из надежных методов прогнозирования временных рядов в количественном анализе. Модель ETS (Error, Trend, Seasonality) представляет формализованную версию этого подхода через представление в пространстве состояний. Метод обеспечивает баланс между простотой реализации и качеством прогнозов для данных с выраженной трендовой и сезонной структурой.. ETS работает через рекурсивное обновление компонентов модели: уровня, тренда и…
-
Обучение baseline моделей для временных рядов: инжиниринг признаков, регуляризация, оценка качества
Бейзлайн (baseline) — это простая стартовая модель, определяющая минимально приемлемый уровень качества следующих ML-моделей. Если другие модели с более сложной архитектурой выдают метрики хуже бейзлайна, значит, их применение неоправданно. Нередко так бывает, что линейная регрессия с правильными признаками превосходит нейросеть со слабой подготовкой данных. А градиентный бустинг с грамотной регуляризацией обходит LSTM на горизонте прогноза…
-
Алгоритмы сбора биржевых данных: практическое руководство
Финансовые рынки генерируют колоссальные объемы данных: котировки тысяч активов, отчеты компаний, новостные потоки. Умение быстро и качественно собирать, обрабатывать и агрегировать эти данные — важное конкурентное преимущество. Профессиональный подход к сбору биржевых данных — это не просто загрузка котировок. Это комплексная система, включающая мониторинг источников, обработку аномалий, синхронизацию временных рядов из разных источников и построение…
-
LSTM для прогнозирования волатильности: многослойные архитектуры и sequence-to-sequence подходы
В течение последних нескольких лет работы с временными рядами финансовых данных я неоднократно сталкивался с проблемой прогнозирования волатильности. Классические GARCH модели и их вариации показывают ограниченную эффективность при краткосрочных и intraday-стратегиях, особенно когда рынок демонстрирует резкие структурные сдвиги. Сегодня хочу поделиться своими наблюдениями о применении LSTM архитектур для решения этой задачи — от базовых многослойных…