-
Байесовский информационный критерий (BIC)
Байесовский информационный критерий (BIC, Bayesian Information Criterion) — метрика для сравнения статистических моделей, балансирующая качество подгонки и сложность модели. Предложен Гидеоном Шварцем в 1978 году, поэтому в литературе встречается также как критерий Шварца (SBC, Schwarz Bayesian Criterion). Критерий BIC решает фундаментальную проблему выбора модели: чем больше параметров, тем лучше модель описывает обучающие данные — но…
-
Анализ временных рядов с помощью нейросетей: полный обзор подходов
Анализ временных рядов — одна из наиболее частых задач, с которой сталкиваются аналитики и дата-саентисты: трафик сайтов, экономические показатели, продажи и спрос, биржевые котировки, потребление электроэнергии, датчики IoT, медицинские сигналы… Все это временные ряды. Несмотря на то, что эта область очень хорошо изучена, моделирование и прогнозирование временных рядов по-прежнему остается одной из наиболее сложных задач.…
-
Библиотека Greykite в Python: установка, настройка и практические примеры прогнозирования рядов
Greykite — библиотека для прогнозирования временных рядов с открытым исходным кодом, разработанная командой LinkedIn и выпущенная в 2021 году. Основу составляет алгоритм Silverkite — быстрая аддитивная модель, построенная на ridge-регрессии с богатым набором фич: тренд, сезонность, праздники, взаимодействия между компонентами. В отличие от большинства библиотек прогнозирования, Greykite дает полный контроль над структурой модели без необходимости…
-
Скользящие оконные функции в Pandas
Скользящие оконные функции решают фундаментальную задачу анализа временных рядов: извлечение локальных паттернов из последовательных данных. Метод основан на применении агрегирующих операций к подмножествам наблюдений фиксированного размера, которые последовательно сдвигаются вдоль временной оси. Библиотека Pandas предоставляет три типа окон для работы с временными рядами: rolling — фиксированный размер; expanding — растущее от начала; exponentially weighted —…
-
Автоматизация заполнения пропусков на основе сравнения 14 методов
Пропуски в данных или NaN — это одна из самых частых проблем, с которой сталкиваются аналитики. И мало эти пропуски найти, важно еще правильно поработать с ними. Библиотека pandas предлагает множество методов замены пропусков, но на практике нередко возникает другой вопрос: а какой метод лучше выбрать, чтобы не исказить данные и сохранить их изначальный смысл…
-
Собственные числа и собственные векторы в финансах: разложения PCA и SVD
Анализ главных компонент (PCA) — один из популярных способов изучения взаимосвязей между доходностями активов и их оценке в финансовом анализе. Метод основан на разложении ковариационной матрицы доходностей: собственные векторы определяют направления факторов, а собственные числа показывают, сколько дисперсии объясняет каждый фактор. PCA позволяет выделить доминирующие источники совместной изменчивости и отделить систематический риск от несистематического. Практическое…
-
Прогнозирование временных рядов с xLSTM
Классические модели прогнозирования временных рядов, такие как градиентный бустинг, хорошо работают на табличных данных и с короткими историческими окнами. Однако при анализе длинных последовательностей и рядов с взаимозависимыми признаками их эффективность драматически падает. В таких случаях стоит присмотреться к нейронным сетям, так как они лучше моделируют сложные временные зависимости. Одним из интересных решений в этой…
-
Скорость и ускорение в последовательностях временных рядов. Методы расчета
В анализе временных рядов скорость показывает, как быстро изменяется значение показателя во времени, а ускорение — насколько стремительно меняется сама скорость. По сути, это первая и вторая производные функции по времени, которые в дискретных данных приближенно рассчитывают как разности между последовательными значениями. В алгоритмическом трейдинге эти метрики применяются для детекции разворотов тренда, измерения волатильности режима…
-
Wavelet-анализ финансовых данных: преобразование Фурье vs вейвлеты, многомасштабный анализ волатильности
Финансовые временные ряды нестационарны: волатильность меняется, тренды возникают и исчезают, корреляции нестабильны. Классический частотный анализ предполагает постоянство частотных компонент во времени, что противоречит природе рыночных данных. Вейвлет-преобразование решает эту проблему через одновременный анализ во временной и частотной областях. Эта статья сравнивает подходы Фурье и вейвлетов к анализу финансовых данных, объясняет механику вейвлет-преобразования и показывает практическое…
-
Модель ETS для прогнозирования временных рядов
Экспоненциальное сглаживание остается одним из надежных методов прогнозирования временных рядов в количественном анализе. Модель ETS (Error, Trend, Seasonality) представляет формализованную версию этого подхода через представление в пространстве состояний. Метод обеспечивает баланс между простотой реализации и качеством прогнозов для данных с выраженной трендовой и сезонной структурой.. ETS работает через рекурсивное обновление компонентов модели: уровня, тренда и…