-
Продвинутые статистические тесты в Python: причинность, бустрэп и непараметрические методы
Стандартные статистические тесты опираются на строгие допущения. Они предполагают нормальное распределение данных, независимость наблюдений и линейные связи между переменными. Финансовые данные этим требованиям обычно не соответствуют. Доходности активов имеют тяжелые хвосты распределений. Волатильность склонна группироваться во времени. Связи между финансовыми инструментами часто нелинейны и тоже меняются со временем. Продвинутые статистические методы решают задачи, с которыми…
-
Тест Чоу (Chow Test) для определения структурных сдвигов временных рядов
Финансовые временные ряды почти всегда содержат структурные сдвиги — моменты, когда рынок меняет поведение. В такие моменты стандартные модели перестают быть устойчивыми: коэффициенты регрессии перестают сохранять свои значения на разных участках ряда, изменяются направления и силы связей между переменными, а сами уравнения, хорошо описывающие данные до разрыва, уже не отражают поведение ряда после него. В…
-
Модель ETS для прогнозирования временных рядов
Экспоненциальное сглаживание остается одним из надежных методов прогнозирования временных рядов в количественном анализе. Модель ETS (Error, Trend, Seasonality) представляет формализованную версию этого подхода через представление в пространстве состояний. Метод обеспечивает баланс между простотой реализации и качеством прогнозов для данных с выраженной трендовой и сезонной структурой.. ETS работает через рекурсивное обновление компонентов модели: уровня, тренда и…
-
Алгоритмы оценки хеджирующих стратегий
Эффективность хеджирования измеряется не столько доходностью, сколько степенью снижения риска. Портфель может показывать нулевую или отрицательную доходность, но если волатильность снизилась на 70%, хедж работает. Задача алгоритмов оценки — количественно определить, насколько инструмент защиты выполняет свою функцию и оправдывает затраты на его поддержание. Метрики эффективности хеджирования Классические портфельные метрики (коэффициент Шарпа, максимальная просадка) не учитывают…
-
Тестирование статистических гипотез с помощью Python
Статистические тесты позволяют принимать обоснованные решения на основе данных. В финансовом анализе, исследованиях и разработке моделей машинного обучения проверка гипотез определяет валидность предположений о данных, выявляет значимые различия между группами и подтверждает применимость математических методов. Python предоставляет инструменты для реализации статистических тестов через библиотеки scipy, statsmodels и numpy. Правильное применение этих методов снижает риск ошибочных…
-
Расширенные методы тестирования стационарности рядов: тесты KPSS, Phillips-Perron и другие
Стационарность временного ряда означает постоянство его статистических свойств во времени. Это не академическая абстракция — от корректного определения стационарности зависит выбор модели прогнозирования, риск-менеджмент и конечная прибыльность стратегии. Нестационарные ряды могут привести к ложным корреляциям, переобучению моделей и катастрофическим потерям в реальной торговле. Проблемы классического теста Дики-Фуллера Расширенный тест Дики-Фуллера (ADF) стал стандартом де-факто для…
-
Доверительная вероятность и уровень значимости в финансовом Data Science
В мире Data Science принятие решений на основе данных требует не только вычислений, но и грамотной интерпретации статистических результатов. Одними из ключевых понятий при проверке гипотез являются доверительная вероятность (confidence level) и уровень значимости (significance level). Эти параметры помогают нам определить, насколько можно доверять полученным выводам и где пролегает граница между случайным совпадением и статистически…
-
Ad hoc задачи в финансовой аналитике
Ad hoc задачи — это нестандартные, часто разовые аналитические исследования, выполняемые для решения конкретной проблемы или ответа на специфический вопрос. В отличие от регулярных отчетов и стандартизированных аналитических процедур, они требуют индивидуального подхода, творческого мышления и глубокого понимания предметной области. Ad hoc можно перевести с латинского как «для этого», «для данного случая». То есть это…
-
Информационные критерии: AIC (Akaike Information Criterion) и BIC (Bayesian Information Criterion)
Информационные критерии Акаике и BIC часто используют для выбора оптимальной модели машинного обучения. Они помогают сбалансировать точность аппроксимации и сложность модели, предотвращая переобучение и избыточную параметризацию. В отличие от чисто статистических метрик, AIC и BIC учитывают не только качество подгонки модели к данным, но и число используемых параметров, что делает их особенно полезными при сравнении…
-
Сглаживание временных рядов полиномиальными регрессиями. Типы регрессий
Временные ряды реальных биржевых котировок представляют собой настоящий вызов для любого аналитика. Традиционные подходы к сглаживанию таких рядов часто дают посредственные результаты, особенно когда речь идет о нелинейных зависимостях и сложных паттернах поведения активов. Полиномиальные регрессии открывают совершенно иные возможности для понимания структуры данных и выявления скрытых закономерностей, которые ускользают от стандартных методов. Основная проблема…