-
Продвинутые статистические тесты в Python: причинность, бустрэп и непараметрические методы
Стандартные статистические тесты опираются на строгие допущения. Они предполагают нормальное распределение данных, независимость наблюдений и линейные связи между переменными. Финансовые данные этим требованиям обычно не соответствуют. Доходности активов имеют тяжелые хвосты распределений. Волатильность склонна группироваться во времени. Связи между финансовыми инструментами часто нелинейны и тоже меняются со временем. Продвинутые статистические методы решают задачи, с которыми…
-
Автоматизация заполнения пропусков на основе сравнения 14 методов
Пропуски в данных или NaN — это одна из самых частых проблем, с которой сталкиваются аналитики. И мало эти пропуски найти, важно еще правильно поработать с ними. Библиотека pandas предлагает множество методов замены пропусков, но на практике нередко возникает другой вопрос: а какой метод лучше выбрать, чтобы не исказить данные и сохранить их изначальный смысл…
-
Библиотека SciPy: оптимизация, статистика и численные методы в Python
SciPy представляет собой фундаментальную библиотеку для научных и инженерных вычислений в Python. Она расширяет возможности NumPy, добавляя алгоритмы оптимизации, статистического анализа, обработки сигналов и численных методов. В отличие от базовых операций с массивами, SciPy предоставляет готовые решения для сложных математических задач: от поиска экстремумов функций до проверки статистических гипотез. Для специалистов в области финансового и…
-
Тест Чоу (Chow Test) для определения структурных сдвигов временных рядов
Финансовые временные ряды почти всегда содержат структурные сдвиги — моменты, когда рынок меняет поведение. В такие моменты стандартные модели перестают быть устойчивыми: коэффициенты регрессии перестают сохранять свои значения на разных участках ряда, изменяются направления и силы связей между переменными, а сами уравнения, хорошо описывающие данные до разрыва, уже не отражают поведение ряда после него. В…
-
Виды статистических распределений в финансах: их интерпретация и применение
Статистические распределения формируют математический фундамент финансового анализа. Выбор адекватной модели распределения влияет на точность оценки рисков, корректность ценообразования активов и надежность прогнозных моделей. Понимание свойств различных распределений позволяет избежать систематических ошибок при принятии инвестиционных решений. Нормальное распределение: базовая модель и ее ограничения Нормальное (гауссово) распределение — наиболее популярное в финансовом моделировании. Распределение задается двумя параметрами:…
-
Тестирование статистических гипотез с помощью Python
Статистические тесты позволяют принимать обоснованные решения на основе данных. В финансовом анализе, исследованиях и разработке моделей машинного обучения проверка гипотез определяет валидность предположений о данных, выявляет значимые различия между группами и подтверждает применимость математических методов. Python предоставляет инструменты для реализации статистических тестов через библиотеки scipy, statsmodels и numpy. Правильное применение этих методов снижает риск ошибочных…
-
Расширенные методы тестирования стационарности рядов: тесты KPSS, Phillips-Perron и другие
Стационарность временного ряда означает постоянство его статистических свойств во времени. Это не академическая абстракция — от корректного определения стационарности зависит выбор модели прогнозирования, риск-менеджмент и конечная прибыльность стратегии. Нестационарные ряды могут привести к ложным корреляциям, переобучению моделей и катастрофическим потерям в реальной торговле. Проблемы классического теста Дики-Фуллера Расширенный тест Дики-Фуллера (ADF) стал стандартом де-факто для…
-
Доверительная вероятность и уровень значимости в финансовом Data Science
В мире Data Science принятие решений на основе данных требует не только вычислений, но и грамотной интерпретации статистических результатов. Одними из ключевых понятий при проверке гипотез являются доверительная вероятность (confidence level) и уровень значимости (significance level). Эти параметры помогают нам определить, насколько можно доверять полученным выводам и где пролегает граница между случайным совпадением и статистически…
-
Преобразование Бокса-Кокса и ADF тест (Дики-Фуллера)
В мире количественного анализа существуют инструменты, которые на первый взгляд кажутся просто академическими упражнениями, однако при внедрении оказываются фундаментальными строительными блоками серьезной аналитики. Преобразование Бокса-Кокса и расширенный тест Дики-Фуллера (ADF) относятся именно к такой категории методов. Многие аналитики используют эти методы поверхностно, применяя их как «черные ящики» без понимания внутренней механики и ограничений. Такой подход…
-
Информационные критерии: AIC (Akaike Information Criterion) и BIC (Bayesian Information Criterion)
Информационные критерии Акаике и BIC часто используют для выбора оптимальной модели машинного обучения. Они помогают сбалансировать точность аппроксимации и сложность модели, предотвращая переобучение и избыточную параметризацию. В отличие от чисто статистических метрик, AIC и BIC учитывают не только качество подгонки модели к данным, но и число используемых параметров, что делает их особенно полезными при сравнении…