-
Продвинутые статистические тесты в Python: причинность, бустрэп и непараметрические методы
Стандартные статистические тесты опираются на строгие допущения. Они предполагают нормальное распределение данных, независимость наблюдений и линейные связи между переменными. Финансовые данные этим требованиям обычно не соответствуют. Доходности активов имеют тяжелые хвосты распределений. Волатильность склонна группироваться во времени. Связи между финансовыми инструментами часто нелинейны и тоже меняются со временем. Продвинутые статистические методы решают задачи, с которыми…
-
Автоматизация заполнения пропусков на основе сравнения 14 методов
Пропуски в данных или NaN — это одна из самых частых проблем, с которой сталкиваются аналитики. И мало эти пропуски найти, важно еще правильно поработать с ними. Библиотека pandas предлагает множество методов замены пропусков, но на практике нередко возникает другой вопрос: а какой метод лучше выбрать, чтобы не исказить данные и сохранить их изначальный смысл…
-
Бэктестинг: что это такое и как правильно его проводить
Перед тем как запускать стратегию в реальную торговлю, ее много раз прогоняют на исторических данных. Бэктестинг — это тестирование стратегии на прошлых котировках, чтобы увидеть, как она вела бы себя в реальных рыночных условиях. Данный процесс позволяет заранее выявить слабые места стратегии и избежать ненужных потерь. Качественный бэктест требует понимания не только программирования, но и…
-
Матожидание в статистике и трейдинге
Математическое ожидание определяет среднее значение случайной величины при бесконечном количестве наблюдений. В трейдинге этот показатель отвечает на вопрос: какую прибыль или убыток принесет стратегия в долгосрочной перспективе. Стратегия с положительным матожиданием доходности генерирует прибыль при достаточном количестве сделок, стратегия с отрицательным — приводит к убыткам независимо от краткосрочных результатов. Понимание матожидания позволяет отделить случайную удачу…
-
Байесовская статистика и вывод в анализе рынков
Байесовская статистика предоставляет инструменты для решения ключевых проблем количественного анализа: учет режимных сдвигов, калибровка моделей на ограниченных выборках, оптимизация гиперпараметров стратегий и управление риском переобучения. Байесовский подход рассматривает вероятность как степень уверенности в гипотезе, а не как частоту события в бесконечной серии испытаний. Параметры модели становятся случайными величинами с распределениями, которые обновляются по мере поступления…
-
Алгоритмы сбора биржевых данных: практическое руководство
Финансовые рынки генерируют колоссальные объемы данных: котировки тысяч активов, отчеты компаний, новостные потоки. Умение быстро и качественно собирать, обрабатывать и агрегировать эти данные — важное конкурентное преимущество. Профессиональный подход к сбору биржевых данных — это не просто загрузка котировок. Это комплексная система, включающая мониторинг источников, обработку аномалий, синхронизацию временных рядов из разных источников и построение…
-
Алгоритмы расчета точек безубыточности стратегий
Точка безубыточности — это ключевой показатель, который позволяет понять, когда стратегия перестает приносить убытки и начинает работать в плюс. Рассчитав ее, можно оценить устойчивость торговой системы, уровень риска и потенциал роста. В данной статье мы разберем алгоритмы вычисления точек безубыточности, сравним разные подходы, способы применения для повышения эффективности стратегий. Математические основы безубыточности в торговле Традиционная…
-
CAGR (среднегодовая доходность) инвестиций
Compound Annual Growth Rate (CAGR) — это один из ключевых показателей, который помогает инвесторам, аналитикам и бизнесу оценивать эффективность вложений и темпы развития компании или рынка. В отличие от простой средней доходности, CAGR показывает усредненный годовой темп роста за определенный период, сглаживая колебания и предоставляя более точную картину динамики. Этот показатель широко используется в инвестиционном…
-
Библиотека ETNA в Python для прогнозирования временных рядов
Мне довелось работать с множеством инструментов для анализа временных рядов, и постоянно приходилось комбинировать различные библиотеки, чтобы получить полный цикл работы с временными рядами — от предобработки до бэктестинга, от подбора гиперпараметров до подготовки к деплою. Библиотека ETNA (Easy Time-series Analysis) от команды T-Bank AI Center решает эту проблему элегантно, предоставляя единый интерфейс для всех…
-
Доверительная вероятность и уровень значимости в финансовом Data Science
В мире Data Science принятие решений на основе данных требует не только вычислений, но и грамотной интерпретации статистических результатов. Одними из ключевых понятий при проверке гипотез являются доверительная вероятность (confidence level) и уровень значимости (significance level). Эти параметры помогают нам определить, насколько можно доверять полученным выводам и где пролегает граница между случайным совпадением и статистически…