-
Чем отличается финансовый ML от других видов машинного обучения
Машинное обучение в финансах работает с данными, которые принципиально отличаются от изображений, текстов или табличных данных из других отраслей. Финансовые временные ряды нестационарны, зашумлены и подвержены частым структурным изменениям. Эти особенности требуют специфических подходов к моделированию, валидации и оценке качества. Сегодня стало модно подавать любые данные в трансформеры, большие языковые модели. Однако этот подход, как…
-
Прогнозирование вероятности дефолта через логистическую регрессию
Прогнозирование вероятности дефолта — одна из ключевых задач в управлении кредитными рисками, которая помогает банкам, инвестиционным компаниям и бизнесу принимать более взвешенные решения. Существует множество инструментов для таких прогнозов, хотя логистическая регрессия — пожалуй, наиболее популярный. Она позволяет на основе набора факторов (например, дохода клиента, кредитной истории, уровня долговой нагрузки) оценить вероятность того, что заемщик…
-
Walk-Forward анализ на практике. Правильное тестирование стратегий на временных рядах
Walk-Forward анализ представляет собой методологию тестирования, которая моделирует реальные условия торговли, где мы постоянно получаем новые данные и должны адаптировать наши модели. Этот подход особенно важен в контексте финансовых рынков, где временная структура данных имеет критическое значение, а традиционные методы кросс-валидации могут давать обманчиво оптимистичные результаты. Фундаментальные проблемы традиционного тестирования Проблема временной зависимости в финансовых…
-
Лаговые переменные и их правильное использование. Избегаем data leakage в финансовых моделях
В трейдинге и количественном анализе существует ряд ошибок, которые могут полностью уничтожить потенциальную прибыльность модели. Одна из таких — неправильное использование лаговых переменных, она приводит к утечке данных (data leakage). Эта проблема особенно критична в финансовых моделях, где требуется быстрая реакция на изменения рынка. В отличие от многих других областей машинного обучения, где порядок наблюдений…