-
Градиентный бустинг: концепция и механизм работы
Градиентный бустинг относится к семейству ансамблевых методов машинного обучения, где финальное предсказание формируется как взвешенная сумма предсказаний множества слабых моделей. Ключевое отличие от других ансамблевых подходов — последовательное обучение, при котором каждая новая модель корректирует ошибки предыдущих. Алгоритм строит композицию из простых моделей (чаще всего деревьев решений малой глубины), добавляя их итеративно и минимизируя функцию…
-
Долгосрочное прогнозирование динамики облигаций с помощью ансамбля статистических моделей
Долгосрочное прогнозирование динамики облигаций — одна из самых сложных задач финансовой аналитики. На горизонтах в 12 месяцев и более даже относительно стабильные рынки перестают вести себя «гладко»: усиливается влияние макроэкономических факторов, процентных ставок, медленных структурных сдвигов и поведенческих эффектов, что приводит к асимметричным реакциям на риски. В таких условиях многие модели машинного обучения формируют смещенные…
-
Прогнозирование временных рядов с xLSTM
Классические модели прогнозирования временных рядов, такие как градиентный бустинг, хорошо работают на табличных данных и с короткими историческими окнами. Однако при анализе длинных последовательностей и рядов с взаимозависимыми признаками их эффективность драматически падает. В таких случаях стоит присмотреться к нейронным сетям, так как они лучше моделируют сложные временные зависимости. Одним из интересных решений в этой…
-
Модель ETS для прогнозирования временных рядов
Экспоненциальное сглаживание остается одним из надежных методов прогнозирования временных рядов в количественном анализе. Модель ETS (Error, Trend, Seasonality) представляет формализованную версию этого подхода через представление в пространстве состояний. Метод обеспечивает баланс между простотой реализации и качеством прогнозов для данных с выраженной трендовой и сезонной структурой.. ETS работает через рекурсивное обновление компонентов модели: уровня, тренда и…
-
Обучение baseline моделей для временных рядов: инжиниринг признаков, регуляризация, оценка качества
Бейзлайн (baseline) — это простая стартовая модель, определяющая минимально приемлемый уровень качества следующих ML-моделей. Если другие модели с более сложной архитектурой выдают метрики хуже бейзлайна, значит, их применение неоправданно. Нередко так бывает, что линейная регрессия с правильными признаками превосходит нейросеть со слабой подготовкой данных. А градиентный бустинг с грамотной регуляризацией обходит LSTM на горизонте прогноза…
-
Чем отличается финансовый ML от других видов машинного обучения
Машинное обучение в финансах работает с данными, которые принципиально отличаются от изображений, текстов или табличных данных из других отраслей. Финансовые временные ряды нестационарны, зашумлены и подвержены частым структурным изменениям. Эти особенности требуют специфических подходов к моделированию, валидации и оценке качества. Сегодня стало модно подавать любые данные в трансформеры, большие языковые модели. Однако этот подход, как…
-
Прогнозирование вероятности дефолта через логистическую регрессию
Прогнозирование вероятности дефолта — одна из ключевых задач в управлении кредитными рисками, которая помогает банкам, инвестиционным компаниям и бизнесу принимать более взвешенные решения. Существует множество инструментов для таких прогнозов, хотя логистическая регрессия — пожалуй, наиболее популярный. Она позволяет на основе набора факторов (например, дохода клиента, кредитной истории, уровня долговой нагрузки) оценить вероятность того, что заемщик…
-
LSTM для прогнозирования волатильности: многослойные архитектуры и sequence-to-sequence подходы
В течение последних нескольких лет работы с временными рядами финансовых данных я неоднократно сталкивался с проблемой прогнозирования волатильности. Классические GARCH модели и их вариации показывают ограниченную эффективность при краткосрочных и intraday-стратегиях, особенно когда рынок демонстрирует резкие структурные сдвиги. Сегодня хочу поделиться своими наблюдениями о применении LSTM архитектур для решения этой задачи — от базовых многослойных…
-
Библиотека ETNA в Python для прогнозирования временных рядов
Мне довелось работать с множеством инструментов для анализа временных рядов, и постоянно приходилось комбинировать различные библиотеки, чтобы получить полный цикл работы с временными рядами — от предобработки до бэктестинга, от подбора гиперпараметров до подготовки к деплою. Библиотека ETNA (Easy Time-series Analysis) от команды T-Bank AI Center решает эту проблему элегантно, предоставляя единый интерфейс для всех…
-
Нейросети для прогнозирования последовательных данных
В мире, где объемы данных растут экспоненциально, способность точно прогнозировать будущие значения становится не просто конкурентным преимуществом, а необходимостью. Для решения этой задачи все больше компаний внедряют машинное обучение. И самым передовым подходом машинного обучения являются нейронные сети. Нейросети сегодня применяются для разного круга задач: детекция изображений, генерация текста и изображений, саммаризация и т. д.…