Копулы в финансовом моделировании: зависимости между случайными величинами

Копулы — это мощный инструмент в финансовом моделировании, позволяющий описывать сложные зависимости между активами, которые выходят далеко за рамки линейной корреляции.

Использование корреляций (в частности Пирсона), несомненно, остаются базой в портфельных моделях, но это адекватно лишь при эллиптических распределениях и линейных связях. В реальности же рынки редко подчиняются этим упрощенным предположениям, что приводит к недооценке рисков и искажению представлений о взаимосвязях между активами.

Копулы решают эту проблему, разделяя модель на два компонента:

  1. Маргинальные распределения отдельных переменных;
  2. Структуру зависимости между ними.

Такое разделение позволяет строить гибкие многомерные распределения, сочетая разные типы индивидуальных распределений с различными формами зависимости.

Благодаря этой универсальности копулы нашли широкое применение в финансах:

  • в риск-менеджменте — для расчета VaR и CVaR с учетом реальных зависимостей;
  • в портфельной оптимизации — при построении эффективных границ за пределами предположений Марковица;
  • в ценообразовании деривативов — для моделирования корзин активов и кредитных дефолтов;
  • в анализе системных рыночных рисков.

Сегодня копулы перешли из академических исследований в практику хедж-фондов и риск-подразделений банков, став неотъемлемой частью инструментов количественного анализа.

Ограничения корреляции Пирсона

Корреляция Пирсона измеряет только линейную связь между переменными. Для двух активов с доходностями X и Y коэффициент вычисляется как:

ρ = Cov(X,Y) / (σ_X · σ_Y)

где:

  • Cov — ковариация;
  • σ — стандартные отклонения.

Этот показатель принимает значения от -1 до 1, где 0 означает отсутствие линейной связи.

Корреляция Пирсона легко интерпретируется и сегодня повсеместно применяется в анализе данных. Однако у этого подхода есть несколько ограничений.

1. Чувствительность к выбросам

Единичное экстремальное наблюдение искажает оценку корреляции для всей выборки. В период кризиса 2008 года многие пары активов, считавшиеся слабо коррелированными, показали совместное падение. Расчетная корреляция на исторических данных не отражала реальный риск одновременных потерь.

2. Неспособность улавливать нелинейные зависимости

Две переменные могут иметь корреляцию близкую к нулю, однако при этом демонстрировать сильную функциональную связь. Классический пример: Y = X² при X с симметричным распределением вокруг нуля дает корреляцию около 0, хотя зависимость детерминированная.

3. Игнорирование хвостовых зависимостей

Активы могут вести себя независимо в обычных рыночных условиях, однако синхронно падать в кризисы. Корреляция Пирсона дает единую оценку для всего диапазона значений и не различает поведение в центре распределения от поведения в хвостах.

Для риск-менеджмента критична именно зависимость в экстремальных событиях, которую линейная корреляция не отражает.

4. Предположение о нормальности распределения данных

Формально коэффициент Пирсона не требует нормального распределения, однако его интерпретация как полной характеристики зависимости справедлива только для многомерного нормального распределения. Финансовые доходности очень часто имеют тяжелые хвосты и асимметрию, что делает эту интерпретацию ошибочной.

Что такое копулы?

Копула — функция, связывающая многомерное распределение с его одномерными маргинальными распределениями. Теорема Склара (1959) формализует это так:

👉🏻  Корреляция и ковариация в финансах: анализ взаимосвязи между активами

для любого многомерного распределения F с маргинальными распределениями F₁, F₂, …, Fₙ существует копула C такая, что:

F(x₁, x₂, …, xₙ) = C(F₁(x₁), F₂(x₂), …, Fₙ(xₙ)).

Теорема работает в обе стороны. Имея маргинальные распределения и копулу, можно построить совместное распределение. Имея совместное распределение, можно извлечь копулу и маргинальные распределения. Это разделение — ключевое преимущество подхода.

Переменные в копуле:

  • F — совместная функция распределения;
  • F₁, F₂, …, Fₙ — маргинальные функции распределения;
  • C — копула, отображающая [0,1]ⁿ в [0,1];
  • x₁, x₂, …, xₙ — значения случайных величин.

Копула описывает структуру зависимости независимо от маргинальных распределений. Можно моделировать зависимость между доходностями акций с распределением Стьюдента, опционными волатильностями с логнормальным распределением и кредитными спредами с произвольным эмпирическим распределением, используя одну и ту же копулу для описания их связи.

Ключевое практическое преимущество данного подхода: возможность оценивать маргинальные распределения и структуру зависимости отдельно. Сначала подбираем наилучшее распределение для каждой переменной (нормальное, Стьюдента, скошенное), затем моделируем зависимость через копулу. Это снимает ограничение на использование одного семейства распределений для всех переменных.

Второе преимущество — инвариантность к монотонным преобразованиям. Корреляция Пирсона меняется при нелинейных преобразованиях переменных (например, переходе от цен к логарифмическим доходностям). Копула остается неизменной при любых строго возрастающих преобразованиях. Это свойство делает копулы естественным инструментом для моделирования финансовых данных, где выбор шкалы (цены, доходности, логарифмы) часто произволен.

Основные семейства копул

Эллиптические копулы

Гауссова копула извлекается из многомерного нормального распределения. Параметры — корреляционная матрица R размерности n×n. Копула имеет форму:

C(u₁, …, uₙ) = Φ_R(Φ⁻¹(u₁), …, Φ⁻¹(uₙ))

где:

  • Φ — стандартная нормальная функция распределения;
  • Φ⁻¹ — обратная функция (квантиль).

Гауссова копула не имеет хвостовых зависимостей: вероятность совместного экстремального события ниже, чем в реальных данных. Два актива с корреляцией 0.5 по Гауссовой копуле редко падают одновременно на 3+ стандартных отклонения. На практике такие события происходят чаще.

t-копула Стьюдента добавляет параметр степеней свободы ν, контролирующий толщину хвостов. При малых ν (3-5) копула демонстрирует сильные хвостовые зависимости. При больших ν (30+) приближается к Гауссовой. Форма копулы Стьюдента следующая:

C(u₁, …, uₙ) = t_{ν,R}(t_ν⁻¹(u₁), …, t_ν⁻¹(uₙ))

где:

  • t_ν — одномерное распределение Стьюдента;
  • t_{ν,R} — многомерное с корреляционной матрицей R.

t-копула захватывает симметричные хвостовые зависимости: активы склонны к совместным экстремальным движениям как вверх, так и вниз. Для большинства пар акций это реалистичное предположение. Для моделирования асимметрии (сильнее падают вместе, чем растут) требуются другие семейства.

Архимедовы копулы

Архимедовы копулы строятся через генератор φ — строго убывающую выпуклую функцию. Общий вид для двумерного случая:

👉🏻  Показатели TWR (Time-Weighted Return), MWR (Money-Weighted Return) и MDR (Modified Dietz Return)

C(u,v) = φ⁻¹(φ(u) + φ(v))

Каждая копула задается выбором генератора.

Копула Клэйтона (Clayton) с параметром θ > 0 имеет генератор:

φ(t) = (t⁻θ — 1)/θ.

Копула Clayton демонстрирует сильную нижнюю хвостовую зависимость и слабую верхнюю. Ее ключевая особенность: активы падают вместе чаще, чем растут. Коэффициент нижней хвостовой зависимости:

λ_L = 2⁻¹/θ.

При θ = 1 получаем λ_L = 0.5. Применяется для моделирования кредитных дефолтов и падений рынков акций.

Копула Гумбеля (Gumbel) с параметром θ ≥ 1 имеет генератор:

φ(t) = (-ln t)θ.

Копула Gumbel противоположна Clayton: сильная верхняя хвостовая зависимость, слабая нижняя. Коэффициент верхней хвостовой зависимости рассчитывается так:

λ_U = 2 — 2¹/θ.

Подходит для товарных рынков и валютных пар, где синхронный рост наблюдается чаще совместного падения.

Копула Фрэнка (Frank) с параметром θ ∈ ℝ имеет генератор:

φ(t) = -ln((e⁻θt — 1)/(e⁻θ — 1)).

Это симметричная копула без хвостовых зависимостей, однако она позволяет моделировать широкий спектр корреляций от -1 до 1. При θ = 0 получаем отсутствие взаимосвязи. Копула Frank применяется, когда эмпирические данные не показывают асимметрии в хвостах.

Vine-копулы для многомерных случаев

Архимедовы копулы в базовой форме ограничены двумя-тремя измерениями. Для портфеля из 10+ активов прямое обобщение не работает или требует предположения об одинаковой парной зависимости между всеми активами.

Vine-копулы решают проблему через декомпозицию многомерной плотности на произведение парных копул и условных плотностей. C-vine и D-vine структуры организуют парные зависимости в древовидную иерархию:

  1. Первое дерево моделирует безусловные парные зависимости;
  2. Второе дерево моделирует условные зависимости первого порядка;
  3. Третье — второго порядка.

R-vine обобщает C-vine и D-vine, позволяя моделировать произвольную структуру дерева. Выбор структуры основывается на силе зависимостей: наиболее зависимые пары моделируются на первых уровнях. Алгоритм последовательного выбора максимальной корреляции автоматически определяет оптимальную структуру.

Vine-копулы обеспечивают гибкость: каждая парная зависимость может использовать свою копулу (Gumbel для одной пары, Clayton для другой). Цена гибкости — вычислительная сложность. Портфель из 20 активов требует оценки 190 парных копул и их параметров.

Тип копулы Хвостовая зависимость Симметрия Размерность Применение
Гауссова Нет Да Любая Базовый бенчмарк
t-Стьюдента Симметричная Да Любая Портфели акций
Clayton Нижняя Нет 2-3 Кредитный риск
Gumbel Верхняя Нет 2-3 Товарные рынки
Frank Нет Да 2-3 Валютные пары
Vine Гибкая Настраиваемая Любая Большие портфели

Применение в риск-менеджменте

Расчет VaR и CVaR для портфеля

Value at Risk (VaR) на уровне α — квантиль распределения потерь портфеля. VaR₀.₉₅ = 100 означает, что с вероятностью 95% потери не превысят 100. Conditional VaR (CVaR) — ожидаемые потери при условии превышения VaR. CVaR₀.₉₅ = 150 означает среднюю потерю 150 в худших 5% сценариев.

Классический подход предполагает многомерное нормальное распределение доходностей. VaR вычисляется аналитически через ковариационную матрицу. Подход недооценивает риск: нормальное распределение имеет тонкие хвосты, реальные потери в кризис превышают прогнозы.

👉🏻  Анализ данных с Python на примере инцидентов с автобусами Лондона

Копульный подход решает эту задачу более точным образом:

  1. Сначала подбираем маргинальные распределения для доходностей каждого актива — часто распределение Стьюдента с 3-7 степенями свободы;
  2. Затем моделируем зависимость через t-копулу с параметрами, оцененными по историческим данным. Получаем многомерное распределение с тяжелыми хвостами и реалистичными хвостовыми зависимостями;
  3. Расчет VaR выполняется через симуляцию Монте-Карло. Генерируем 100000 сценариев из копулы;
  4. Преобразуем в доходности активов через обратные маргинальные распределения;
  5. Вычисляем P&L портфеля для каждого сценария, берем 95-й перцентиль. CVaR вычисляется как среднее по сценариям хуже VaR.

Эмпирические результаты показывают улучшение точности. Бэктест на кризисе 2008: копульный VaR нарушался в 6% дней (близко к теоретическим 5%), нормальный VaR — в 12% дней. Для CVaR разница еще заметнее: копульная оценка давала ошибку предсказания 8%, нормальная — 25%.

Моделирование совместных дефолтов

Кредитный портфель обычно состоит из облигаций или кредитов множества эмитентов. И нарастание риска здесь происходит не столько от отдельных дефолтов, сколько при их одновременном возникновении.

Когда несколько эмитентов не могут выполнить обязательства в одно и то же время, потери оказываются значительно выше, чем при независимых дефолтах: в кризис ликвидация залогов идет с большими дисконтами, и уровень возврата (recovery rate) падает.

Структурные модели, такие как модель Мертона, рассматривают дефолт как момент, когда стоимость активов компании опускается ниже определенного порога. Чтобы смоделировать поведение целого портфеля, нужно знать, как связаны между собой стоимости активов разных компаний. В 2000-х управляющие часто использовали гауссовы копулы при оценке рисков, в том числе для сложных кредитных инструментов вроде CDO (Collateralized Debt Obligations). К чему привели «игры с CDO» — общеизвестно, кризис 2008 года.

Проблема заключалась в том, что гауссова копула недооценивала вероятность множественных дефолтов. Согласно модели, вероятность потерь по самому надежному, AAA-траншу составляла всего около 0.1%, но на практике убытки возникали в 3–5% случаев. Это расхождение объясняется тем, что гауссова копула не учитывает хвостовые зависимости — ситуацию, когда дефолты становятся более вероятными именно во времена кризисов.

Более реалистичные результаты дают t-копула и копула Клейтона. Последняя особенно хорошо описывает поведение компаний в стрессовых условиях, поскольку моделирует сильную зависимость в нижнем хвосте распределения: фирмы с большей вероятностью дефолтят одновременно во время кризиса, чем демонстрируют одновременный рост в спокойные периоды. Параметр зависимости θ при этом можно откалибровать по историческим данным о корпоративных дефолтах или на основе цен CDS (Credit Default Swaps), отражающих восприятие рынка относительно кредитного риска.

👉🏻  Как правильно выбирать активы в биржевой портфель: подход институциональных инвесторов

Практические результаты: портфель из 100 корпоративных облигаций, вероятность дефолта каждой 2% в год. Гауссова копула с корреляцией 0.3 дает вероятность 5+ одновременных дефолтов около 0.5%. Clayton с θ = 1.5 (примерно соответствует той же ранговой корреляции) дает 2.8%. Разница в 5 раз влияет на ценообразование и резервы капитала.

Применение в портфельной оптимизации

Модель Марковица строит эффективную границу портфелей через минимизацию дисперсии при заданной ожидаемой доходности. Предположения: доходности активов имеют многомерное нормальное распределение, зависимость описывается ковариационной матрицей. Естественно, эти предположения разрушаются о суровую реальность рынков.

Копульный подход отличается тем, что сохраняет логику оптимизации, при этом заменяет входные данные. Вместо ковариационной матрицы используем копулу и маргинальные распределения для генерации реалистичных сценариев доходностей. Целевая функция — минимизация CVaR вместо дисперсии, что лучше отражает толерантность к риску.

Процедура оптимизации:

  1. Выбираем копулу и маргинальные распределения по историческим данным;
  2. Генерируем 50000 сценариев будущих доходностей;
  3. Для каждого набора весов портфеля вычисляем CVaR по сценариям;
  4. Находим веса с минимальным CVaR при ограничении на ожидаемую доходность.

Сравнение подходов на портфеле из акций S&P 500 за 2015-2020 годы:

  • Марковиц с нормальным предположением: Sharpe ratio 0.85, максимальная просадка 18%;
  • Копульная оптимизация с t-копулой и маргинальными распределениями Стьюдента: Sharpe ratio 0.92, максимальная просадка 14%.

Улучшение достигается за счет снижения весов активов с сильной нижней хвостовой зависимостью.

Дополнительное преимущество — учет асимметричных зависимостей. Акции технологического сектора могут иметь умеренную корреляцию с финансовым в обычное время, но высокую в кризис. Копулы Гумбеля и Клейтона захватывают эту асимметрию. Оптимизатор снижает совместные позиции в активах с сильной нижней хвостовой зависимостью, улучшая профиль риска.

Ограничение подхода — вычислительная стоимость. Каждая оценка целевой функции требует генерации тысяч сценариев. Для портфеля из 50 активов и 10000 итераций оптимизатора требуется генерация 500 миллионов сценариев. Время расчета на современном сервере — 20-30 минут против секунд для классического Марковица.

Оценка параметров и выбор копулы

Метод Inference Functions for Margins (IFM) разделяет оценку на два этапа:

  1. Первый этап — оценка параметров маргинальных распределений по данным каждой переменной отдельно;
  2. Второй этап — оценка параметров копулы по псевдо-наблюдениям, полученным через преобразование данных маргинальными функциями распределения.

Псевдо-наблюдения вычисляются как:

u_i = F̂(x_i)

где:

  • F̂ — оценка маргинального распределения;
  • x_i — исходные наблюдения.

Для выборки из 1000 наблюдений получаем 1000 точек в [0,1]ⁿ. По этим точкам оцениваем параметры копулы методом максимального правдоподобия.

Метод Canonical Maximum Likelihood (CML) оценивает маргинальные распределения непараметрически через эмпирические функции распределения:

F̂(x_i) = rank(x_i) / (n+1)

Затем оценивает параметры копулы по псевдо-наблюдениям. Преимущество подхода — устойчивость к неверной спецификации маргинальных распределений. Недостаток — потеря эффективности, если параметрическая форма маргинальных распределений известна.

👉🏻  Модели временной структуры процентных ставок: Hull-White, Cox-Ingersoll-Ross (CIR) и другие одно- и многофакторные модели

Метод Maximum Likelihood (ML) оценивает все параметры (маргинальные распределения и копула) совместно. Максимизируется полное правдоподобие:

L = ∏ c(F₁(x₁), …, Fₙ(xₙ)) · ∏ f_i(x_i)

где:

  • c — плотность копулы;
  • f_i — маргинальные плотности.

Метод дает наиболее эффективные оценки, но требует правильной спецификации всех компонентов и вычислительно сложен.

Выбор между копулами основывается на информационных критериях:

  • Akaike Information Criterion (AIC) = -2·ln(L) + 2k, где L — максимизированное правдоподобие, k — число параметров;
  • Bayesian Information Criterion (BIC) = -2·ln(L) + k·ln(n), где n — размер выборки.

Меньшее значение критерия указывает на лучшую модель.

BIC сильнее штрафует сложные модели. Для больших выборок (n > 1000) BIC предпочтителен, поскольку лучше защищает модель от переобучения. Для малых выборок (n < 500) AIC дает лучший баланс между точностью подгонки и сложностью.

Тесты согласия проверяют адекватность выбранной копулы. Обычно используют тест Крамера-фон Мизеса. Он сравнивает эмпирическую копулу с теоретической:

S_n = ∫ [C_emp(u) — C_θ(u)]² dC_emp(u)

Тест основан на бутстрепе: генерируем выборки из подобранной копулы, вычисляем статистику для каждой, сравниваем с наблюдаемым значением. P-value < 0.05 означает что модель нужно отвергнуть.

Практические рекомендации по выбору:

  1. Начинаем с простых копул (Гауссова, t-Стьюдента), проверяем адекватность через тесты и визуальный анализ зависимости в хвостах;
  2. Если симметричные копулы не подходят, тестируем архимедовы (Clayton, Gumbel, Frank). Для портфелей 5+ активов рассматриваем vine-копулы только если простые модели явно неадекватны — высокая вычислительная сложность vine-копул редко оправдана;
  3. Для финансовых временных рядов проверяем стационарность зависимости. Оценка скользящим окном параметров копулы на окнах 250-500 наблюдений должна показывать стабильность. Если параметры дрейфуют, рассматриваем time-varying копулы, либо переоцениваем модель чаще.

Моделирование копулами: ограничения и подводные камни

1. Вычислительная сложность и масштабируемость

Одно из главных ограничений сложных копул (в частности vine) — квадратичный рост вычислительной сложности с числом активов.

Например, для портфеля из 50 активов требуется оценить 1225 парных копул. Даже при использовании хорошего железа время расчета одной симуляции может занимать несколько минут, что становится узким местом в задачах, где нужны тысячи симуляций — например, при оптимизации портфеля или бэктестах стратегий.

Чтобы сократить сложность, применяют факторные модели. Предполагается, что все активы зависят от общих факторов (например, рыночного и отраслевых индексов) и условно независимы, если эти факторы известны.

Такой подход снижает число параметров с O(n²) до O(n⋅k), где k — число факторов. Пример: при 50 активах и 3 факторах количество параметров сокращается с 1225 до 150.

2. Выбор маргинальных распределений

Выбор маргинальных распределений оказывает на результат моделирования зачастую большее влияние, чем выбор копулы. Ошибка в хвостах распределений напрямую приводит к ошибкам в оценках VaR и CVaR.

👉🏻  Автокорреляция (ACF) и частичная автокорреляция (PACF) в биржевом анализе

В этом случае лучше тестировать несколько семейств распределений:

  • нормальное,
  • Стьюдента,
  • скошенное Стьюдента,
  • обобщенное гиперболическое.

Для проверки согласия — особенно в хвостах — используют тесты Колмогорова-Смирнова и Андерсона-Дарлинга.

Практический подход:

  • Если Q–Q plot показывает отклонения от нормальности в хвостах, выбираем распределение Стьюдента;
  • Если наблюдается асимметрия (один хвост толще другого), добавляем параметр скошенности;
  • Обобщенное гиперболическое распределение — наиболее гибкое, но требует оценки пяти параметров против двух у Стьюдента.

3. Нестабильность параметров во времени

Зависимости между активами нестационарны — они усиливаются в периоды кризисов и ослабевают в спокойные времена. Например, копула, оцененная на данных 2015–2019 годов, давала плохие результаты в марте 2020 во время COVID-кризиса.

Для решения этих ограничений можно использовать динамические копулы с параметрами, меняющимися во времени. Например, модели DCC-GARCH для корреляционной матрицы или авторегрессионные процессы для параметра зависимости. Ключевая сложность здесь состоит в необходимости прогнозировать эволюцию параметров.

Более простой вариант — переоценка в скользящих окнах с экспоненциальным взвешиванием, где больший вес получают недавние наблюдения.

4. Риск переобучения

При использовании vine-копул с произвольной структурой возникает риск переобучения. Например, для 50 активов и 5 лет дневных данных (около 1250 наблюдений) нужно оценить 1225 параметров, то есть меньше одного наблюдения на параметр.

Для решения этой проблемы можно попробовать:

  • Ограничить структуру копулы: использовать C-vine или D-vine вместо R-vine;
  • Попробовать привести корреляции к средним значениям.

5. Проблема экстраполяции и стресс-тестирование

Копула строится на основе исторических данных, но часто используется для оценки событий, которые выходят за рамки прошлого опыта. Если в данных максимальная просадка доходила до −15%, а модель пытается оценить риск падения на −30%, ее прогнозы будут слабо обоснованы.

Чтобы повысить надежность таких оценок, применяют стресс-тестирование. Для этого параметры копулы искусственно изменяют так, чтобы зависимости между активами усиливались — как это бывает во время кризисов. Такой подход помогает определить диапазон возможных потерь и понять, насколько портфель уязвим к системным шокам.

Заключение

Моделирование рынка копулами — мощный инструмент для описания сложных зависимостей между активами, однако он требует внимательного и осознанного подхода.

Важно:

  1. контролировать вычислительную сложность и избегать переобучения;
  2. тщательно выбирать маргинальные распределения;
  3. учитывать временную изменчивость параметров;
  4. тестировать модель на устойчивость к стрессовым сценариям.

Только при соблюдении этих условий копулы дают реалистичные и надежные оценки риска.

Копулы — инструмент сложный не только с точки зрения вычислений, но и в плане интерпретации данных. Однако в задачах, где точность оценки рисков определяет устойчивость стратегии, эта сложность оправдана: она дает глубину анализа, недостижимую для более простых моделей.