Гомоскедастичность и Гетероскедастичность временных рядов

Гомоскедастичность (homoskedasticity) и гетероскедастичность (heteroskedasticity) представляют собой фундаментальные свойства временных рядов, описывающие характер изменения дисперсии случайной компоненты во времени. Эти концепции напрямую влияют на выбор модели, методы оценки параметров и, что особенно важно для практикующих квант-аналитиков, на качество прогнозов и риск-менеджмент.

Теоретические основы гомоскедастичности

Гомоскедастичность временного ряда подразумевает постоянство дисперсии случайной компоненты на протяжении всего анализируемого периода. Математически это можно выразить как:

Var(εt) = σ² = const для всех моментов времени t,

где εt представляет собой случайную ошибку в момент времени t.

В контексте финансовых временных рядов гомоскедастичность встречается крайне редко и, как правило, характерна только для искусственно сгенерированных или сильно агрегированных данных. Тем не менее, понимание этой концепции критически важно, поскольку многие классические статистические методы основываются на предположении о постоянстве дисперсии.

При работе с гомоскедастичными временными рядами можно использовать стандартные методы оценки параметров, такие как метод наименьших квадратов (OLS), без дополнительных корректировок. Доверительные интервалы и статистические тесты сохраняют свою валидность, что существенно упрощает анализ. Однако именно эта кажущаяся простота часто становится ловушкой для начинающих аналитиков, которые применяют методы, предполагающие гомоскедастичность, к данным с изменяющейся во времени волатильностью.

Практическое определение гомоскедастичности

Для практического определения гомоскедастичности временного ряда используют несколько подходов. Визуальный анализ остатков модели часто дает первичное представление о характере дисперсии. Если при построении графика остатков против времени или против предсказанных значений точки распределены случайным образом вокруг нулевой линии без видимых паттернов в их разбросе, это может указывать на гомоскедастичность.

Однако визуальный анализ субъективен и может быть недостаточно точным для принятия решений в алгоритмической торговле. Поэтому применяются формальные статистические тесты, такие как тест Бройша-Пагана (Breusch-Pagan test) или тест Уайта (White test). Эти тесты позволяют количественно оценить наличие гетероскедастичности в данных и принять обоснованное решение о выборе соответствующих методов моделирования.

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats
from statsmodels.stats.diagnostic import het_breuschpagan
from statsmodels.regression.linear_model import OLS
import seaborn as sns

# Генерация гомоскедастичного временного ряда
np.random.seed(42)
n_periods = 1000
time_index = pd.date_range('2020-01-01', periods=n_periods, freq='D')

# Создаем детерминистический тренд
trend = 0.02 * np.arange(n_periods)
# Сезонная компонента
seasonal = 5 * np.sin(2 * np.pi * np.arange(n_periods) / 365.25)
# Гомоскедастичный шум с постоянной дисперсией
homoskedastic_noise = np.random.normal(0, 2, n_periods)

# Результирующий гомоскедастичный ряд
homoskedastic_series = trend + seasonal + homoskedastic_noise

# Создаем DataFrame
df_homo = pd.DataFrame({
    'date': time_index,
    'value': homoskedastic_series,
    'trend': trend,
    'seasonal': seasonal,
    'noise': homoskedastic_noise
})

print(f"Статистики гомоскедастичного ряда:")
print(f"Среднее значение шума: {np.mean(homoskedastic_noise):.4f}")
print(f"Стандартное отклонение шума: {np.std(homoskedastic_noise):.4f}")
print(f"Коэффициент вариации: {np.std(homoskedastic_noise)/np.abs(np.mean(homoskedastic_series)):.4f}")

# %% Визуализация временного ряда
plt.figure(figsize=(14, 10))

# Общий временной ряд
plt.subplot(4, 1, 1)
plt.plot(df_homo['date'], df_homo['value'], label='value', color='blue')
plt.title('Общий временной ряд (value)')
plt.ylabel('Значение')
plt.grid(True)

# Тренд
plt.subplot(4, 1, 2)
plt.plot(df_homo['date'], df_homo['trend'], label='trend', color='green')
plt.title('Трендовая компонента')
plt.ylabel('Значение')
plt.grid(True)

# Сезонная компонента
plt.subplot(4, 1, 3)
plt.plot(df_homo['date'], df_homo['seasonal'], label='seasonal', color='orange')
plt.title('Сезонная компонента')
plt.ylabel('Значение')
plt.grid(True)

# Шум (остатки)
plt.subplot(4, 1, 4)
plt.plot(df_homo['date'], df_homo['noise'], label='noise', color='red')
plt.title('Гомоскедастичный шум')
plt.ylabel('Значение')
plt.xlabel('Дата')
plt.grid(True)

plt.tight_layout()
plt.show()

Статистики гомоскедастичного ряда:
Среднее значение шума: 0.0387
Стандартное отклонение шума: 1.9575
Коэффициент вариации: 0.1892

Рис. 1: График гомоскедатичного временного ряда и его компонент

Приведенный код демонстрирует генерацию идеального гомоскедастичного временного ряда, где случайная компонента имеет постоянную дисперсию на всем протяжении наблюдений. В реальных условиях такие ряды встречаются крайне редко, но понимание их свойств необходимо для контраста с гетероскедастичными данными.

Гетероскедастичность: Природа изменчивой волатильности

Гетероскедастичность представляет собой гораздо более распространенное явление в финансовых временных рядах. Она характеризуется изменением дисперсии случайной компоненты во времени:

Var(εt) = σt² ≠ const.

Это означает, что в разные периоды времени одни и те же факторы могут оказывать различное по силе воздействие на анализируемую переменную.

Феномен гетероскедастичности особенно ярко проявляется в финансовых рынках, где периоды относительного спокойствия сменяются периодами высокой волатильности. Классическим примером служат фондовые индексы, где волатильность может увеличиваться в несколько раз во время кризисов или значимых экономических событий. Такая структура волатильности создает кластеры — периоды, в которых высокие значения волатильности следуют за высокими, а низкие за низкими.

Вот почему моделирование рядов биржевых активов всегда должно строится с учетом гетероскедастичности. В противном случае можно столкнуться с серьезными проблемами. Стандартные ошибки коэффициентов модели становятся смещенными, что делает статистические тесты недостоверными. Доверительные интервалы и прогнозы теряют свою точность, а риск-модели дают неадекватные оценки потенциальных убытков.

Типы гетероскедастичности

В практике количественного анализа мне хотелось бы выделить несколько основных типов гетероскедастичности.

Безусловная гетероскедастичность (unconditional heteroskedasticity) характеризуется изменением дисперсии, которое можно предсказать на основе внешних факторов или времени. Примером может служить сезонная волатильность в сельскохозяйственных товарах или повышенная активность в определенные дни недели на валютных рынках.

👉🏻 Библиотека ETNA в Python для прогнозирования временных рядов

Условная гетероскедастичность (conditional heteroskedasticity) представляет собой более сложное явление, где дисперсия зависит от предыдущих значений самого ряда или его инноваций. Модели семейства ARCH (Autoregressive Conditional Heteroskedasticity) и GARCH (Generalized ARCH) специально разработаны для моделирования таких зависимостей. Эти модели широко применяются в современном риск-менеджменте и алгоритмической торговле.

Мультипликативная гетероскедастичность возникает, когда дисперсия пропорциональна некоторой функции от ожидаемого значения переменной. Этот тип часто наблюдается в моделях роста, где абсолютная изменчивость растет вместе с уровнем переменной.

Аддитивная гетероскедастичность предполагает, что дисперсия изменяется независимо от уровня переменной, что характерно для временных рядов с внешними шоками.

Давайте рассмотрим следующий код на Python, который генерирует и рассматривает особенности рядов с различными типами гетероскедастичности.

import matplotlib.pyplot as plt
import seaborn as sns
from matplotlib.dates import DateFormatter

# Генерация различных типов гетероскедастичных временных рядов
def generate_heteroskedastic_series():
    np.random.seed(42)
    n_periods = 1000
    time_index = pd.date_range('2020-01-01', periods=n_periods, freq='D')
    
    # Базовый тренд
    base_trend = 0.01 * np.arange(n_periods)
    
    # Условная гетероскедастичность (ARCH-эффект)
    arch_series = np.zeros(n_periods)
    sigma_t = np.zeros(n_periods)
    sigma_t[0] = 1.0
    
    alpha0, alpha1 = 0.1, 0.3  # ARCH(1) параметры
    
    for t in range(1, n_periods):
        # Условная дисперсия зависит от предыдущего квадрата инновации
        sigma_t[t] = np.sqrt(alpha0 + alpha1 * arch_series[t-1]**2)
        arch_series[t] = sigma_t[t] * np.random.normal(0, 1)
    
    # Мультипликативная гетероскедастичность
    mult_base = np.exp(base_trend/10)  # Экспоненциальный рост
    mult_volatility = 0.1 * mult_base  # Волатильность растет с уровнем
    mult_series = mult_base + mult_volatility * np.random.normal(0, 1, n_periods)
    
    # Структурные разрывы в волатильности
    structural_series = np.zeros(n_periods)
    volatility_regimes = np.ones(n_periods)
    # Три режима волатильности
    volatility_regimes[:300] = 1.0      # Низкая волатильность
    volatility_regimes[300:700] = 3.0   # Высокая волатильность
    volatility_regimes[700:] = 1.5      # Средняя волатильность
    
    structural_series = base_trend + volatility_regimes * np.random.normal(0, 1, n_periods)
    
    return {
        'time_index': time_index,
        'arch_series': arch_series,
        'arch_volatility': sigma_t,
        'multiplicative': mult_series,
        'structural': structural_series,
        'volatility_regimes': volatility_regimes
    }

# Генерируем данные
hetero_data = generate_heteroskedastic_series()

# Анализ свойств различных типов гетероскедастичности
print("Анализ типов гетероскедастичности:")
print(f"ARCH серия - среднее: {np.mean(hetero_data['arch_series']):.4f}, std: {np.std(hetero_data['arch_series']):.4f}")
print(f"Мультипликативная - среднее: {np.mean(hetero_data['multiplicative']):.4f}, std: {np.std(hetero_data['multiplicative']):.4f}")
print(f"Структурные разрывы - среднее: {np.mean(hetero_data['structural']):.4f}, std: {np.std(hetero_data['structural']):.4f}")

# Расчет rolling volatility для демонстрации изменчивости
window = 50
arch_rolling_vol = pd.Series(hetero_data['arch_series']).rolling(window).std()
mult_rolling_vol = pd.Series(hetero_data['multiplicative']).rolling(window).std()
struct_rolling_vol = pd.Series(hetero_data['structural']).rolling(window).std()

print(f"\nКоэффициент вариации rolling volatility:")
print(f"ARCH: {np.std(arch_rolling_vol.dropna())/np.mean(arch_rolling_vol.dropna()):.4f}")
print(f"Мультипликативная: {np.std(mult_rolling_vol.dropna())/np.mean(mult_rolling_vol.dropna()):.4f}")
print(f"Структурная: {np.std(struct_rolling_vol.dropna())/np.mean(struct_rolling_vol.dropna()):.4f}")

# Стиль графиков
sns.set(style="whitegrid", palette="muted", font_scale=1.2)

# Форматтер для дат на оси X
date_format = DateFormatter("%Y-%m")

# Создаем графики
fig, axes = plt.subplots(3, 2, figsize=(16, 18), sharex=False)

# Визуализация ARCH-процесса
axes[0, 0].plot(hetero_data['time_index'], hetero_data['arch_series'], label='ARCH Серия', color='steelblue')
axes[0, 0].set_title('ARCH(1) Процесс\n(Условная гетероскедастичность)')
axes[0, 0].set_ylabel('Значение')

axes[0, 1].plot(hetero_data['time_index'], hetero_data['arch_volatility'], label='Условная волатильность', color='darkorange')
axes[0, 1].set_title('Условная волатильность ARCH')

# Визуализация Мультипликативной гетероскедастичности
axes[1, 0].plot(hetero_data['time_index'], hetero_data['multiplicative'], label='Мультипликативный ряд', color='forestgreen')
axes[1, 0].set_title('Мультипликативная гетероскедастичность')
axes[1, 0].set_ylabel('Значение')

axes[1, 1].plot(hetero_data['time_index'][window:], mult_rolling_vol[window:], label='Rolling Volatility', color='goldenrod')
axes[1, 1].set_title('Rolling волатильность\n(окно=50)')

# Визуализация Структурных разрывов
axes[2, 0].plot(hetero_data['time_index'], hetero_data['structural'], label='С структурными разрывами', color='crimson')
axes[2, 0].set_title('Структурные разрывы в волатильности')
axes[2, 0].set_ylabel('Значение')

axes[2, 1].plot(hetero_data['time_index'], hetero_data['volatility_regimes'], label='Режимы волатильности', color='purple')
axes[2, 1].set_title('Режимы волатильности')

# Общая настройка графика
for ax in axes.flat:
    ax.xaxis.set_major_formatter(date_format)
    ax.tick_params(axis='x', rotation=45)
    ax.legend(loc='upper right')

plt.tight_layout()
plt.show()

Анализ типов гетероскедастичности:
ARCH серия — среднее: 0.0050, std: 0.3625
Мультипликативная — среднее: 1.7286, std: 0.5227
Структурные разрывы — среднее: 5.0260, std: 3.5724

Коэффициент вариации rolling volatility:
ARCH: 0.1190
Мультипликативная: 0.2818
Структурная: 0.4245

Рис. 2: Визуализация гетероскедастичных рядов различного типа и их волатильностей

Представленный код иллюстрирует генерацию различных типов гетероскедастичности, что позволяет лучше понять их особенности и влияние на характеристики временного ряда. ARCH-процесс демонстрирует кластеризацию волатильности, мультипликативная гетероскедастичность показывает связь между уровнем и изменчивостью, а структурные разрывы отражают дискретные изменения в режиме волатильности.

Методы диагностики гетероскедастичности

Правильная диагностика гетероскедастичности критически важна для выбора адекватных методов моделирования. В моей практике использую комплексный подход, включающий как визуальные, так и формальные статистические методы. Каждый из них имеет свои преимущества и ограничения, поэтому их комбинирование дает наиболее надежные результаты.

Визуальная диагностика начинается с анализа графика временного ряда и его остатков. График остатков против времени может выявить паттерны в изменении дисперсии, такие как воронкообразные структуры, периодические изменения волатильности или кластеры высоких значений. График остатков против предсказанных значений помогает обнаружить зависимость дисперсии от уровня переменной.

Особое внимание я уделяю анализу квадратов остатков, поскольку они представляют собой несмещенную оценку условной дисперсии. График квадратов остатков часто более четко показывает наличие гетероскедастичности, чем график самих остатков. Дополнительно строю Q-Q графики для проверки нормальности распределения остатков, поскольку отклонения от нормальности могут указывать на наличие условной гетероскедастичности.

Формальные тесты на гетероскедастичность

Тест Бройша-Пагана (Breusch-Pagan test) представляет собой Lagrange Multiplier тест, который проверяет нулевую гипотезу о гомоскедастичности против альтернативной гипотезы о линейной зависимости дисперсии от регрессоров. Тест основывается на регрессии квадратов остатков на исходные регрессоры и анализе R² этой вспомогательной регрессии;
Тест Уайта (White test) является более общим и не предполагает конкретной функциональной формы гетероскедастичности. Он включает в регрессию квадратов остатков не только исходные регрессоры, но и их квадраты и произведения. Это делает тест более мощным для обнаружения различных форм гетероскедастичности, но также увеличивает число степеней свободы;
Тест Голдфелда-Квандта (Goldfeld-Quandt test) особенно полезен при подозрении на монотонную зависимость дисперсии от одного из регрессоров. Тест заключается в разделении выборки на две части и сравнении дисперсий остатков в каждой подвыборке с помощью F-статистики;
ARCH LM тест специально разработан для выявления условной гетероскедастичности типа ARCH. Тест проверяет значимость авторегрессии в квадратах остатков, что позволяет обнаружить зависимость текущей дисперсии от предыдущих значений инноваций.

from statsmodels.stats.diagnostic import het_white, het_goldfeldquandt, het_arch
from statsmodels.tsa.stattools import adfuller
from statsmodels.stats.stattools import jarque_bera
import statsmodels.api as sm
from statsmodels.regression.linear_model import OLS
import matplotlib.pyplot as plt
import seaborn as sns

def comprehensive_heteroskedasticity_tests(series, exog_vars=None, series_name="Временной ряд"):
    """
    Комплексная диагностика гетероскедастичности временного ряда с визуализацией
    """
    results = {}
    
    # Если экзогенные переменные не заданы, используем константу и тренд
    if exog_vars is None:
        n = len(series)
        exog_vars = np.column_stack([np.ones(n), np.arange(n)])
    
    # Подгонка базовой модели
    model = OLS(series, exog_vars).fit()
    residuals = model.resid
    
    # Визуализация ряда и его остатков
    fig, axes = plt.subplots(3, 1, figsize=(14, 12))
    sns.set(style="whitegrid")

    # Сам временной ряд
    axes[0].plot(series, label='Временной ряд', color='steelblue')
    axes[0].set_title(f'{series_name}: Исходный временной ряд')
    axes[0].legend()

    # Остатки модели
    axes[1].plot(residuals, label='Остатки модели', color='darkorange')
    axes[1].set_title('Остатки регрессии')
    axes[1].axhline(0, linestyle='--', color='gray')
    axes[1].legend()

    # Квадраты остатков (ARCH-эффект)
    axes[2].plot(residuals**2, label='Квадраты остатков', color='forestgreen')
    axes[2].set_title('Квадраты остатков (ARCH-эффект)')
    axes[2].axhline(0, linestyle='--', color='gray')
    axes[2].legend()

    plt.tight_layout()
    plt.show()
    
    # Тестирование на гетероскедатичность
    # Тест Бройша-Пагана
    bp_stat, bp_pvalue, bp_fstat, bp_fpvalue = het_breuschpagan(residuals, exog_vars)
    results['breusch_pagan'] = {
        'statistic': bp_stat,
        'p_value': bp_pvalue,
        'interpretation': 'Гетероскедастичность обнаружена' if bp_pvalue < 0.05 else 'Гомоскедастичность не отвергается'
    }
    
    # Тест Уайта
    white_stat, white_pvalue, white_fstat, white_fpvalue = het_white(residuals, exog_vars)
    results['white'] = {
        'statistic': white_stat,
        'p_value': white_pvalue,
        'interpretation': 'Гетероскедастичность обнаружена' if white_pvalue < 0.05 else 'Гомоскедастичность не отвергается' } # Тест Голдфелда-Квандта (только если есть тренд) if exog_vars.shape[1] >= 2:  # Если есть тренд
        gq_stat, gq_pvalue, gq_ordering = het_goldfeldquandt(series, exog_vars, idx=1)
        results['goldfeld_quandt'] = {
            'statistic': gq_stat,
            'p_value': gq_pvalue,
            'interpretation': 'Гетероскедастичность обнаружена' if gq_pvalue < 0.05 else 'Гомоскедастичность не отвергается'
        }

    # Тест Жарка-Бера на нормальность остатков
    jb_stat, jb_pvalue, skew, kurtosis = jarque_bera(residuals)
    results['jarque_bera'] = {
        'statistic': jb_stat,
        'p_value': jb_pvalue,
        'interpretation': 'Остатки не нормальны' if jb_pvalue < 0.05 else 'Нормальность остатков не отвергается'
    }

    # Анализ автокорреляции квадратов остатков (ARCH-эффект)
    arch_lm = sm.stats.diagnostic.het_arch(residuals, maxlag=5)
    results['arch_lm'] = {
        'statistic': arch_lm[0],
        'p_value': arch_lm[1],
        'interpretation': 'ARCH-эффект обнаружен' if arch_lm[1] < 0.05 else 'ARCH-эффект не обнаружен'
    }

    return results

# Тестирование на различных типах данных
print("Диагностика гомоскедастичного ряда")
homo_results = comprehensive_heteroskedasticity_tests(df_homo['value'].values)
for test_name, test_result in homo_results.items():
    print(f"{test_name}: {test_result['interpretation']} (p-value: {test_result['p_value']:.6f})")

print("\nДиагностика ARCH-процесса")
arch_results = comprehensive_heteroskedasticity_tests(hetero_data['arch_series'])
for test_name, test_result in arch_results.items():
    print(f"{test_name}: {test_result['interpretation']} (p-value: {test_result['p_value']:.6f})")

print("\nДиагностика мультипликативной гетероскедастичности")
mult_results = comprehensive_heteroskedasticity_tests(hetero_data['multiplicative'])
for test_name, test_result in mult_results.items():
    print(f"{test_name}: {test_result['interpretation']} (p-value: {test_result['p_value']:.6f})")

Рис. 3: График временного ряда №1, его остатков регрессии и квадратов остатков

Диагностика гомоскедастичности ряда
breusch_pagan: Гетероскедастичность обнаружена (p-value: 0.009273)
white: Гетероскедастичность обнаружена (p-value: 0.002752)
goldfeld_quandt: Гомоскедастичность не отвергается (p-value: 0.426441)
jarque_bera: Остатки не нормальны (p-value: 0.000011)
arch_lm: ARCH-эффект обнаружен (p-value: 0.000000)

Рис. 4: График временного ряда №2, его остатков регрессии и квадратов остатков

Диагностика ARCH-процесса
breusch_pagan: Гомоскедастичность не отвергается (p-value: 0.502805)
white: Гомоскедастичность не отвергается (p-value: 0.192069)
goldfeld_quandt: Гомоскедастичность не отвергается (p-value: 0.371290)
jarque_bera: Нормальность остатков не отвергается (p-value: 0.372403)
arch_lm: ARCH-эффект обнаружен (p-value: 0.000000)

Рис. 5: График временного ряда №3, его остатков регрессии и квадратов остатков

Диагностика мультипликативной гетероскедастичности
breusch_pagan: Гетероскедастичность обнаружена (p-value: 0.000000)
white: Гетероскедастичность обнаружена (p-value: 0.000000)
goldfeld_quandt: Гетероскедастичность обнаружена (p-value: 0.000000)
jarque_bera: Остатки не нормальны (p-value: 0.000000)
arch_lm: ARCH-эффект обнаружен (p-value: 0.000000)

Результаты комплексного тестирования позволяют не только обнаружить наличие гетероскедастичности, но и получить представление о ее природе. ARCH LM тест особенно важен для выявления условной гетероскедастичности, которая требует специальных методов моделирования. Комбинирование различных тестов повышает надежность выводов и помогает избежать ошибок первого и второго рода.

👉🏻 Собственные числа и собственные векторы в финансах: разложения PCA и SVD

Влияние гетероскедастичности на моделирование

Присутствие гетероскедастичности в временных рядах создает множественные проблемы для традиционных методов моделирования и прогнозирования. Наиболее серьезное последствие — это нарушение предпосылок классической линейной регрессии, что приводит к неэффективности оценок параметров и искажению статистических выводов.

Когда мы применяем метод наименьших квадратов к гетероскедастичным данным, получаемые оценки коэффициентов остаются несмещенными и состоятельными, но теряют свойство эффективности. Это означает, что существуют другие оценки с меньшей дисперсией.

Более сложная проблема заключается в том, что стандартные ошибки коэффициентов, рассчитанные по классическим формулам, становятся смещенными. Обычно они занижены, что приводит к завышению значимости коэффициентов и ложному отклонению нулевых гипотез.

Доверительные интервалы и предсказательные интервалы, построенные на основе неверных стандартных ошибок, теряют свою номинальную вероятность покрытия. В контексте финансового моделирования это может привести к недооценке рисков и неадекватному управлению портфелем. Статистические тесты, основанные на предположении о гомоскедастичности, дают искаженные результаты, что может привести к неверным выводам о значимости факторов.

Коррекция стандартных ошибок

Одним из наиболее распространенных методов работы с гетероскедастичностью является использование робастных стандартных ошибок Уайта (White’s heteroskedasticity-consistent standard errors). Эти оценки состоятельны в присутствии гетероскедастичности произвольной формы и не требуют знания точной структуры изменения дисперсии.

Формула Уайта для ковариационной матрицы коэффициентов имеет вид:

V(β̂) = (X’X)⁻¹X’ΩX(X’X)⁻¹,

где Ω — диагональная матрица с элементами ε²ᵢ.

Эта формула учитывает индивидуальные значения квадратов остатков для каждого наблюдения, что позволяет корректно оценить дисперсию коэффициентов при наличии гетероскедастичности.

Для временных рядов часто применяются модификации формулы Уайта, учитывающие возможную автокорреляцию остатков. HAC (Heteroskedasticity and Autocorrelation Consistent) стандартные ошибки Ньюи-Веста (Newey-West) представляют собой одну из наиболее популярных корректировок, которая одновременно устойчива к гетероскедастичности и автокорреляции.

from statsmodels.regression.linear_model import OLS
from statsmodels.stats.sandwich_covariance import cov_hac
import pandas as pd

def compare_standard_errors(series, exog_vars):
    """
    Сравнение различных методов расчета стандартных ошибок
    """
    # Подгонка базовой модели
    model = OLS(series, exog_vars).fit()
    
    # Классические стандартные ошибки (предполагают гомоскедастичность)
    classical_se = model.bse
    
    # Робастные стандартные ошибки Уайта
    robust_cov = model.cov_HC0  # HC0 - это формула Уайта
    white_se = np.sqrt(np.diag(robust_cov))
    
    # HAC стандартные ошибки Ньюи-Веста
    hac_cov = cov_hac(model, nlags=5)
    newey_west_se = np.sqrt(np.diag(hac_cov))
    
    # Сравнительная таблица
    comparison = pd.DataFrame({
        'Classical': classical_se,
        'White_Robust': white_se,
        'Newey_West_HAC': newey_west_se,
        'White_vs_Classical_Ratio': white_se / classical_se,
        'HAC_vs_Classical_Ratio': newey_west_se / classical_se
    })
    
    return comparison, model

# Демонстрация на различных типах данных
print("=== Сравнение стандартных ошибок для гомоскедастичного ряда ===")
n = len(df_homo)
exog_homo = np.column_stack([np.ones(n), np.arange(n), np.sin(2*np.pi*np.arange(n)/365.25)])
comparison_homo, model_homo = compare_standard_errors(df_homo['value'].values, exog_homo)
print(comparison_homo.round(6))

print(f"\nR-squared: {model_homo.rsquared:.4f}")
print(f"Durbin-Watson: {sm.stats.stattools.durbin_watson(model_homo.resid):.4f}")

print("\n=== Сравнение стандартных ошибок для ARCH-процесса ===")
n_arch = len(hetero_data['arch_series'])
exog_arch = np.column_stack([np.ones(n_arch), np.arange(n_arch)])
comparison_arch, model_arch = compare_standard_errors(hetero_data['arch_series'], exog_arch)
print(comparison_arch.round(6))

print(f"\nR-squared: {model_arch.rsquared:.4f}")
print(f"Durbin-Watson: {sm.stats.stattools.durbin_watson(model_arch.resid):.4f}")

# Демонстрация влияния на статистическую значимость
def significance_comparison(model, white_se, newey_west_se):
    """Сравнение t-статистик при различных стандартных ошибках"""
    coeffs = model.params
    classical_t = coeffs / model.bse
    white_t = coeffs / white_se
    newey_west_t = coeffs / newey_west_se
    
    # Критическое значение для 5% уровня значимости
    critical_value = stats.t.ppf(0.975, model.df_resid)
    
    significance_df = pd.DataFrame({
        'Coefficient': coeffs,
        'Classical_t': classical_t,
        'White_t': white_t,
        'Newey_West_t': newey_west_t,
        'Classical_Significant': np.abs(classical_t) > critical_value,
        'White_Significant': np.abs(white_t) > critical_value,
        'Newey_West_Significant': np.abs(newey_west_t) > critical_value
    })
    
    return significance_df

print("\n=== Влияние на статистическую значимость (ARCH-процесс) ===")
significance_arch = significance_comparison(model_arch, comparison_arch['White_Robust'], comparison_arch['Newey_West_HAC'])
print(significance_arch.round(4))

=== Сравнение стандартных ошибок для гомоскедастичного ряда ===
   Classical  White_Robust  Newey_West_HAC  White_vs_Classical_Ratio   HAC_vs_Classical_Ratio 
0   0.125688      0.123399        0.119278                  0.981788   0.948999 
1   0.000217      0.000212        0.000212                  0.977967   0.978983
2   0.089184      0.090797        0.086610                  1.018087   0.971136 

R-squared: 0.9136
Durbin-Watson: 2.0170

=== Сравнение стандартных ошибок для ARCH-процесса ===
   Classical  White_Robust  Newey_West_HAC  White_vs_Classical_Ratio   HAC_vs_Classical_Ratio  
0   0.022921      0.021956        0.021175                  0.957899   0.923836  
1   0.000040      0.000038        0.000038                  0.962850   0.954922   

R-squared: 0.0011
Durbin-Watson: 2.0170

=== Влияние на статистическую значимость (ARCH-процесс) ===
   Coefficient  Classical_t  White_t  Newey_West_t  Classical_Significant   White_Significant  Newey_West_Significant
0      -0.0159      -0.6951  -0.7256       -0.7524                  False   False              False 
1       0.0000       1.0557   1.0965        1.1056                  False   False              False

Приведенный анализ демонстрирует критическую важность выбора правильного метода расчета стандартных ошибок. В случае гетероскедастичных данных классические стандартные ошибки могут существенно занижаться, что приводит к завышению статистической значимости коэффициентов. Робастные методы корректируют эти искажения и дают более надежные статистические выводы.

👉🏻 23 способа визуализации котировок с помощью Mplfinance

Взвешенный метод наименьших квадратов

Когда структура гетероскедастичности известна или может быть смоделирована, эффективным решением становится применение взвешенного метода наименьших квадратов (WLS — Weighted Least Squares). Этот подход заключается в присвоении различных весов наблюдениям обратно пропорционально их дисперсии: wᵢ = 1/σᵢ².

Основная идея WLS состоит в том, чтобы дать больший вес наблюдениям с меньшей дисперсией и меньший вес наблюдениям с большей дисперсией. Это приводит к более эффективным оценкам коэффициентов по сравнению с обычным методом наименьших квадратов. Однако практическое применение WLS требует знания или надежной оценки структуры дисперсии, что не всегда возможно.

Двухэтапный метод наименьших квадратов (FGLS — Feasible Generalized Least Squares) представляет собой практическую реализацию идеи взвешивания. На первом этапе подгоняется обычная регрессия и анализируются остатки для выявления структуры гетероскедастичности. На втором этапе используется оценочная структура дисперсии для взвешивания наблюдений.

from scipy.optimize import minimize
from sklearn.preprocessing import StandardScaler

def feasible_gls_estimation(y, X, heterosked_vars=None):
    """
    Реализация двухэтапного обобщенного метода наименьших квадратов
    """
    n, k = X.shape
    
    # Этап 1: Обычная регрессия для получения остатков
    beta_ols = np.linalg.solve(X.T @ X, X.T @ y)
    residuals = y - X @ beta_ols
    
    # Этап 2: Моделирование структуры дисперсии
    if heterosked_vars is None:
        # Используем предсказанные значения как источник гетероскедастичности
        heterosked_vars = X @ beta_ols
    
    # Регрессия логарифма квадратов остатков на переменные гетероскедастичности
    log_sq_residuals = np.log(residuals**2 + 1e-8)  # Добавляем малую константу для стабильности
    
    # Подготавливаем переменные для модели дисперсии
    if len(heterosked_vars.shape) == 1:
        Z = np.column_stack([np.ones(n), heterosked_vars, heterosked_vars**2])
    else:
        Z = np.column_stack([np.ones(n), heterosked_vars])
    
    # Оценка параметров модели дисперсии
    gamma = np.linalg.solve(Z.T @ Z, Z.T @ log_sq_residuals)
    
    # Предсказание дисперсии
    log_sigma2_hat = Z @ gamma
    sigma2_hat = np.exp(log_sigma2_hat)
    weights = 1 / np.sqrt(sigma2_hat)
    
    # Этап 3: Взвешенная регрессия
    X_weighted = X * weights.reshape(-1, 1)
    y_weighted = y * weights
    
    beta_fgls = np.linalg.solve(X_weighted.T @ X_weighted, X_weighted.T @ y_weighted)
    
    # Расчет ковариационной матрицы
    residuals_fgls = y - X @ beta_fgls
    sigma2_fgls = np.sum((residuals_fgls * weights)**2) / (n - k)
    cov_fgls = sigma2_fgls * np.linalg.inv(X_weighted.T @ X_weighted)
    se_fgls = np.sqrt(np.diag(cov_fgls))
    
    return {
        'coefficients': beta_fgls,
        'standard_errors': se_fgls,
        'weights': weights,
        'sigma2_hat': sigma2_hat,
        'residuals': residuals_fgls,
        'gamma': gamma
    }

# Применение FGLS к мультипликативно гетeroскедастичным данным
print("=== FGLS оценка для мультипликативной гетероскедастичности ===")
n_mult = len(hetero_data['multiplicative'])
X_mult = np.column_stack([np.ones(n_mult), np.arange(n_mult), np.arange(n_mult)**2/1000])
y_mult = hetero_data['multiplicative']

# Обычная регрессия
ols_mult = OLS(y_mult, X_mult).fit()
print("OLS результаты:")
print(f"Коэффициенты: {ols_mult.params}")
print(f"Стандартные ошибки: {ols_mult.bse}")
print(f"R-squared: {ols_mult.rsquared:.4f}")

# FGLS оценка
fgls_results = feasible_gls_estimation(y_mult, X_mult)
print("\nFGLS результаты:")
print(f"Коэффициенты: {fgls_results['coefficients']}")
print(f"Стандартные ошибки: {fgls_results['standard_errors']}")

# Сравнение эффективности
efficiency_gain = ols_mult.bse / fgls_results['standard_errors']
print(f"\nПовышение эффективности (OLS SE / FGLS SE): {efficiency_gain}")

# Диагностика остатков после FGLS
weighted_residuals = fgls_results['residuals'] * fgls_results['weights']
print(f"\nДиагностика взвешенных остатков:")
print(f"Среднее: {np.mean(weighted_residuals):.6f}")
print(f"Стандартное отклонение: {np.std(weighted_residuals):.4f}")
print(f"Коэффициент асимметрии: {stats.skew(weighted_residuals):.4f}")
print(f"Коэффициент эксцесса: {stats.kurtosis(weighted_residuals):.4f}")

=== FGLS оценка для мультипликативной гетероскедастичности ===
OLS результаты:
Коэффициенты: [1.03170743e+00 8.07930144e-04 8.81421401e-04]
Стандартные ошибки: [1.67692458e-02 7.75362159e-05 7.51445735e-05]
R-squared: 0.8855

FGLS результаты:
Коэффициенты: [1.02820668e+00 8.30522841e-04 8.58224752e-04]
Стандартные ошибки: [1.12323751e-02 6.36053313e-05 6.99485903e-05]

Повышение эффективности (OLS SE / FGLS SE): [1.49293855 1.21902071 1.07428289]

Диагностика взвешенных остатков:
Среднее: -0.000373
Стандартное отклонение: 1.9358
Коэффициент асимметрии: -0.0478
Коэффициент эксцесса: 0.0767

FGLS метод показывает существенное улучшение эффективности оценок при правильном моделировании структуры гетероскедастичности. Однако его применение требует осторожности, поскольку неправильная спецификация модели дисперсии может привести к менее эффективным оценкам, чем обычный МНК.

👉🏻 Теория вероятностей и биржевая торговля

Модели условной гетероскедастичности: ARCH и GARCH

Модели семейства ARCH (Autoregressive Conditional Heteroskedasticity) представляют собой революционный подход к моделированию изменяющейся во времени дисперсии временных рядов. Роберт Энгл, получивший за разработку этих моделей Нобелевскую премию по экономике в 2003 году, заложил основы современного подхода к анализу финансовых временных рядов.

Основная идея ARCH моделей заключается в том, что условная дисперсия в текущий момент времени зависит от квадратов предыдущих инноваций. Простейшая ARCH(1) модель имеет вид:

σ²ₜ = α₀ + α₁ε²ₜ₋₁,

где σ²ₜ — условная дисперсия в момент t;
εₜ₋₁ — инновация предыдущего периода;
α₀ > 0 и α₁ ≥ 0 для обеспечения положительности дисперсии.

Эта простая формулировка объясняет одну из часто встречающихся закономерностей финансовых временных рядов — кластеризацию волатильности. Периоды высокой волатильности имеют тенденцию следовать за периодами высокой волатильности, а периоды низкой волатильности за периодами низкой волатильности. Такое поведение невозможно адекватно смоделировать с помощью традиционных подходов, предполагающих постоянную дисперсию.

Обобщенные ARCH модели (GARCH)

Тим Боллерслев предложил обобщение ARCH моделей, названное GARCH (Generalized ARCH). GARCH(p,q) модель включает в уравнение условной дисперсии не только лаги квадратов инноваций, но и лаги самой условной дисперсии:

σ²ₜ = α₀ + Σᵢ₌₁ᵖ αᵢε²ₜ₋ᵢ + Σⱼ₌₁ᵠ βⱼσ²ₜ₋ⱼ.

Наиболее популярной спецификацией является GARCH(1,1):

σ²ₜ = α₀ + α₁ε²ₜ₋₁ + β₁σ²ₜ₋₁.

Эта модель позволяет захватить долговременную память в волатильности при использовании всего трех параметров. Условие α₁ + β₁ < 1 обеспечивает стационарность процесса волатильности, а сумма α₁ + β₁ близкая к единице указывает на высокую персистентность волатильности.

Безусловная дисперсия GARCH(1,1) процесса равна α₀/(1 — α₁ — β₁), что позволяет интерпретировать α₀ как базовый уровень волатильности. Параметр α₁ отражает краткосрочную реакцию волатильности на рыночные шоки, в то время как β₁ характеризует инерцию или персистентность волатильности.

Вот как можно построить GARCH(1,1) модель с помощью Python:

from scipy.optimize import minimize
from scipy.stats import norm
import warnings
warnings.filterwarnings('ignore')
class GARCHModel:
"""
Реализация GARCH(1,1) модели с оценкой методом максимального правдоподобия
"""
def __init__(self):
self.params = None
self.fitted_values = None
self.conditional_volatility = None
self.log_likelihood = None
def _garch_likelihood(self, params, returns):
"""
Функция логарифмического правдоподобия для GARCH(1,1)
"""
omega, alpha, beta = params
# Проверка ограничений
if omega <= 0 or alpha < 0 or beta < 0 or alpha + beta >= 1:
return -np.inf
n = len(returns)
sigma2 = np.zeros(n)
# Инициализация условной дисперсии
sigma2[0] = np.var(returns)
# Рекурсивное вычисление условной дисперсии
for t in range(1, n):
sigma2[t] = omega + alpha * returns[t-1]**2 + beta * sigma2[t-1]
# Логарифмическое правдоподобие
log_likelihood = -0.5 * np.sum(np.log(2 * np.pi * sigma2) + returns**2 / sigma2)
return -log_likelihood  # Минимизируем отрицательное правдоподобие
def fit(self, returns):
"""
Оценка параметров GARCH модели
"""
# Начальные значения параметров
initial_params = [np.var(returns) * 0.1, 0.1, 0.8]
# Ограничения для оптимизации
bounds = [(1e-6, None), (0, 0.99), (0, 0.99)]
constraints = {'type': 'ineq', 'fun': lambda x: 0.99 - x[1] - x[2]}
# Оптимизация
result = minimize(
self._garch_likelihood,
initial_params,
args=(returns,),
method='SLSQP',
bounds=bounds,
constraints=constraints,
options={'ftol': 1e-12, 'disp': False}
)
if result.success:
self.params = result.x
self.log_likelihood = -result.fun
# Вычисление условной волатильности
omega, alpha, beta = self.params
n = len(returns)
sigma2 = np.zeros(n)
sigma2[0] = np.var(returns)
for t in range(1, n):
sigma2[t] = omega + alpha * returns[t-1]**2 + beta * sigma2[t-1]
self.conditional_volatility = np.sqrt(sigma2)
self.fitted_values = returns
return True
else:
print(f"Оптимизация не сошлась: {result.message}")
return False
def forecast_volatility(self, horizon=1):
"""
Прогнозирование волатильности на несколько периодов вперед
"""
if self.params is None:
raise ValueError("Модель не обучена")
omega, alpha, beta = self.params
last_return = self.fitted_values[-1]
last_sigma2 = self.conditional_volatility[-1]**2
forecasts = []
current_sigma2 = last_sigma2
# Безусловная дисперсия (долгосрочная)
unconditional_var = omega / (1 - alpha - beta)
for h in range(1, horizon + 1):
if h == 1:
# Одношаговый прогноз
next_sigma2 = omega + alpha * last_return**2 + beta * current_sigma2
else:
# Многошаговые прогнозы сходятся к безусловной дисперсии
persistence = alpha + beta
next_sigma2 = unconditional_var + (persistence)**(h-1) * (current_sigma2 - unconditional_var)
forecasts.append(np.sqrt(next_sigma2))
current_sigma2 = next_sigma2
return np.array(forecasts)
def model_diagnostics(self):
"""
Диагностика модели
"""
if self.params is None:
raise ValueError("Модель не обучена")
omega, alpha, beta = self.params
# Основные характеристики
persistence = alpha + beta
unconditional_vol = np.sqrt(omega / (1 - persistence))
half_life = np.log(0.5) / np.log(persistence) if persistence < 1 else np.inf
# Стандартизированные остатки
std_residuals = self.fitted_values / self.conditional_volatility
diagnostics = {
'parameters': {
'omega': omega,
'alpha': alpha,
'beta': beta
},
'persistence': persistence,
'unconditional_volatility': unconditional_vol,
'half_life': half_life,
'log_likelihood': self.log_likelihood,
'std_residuals_stats': {
'mean': np.mean(std_residuals),
'std': np.std(std_residuals),
'skewness': stats.skew(std_residuals),
'kurtosis': stats.kurtosis(std_residuals),
'jarque_bera': jarque_bera(std_residuals)
}
}
return diagnostics
# Применение GARCH модели к различным типам данных
print("=== GARCH(1,1) моделирование ===")
# Генерация GARCH процесса для демонстрации
np.random.seed(42)
n_garch = 1000
true_omega, true_alpha, true_beta = 0.01, 0.1, 0.85
garch_returns = np.zeros(n_garch)
garch_sigma2 = np.zeros(n_garch)
garch_sigma2[0] = true_omega / (1 - true_alpha - true_beta)
for t in range(1, n_garch):
garch_sigma2[t] = true_omega + true_alpha * garch_returns[t-1]**2 + true_beta * garch_sigma2[t-1]
garch_returns[t] = np.sqrt(garch_sigma2[t]) * np.random.normal()
# Подгонка GARCH модели
garch_model = GARCHModel()
if garch_model.fit(garch_returns):
diagnostics = garch_model.model_diagnostics()
print("Истинные параметры:")
print(f"omega: {true_omega:.4f}, alpha: {true_alpha:.4f}, beta: {true_beta:.4f}")
print(f"Персистентность: {true_alpha + true_beta:.4f}")
print("\nОценочные параметры:")
params = diagnostics['parameters']
print(f"omega: {params['omega']:.4f}, alpha: {params['alpha']:.4f}, beta: {params['beta']:.4f}")
print(f"Персистентность: {diagnostics['persistence']:.4f}")
print(f"Безусловная волатильность: {diagnostics['unconditional_volatility']:.4f}")
print(f"Период полураспада: {diagnostics['half_life']:.2f} дней")
print(f"Логарифмическое правдоподобие: {diagnostics['log_likelihood']:.2f}")
# Прогнозирование волатильности
vol_forecast = garch_model.forecast_volatility(horizon=10)
print(f"\nПрогноз волатильности на 10 периодов:")
for i, vol in enumerate(vol_forecast, 1):
print(f"Период {i}: {vol:.4f}")
# Диагностика стандартизированных остатков
std_res_stats = diagnostics['std_residuals_stats']
print(f"\nДиагностика стандартизированных остатков:")
print(f"Среднее: {std_res_stats['mean']:.4f}")
print(f"Стандартное отклонение: {std_res_stats['std']:.4f}")
print(f"Асимметрия: {std_res_stats['skewness']:.4f}")
print(f"Эксцесс: {std_res_stats['kurtosis']:.4f}")
print(f"Тест Жарка-Бера: статистика={std_res_stats['jarque_bera'][0]:.4f}, p-value={std_res_stats['jarque_bera'][1]:.4f}")
else:
print("Не удалось подогнать GARCH модель")

=== GARCH(1,1) моделирование ===
Истинные параметры:
omega: 0.0100, alpha: 0.1000, beta: 0.8500
Персистентность: 0.9500
Оценочные параметры:
omega: 0.0116, alpha: 0.0760, beta: 0.8552
Персистентность: 0.9313
Безусловная волатильность: 0.4113
Период полураспада: 9.73 дней
Логарифмическое правдоподобие: -507.98
Прогноз волатильности на 10 периодов:
Период 1: 0.4063
Период 2: 0.4067
Период 3: 0.4073
Период 4: 0.4080
Период 5: 0.4088
Период 6: 0.4096
Период 7: 0.4102
Период 8: 0.4106
Период 9: 0.4109
Период 10: 0.4111
Диагностика стандартизированных остатков:
Среднее: 0.0175
Стандартное отклонение: 0.9986
Асимметрия: 0.1042
Эксцесс: 0.0444
Тест Жарка-Бера: статистика=1.8933, p-value=0.3880

Представленная реализация GARCH модели демонстрирует основные принципы работы с условной гетероскедастичностью. Оценка параметров методом максимального правдоподобия обеспечивает состоятельные и эффективные оценки при правильной спецификации модели. Диагностика стандартизированных остатков позволяет проверить адекватность модели.

👉🏻 Байесовская модель пространственно-временного ряда (Bayesian State-Space Time Series Model)

Продвинутые модели волатильности

Стандартные GARCH модели, несмотря на свою популярность, имеют ряд ограничений при моделировании реальных финансовых временных рядов. Одним из наиболее существенных недостатков является симметричная реакция волатильности на положительные и отрицательные шоки одинаковой величины. В действительности финансовые рынки демонстрируют асимметричное поведение, где негативные новости обычно приводят к большему увеличению волатильности, чем позитивные новости той же интенсивности.

Эффект левериджа (leverage effect) или асимметрия волатильности особенно ярко проявляется на фондовых рынках. Падение цен акций обычно сопровождается более значительным ростом волатильности по сравнению с аналогичным по величине ростом цен. Это явление объясняется несколькими факторами: увеличением финансового рычага компаний при падении стоимости активов, изменением восприятия риска инвесторами и психологическими особенностями участников рынка.

Модель GJR-GARCH, предложенная Глостеном, Ягаментаном и Рункле (Glosten, Jagannathan, and Runkle), представляет собой одно из наиболее популярных расширений стандартной GARCH модели для учета асимметрии. Уравнение условной дисперсии имеет вид:

σ²ₜ = ω + αε²ₜ₋₁ + γIₜ₋₁ε²ₜ₋₁ + βσ²ₜ₋₁,

где Iₜ₋₁ — индикаторная функция, равная 1 при εₜ₋₁ < 0 и 0 в противном случае.

Модель EGARCH отличается тем, что использует логарифмическую параметризацию:

ln(σ²ₜ) = ω + β ln(σ²ₜ₋₁) + α|εₜ₋₁/σₜ₋₁| + γεₑ₋₁/σₜ₋₁

Мы уже рассматривали эти модели ранее в статьях Модели GARCH: моделирование волатильности и Волатильность акций, облигаций, деривативов. Как ее посчитать?.

Многомерные модели волатильности

Модели BEKK и DCC

В портфельном управлении и риск-менеджменте часто требуется моделирование совместной динамики волатильности нескольких активов. Многомерные GARCH модели позволяют учесть не только изменение индивидуальных волатильностей, но и динамику корреляций между активами.

Модель BEKK (Baba, Engle, Kraft, and Kroner) представляет собой обобщение GARCH на многомерный случай:

Hₜ = C’C + A’εₜ₋₁ε’ₜ₋₁A + B’Hₜ₋₁B

где Hₜ — матрица условных ковариаций размерности n×n.

Модель DCC (Dynamic Conditional Correlation) предложена Энглом и представляет более гибкий подход к моделированию условных корреляций:

👉🏻 Виды статистических распределений в финансах: их интерпретация и применение

Hₜ = DₜRₜDₜ

где Dₜ — диагональная матрица условных волатильностей, а Rₜ — матрица условных корреляций.

Копула-GARCH модели

Копула-GARCH модели представляют современный подход к моделированию многомерных временных рядов с изменяющейся волатильностью. Они разделяют моделирование маргинальных распределений и структуры зависимости:

Каждый временной ряд моделируется индивидуально с помощью GARCH модели;
Структура зависимости моделируется с помощью копулы;
Параметры копулы могут изменяться во времени.

Такой подход обеспечивает высокую гибкость в моделировании различных типов зависимости и особенно эффективен при моделировании экстремальных событий.

Прогнозирование волатильности

Оценка качества прогнозов волатильности требует специальных подходов, поскольку истинная волатильность не наблюдается напрямую. Основные методы включают:

Прокси-переменные для волатильности:

Квадраты доходностей: Var(rₜ) ≈ r²ₜ
Реализованная волатильность: RVₜ = Σᵢ r²ₜ,ᵢ для внутридневных данных
Диапазон цен: Range-based volatility = ln(High/Low).

Метрики качества прогнозов:

Mean Squared Error (MSE): MSE = 1/n Σ(σ²ₜ — σ̂²ₜ)²
Mean Absolute Error (MAE): MAE = 1/n Σ|σ²ₜ — σ̂²ₜ|
Mincer-Zarnowitz регрессия для проверки несмещенности прогнозов.

Комбинирование прогнозов волатильности

Исследования показывают, что комбинирование прогнозов различных моделей часто дает лучшие результаты, чем использование одной модели. Основные подходы включают:

Простое усреднение: σ̂²ₜ,combined = 1/n Σᵢ σ̂²ₜ,ᵢ
Взвешенное усреднение: σ̂²ₜ,combined = Σᵢ wᵢσ̂²ₜ,ᵢ

где веса wᵢ определяются на основе исторической точности моделей.

Байесовское усреднение моделей (BMA) использует байесовские веса, основанные на предельных правдоподобиях моделей.

Применение в риск-менеджменте

Value at Risk (VaR) и Expected Shortfall (ES)

Точное моделирование волатильности критически важно для расчета мер риска. При наличии гетероскедастичности использование постоянной исторической волатильности приводит к существенным ошибкам в оценке VaR.

Параметрический VaR с GARCH моделями рассчитывается по следующей формуле:

VaRₜ₊₁(α) = μₜ₊₁ + σₜ₊₁ × Φ⁻¹(α)

где σₜ₊₁ — прогноз условной волатильности из GARCH модели.

Также в количественном анализе широко используются методы симуляции исторических волатильностей:

Стандартизация исторических доходностей: zₜ = rₜ/σₜ
Ресэмплинг стандартизированных инноваций
Генерация сценариев: rₜ₊₁ = μₜ₊₁ + σₜ₊₁ × zₜ*

Стресс-тестирование и сценарный анализ

GARCH модели позволяют проводить более реалистичное стресс-тестирование, учитывающее кластеризацию волатильности. Основные подходы включают:

Исторические сценарии с корректировкой на текущий уровень волатильности;
Гипотетические сценарии с моделированием изменения режимов волатильности;
Монте-Карло симуляции на основе оцененных GARCH моделей.

Практические рекомендации и ограничения

Выбор оптимальной модели волатильности зависит от специфики данных и целей анализа:

Для финансовых временных рядов:

GARCH(1,1) как базовая модель;
GJR-GARCH при наличии асимметрии;
EGARCH для логнормальных данных;
Модели с толстыми хвостами (t-GARCH) при наличии экстремальных событий.

Для портфельного анализа:

DCC-GARCH для моделирования условных корреляций;
Копула-GARCH для сложных структур зависимости;
Factor-GARCH для высокоразмерных портфелей.

Финансовые временные ряды часто содержат структурные изменения в волатильности. Основные подходы к их обработке:

Модели с переключением режимов (Markov-Switching GARCH);
Модели с изменяющимися параметрами (TV-GARCH);
Робастные методы оценки с anomaly downwaiting;
Адаптивные модели с забыванием старых наблюдений.

Нужно учитывать, что оценка сложных GARCH-моделей может быть вычислительно затратной, особенно при увеличении размерности модели или усложнении ее структуры. Чтобы повысить устойчивость оценки и сократить время вычислений, я рекомендую следовать следующим практическим советам:

Используйте как можно более вероятные начальные приближения для параметров модели — это ускорит сходимость оптимизационного алгоритма и снизит риск попадания в локальные минимумы;
Применяйте численные методы второго порядка, такие как BFGS или Newton-Raphson, которые обеспечивают более точную и устойчивую оценку по сравнению с градиентными методами первого порядка;
Используйте параллельные вычисления, особенно при работе с многомерными GARCH-моделями (например, DCC-GARCH или BEKK), в которых объем вычислений растет квадратично с количеством активов.

Эти подходы помогут не только ускорить процесс, но и повысить надежность получаемых результатов при работе с реальными финансовыми данными.

Заключение

Гомоскедастичность и гетероскедастичность представляют фундаментальные характеристики временных рядов, глубокое понимание которых критически важно для успешного применения эконометрических методов в современном количественном анализе. Исследование, представленное в данной статье, демонстрирует как теоретические основы этих концепций, так и их практическое значение для финансового моделирования и риск-менеджмента.

Игнорирование гетероскедастичности может приводить к систематическим ошибкам в оценке рисков, особенно в периоды рыночной нестабильности. Правильная диагностика наличия и типа гетероскедастичности определяет адекватность всех последующих этапов анализа. Комбинирование визуальных методов с формальными статистическими тестами обеспечивает надежную основу для выбора соответствующих моделей и корректные оценки Value at Risk и Expected Shortfall — ключевых метрик расчета риска в инвестициях.