-
EGARCH, TGARCH, FIGARCH для моделирования асимметричной волатильности
Волатильность большинства финансовых активов ассиметрична: негативные шоки увеличивают ее сильнее, чем позитивные той же величины. Классическая модель GARCH (1,1) предполагает симметричный отклик условной дисперсии, что приводит к систематическим ошибкам в оценке риска и неэффективному хеджированию опционных позиций. Эконометрические модели EGARCH, TGARCH…
-
Автоматизация заполнения пропусков на основе сравнения 14 методов
Пропуски в данных или NaN — это одна из самых частых проблем, с которой сталкиваются аналитики. И мало эти пропуски найти, важно еще правильно поработать с ними. Библиотека pandas предлагает множество методов замены пропусков, но на практике нередко возникает другой вопрос:…
-
Собственные числа и собственные векторы в финансах: разложения PCA и SVD
Анализ главных компонент (PCA) — один из популярных способов изучения взаимосвязей между доходностями активов и их оценке в финансовом анализе. Метод основан на разложении ковариационной матрицы доходностей: собственные векторы определяют направления факторов, а собственные числа показывают, сколько дисперсии объясняет каждый фактор.…
-
Обзор книги «Apache Superset Quick Start Guide»
Книга «Apache Superset Quick Start Guide» за авторством Ш. Шекхара, издана Packt Publishing в 2018 году. Цель книги — демострация преимуществ и возможностей Apache Superset, и то как их применять на практике. Автор подробно разбирает подключение Superset к базам данных, работающим…
-
Масштабирование признаков в ML: StandardScaler, MinMaxScaler, RobustScaler и другие методы
Масштабирование признаков — базовая процедура предобработки данных, влияющая на скорость обучения и качество предсказаний большинства алгоритмов машинного обучения. Признаки в датасете часто имеют разные единицы измерения и диапазоны значений: цена акции может варьироваться от $10 до $500, объем торгов — от…
-
Градиентный бустинг: концепция и механизм работы
Градиентный бустинг относится к семейству ансамблевых методов машинного обучения, где финальное предсказание формируется как взвешенная сумма предсказаний множества слабых моделей. Ключевое отличие от других ансамблевых подходов — последовательное обучение, при котором каждая новая модель корректирует ошибки предыдущих. Алгоритм строит композицию из…
-
Винрейт (Winrate) и Соотношение риск/прибыль (Risk/Reward Ratio, RRR)
Эффективность торговой стратегии определяется двумя базовыми метриками: винрейтом и соотношением риск/прибыль. Винрейт показывает долю прибыльных сделок, RRR — соотношение потенциальной прибыли к риску в каждой позиции. Обе метрики связаны математически: стратегия с винрейтом 30% может быть прибыльной при RRR 3:1, тогда…
-
Портфель максимальной диверсификации (Maximum Diversification Portfolio)
Портфель максимальной диверсификации (Maximum Diversification Portfolio) представляет альтернативу классическим подходам к формированию инвестиционных портфелей. В отличие от метода Марковица, который требует оценки ожидаемой доходности активов, максимальная диверсификация фокусируется исключительно на структуре риска. Метод строится на максимизации диверсификационного коэффициента — отношения взвешенной…
-
Портфель минимальной волатильности (Minimum Variance Portfolio)
Портфель минимальной волатильности (Minimum Variance Portfolio, MVP) — метод построения инвестиционного портфеля, где целевая функция оптимизации направлена исключительно на минимизацию риска, без учета ожидаемой доходности активов. Подход решает задачу поиска такой комбинации весов активов, при которой волатильность портфеля достигает минимального значения…
-
Случайный лес (Random Forest): механика алгоритма, Бутстрэп-агрегирование, out-of-bag оценка
Random Forest или Случайный лес — это ансамблевый алгоритм машинного обучения, объединяющий множество деревьев решений для повышения точности и устойчивости предсказаний. Алгоритм был предложен Лео Брейманом в 2001 году и с тех пор стал одним из наиболее используемых методов в задачах…
Добро пожаловать на сайт Machine Learning Guru! Здесь вы найдете увлекательные статьи и полезные советы о data science, машинном обучении, нейронных сетях, финансовой и биржевой аналитике, веб-аналитике, прогнозировании данных, временных рядах и современных алгоритмах исскуственного интеллекта.
На сайте mlgu.ru представлены: гайды по исследованиям данных, примеры кода на Python, SQL и других языках программирования, примеры анализа данных и построения ML-моделей в различных сферах и проектах. Здесь вы также найдете обзоры новейших инструментов и библиотек data science и machine learning, а также сможете ознакомиться с лучшими практиками по оптимизации бизнес-процессов с помощью этих инструментов.