-
Скользящие оконные функции в Pandas
Скользящие оконные функции решают фундаментальную задачу анализа временных рядов: извлечение локальных паттернов из последовательных данных. Метод основан на применении агрегирующих операций к подмножествам наблюдений фиксированного размера, которые последовательно сдвигаются вдоль временной оси. Библиотека Pandas предоставляет три типа окон для работы с…
-
Продвинутые статистические тесты в Python: причинность, бустрэп и непараметрические методы
Стандартные статистические тесты опираются на строгие допущения. Они предполагают нормальное распределение данных, независимость наблюдений и линейные связи между переменными. Финансовые данные этим требованиям обычно не соответствуют. Доходности активов имеют тяжелые хвосты распределений. Волатильность склонна группироваться во времени. Связи между финансовыми инструментами…
-
EGARCH, TGARCH, FIGARCH для моделирования асимметричной волатильности
Волатильность большинства финансовых активов ассиметрична: негативные шоки увеличивают ее сильнее, чем позитивные той же величины. Классическая модель GARCH (1,1) предполагает симметричный отклик условной дисперсии, что приводит к систематическим ошибкам в оценке риска и неэффективному хеджированию опционных позиций. Эконометрические модели EGARCH, TGARCH…
-
Автоматизация заполнения пропусков на основе сравнения 14 методов
Пропуски в данных или NaN — это одна из самых частых проблем, с которой сталкиваются аналитики. И мало эти пропуски найти, важно еще правильно поработать с ними. Библиотека pandas предлагает множество методов замены пропусков, но на практике нередко возникает другой вопрос:…
-
Собственные числа и собственные векторы в финансах: разложения PCA и SVD
Анализ главных компонент (PCA) — один из популярных способов изучения взаимосвязей между доходностями активов и их оценке в финансовом анализе. Метод основан на разложении ковариационной матрицы доходностей: собственные векторы определяют направления факторов, а собственные числа показывают, сколько дисперсии объясняет каждый фактор.…
-
Обзор книги «Apache Superset Quick Start Guide»
Книга «Apache Superset Quick Start Guide» за авторством Ш. Шекхара, издана Packt Publishing в 2018 году. Цель книги — демострация преимуществ и возможностей Apache Superset, и то как их применять на практике. Автор подробно разбирает подключение Superset к базам данных, работающим…
-
Масштабирование признаков в ML: StandardScaler, MinMaxScaler, RobustScaler и другие методы
Масштабирование признаков — базовая процедура предобработки данных, влияющая на скорость обучения и качество предсказаний большинства алгоритмов машинного обучения. Признаки в датасете часто имеют разные единицы измерения и диапазоны значений: цена акции может варьироваться от $10 до $500, объем торгов — от…
-
Градиентный бустинг: концепция и механизм работы
Градиентный бустинг относится к семейству ансамблевых методов машинного обучения, где финальное предсказание формируется как взвешенная сумма предсказаний множества слабых моделей. Ключевое отличие от других ансамблевых подходов — последовательное обучение, при котором каждая новая модель корректирует ошибки предыдущих. Алгоритм строит композицию из…
-
Винрейт (Winrate) и Соотношение риск/прибыль (Risk/Reward Ratio, RRR)
Эффективность торговой стратегии определяется двумя базовыми метриками: винрейтом и соотношением риск/прибыль. Винрейт показывает долю прибыльных сделок, RRR — соотношение потенциальной прибыли к риску в каждой позиции. Обе метрики связаны математически: стратегия с винрейтом 30% может быть прибыльной при RRR 3:1, тогда…
-
Портфель максимальной диверсификации (Maximum Diversification Portfolio)
Портфель максимальной диверсификации (Maximum Diversification Portfolio) представляет альтернативу классическим подходам к формированию инвестиционных портфелей. В отличие от метода Марковица, который требует оценки ожидаемой доходности активов, максимальная диверсификация фокусируется исключительно на структуре риска. Метод строится на максимизации диверсификационного коэффициента — отношения взвешенной…
Добро пожаловать на сайт Machine Learning Guru! Здесь вы найдете увлекательные статьи и полезные советы о data science, машинном обучении, нейронных сетях, финансовой и биржевой аналитике, веб-аналитике, прогнозировании данных, временных рядах и современных алгоритмах исскуственного интеллекта.
На сайте mlgu.ru представлены: гайды по исследованиям данных, примеры кода на Python, SQL и других языках программирования, примеры анализа данных и построения ML-моделей в различных сферах и проектах. Здесь вы также найдете обзоры новейших инструментов и библиотек data science и machine learning, а также сможете ознакомиться с лучшими практиками по оптимизации бизнес-процессов с помощью этих инструментов.