-
Детекция аномалий через Isolation Forest
Аномалии в данных бывают разными. Большинство — это шум, ошибки сбора, сбитые логи или просто разовые всплески, которые искажают распределения и ухудшают работу моделей. Но среди них могут встречаться действительно важные точки — те, что указывают на сбои в системах, подозрительные действия пользователей или нетипичную динамику бизнес-показателей. В большинстве примеров из учебных пособий аномалии легко…
-
Ad hoc задачи в финансовой аналитике
Ad hoc задачи — это нестандартные, часто разовые аналитические исследования, выполняемые для решения конкретной проблемы или ответа на специфический вопрос. В отличие от регулярных отчетов и стандартизированных аналитических процедур, они требуют индивидуального подхода, творческого мышления и глубокого понимания предметной области. Ad hoc можно перевести с латинского как «для этого», «для данного случая». То есть это…
-
Поиск аномалий в данных с Python
Аномалии в данных (или выбросы) представляют собой нетипичные, необычные или экстремальные значения, которые могут указывать на ошибки, всплески, странные события, атаку конкурентов, мошенников и другие потенциальные проблемы. Большое количество аномалий не только пагубно влияет на многие бизнес-модели, но еще может затруднить машинное обучение или вовсе исказить его результаты. Вот почему их важно обнаруживать и работать…