-
Прогнозирование временных рядов с помощью ARIMA, SARIMA, ARFIMA
В мире анализа данных и машинного обучения прогнозирование временных рядов остается одной из самых востребованных и сложных задач. За годы работы с различными проектами в области Data Science я неоднократно сталкивался с необходимостью построения точных прогнозов на основе исторических данных. В этой статье я поделюсь своим опытом использования классических моделей прогнозирования ARIMA, SARIMA и ARFIMA,…
-
Поиск аномалий в данных с Python
Аномалии в данных (или выбросы) представляют собой нетипичные, необычные или экстремальные значения, которые могут указывать на ошибки, всплески, странные события, атаку конкурентов, мошенников и другие потенциальные проблемы. Большое количество аномалий не только пагубно влияет на многие бизнес-модели, но еще может затруднить машинное обучение или вовсе исказить его результаты. Вот почему их важно обнаруживать и работать…
-
Прогнозирование временных рядов с помощью N-HITS, N-BEATS
В мире data science и машинного обучения постоянно появляются новые методы и алгоритмы, призванные решать сложные задачи прогнозирования временных рядов. Сегодня я хочу поделиться с вами информацией о двух передовых моделях нейронных сетей для прогнозирования временных рядов: N-HITS и N-BEATS. N-HITS расшифровывается как Neural Hierarchical Interpolation for Time Series, а N-BEATS – Neural Basis Expansion…
-
Прогнозирование трафика и конверсий сайта с помощью SVM, SVR (опорных векторов)
Данные веб-аналитики являются многомерными. И хорошо бы чтобы модель машинного обучения учитывала это. SVM (Support Vector Machines) и SVR (Support Vector Regression) – это мощные алгоритмы машинного обучения, которые отлично подходят для работы с многомерными данными. Когда мы анализируем трафик и конверсии, мы имеем дело с множеством факторов: источники трафика, поведение пользователей на сайте, сезонность,…
-
Анализ акций Tesla с помощью Python
Целью этого проекта был анализ возможностей Python для исследования цен на акции. Легенда этого исследования такова: некий инвестор хочет инвестировать в акции Tesla, потому что он видит хорошую тенденцию к росту на многочисленных биржевых сайтах. Я, как аналитик, должен ответить ему хорошее ли сейчас время для покупки или нет. Поскольку Python сам строит графики, а…
-
Сглаживание временных рядов и шума в данных с помощью Kalman Filter
В мире анализа данных и машинного обучения мы часто сталкиваемся с временными рядами, которые содержат значительное количество шума. Этот шум может затруднять выявление истинных закономерностей и трендов, критически важных для принятия обоснованных решений. Именно поэтому сглаживание временных рядов и фильтрация шума стали неотъемлемой частью предобработки данных в различных областях: от финансового прогнозирования до управления автономными…
-
Прогнозирование трафика и конверсий сайта с помощью Prophet
Prophet – это библиотека с открытым исходным кодом, разработанная специально для прогнозирования временных рядов. Она основана на декомпозиционной модели, которая учитывает тренд, сезонность и праздничные эффекты. Prophet особенно хорошо подходит для задач прогнозирования с сильными сезонными паттернами и несколькими циклами в исторических данных. Ключевые особенности Prophet: Простота использования: не требует глубоких знаний в области статистики…
-
Прогнозирование трафика и конверсий сайта с помощью LightGBM
LightGBM (Light Gradient Boosting Machine) – это высокоэффективная реализация градиентного бустинга, которая в последние годы завоевала популярность среди специалистов по машинному обучению благодаря своей скорости и точности. В этой статье мы глубоко погрузимся в то, как использовать LightGBM для прогнозирования ключевых метрик веб-сайта, рассмотрим конкретные примеры кода и обсудим лучшие практики. Почему LightGBM является эффективным…
-
Новейшие модели прогнозирования временных рядов
Прогнозирование временных рядов – одна из важнейших задач в области data science. Долгое время эти задачи не доверяли нейронным сетям: исследователи предпочитали использовать быстрые, надежные и понятные методы классического машинного обучения. К тому же, точность нейронок в таких задачах оставляла желать лучшего. Однако, в последние годы кое-что изменилось – нейросети начали побеждать классические ML алгоритмы…