-
Массивы NumPy и Pandas. Техники дескриптивного анализа
В мире анализа данных сложно переоценить важность эффективных инструментов для работы с большими массивами информации. В этой статье я хочу поделиться своим опытом использования двух фундаментальных библиотек Python для анализа данных: NumPy и Pandas, а также рассказать о техниках дескриптивного анализа, которые позволяют извлечь максимум полезной информации из имеющихся данных. Фишки NumPy: высокопроизводительные вычисления с…
-
Анализ фьючерса на Brent с помощью Pandas, Sklearn, Hmmlearn
Фьючерсы на Brent являются международным эталоном для мировых цен на нефть, их мониторят нефтяные трейдеры во всем мире. Они представляют собой контракты, которые обязывают покупателя приобрести, а продавца продать определенное количество нефти в будущем по цене, согласованной сегодня. Профессиональный анализ фьючерсов на нефть Brent может дать значительное преимущество трейдерам и инвесторам, особенно если применять современные…
-
Анализ данных с Python на примере исследования изменения температуры в мире и России
Среднегодовая температура воздуха в большинстве стран растет с каждым годом. Это факт. И виноват в этом в первую очередь человек. Ученые подтвердили связь, а также влияние человеческой деятельности на климат. Многочисленные свидетельства указывают на беспрецедентный уровень изменения климата в истории человечества. В период с 2011 по 2020 год глобальная температура поверхности Земли была примерно на…
-
RFM-анализ с помощью Python
RFM-анализ — это мощный метод сегментации клиентов, основанный на трех ключевых метриках их поведения: Recency (давность последней покупки), Frequency (частота покупок) и Monetary Value (денежная ценность клиента). За свою карьеру в области data science я убедился, что это один из самых эффективных способов понять и структурировать клиентскую базу. Каждый раз, когда я применяю RFM-анализ в…
-
Анализ данных с Python на примере инцидентов с автобусами Лондона
Лондон — это столица Великобритании и один из крупнейших городов мира. Этот город также обладает одной из самых развитых транспортных систем в мире. Лондонский метрополитен — один из крупнейших и старейших в мире, общая протяженность его сети превышает 400 км и насчитывает 270 станций. Автобусная сеть Лондона также является одной из крупнейших в мире. Она…
-
Анализ песен рейтинга Billboard Top-100 с 1958 по 2023 гг
Честно говоря, я не очень верю в рейтинги песен. Потому что музыка сегодня — это, в основном, дело вкуса. И то, что популярно в одних сообществах, не обязательно популярно в других. Однако надо признать, что такие рейтинги существуют, за ними следят, их изучают, и артисты стараются попасть в них любой ценой. Особенно если такие рейтинги…
-
Как предсказать отток клиентов с помощью машинного обучения
Клиентский отток — это одна из ключевых проблем современного бизнеса, особенно для компаний, работающих по модели подписки или регулярных продаж. В этой статье я поделюсь своим опытом и расскажу, как построить эффективную модель машинного обучения для предсказания оттока. Почему прогнозирование оттока так важно? Привлечение нового клиента обходится бизнесу в 5-25 раз дороже, чем удержание существующего.…
-
Профессиональный анализ данных бизнеса с помощью Python и Pandas
Многие владельцы бизнеса не хотят погружаться в аналитику. И это нормально. У этих людей совершенно другие приоритеты: им нужно развивать свой бизнес, встречаться с важными клиентами, управлять персоналом, решать стратегические проблемы. У них нет времени погружаться в детали. И в этой ситуации крайне важно иметь под рукой опытного аналитика, желательно дата саентиста. Имея такого человека…
-
Big Data исследование: Снимали ли кино раньше лучше, чем сейчас?
Полагаю что вы согласитесь со мной, что сегодня найти хороший фильм гораздо сложнее, чем это было лет 10-20 назад. Это связано с тем, что сегодня киноиндустрия выпускает тысячи фильмов в год. Это в десятки раз больше, чем в 90-е, и в сотни раз больше, чем в 50-е. Безусловно, огромное количество сказывается на качестве. Точнее, на…
-
Анализ поездок в такси с помощью статистических методов
Пожалуй, каждый владелец таксопарка хоть раз, но задумывался о том, стоит ли тратить больше денег на более дорогие автомобили. С одной стороны, это кажется плохой идеей, но данные бизнес-анализа доказывают обратное. В этой статье я провел исследование поездок одной известной российской компании по предоставлению услуг такси и обнаружил интересную закономерность: чем выше класс автомобиля, тем…