-
Виды функций потерь в машинном обучении
Функция потерь — это способ «сообщить» модели, какие ошибки наиболее критичны. Математическая формулировка напрямую влияет на поведение модели во время обучения: какие ошибки минимизируются в приоритетном порядке, как модель реагирует на выбросы и насколько агрессивно оптимизирует параметры. Оптимизация этой функции через градиентный спуск составляет основу обучения моделей машинного обучения. Разные типы задач требуют разных функций…
-
Метрики качества ML-моделей: Accuracy, Precision, Recall, F1 Score, ROC-AUC
Когда мы создаем или обучаем модель машинного обучения, один из первых вопросов, который возникает: насколько хорошо она работает? Ответить на него не так просто, ведь разные задачи требуют разных критериев оценки, и не существует универсальной метрики для всех случаев. Поэтому в практике Data Science применяют целый набор показателей, позволяющих рассмотреть модель с разных сторон и…
-
Методы разделения деревьев решений: Gini, Энтропия, Gain Ratio, Хи-квадрат, Variance Reduction, Classification Error
Деревья решений остаются одним из самых интуитивно понятных и мощных инструментов в арсенале специалиста по данным. Выбор критерия разделения деревьев без преувеличения влияет на все: от скорости обучения до интерпретируемости результатов. В процессе работы с финансовыми данными я обнаружил, что разные критерии могут давать совершенно разные результаты даже на одних и тех же данных. Некоторые…
-
Прогнозирование трафика и конверсий сайта с помощью SVM, SVR (опорных векторов)
Данные веб-аналитики являются многомерными. И хорошо бы чтобы модель машинного обучения учитывала это. SVM (Support Vector Machines) и SVR (Support Vector Regression) — это мощные алгоритмы машинного обучения, которые отлично подходят для работы с многомерными данными. Когда мы анализируем трафик и конверсии, мы имеем дело с множеством факторов: источники трафика, поведение пользователей на сайте, сезонность,…