Изменения

Перейти к: навигация, поиск

CatBoost

61 байт добавлено, 23:02, 25 ноября 2018
Нет описания правки
Статья посвящена работе с библиотекой CatBoost {{---}} методу машинного обучения, основанному на градиентном бустинге (англ. ''gradient boosting'').
Практически любой современный метод на основе градиентного бустинга работает с числами. Это приводит к искажению их сути и потенциальному снижению точности работы модели.
Именно поэтому было важно научить машину работать не только с числами, но и с категориями напрямую, закономерности между которыми она будет выявлять самостоятельно, без ручной «помощи».
CatBoost разработан так, чтобы одинаково хорошо работать «из коробки» как с числовыми признаками (англ. ''features''), так и с категориальными (англ. ''categorical features'').
Документацию можно найти здесь: [https://tech.yandex.com/catboost/doc/dg/concepts/about-docpage/].
=== Режимы работы ===
* Регрессия (англ. ''regression'') * Классификация (англ. ''classification'')Функция потерь (англ. ''loss function'' - максимизируем вероятность того что все объекты в обучающей выборке классифицированы правильно, вероятность - это сигмоида над значением формулы
Функция ```predict_proba``` - на вхоже получаем готовый вероятности. Нужно отметить, что складывать их уже нельзя.
Функция ```predict``` - выдает необработанный результат. Такой результат можно складывать, например, с результатами других моделей.
* Мультиклассификация (англ. ''multiclass classification'')* Ранжирование (англ. ''ranking'')
Объекты с попарной классификацией
=== Метрики ===
Поддерживает множество метрик (англ. ''metrics''), таких как:* Регрессия (англ. regression): ''MAE, MAPE, RMSE, SMAPE'' etc.* Классификация (англ. classification): ''Logloss , Precision, Recall, F1, CrossEntropy, BalancedAccuracy'' etc.* Мультиклассификация (англ. multiclass classification): ''MultiClass, MultiClassOneVsAll, HammingLoss, F1'' etc.* Ранжирование (англ. ranking): ''NDCG, PrecisionAt, RecallAt, PFound, PairLogit'' etc.
== Обучение ==
== Подбор параметров ==
Ниже описаны гиперпараметры (англ. ''hyper parameters''), на которые стоит обратить внимание при использовании библиотеки.
* cat_features
Анонимный участник

Навигация