Изменения

Перейти к: навигация, поиск

CatBoost

241 байт добавлено, 22:59, 25 ноября 2018
Нет описания правки
Статья посвящена работе с библиотекой CatBoost {{---}} методу машинного обучения, основанному на градиентном бустинге(англ. gradient boosting).
Практически любой современный метод на основе градиентного бустинга работает с числами. Это приводит к искажению их сути и потенциальному снижению точности работы модели.
Именно поэтому было важно научить машину работать не только с числами, но и с категориями напрямую, закономерности между которыми она будет выявлять самостоятельно, без ручной «помощи».
CatBoost разработан так, чтобы одинаково хорошо работать «из коробки» как с числовыми признаками(англ. features), так и с категориальными(англ. categorical features).
Документацию можно найти здесь: [https://tech.yandex.com/catboost/doc/dg/concepts/about-docpage/].
=== Метрики ===
Поддерживает множество метрик(англ. metrics), таких как:* Регрессия(англ. regression): ''MAE, MAPE, RMSE, SMAPE'' etc.* Классификация(англ. classification): ''Logloss , Precision, Recall, F1, CrossEntropy, BalancedAccuracy'' etc.* Мультиклассификация(англ. multiclass classification): ''MultiClass, MultiClassOneVsAll, HammingLoss, F1'' etc.* Ранжирование(англ. ranking): ''NDCG, PrecisionAt, RecallAt, PFound, PairLogit'' etc.
== Обучение ==
== Подбор параметров ==
Ниже описаны гиперпараметры(англ. hyper parameters), на которые стоит обратить внимание при использовании библиотеки.
* cat_features
Анонимный участник

Навигация