Изменения

Перейти к: навигация, поиск

CatBoost

117 байт добавлено, 19:06, 25 ноября 2018
Работа с категориальными фичами
== Работа с категориальными фичами ==
* LabelEncoding - работает плохона реальных примерах точность работы низкая, так как появляется отношения порядка между объектами.* One-hot encoding - работаетдает неплохую точность, если различных значений фичи признаков не много. Иначе одна фича один признак размножится на множество фичей признаков и будет влиять на модель заведомо сильнее остальных фичей.
Лучше не делать препроцессинг самим, из-за проблем, описанных выше. В CatBoost можно задать параметр cat_features, передав туда индексы категориальных фичей. Также можно отрегулировать параметр ''one_hot_max_size'' - максимальное количество различных значений у категориальной фичикатегориального признака, чтобы она могла он мог в последствии быть подвержена подвержен one-hot encoding.
== Подбор параметров ==
Анонимный участник

Навигация