Изменения

Перейти к: навигация, поиск

CatBoost

1 байт убрано, 02:53, 8 ноября 2018
Работа с категориальными фичами
* LabelEncoding - работает плохо, так как появляется отношения порядка между объектами.
* One-hot encoding - работает, если различных значений фичи не много. Иначе одна фича размножится на множество фичей и влиять на модель заведомо сильнее остальных фичей.
 
Лучше не делать препроцессинг самим, из-за проблем, описанных выше. В CatBoost можно задать параметр cat_features, передав туда индексы категориальных фичей. Также можно отрегулировать параметр ''one_hot_max_size'' - максимальное количество различных значений у категориальной фичи, чтобы она могла в последствии быть подвержена one-hot encoding.
Анонимный участник

Навигация