Изменения
CatBoost
,→Работа с категориальными признаками
=== Работа с категориальными признаками ===
* LabelEncoding {{- --}} на реальных примерах точность работы низкая, так как появляется отношения порядка между объектами.* One-hot encoding {{--- }} дает неплохую точность, если различных значений признаков не много. Иначе один признак размножится на множество признаков и будет влиять на модель заведомо сильнее остальных признаков.
Лучше не делать препроцессинг самим, из-за проблем, описанных выше. В CatBoost можно задать параметр cat_features, передав туда индексы категориальных признаков. Также можно отрегулировать параметр ''one_hot_max_size'' {{- --}} максимальное количество различных значений у категориального признака, чтобы он мог в последствии быть подвержен one-hot encoding.
== Подбор параметров ==