Изменения
CatBoost
,→Работа с категориальными фичами
* GreedyLogSum - аналог MaxSumLog, однако в основе лежит жадность, поэтому работает не точно, однако быстрее чем MaxSumLog
=== Работа с категориальными фичами признаками ===
* LabelEncoding - на реальных примерах точность работы низкая, так как появляется отношения порядка между объектами.
* One-hot encoding - дает неплохую точность, если различных значений признаков не много. Иначе один признак размножится на множество признаков и будет влиять на модель заведомо сильнее остальных фичейпризнаков.
Лучше не делать препроцессинг самим, из-за проблем, описанных выше. В CatBoost можно задать параметр cat_features, передав туда индексы категориальных фичейпризнаков. Также можно отрегулировать параметр ''one_hot_max_size'' - максимальное количество различных значений у категориального признака, чтобы он мог в последствии быть подвержен one-hot encoding.
== Подбор параметров ==