Изменения

Перейти к: навигация, поиск

CatBoost

4 байта убрано, 02:53, 8 ноября 2018
Работа с датасетом
CatBoost поддерживает несколько режимов выборки данных
* Бутстрап Бернулли - выбираем документ с вероятностью ''p''. Регулируется параметром ''sample rate''
* Байесовский бутстрап - байесовское распределение. Регулируется параметром ''bagging temp''
'' Отметим, что бутстрап используется только для выбора структуры дерева, для подсчета значения в листьях используем всю выборку. Это сделано так как выбор структуры дерева происходит долго, нужно несколько раз пересчитывать значения, поэтому использовать всю выборку - слишком дорого. Однако значения в листьях с уже готовой структурой дерева считаются один раз, и для большей точности можно позволить использовать весь датасет.''
----
Анонимный участник

Навигация