Изменения

Перейти к: навигация, поиск

CatBoost

12 байт добавлено, 10:20, 26 ноября 2018
Режимов выборки данных
CatBoost поддерживает несколько режимов выборки данных
* Бутстрап (англ. ''bootstrap'') Бернулли {{- --}} выбираем документ с вероятностью ''p''. Регулируется параметром ''sample_rate''* Байесовский бутстрап {{--- }} байесовское распределение. Регулируется параметром ''bagging_temp''
Отметим, что бутстрап используется только для выбора структуры дерева, для подсчета значения в листьях используем всю выборку. Это сделано так как выбор структуры дерева происходит долго, нужно несколько раз пересчитывать значения, поэтому использовать всю выборку - слишком дорого. Однако значения в листьях с уже готовой структурой дерева считаются один раз, и для большей точности можно позволить использовать весь датасет.
Анонимный участник

Навигация