Изменения
CatBoost
,→Работа с датасетом
CatBoost поддерживает несколько режимов выборки данных
* Бутстрап Бернулли - выбираем документ с вероятностью ''p''. Регулируется параметром ''sample ratesample_rate''* Байесовский бутстрап - байесовское распределение. Регулируется параметром ''bagging tempbagging_temp''
Отметим, что бутстрап используется только для выбора структуры дерева, для подсчета значения в листьях используем всю выборку. Это сделано так как выбор структуры дерева происходит долго, нужно несколько раз пересчитывать значения, поэтому использовать всю выборку - слишком дорого. Однако значения в листьях с уже готовой структурой дерева считаются один раз, и для большей точности можно позволить использовать весь датасет.