Изменения
CatBoost
,Нет описания правки
== Метрики ==
----
== Как работает градиентный бустинг? ==
----
* Бутстрап Бернулли - выбираем документ с вероятностью ''p''. Регулируется параметром ''sample rate''
* Байесовский бутстрап - байесовское распределение. Регулируется параметром ''bagging temp''
Отметим, что бутстрап используется только для выбора структуры дерева, для подсчета значения в листьях используем всю выборку. Это сделано так как выбор структуры дерева происходит долго, нужно несколько раз пересчитывать значения, поэтому использовать всю выборку - слишком дорого. Однако значения в листьях с уже готовой структурой дерева считаются один раз, и для большей точности можно позволить использовать весь датасет.
* Bagging_temp
* Глубина дерева (стоит попробовать 10 и 6)
== Полезная функциональность ==
* Snapshots
* Overfitting detector
* cv
* eval_metrics
== Бенчмрки ==
Сравнение библиотеки CatBoost с открытыми аналогами XGBoost, LightGBM и H20 на наборе публичных датасетов. Результаты - [https://catboost.yandex/#benchmark]