Изменения

Перейти к: навигация, поиск

XGBoost

2422 байта добавлено, 14:03, 30 марта 2019
Основные преимущества
Она вскоре стала использоваться с несколькими другими пакетами, что облегчает ее использование в соответствующих сообществах. Теперь у нее есть интеграция с scikit-learn для пользователей Python, а также с пакетом caret для пользователей R. Она также может быть интегрирована в рамах потока данных, таких как Apache Spark<ref>[https://spark.apache.org/ Apache Spark]</ref>, Apache Hadoop<ref>[https://hadoop.apache.org/ Apache Hadoop]</ref>, и Apache Flink<ref>[https://flink.apache.org/ Apache Flink]</ref> с использованием абстрактных Rabit<ref>[https://github.com/dmlc/rabit Rabit]</ref> и XGBoost4J<ref>[https://xgboost.readthedocs.io/en/latest/jvm/ XGBoost JVM]</ref>. Принцип работы XGBoost также был опубликован Тяньцзи Ченом (Tianqi Chen) и Карлосом Гастрин (Carlos Guestrin).
==Основные преимуществаВозможности XGBoost=='''Особенности модели''' Реализация модели поддерживает особенности реализации scikit-learn и R с новыми дополнениями, такими как регуляризация. Поддерживаются три основные формы повышения градиента: * Возможность добавлять [[Регуляризация|регуляризацию]]<sup>[Алгоритм Gradient Boosting также называется градиентной машиной повышения, включая скорость обучения.* Stochastic Gradient Boosting с суб-выборкой в ​​строке, столбце и столбце на 16каждый уровень разделения.03* Регулярное усиление градиента с регуляцией L1 и L2.19  '''Системные функции''' Библиотека предоставляет систему для использования в различных вычислительных средах, не создан]</sup>в последнюю очередь: * Параллелизация построения дерева с использованием всех ваших ядер процессора во время обучения.* Возможность работать Распределенные вычисления для обучения очень крупных моделей с разреженными даннымииспользованием кластера машин.* Внекорпоративные вычисления для очень больших наборов данных, которые не вписываются в память.* Возможность распределенного Кэш Оптимизация структуры данных и алгоритма для наилучшего использования аппаратного обеспечения. '''Особенности алгоритма''' Реализация алгоритма была разработана для эффективности вычислительных ресурсов времени и памяти. Цель проекта заключалась в том, чтобы наилучшим образом использовать имеющиеся ресурсы для обучениямодели.Некоторые ключевые функции реализации алгоритма включают: * Эффективная Редкая реализацияAware с автоматической обработкой отсутствующих значений данных.* Блочная структура для поддержки распараллеливания конструкции дерева.* Продолжение обучения, чтобы вы могли еще больше повысить уже установленную модель для новых данных.
==Идея алгоритма==
Анонимный участник

Навигация