Изменения

XGBoost

2422 байта добавлено, 14:03, 30 марта 2019

→‎Основные преимущества

Она вскоре стала использоваться с несколькими другими пакетами, что облегчает ее использование в соответствующих сообществах. Теперь у нее есть интеграция с scikit-learn для пользователей Python, а также с пакетом caret для пользователей R. Она также может быть интегрирована в рамах потока данных, таких как Apache Spark<ref>[https://spark.apache.org/ Apache Spark]</ref>, Apache Hadoop<ref>[https://hadoop.apache.org/ Apache Hadoop]</ref>, и Apache Flink<ref>[https://flink.apache.org/ Apache Flink]</ref> с использованием абстрактных Rabit<ref>[https://github.com/dmlc/rabit Rabit]</ref> и XGBoost4J<ref>[https://xgboost.readthedocs.io/en/latest/jvm/ XGBoost JVM]</ref>. Принцип работы XGBoost также был опубликован Тяньцзи Ченом (Tianqi Chen) и Карлосом Гастрин (Carlos Guestrin).

==~~Основные преимущества~~Возможности XGBoost=='''Особенности модели''' Реализация модели поддерживает особенности реализации scikit-learn и R с новыми дополнениями, такими как регуляризация. Поддерживаются три основные формы повышения градиента: * ~~Возможность добавлять [[Регуляризация|регуляризацию]]<sup>[~~Алгоритм Gradient Boosting также называется градиентной машиной повышения, включая скорость обучения.* Stochastic Gradient Boosting с суб-выборкой в строке, столбце и столбце на 16каждый уровень разделения.03* Регулярное усиление градиента с регуляцией L1 и L2.19 '''Системные функции''' Библиотека предоставляет систему для использования в различных вычислительных средах, не ~~создан]</sup>~~в последнюю очередь: * Параллелизация построения дерева с использованием всех ваших ядер процессора во время обучения.* ~~Возможность работать~~ Распределенные вычисления для обучения очень крупных моделей с ~~разреженными данными~~использованием кластера машин.* Внекорпоративные вычисления для очень больших наборов данных, которые не вписываются в память.* ~~Возможность распределенного~~ Кэш Оптимизация структуры данных и алгоритма для наилучшего использования аппаратного обеспечения. '''Особенности алгоритма''' Реализация алгоритма была разработана для эффективности вычислительных ресурсов времени и памяти. Цель проекта заключалась в том, чтобы наилучшим образом использовать имеющиеся ресурсы для обучениямодели.Некоторые ключевые функции реализации алгоритма включают: * ~~Эффективная~~ Редкая реализацияAware с автоматической обработкой отсутствующих значений данных.* Блочная структура для поддержки распараллеливания конструкции дерева.* Продолжение обучения, чтобы вы могли еще больше повысить уже установленную модель для новых данных.

==Идея алгоритма==

Анонимный участник

188.242.87.196

Изменения

XGBoost

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты