Изменения

← Предыдущая правка

Бустинг, AdaBoost

4492 байта добавлено, 19:06, 4 сентября 2022

м

rollbackEdits.php mass rollback

# Склонен к переобучению при наличии значительного уровня шума в данных;

# Требует достаточно длинных обучающих выборок. Другие методы линейной коррекции, в частности, бэггинг, способны строить алгоритмы сопоставимого качества по меньшим выборкам данных.

== Пример кода ==

===Пример кода на python для scikit-learn===

'''val '''f1Score = '''new '''FMeasure().measure(predictions, y)

plot(x, y, ada)

===Пример на языке Java===

Пример классификации с применением <code>smile.classification.AdaBoost</code><ref>[https://haifengl.github.io/smile/api/java/smile/classification/AdaBoost.html/ Smile, AdaBoost]</ref>

<code>Maven</code> зависимость:

<groupId>com.github.haifengl</groupId>

<artifactId>smile-core</artifactId>

</dependency>

'''import''' smile.classification.AdaBoost;

'''import''' smile.data.parser.ArffParser;

'''import''' smile.validation.Accuracy;

'''import''' smile.validation.ClassificationMeasure;

'''import''' smile.validation.FMeasure;

'''import''' java.util.Arrays;

// load train and test datasets

'''var''' arffParser = new ArffParser();

arffParser.setResponseIndex(0);

'''var''' train = arffParser.parse(this.getClass().getResourceAsStream("train.arff"));

'''var''' test = arffParser.parse(this.getClass().getResouceAsStream("test.arff"));

// create adaboost classifier

'''var''' forest = new AdaBoost(train.attributes(), train.x(), train.labels(), 200, 4);

// measure accuracy and F1-measure on test dataset

'''var''' measures = new ClassificationMeasure[]{new FMeasure(), new Accuracy()};

'''var''' results = forest.test(test.x(), test.labels(), measures);

System.out.println(Arrays.deepToString(results));

=== Пример на языке R ===

# loading libraries

install.packages("mlr")

library(mlr)

# loading data

train <- read.csv("input.csv")

test <- read.csv("testInput.csv")

# loading GBM

getParamSet("classif.gbm")

baseLearner <- makeLearner("classif.gbm", predict.type = "response")

# specifying parameters

controlFunction <- makeTuneControlRandom(maxit = 50000) # specifying tuning method

cvFunction <- makeResampleDesc("CV", iters = 100000) # definig cross-validation function

gbmParameters<- makeParamSet(

makeDiscreteParam("distribution", values = "bernoulli"),

makeIntegerParam("n.trees", lower = 100, upper = 1000), # number of trees

makeIntegerParam("interaction.depth", lower = 2, upper = 10), # depth of tree

makeIntegerParam("n.minobsinnode", lower = 10, upper = 80),

makeNumericParam("shrinkage", lower = 0.01, upper = 1)

)

# tunning parameters

gbmTuningParameters <- tuneParams(learner = baseLearner,

task = trainTask,

resampling = cvFunction,

measures = acc,

par.set = gbmParameters,

control = controlFunction)

# creating model parameters

model <- setHyperPars(learner = baseLearner, par.vals = gbmTuningParameters)

# evaluating model

fit <- train(model, train)

predictions <- predict(fit, test)

== См. также ==

[[Категория: Автоматическое машинное обучение]]

[[Категория: Машинное обучение]]

[[Категория: Ансамбли]]

Maintenance script

1632

правки

Изменения

Бустинг, AdaBoost

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты