Изменения

Примеры кода на R

5418 байт добавлено, 18:52, 28 сентября 2020

м

Подсветка синтаксиса

Язык постоянно расширяется за счёт новых библиотек (пакетов). Для импорта одного пакета необходимо прописать в файле следующие строки:

~~<pre>~~ install.packages("packageName") require("packageName")</~~pre~~font>)

Для того чтобы импортировать пакет с его зависимостями в код следует включить следующие строки:

~~<pre>~~ library("packageName")</~~pre~~font>)

== Описание известных пакетов ==

==== Линейная регрессия ====

~~<pre>~~

~~#$$reading data~~

~~data <- read.csv("input.csv", sep = ',', header = FALSE)~~

~~#evaluating linear regression model~~

~~model <- lm(data$x ~ data$y)~~

~~#getting summary~~

~~print(summary(model))~~

# reading data data <- read.csv("input.csv", sep = ',', header = FALSE) # evaluating linear regression model model <- lm(data$x ~ data$y) # getting summary print(summary(model)) #visualizing data plot(data$y, data$x) lines(data$y, predict(fit), col = 'red')</~~pre~~font>)

==== Множественная регрессия ====

~~<pre>~~

~~#$$reading data~~

~~rdata <- read.csv("input.csv", sep = ',', header = FALSE)~~

~~#evaluating regression model~~

~~model <- lm(target ~ x + y + z, data = rdata)~~

# reading data rdata <- read.csv("input.csv", sep = ',', header = FALSE) # evaluating regression model model <- lm(target ~ x + y + z, data = rdata) #getting summary print(summary(model))~~</pre>~~

==== Логистическая регрессия ====

Логистическая регрессия – это модель регрессии, в которой переменная ответа принимает значения 0 или 1 (True или False). Реализация на языке <code>R</code> представлена в следующем фрагменте:

<~~pre~~font color="gray">#$$reading data rdata <- read.csv("input.csv", sep = ',', header = FALSE) #evaluating model model = glm(formula = target ~ x + y + z, data = rdata, family = binomial) #printing summary print(summary(model))~~</pre>~~

=== PCA ===

~~<pre>~~

~~#importing library and its' dependencies~~

~~library(h2o)~~

~~h2o.init()~~

~~path <- system.file("extdata", "data.csv", package = "h2o")~~

~~data <- h2o.uploadFile(path = data)~~

# importing library and its' dependencies library(h2o) h2o.init() path <- system.file("extdata", "data.csv", package = "h2o") data <- h2o.uploadFile(path = data) #evaluating h2o.prcomp(training_frame = data, k = 8, transform = "STANDARDIZE")</~~pre~~font>)

=== Деревья решений, случайный лес ===

Для создания ''[[Дерево решений и случайный лес |деревьев решений]]'' в <code>R</code> используется функция <code>ctree()</code> из пакета <code>party</code>.

<~~pre~~font color="gray">#importing package install.packages("party") #reading data rdata <- read.csv("input.csv", sep = ',', header = FALSE) #evaluating model output.tree <- ctree(target ~ x + y + z, data = rdata) #plotting results plot(output.tree)~~</pre>~~

==== Случайный лес ====

Для создания ''[[Дерево решений и случайный лес|случайного леса]]'' необходимо импортировать пакет <code>randomForest</code>

<~~pre~~font color="gray">#importing packages install.packages("party") install.packages("randomForest") #reading data rdata <- read.csv("input.csv", sep = ',', header = FALSE) #creating the forest output.forest <- randomForest(target ~ x + y + z, data = rdata) #getting results print(output.forest) ~~</pre>~~

=== Наивный Бейесовский классификатор ===

~~<pre>~~

~~#$$importing package and it's dependencies~~

~~library(e1071)~~

~~#reading data~~

~~data <- read.csv("input.csv", sep = ',', header = FALSE)~~

# importing package and it's dependencies library(e1071) # reading data data <- read.csv("input.csv", sep = ',', header = FALSE) #splitting data into training and test data sets index <- createDataPartition(y = data$target, p = 0.8,list = FALSE) training <- data[index,] testing <- data[-index,] #create objects x and y for predictor and response variables x = <- training[,-9] y = <- training$target #training model model = <- train(x,y,'nb',trControl =trainControl(method = 'cv',number = 10)) #predicting results predictions <- predict(model, newdata = testing)~~</pre>~~

=== SVM ===

~~<pre>~~

~~#$$ importing package and its' dependencies~~

~~library(caret)~~

~~#reading data~~

~~data <- read.csv("input.csv", sep = ',', header = FALSE)~~

~~#splitting data into train and test sets~~

~~index <- createDataPartition(y = data$target, p=0.8, list = FALSE)~~

~~training <- data[index,]~~

~~testing <- data[-index,]~~

~~#evaluating model~~

~~fit <- train(target ~ x + y + z,~~

~~data = train_flats,~~

~~method = "svmRadial",~~

~~trControl = trainControl(method = "repeatedcv", number = 10, repeats = 3))~~

# importing package and its' dependencies library(caret) #reading data data <- read.csv("input.csv", sep = ',', header = FALSE) #~~printing parameters~~splitting data into train and test sets~~print~~ index <- createDataPartition(y = data$target, p = 0.8, list = FALSE) training <- data[index,] testing <- data[-index,] # evaluating model fit<- train(target ~ x + y + z, data = train_flats, method = "svmRadial", trControl = trainControl(method = "repeatedcv", number = 10, repeats = 3)) # printing parameters</~~pre~~font> print(fit)

=== GBM ===

~~<pre>~~

~~#loading libraries~~

~~install.packages("mlr")~~

~~library(mlr)~~

~~#loading data~~

~~train <- read.csv("input.csv")~~

~~test <- read.csv("testInput.csv")~~

~~#loading GBM~~

~~getParamSet("classif.gbm")~~

~~baseLearner <- makeLearner("classif.gbm", predict.type = "response")~~

# loading libraries install.packages("mlr") library(mlr) # loading data train <- read.csv("input.csv") test <- read.csv("testInput.csv") # loading GBM getParamSet("classif.gbm") baseLearner <- makeLearner("classif.gbm", predict.type = "response") #specifying parameters controlFunction <- makeTuneControlRandom(maxit = 50000)#specifying tuning method cvFunction <- makeResampleDesc("CV",iters = 100000) #definig cross-validation function gbmParameters<- makeParamSet( makeDiscreteParam("distribution", values = "bernoulli"), makeIntegerParam("n.trees", lower = 100, upper = 1000), #number of trees makeIntegerParam("interaction.depth", lower = 2, upper = 10), #depth of tree makeIntegerParam("n.minobsinnode", lower = 10, upper = 80), makeNumericParam("shrinkage",lower = 0.01, upper = 1) ) #tunning parameters gbmTuningParameters <- tuneParams(learner = baseLearner, task = trainTask, resampling = cvFunction, measures = acc, par.set = gbmParameters, control = controlFunction) #creating model parameters model <- setHyperPars(learner = baseLearner, par.vals = gbmTuningParameters) #evaluating model fit <- train(model, train) predictions <- predict(fit, test)~~</pre>~~

=== Кластеризация ===

Для реализации алгоритма кластеризации ''k-средних'' используется пакет <code>ClusterR</code>. В нем реализовано 2 функции: <code>KMeans_arma()</code> и <code>KMeans_rcpp()</code>. В примере далее рассмотрена реализация с использованием функции <code>KMeans_arma()</code>.

<~~pre~~font color="gray">#$$ importing package and its' dependencies library(ClusterR) #reading data data <- read.csv("data.csv") #evaluating model model = <- KMeans_arma(data, clusters = 2, n_iter = 10, seed_mode = "random_subset", verbose = T, CENTROIDS = NULL) #predicting results predictions = <- predict_KMeans(test_data, model) ~~</pre>~~

==См. также==

Mervap

286

правок

Изменения

Примеры кода на R

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты