Изменения

Перейти к: навигация, поиск

Примеры кода на R

1131 байт добавлено, 18:13, 23 апреля 2020
GBM
==== ClusterR ====
Пакет <code>ClusterR</code> <ref>[https://cran.r-project.org/web/packages/ClusterR/vignettes/the_clusterR_package.html ClusterR documentation]</ref> состоит из алгоритмов кластеризации на основе центроидов (''k-means'', ''mini-batch-kmeans'', ''k-medoids'') и распределений (''GMM''). Кроме того, пакет предлагает функции для:* проверки результатов,* построения графика результатов, используя либо силуэт, либо 2-мерный график,''[[Оценка качества в задаче кластеризации |метрики]]''
* прогнозирования новых наблюдения,
*оценки оптимального количества кластеров для каждого алгоритма  
==== E1071 ====
Пакет <ref>[https://www.rdocumentation.org/packages/e1071/versions/1.7-3 1071 package documentation]</ref> содержит в себя функции для анализа классов, ''кратковременного преобразование Фурье'', ''нечеткой кластеризации'', реализации ''[[Метод опорных векторов (SVM) | SVM]]'', ''вычисления кратчайшего пути'', а также реализации ''наивного байесовского классификатора''
==== Mlr ====
В пакете <code>Mlr</code> <ref>[https://cran.r-project.org/web/packages/mlr/mlr.pdf Mlr package documentation]</ref> представлены модели для регрессии, классификации, кластеризации и анализа выживаемости, а также широкие возможности для оценки качества (в том числе функции для анализа ''[https://en.wikipedia.org/wiki/Receiver_operating_characteristic ROC-кривых]'').
Есть поддержка параллельных вычислений и конвейерных операций.
 
==== H2O ====
В пакете <code>H20</code> <ref>[https://cran.r-project.org/web/packages/h2o/index.html H20 main info page]</ref> представлены линейные модели, такие как ''[[Бустинг, AdaBoost |градиентный бустинг]]'', ''[[Метод главных компонент (PCA)|PCA]]'', ''GLRM'', ''KNN'', Radom forest''[[Дерево решений и случайный лес|RadomForest]]'', ''наивный Байесовский классификатор''. Сильная сторона этой библиотеки – работа с большими объемами данных и поддержка многопоточных вычислений.Однако в ней нет возможности задавать параметры используемых алгоритмов
== Примеры алгоритмов ==
=== Задачи регрессии ===
==== Линейная регрессия ====
{{Main|Линейная регрессия|ll=Линейная регрессия}}
<pre>
#$$reading data
==== Логистическая регрессия ====
{{Main|Логистическая регрессия|ll=Логистическая регрессия}}Логистическая регрессия – это модель регрессии, в которой переменная ответа принимает значения 0 или 1 (True или False). Реализация на языке ?<code>R</code> представлена в следующем фрагменте:
<pre>
=== PCA ===
{{Main|Метод главных компонент (PCA)|ll=PCA}}
<pre>
#importing library and its' dependencies
=== Деревья решений, случайный лес ===
{{Main|Дерево решений и случайный лес |ll=деревьев решений}}
==== Деревья решений ====
Для создания ''[[Дерево решений и случайный лес |деревьев решений ]]'' в <code>R</code> используется функция <code>ctree()</code> из пакета <code>party</code>.
<pre>
==== Случайный лес ====
Для создания ''[[Дерево решений и случайный лес|случайного леса ]]'' необходимо импортировать пакет <code>randomForest</code>
<pre>
=== Наивный Бейесовский классификатор ===
{{Main|Байесовская классификация|ll=Байесовская классификация}}
<pre>
#$$importing package and it's dependencies
=== SVM ===
{{Main|Метод опорных векторов (SVM)|ll=SVM}}
<pre>
#$$ importing package and its' dependencies
=== GBM ===
{{Main|Бустинг, AdaBoost|ll=Бустинг}}
<pre>
#loading libraries
=== Кластеризация ===
Для реализации алгоритма кластеризации ''k-средних '' используется пакет <code>ClusterR</code>. В нем реализовано 2 функции: <code>KMeans_arma() </code> и <code>KMeans_rcpp()</code>. В примере далее рассмотрена реализация с использованием функции <code>KMeans_arma()</code>.
<pre>
67
правок

Навигация