67
правок
Изменения
→Пакеты с реализованными алгоритмами машинного обучения: clusterR added
Основная функция в составе Caret - функция train(). Параметры обучения в ней задаются аргументом trControl, а оценка качества модели - аргументом metric.
Отличительными особенностями Caret является универсальность используемых команд, наличие автоматического подбора гиперпараметров для алгоритмов, в также наличие параллельных вычислений.
==== party =Party ====Пакет Party <ref>[https://cran.r-project.org/web/packages/party/index.html party package main info page]</ref> содержит в себе инструменты для рекурсивного разбиения, в которой доступна расширяемая функциональность для визуализации древовидных регрессионных моделей. Основная функция пакета - ctree (), которая используется для создания деревьев решения для таких задач регрессии как номинальные, порядковые, числовые а также многовариантные переменные отклика. На основе деревьев условного вывода cforest () предоставляет реализацию случайных лесов Бреймана. Функция mob () реализует алгоритм рекурсивного разделения на основе параметрических моделей (например, линейных моделей, GLM или регрессии выживания), использующих тесты нестабильности параметров для выбора разделения. Доступна расширяемая функциональность для визуализации древовидных регрессионных моделей. ==== randomForest =====Random Forest <ref>[https://cran.r-project.org/web/packages/randomForest/index.html RandomForest package main info]</ref> - пакет с реализацией алгоритма random Forest. Используется для решения задач регрессии и классификации, а также для поиска аномалий и отбора предикторов. ==== ClusterR =====Пакет ClusterR <ref>[https://cran.r-project.org/web/packages/ClusterR/vignettes/the_clusterR_package.html ClusterR documentation]</ref> состоит из алгоритмов кластеризации на основе центроидов (k-means, mini-batch-kmeans, k-medoids) и распределений (GMM). Кроме того, пакет предлагает функции для:* проверки результатов* построения графика результатов, используя либо силуэт, либо 2-мерный график,* прогнозирования новых наблюдения,*оценки оптимального количества кластеров для каждого алгоритма
==== Mlr ====
В пакете Mlr <ref>[https://cran.r-project.org/web/packages/mlr/mlr.pdf Mlr package documentation]</ref> представлены модели для регрессии, классификации, кластеризации и анализа выживаемости, а также широкие возможности для оценки качества (в том числе функции для анализа ROC-кривых).