286
правок
Изменения
м
$ -> <tex>
#: В качестве ядра можно использовать <code>crossv_mc</code> ([[Кросс-валидация#Случайные разбиения (Random subsampling)|случайные разбиения]]), <code>crossv_kfold</code> ([[Кросс-валидация#k-fold кросс-валидация|k-fold кросс-валидация]]) или crossv_loo ([[Кросс-валидация#Кросс-валидация по отдельным объектам (Leave-One-Out)|leave-one-out разбиения]]) из пакета <code>modelr</code><ref>[https://github.com/tidyverse/modelr Modelr github repository]</ref>. Если данных способов недостаточно можно написать и свою функцию разбиения.
#* <code>learn_curves()</code> служит для настройки [[Переобучение#Кривые обучения|кривых обучения]]. Для настройки используются увеличивающиеся пропорции от начала датасета.
#: Например, вызов <code>learn_curves(.5, .75, 1)</code> создаст $<tex>3$ </tex> сценария работы: в первом будет взята первая половина выбоки, во втором {{---}} первые $<tex>\frac{3}{4}$ </tex> объектов, и в третьем {{---}} вся выборка. Авторы пакета утрверждают, что брать случайные объекты выборки не имеет смысла, потому что выборка уже случайно разбита с помощью <code>learn_cvpairs()</code>.
#* <code>learn_models()</code> предназначен для добавления новых обучающих моделей.
# '''Обучение'''
Пакет <code>MICE</code><ref>[https://cran.r-project.org/web/packages/mice/mice.pdf MICE package documentation]</ref> используется для заполнения пропущенных значений в данных. При этом нет необходимости думать о типах значений: для каждого из них в пакете предусмотрено заполнение по умолчанию.
==== Ggplot2 ====
Данный пакет<ref>[https://cran.r-project.org/web/packages/ggplot2/index.html Ggplot2 main info page]</ref> используется для отрисовки данных и графиков.
=== Пакеты с реализованными алгоритмами машинного обучения ===
==== Caret ====