Изменения

Перейти к: навигация, поиск

Настройка гиперпараметров

55 байт добавлено, 19:57, 22 апреля 2020
м
форматирование текста
Зачем нам нужен и валидационный, и тестовый набор? Дело в том, что модель может переучиться на валидационном наборе данных. Для выявления переобучения используется тестовый набор данных.
Рассмотрим модель ''<code>KNeighborsClassifier'' </code> из библиотеки ''sklearn''. Все “параметры” данной модели, с точки зрения машинного обучения, являются гиперпараметрами, так как задаются до начала обучения.
[[Файл:KNeighborsClassifier_model.png|center|1000px]]
==== Sklearn Grid search: использование ====
Пример использования ''Grid search'' <code>GridSearch</code> из библиотеки ''scikit-learn'':
# Создание экземпляра класса ''<code>SGDClassifier'' </code> (из ''sklearn'')
# Создание сетки гиперпараметров. В данном случае будем подбирать коэффициент регуляризации, шаг градиентного спуска, количество итераций и параметр скорости обучения.
# Создание экземпляра класса кросс-валидации
# Создание экземпляра ''<code>GridSearch'' </code> (из ''sklearn''). Первый параметр — модель, второй — сетка гиперпараметров, третий — функционал ошибки (используемый для контроля качества моделей по технике кросс-валидации), четвертый — кросс-валидация (можно задать количество фолдов, а можно передать экземпляр класса кросс - валидации)
# Запуск поиска по сетке.
==== Sklearn Grid search: важные атрибуты ====
* ''<code>best_estimator_'' </code> — лучшая модель* ''<code>best_score_'' </code> — ошибка, полученная на лучшей модели.* ''<code>best_params_'' </code> — гиперпараметры лучшей модели <br>
[[Файл:KNeighborsClassifier_bestest.png|center|1000px]] <br>
* ''<code>cv_results_'' </code> — результаты всех моделей. <br>
[[Файл:KNeighborsClassifier_results.png|center|1000px]] <br>
51
правка

Навигация