Редактирование: Кросс-валидация

Перейти к: навигация, поиск

Внимание! Вы не авторизовались на сайте. Ваш IP-адрес будет публично видимым, если вы будете вносить любые правки. Если вы войдёте или создадите учётную запись, правки вместо этого будут связаны с вашим именем пользователя, а также у вас появятся другие преимущества.

Правка может быть отменена. Пожалуйста, просмотрите сравнение версий, чтобы убедиться, что это именно те изменения, которые вас интересуют, и нажмите «Записать страницу», чтобы изменения вступили в силу.
Текущая версия Ваш текст
Строка 54: Строка 54:
 
\\ CV_k = \frac{1}{k} \sum_{i=1}^{k} Q(\mu(T^l \setminus F_i),F_i) \to min </tex>.
 
\\ CV_k = \frac{1}{k} \sum_{i=1}^{k} Q(\mu(T^l \setminus F_i),F_i) \to min </tex>.
  
   <font color="green"># Пример кода для k-fold кросс-валидации:
+
   <font color="green"># Пример кода для k-fold кросс-валидации:</font>
 
   '''# Пример классификатора, cпособного проводить различие между всего лишь двумя
 
   '''# Пример классификатора, cпособного проводить различие между всего лишь двумя
   '''# классами, "пятерка" и "не пятерка" из набор данных MNIST</font>
+
   '''# классами, "пятерка" и "не пятерка" из набор данных MNIST
 
   '''import''' numpy '''as''' np
 
   '''import''' numpy '''as''' np
 
   '''from''' sklearn.model_selection '''import''' StratifiedKFold
 
   '''from''' sklearn.model_selection '''import''' StratifiedKFold
Строка 67: Строка 67:
 
   y = y.astype(np.uint8)
 
   y = y.astype(np.uint8)
 
   X_train, X_test, y_train, y_test = X[:60000], X[60000:], y[:60000], y[60000:]
 
   X_train, X_test, y_train, y_test = X[:60000], X[60000:], y[:60000], y[60000:]
   y_train_5 = (y_train == 5) <font color="green"> # True для всех пятерок, False для в сех остальных цифр. Задача опознать пятерки</font>
+
   y_train_5 = (y_train == 5) # True для всех пятерок, False для в сех остальных цифр. Задача опознать пятерки
 
   y_test_5 = (y_test == 5)
 
   y_test_5 = (y_test == 5)
   sgd_clf = SGDClassifier(random_state=42)<font color="green"> # классификатор на основе метода стохастического градиентного спуска (Stochastic Gradient Descent SGD)</font>
+
   sgd_clf = SGDClassifier(random_state=42) #классификатор на основе метода стохастического градиентного спуска (Stochastic Gradient Descent SGD)
   <font color="green"># Разбиваем обучающий набора на 3 блока</font>
+
   # Разбиваем обучающий набора на 3 блока,
   # выработку прогнозов и их оценку осуществляем на каждом блоке с использованием модели, обученной на остальных блоках</font>
+
   # выработку прогнозов и их оценку осуществляем на каждом блоке с использованием модели, обученной на остальных блоках
 
   skfolds = StratifiedKFold(n_splits=3, random_state=42)
 
   skfolds = StratifiedKFold(n_splits=3, random_state=42)
 
   for train_index, test_index in skfolds.split(X_train, y_train_5):
 
   for train_index, test_index in skfolds.split(X_train, y_train_5):
Строка 83: Строка 83:
 
       n_correct = sum(y_pred == y_test_fold)
 
       n_correct = sum(y_pred == y_test_fold)
 
       print(n_correct / len(y_pred))
 
       print(n_correct / len(y_pred))
   <font color="green"># print 0.95035  
+
   # print 0.95035  
 
   #      0.96035  
 
   #      0.96035  
   #      0.9604</font>
+
   #      0.9604
  
 
=== t×k-fold кросс-валидация ===  
 
=== t×k-fold кросс-валидация ===  

Пожалуйста, учтите, что любой ваш вклад в проект «Викиконспекты» может быть отредактирован или удалён другими участниками. Если вы не хотите, чтобы кто-либо изменял ваши тексты, не помещайте их сюда.
Вы также подтверждаете, что являетесь автором вносимых дополнений, или скопировали их из источника, допускающего свободное распространение и изменение своего содержимого (см. Викиконспекты:Авторские права). НЕ РАЗМЕЩАЙТЕ БЕЗ РАЗРЕШЕНИЯ ОХРАНЯЕМЫЕ АВТОРСКИМ ПРАВОМ МАТЕРИАЛЫ!

Чтобы изменить эту страницу, пожалуйста, ответьте на приведённый ниже вопрос (подробнее):

Отменить | Справка по редактированию (в новом окне)

Шаблон, используемый на этой странице: