Изменения

Обучение на больших данных

73 байта добавлено, 21:21, 17 января 2021

→‎Примеры реализации алгоритмов с использованием Spark MLlib

.filter(_.getText.contains("earthquake") || _.getText.contains("shaking"))

Далее подготовим эти данные к построению модели. Разобьем выборку на обучающую и тестирующую

val data = MLUtils.loadLibSVMFile(sc, "sample_earthquate_tweets.txt")

val splits = data.randomSplit(Array(0.6, 0.4), seed = 11L) val training = splits(0).cache() val test = splits(1)

Проводим обучение нашей модели. В качестве алгоритма выберем метод опорных векторов.

val numIterations = 100

val model = SVMWithSGD.train(training, numIterations)

// Очищаем пороговое значение, заданное по умолчанию

model.clearThreshold()

Выведем интересующий нас результат

Анонимный участник