Изменения

← Предыдущая правка

Долгая краткосрочная память

1946 байт добавлено, 19:08, 4 сентября 2022

м

rollbackEdits.php mass rollback

== Примеры кода ==

=== Keras ===

Пример кода с использованием библиотеки Keras.<ref name=KerasRNN>[https://keras.io/layers/recurrent/ Keras RNN with LSTM layer]</ref>

# Импорты

'''import''' numpy '''as''' np

'''import''' keras.backend '''as''' K

'''from''' keras.preprocessing '''import''' sequence

'''from''' keras.models '''import''' Sequential

'''from''' keras.layers '''import''' Dense, Activation, Embedding

'''from''' keras.layers '''import''' LSTM

'''from''' keras.datasets '''import''' imdb

'''def''' f1(y_true, y_pred):

'''def''' recall(y_true, y_pred):

true_positives = K.sum(K.round(K.clip(y_true * y_pred, 0, 1)))

possible_positives = K.sum(K.round(K.clip(y_true, 0, 1)))

recall = true_positives / (possible_positives + K.epsilon())

return recall

'''def''' precision(y_true, y_pred):

true_positives = K.sum(K.round(K.clip(y_true * y_pred, 0, 1)))

predicted_positives = K.sum(K.round(K.clip(y_pred, 0, 1)))

precision = true_positives / (predicted_positives + K.epsilon())

return precision

precision = precision(y_true, y_pred)

recall = recall(y_true, y_pred)

return 2*((precision*recall)/(precision+recall+K.epsilon()))

# Устанавливаем seed для обеспечения повторяемости результатов

np.random.seed(42)

# Указываем количество слов из частотного словаря, которое будет использоваться (отсортированы по частоте использования)

max_features = 5000

# Загружаем данные (датасет IMDB содержит 25000 рецензий на фильмы с правильным ответом для обучения и 25000 рецензий на фильмы с правильным ответом для тестирования)

(X_train, y_train), (X_test, y_test) = imdb.load_data(nb_words = max_features)

# Устанавливаем максимальную длину рецензий в словах, чтобы они все были одной длины

maxlen = 80

# Заполняем короткие рецензии пробелами, а длинные обрезаем

X_train = sequence.pad_sequences(X_train, maxlen = maxlen)

X_test = sequence.pad_sequences(X_test, maxlen = maxlen)

# Создаем модель последовательной сети

model = Sequential()

# Добавляем слой для векторного представления слов (5000 слов, каждое представлено вектором из 32 чисел, отключаем входной сигнал с вероятностью 20% для предотвращения переобучения)

model.add(Embedding(max_features, 32, dropout = 0.2))

# Добавляем слой долго-краткосрочной памяти (100 элементов для долговременного хранения информации, отключаем входной сигнал с вероятностью 20%, отключаем рекуррентный сигнал с вероятностью 20%)

model.add(LSTM(100, dropout_W = 0.2, dropout_U = 0.2))

# Добавляем полносвязный слой из 1 элемента для классификации, в качестве функции активации будем использовать сигмоидальную функцию

model.add(Dense(1, activation = 'sigmoid'))

# Компилируем модель нейронной сети

model.compile(loss = 'binary_crossentropy',

optimizer = 'adam',

metrics = ['accuracy', 'f1'])

# Обучаем нейронную сеть (данные для обучения, ответы к данным для обучения, количество рецензий после анализа которого будут изменены веса, число эпох обучения, тестовые данные, показывать progress bar или нет)

model.fit(X_train, y_train,

batch_size = 64,

nb_epoch = 7,

validation_data = (X_test, y_test),

verbose = 1)

# Проверяем качество обучения на тестовых данных (если есть данные, которые не участвовали в обучении, лучше использовать их, но в нашем случае таковых нет)

scores = model.evaluate(X_test, y_test, batch_size = 64)

print('Точность на тестовых данных: %.2f%%' % (scores[1] * 100))

print('F1 на тестовых данных: %.2f%%' % (scores[2] * 100))

Результат:

Точность на тренировочных данных: 89.64%

F1 на тренировочных данных: 89.55%

Точность на тестовых данных: 83.01%

F1 на тестовых данных: 82.48%

=== TensorFlow ===

Пример кода с библиотекой TensorFlow<ref>[https://www.tensorflow.org/ TensorFlow]</ref>

sess.run(accuracy, feed_dict={X: test_data, Y: test_label}))

~~=== Keras ===~~Результат: Точность на тренировочных данных: 91.40% F1 на тренировочных данных: 91.05%~~Пример кода с использованием библиотеки Keras~~ Точность на тестовых данных: 85.~~<ref name=KerasRNN>[https~~15% F1 на тестовых данных:~~//keras~~84.~~io/layers/recurrent/ Keras RNN with LSTM layer]</ref>~~28%

~~# Импорты~~ ~~'''import''' numpy '''as''' np~~ ~~'''from''' keras.preprocessing '''import''' sequence~~ ~~'''from''' keras.models '''import''' Sequential~~ ~~'''from''' keras.layers '''import''' Dense, Activation, Embedding~~ ~~'''from''' keras.layers '''import''' LSTM~~ ~~'''from''' keras.datasets '''import''' imdb~~ ~~# Устанавливаем seed для обеспечения повторяемости результатов~~ ~~np.random.seed(42)~~ ~~# Указываем количество слов из частотного словаря, которое будет использоваться (отсортированы по частоте использования) ~~max_features = 5000~~ ~~# Загружаем данные (датасет IMDB содержит 25000 рецензий~~ Пример на ~~фильмы с правильным ответом для обучения и 25000 рецензий на фильмы с правильным ответом для тестирования)~~ ~~(X_train, y_train), (X_test, y_test)~~ языке Java= ~~imdb.load_data(nb_words~~ = ~~max_features)~~ ~~# Устанавливаем максимальную длину рецензий в словах, чтобы они все были одной длины~~ ~~maxlen = 80~~ ~~# Заполняем короткие рецензии пробелами, а длинные обрезаем<~~[https:/~~font>~~ ~~X_train = sequence.pad_sequences(X_train, maxlen = maxlen)~~ ~~X_test = sequence.pad_sequences(X_test, maxlen = maxlen)~~ ~~# Создаем модель последовательной сети~~ ~~model = Sequential()~~ # Добавляем слой для векторного представления слов (5000 слов, каждое представлено вектором из 32 чисел, отключаем входной сигнал с вероятностью 20% для предотвращения переобучения)</~~font>~~ ~~model~~github.~~add(Embedding(max_features, 32<~~com/~~font>, dropout = 0.2<~~deeplearning4j/~~font>))~~ ~~# Добавляем слой долго~~dl4j-краткосрочной памяти (100 элементов для долговременного хранения информации, отключаем входной сигнал с вероятностью 20%, отключаем рекуррентный сигнал с вероятностью 20%)<examples/~~font>~~ ~~model.add(LSTM(100<~~blob/~~font>, dropout_W = 0.2<~~master/~~font>, dropout_U = 0.2<~~dl4j-examples/~~font>))~~ # Добавляем полносвязный слой из 1 элемента для классификации, в качестве функции активации будем использовать сигмоидальную функцию<src/~~font>~~ ~~model.add(Dense(1<~~main/~~font>, activation = 'sigmoid'<~~java/~~font>))~~ ~~# Компилируем модель нейронной сети<~~org/~~font>~~ ~~model.compile(loss = 'binary_crossentropy'<~~deeplearning4j/~~font>,~~ ~~optimizer = 'adam'<~~examples/~~font>,~~ ~~metrics = ['accuracy'<~~recurrent/~~font>])~~ # Обучаем нейронную сеть (данные для обучения, ответы к данным для обучения, количество рецензий после анализа которого будут изменены веса, число эпох обучения, тестовые данные, показывать progress bar или нет)<character/~~font>~~ ~~model~~LSTMCharModellingExample.~~fit(X_train~~java Пример] реализации рекуррентной нейронной сети, ~~y_train,~~ ~~batch_size = 64,~~ ~~nb_epoch = 7,~~ ~~validation_data = (X_test, y_test),~~ ~~verbose = 1)~~ ~~# Проверяем качество обучения~~ использующей механизм LSTM и натренированной на ~~тестовых данных (если есть данные~~текстах Шекспира, ~~которые не участвовали в обучении, лучше использовать их, но в нашем случае таковых нет)~~с применением библиотеки <~~/font~~code> ~~scores = model.evaluate(X_test, y_test, batch_size = 64~~deeplearning4j</~~font>)~~ ~~print(~~'Точность на тестовых данных: %~~.~~2f%%' % (scores[1] * 100))~~

==См. также==

Maintenance script

1632

правки

Изменения

Долгая краткосрочная память

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты