Изменения

Перейти к: навигация, поиск

Векторное представление слов

117 байт добавлено, 15:23, 2 марта 2019
sta
Недостатком word2vec является то, что с его помощью не могут быть представлены слова, не встречающиеся в обучающей выборке. fastText решает эту проблему с помощью N-грамм символов. Например, 3-граммами для слова ''яблоко'' являются ''ябл'', ''бло'', ''лок'', ''око''. Модель теперь строит векторные представления N-грамм, а векторным представлением слова будет сумма векторных представлений для всех его N-грамм. Части слов с большой вероятностью встречаются и в других словах, что позволяет выдавать векторные представления и для редких слов тоже.
== Пример использования модели word2vec из библиотеки Gensim ==
import gensim
== См. также ==
61
правка

Навигация