Изменения

Перейти к: навигация, поиск

Векторное представление слов

44 байта убрано, 15:23, 12 января 2021
One-hot encoding
== One-hot encoding ==
[[Файл:One-hot-encoding.png|thumb|right|250px| Рисунок 1. Пример one-hot encoding для словаря из 9 слов. <ref>[https://www.shanelynn.ie/get-busy-with-word-embeddings-introduction/ Get Busy with Word Embeddings – An IntroductionИсточник]</ref>]]
Пусть число различных слов равно <math>K</math>. Сопоставим слову с номером <math>i</math> вектор длины <math>K</math>, в котором <math>i</math>-тая координата равна единице, а все остальные {{---}} нулям (рис. 1). Недостатком one-hot encoding является то, что по векторным представлениям нельзя судить о схожести смысла слов. Также вектора имеют очень большой размер, из-за чего их неэффективно хранить в памяти.
38
правок

Навигация