Изменения

Векторное представление слов

400 байт добавлено, 23:28, 5 марта 2019

→‎Загрузка предобученной модели русского корпуса

'''import''' gensim.downloader '''as''' download_api

russian_model = download_api.load('word2vec-ruscorpora-300')

# ''~~Первые~~ Выведем первые 10 слов корпуса. # Заметим, что после слова и указывается часть речи: NOUN (существительное), ADJ (прилагательное) и так далее.'' # ''Существуют также предоубученные модели без разделения слов по частям речи'' # ''например, "glove-wiki-gigaword-50" из [https://github.com/RaRe-Technologies/gensim-data репозитория]''

list(russian_model.vocab.keys())[:10]

''# ['весь_DET', 'человек_NOUN', 'мочь_VERB', 'год_NOUN', 'сказать_VERB', 'время_NOUN', 'говорить_VERB', 'становиться_VERB', 'знать_VERB', 'самый_DET']''

# ''Поиск наиболее близких по смыслу слов. ~~После слова указывается часть речи: NOUN, ADJ, VERB, DET~~''

russian_model.most_similar('кошка_NOUN')

''# [('кот_NOUN', 0.7570087909698486), ('котенок_NOUN', 0.7261239290237427), ('собака_NOUN', 0.6963180303573608),''

Анонимный участник

81.3.129.2

Изменения

Векторное представление слов

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты