Изменения

Перейти к: навигация, поиск

Векторное представление слов

20 байт добавлено, 17:00, 2 марта 2019
Загрузка предобученной модели русского корпуса
import gensim.downloader as download_api
russian_model = api.load("word2vec-ruscorpora-300")<br>
#''Первые 10 слов корпуса''
list(russian_model.vocab.keys())[:10]
['весь_DET', 'человек_NOUN', 'мочь_VERB', 'год_NOUN', 'сказать_VERB', 'время_NOUN', 'говорить_VERB', 'становиться_VERB', 'знать_VERB', 'самый_DET']<br>
#''Поиск наиболее близких по смыслу слов. После слова указывается часть речи: NOUN, ADJ, VERB, DET''
russian_model.most_similar('кошка_NOUN')
[('кот_NOUN', 0.7570087909698486), ('котенок_NOUN', 0.7261239290237427), ('собака_NOUN', 0.6963180303573608),
('щенок_NOUN', 0.6028496026992798), ('мышь_NOUN', 0.5975362062454224), ('пес_NOUN', 0.5956044793128967),
('кошечка_NOUN', 0.5920293927192688)]<br>
#''Вычисление сходства слов''
russian_model.similarity('мужчина_NOUN', 'женщина_NOUN')
0.85228276<br>
#''Поиск лишнего слова''
russian_model.doesnt_match("завтрак_NOUN хлопья_NOUN обед_NOUN ужин_NOUN".split())
хлопья_NOUN
61
правка

Навигация