Изменения

Перейти к: навигация, поиск

Векторное представление слов

2 байта убрано, 23:30, 5 марта 2019
Загрузка предобученной модели русского корпуса
'''import''' gensim.downloader '''as''' download_api
russian_model = download_api.load(<font color="green">'word2vec-ruscorpora-300'</font>)<br>
<font color="grey"># ''Выведем первые 10 слов корпуса.<br># Заметим, что после слова и указывается часть речи: NOUN (существительное), ADJ (прилагательное) и так далее.''<br># ''Существуют также предоубученные модели без разделения слов по частям речи''st</font>
list(russian_model.vocab.keys())[:<font color="blue">10</font>]
''<font color="grey"># ['весь_DET', 'человек_NOUN', 'мочь_VERB', 'год_NOUN', 'сказать_VERB', 'время_NOUN', 'говорить_VERB', 'становиться_VERB', 'знать_VERB', 'самый_DET']</font>''<br>
Анонимный участник

Навигация