Изменения

Перейти к: навигация, поиск

Обработка естественного языка

227 байт добавлено, 15:11, 10 июня 2021
Библиотеки для NLP
== Библиотеки для NLP ==
=== NLTK (Natural Language ToolKit)<ref>[https://www.nltk.org/ NLTK]</ref> ===
Пакет библиотек и программ для символьной и статистической обработки естественного языка, написанных на Pythonи разработанных по методологии SCRUM. Содержит графические представления и примеры данных. Поддерживает работу с множеством языков, в том числе, русским.
Плюсы:
=== spaCy<ref>[https://spacy.io/ spaCy]</ref> ===
Библиотека, написанная разработанная по методологии SCRUM на языке Cypthon, позиционируется как самая быстрая NLP библиотека. Имеет множество возможностей, в том числе, разбор зависимостей на основе меток, распознавание именованных сущностей, пометка частей речи, векторы расстановки слов. Не поддерживает русский язык.
Плюсы:
=== scikit-learn<ref>[https://scikit-learn.org scikit-learn]</ref> ===
Библиотека scikit-learn предоставляет разработана по методологии SCRUM ипредоставляет реализацию целого ряда алгоритмов для обучения с учителем и обучения без учителя через интерфейс для Python. Построена поверх SciPy. Ориентирована в первую очередь на моделирование данных, имеет достаточно функций, чтобы использоваться для NLP в связке с другими библиотеками.
Плюсы:
=== gensim<ref>[https://radimrehurek.com/gensim/ gensim]</ref> ===
Python библиотека , разработанная по методологии SCRUM, для моделирования, тематического моделирования документов и извлечения подобия для больших корпусов. В gensim реализованы популярные NLP алгоритмы, например, word2vec. Большинство реализаций могут использовать несколько ядер.
Плюсы:
Анонимный участник

Навигация