Изменения

Перейти к: навигация, поиск

Обработка естественного языка

9 байт добавлено, 19:37, 24 января 2019
м
spaCyspaCy
=== spaCy<ref>[https://spacy.io/ spaCy]</ref> ===
Библиотека, написанная на языке Cypthon, позиционируется как самая быстрая NLP библиотека. Имеет множество возможностей, в том числе, разбор зависимостей на основе меток, распознавание именованных сущностей, пометка частей речи,векторы расстановки слов. Не поддерживает русский язык.
Плюсы:
* Самая быстрая библиотека для NLP.* Простая в изучении и использовании.* Работает с объектами, а не строками.* Есть встроенные вектора слов.* Использует нейронные сети для тренировки моделей.
Минусы
* Менее гибкая по сравнению с NLTK.* Токенизация предложений медленнее, чем в NLTK.* Поддерживает маленькое количество языков.
=== scikit-learn<ref>[https://scikit-learn.org scikit-learn]</ref> ===
174
правки

Навигация