Классификация текстов и анализ тональности — различия между версиями
KirillTim (обсуждение | вклад) (init) |
KirillTim (обсуждение | вклад) (+ задачи) |
||
Строка 1: | Строка 1: | ||
'''Классификация текстов (документов)''' (''Document classification'') {{---}} задача компьютерной лингвистики<ref>[https://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BD%D0%B0%D1%8F_%D0%BB%D0%B8%D0%BD%D0%B3%D0%B2%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0 Компьютерная лингвистика]</ref>, заключающаяся в отнесении документа к одной из нескольких категорий на основании содержания документа. | '''Классификация текстов (документов)''' (''Document classification'') {{---}} задача компьютерной лингвистики<ref>[https://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BD%D0%B0%D1%8F_%D0%BB%D0%B8%D0%BD%D0%B3%D0%B2%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B0 Компьютерная лингвистика]</ref>, заключающаяся в отнесении документа к одной из нескольких категорий на основании содержания документа. | ||
− | '''Анализ тональности текста''' (''Sentiment analysis'') {{---}} задача компьютерной лингвистики<ref>[https://ru.wikipedia.org/wiki/%D0% | + | '''Анализ тональности текста''' (''Sentiment analysis'') {{---}} задача компьютерной лингвистики, заключающаяся в определении эмоциональной окраски (тональности) текста и, в частности, в выявлении эмоциональной оценки авторов по отношению к объектам, описываемым в тексте. |
+ | |||
+ | == Задачи классификации текстов == | ||
+ | Классификация текстов применяется, в том числе, для: | ||
+ | * Разделения веб страниц и сайтов по тематическим каталогам | ||
+ | * Борьбы со спамом | ||
+ | * Показа более релевантной рекламы | ||
+ | |||
+ | == Задачи анализа тональности текста == | ||
+ | Основной задачей анализа тональности текста является определение его эмоциональной окраски. Это необходимо, в том числе, для: | ||
+ | * Анализа отзывов о товарах и услугах | ||
+ | * Определение языка вражды<ref>[https://ru.wikipedia.org/wiki/%D0%AF%D0%B7%D1%8B%D0%BA_%D0%B2%D1%80%D0%B0%D0%B6%D0%B4%D1%8B Язык Вражды]</ref> |
Версия 01:48, 9 апреля 2019
Классификация текстов (документов) (Document classification) — задача компьютерной лингвистики[1], заключающаяся в отнесении документа к одной из нескольких категорий на основании содержания документа.
Анализ тональности текста (Sentiment analysis) — задача компьютерной лингвистики, заключающаяся в определении эмоциональной окраски (тональности) текста и, в частности, в выявлении эмоциональной оценки авторов по отношению к объектам, описываемым в тексте.
Задачи классификации текстов
Классификация текстов применяется, в том числе, для:
- Разделения веб страниц и сайтов по тематическим каталогам
- Борьбы со спамом
- Показа более релевантной рекламы
Задачи анализа тональности текста
Основной задачей анализа тональности текста является определение его эмоциональной окраски. Это необходимо, в том числе, для:
- Анализа отзывов о товарах и услугах
- Определение языка вражды[2]