5
правок
Изменения
Нет описания правки
<b>Извлечение эмоций</b>(англ. Emotion Analysis) {{---}} эффективное обучение человеческим эмоциямэто исследование человеческих эмоций, которое который пытается идентифицировать настоящие правильные эмоции из контекста и проанализировать их согласно предопределенным классовым моделям эмоций. Часто вместе с эмоциями извлекается настрой (англ. Sentiment analysis) для определения отношения человека к той или иной теме. Источником данных могут служить речь, текст, видео или изображение человека. Данные методы можно применить практически ко всем многим аспектам нашей жизни, например, слежение за состоянием ментального здоровья оценивание отзывов людей о товарах или услугах для улучшения бизнес-стратегий или улучшение взаимодействия человека отслеживании реакции на события с целью анализа настроя общества и компьютераего отношения.
Множество усилий сейчас направлено на создание алгоритмов извлечения эмоций из текста, так как, хотя это является достаточно трудоемкой задачей по сравнению с остальными, но многие люди предпочитают делиться своим мнением и отношениям к событиям или явлениям в виде текстовых сообщений: статусов, постов, комментариев, что позволяет охватывать больше данных.
<h2>Какие бывают эмоции</h2>
<h3>Эмоциональные модели</h3>
Эмоциональная модель {{---}} структурированная форма или способ определения множества человеческих эмоций согласно некоторым баллам, рангам или измерениям. Бывают категориальными или пространственными. Категориальная модель (англ. categorical) {{---}} определяет список категорий эмоций, которые отделены друг от друга. Пространственная модель (англ. Dimensional) {{---}} определяет некоторое количество измерений с несколькими параметрами и идентифицирует эмоцию по ее значениям этих измерениям.
<h3>Эмоции и текст</h3>
<b>Подход, основанный на ключевых словах</b> (англ. keyword-based method). Наиболее интуитивный и сильный подход. Идея заключается в нахождении шаблонов близких к эмоциональным ключевым словам и сопоставлении их.
<b>Подход, основанный на лексике</b> (англ. lexicon-based method). Классифицирует текст используя надлежащую лексику имеющийся лексикон (основанную на знание уровня текста относительно эмоцийбаза знаний текстов, помеченных в соответствии с эмоциями) для входных данных.
<b>Машинное обучение</b> (англ. Machine learning method). Используются Для распознавания эмоций используются обучение как с учителем, так и без, в котором создается которых модель для тренировки направлена на обучение и тестирование классификатора , при этом данные делятся на части данных обучающую и на оставшихся проверяетсяпроверочную выборки.
<b>Смешанный подход</b> (англ. Hybrid method). Комбинирует два или три метода для достижения наилучшего выигрыша среди множества алгоритма алгоритмов и наивысшего уровня точности.
<h2h3>ПримерОписание некоторых работ по извлечению эмоций</h3>{| class="wikitable"! style="font-weight:bold;" | Авторы! style="font-weight:bold;" | Тип! style="font-weight:bold;" | Подход! style="font-weight:bold;" | Метод! style="font-weight: извлечение эмоций из твитовbold;" | Эмоции! style="font-weight:bold;" | Особенности! style="font-weight:bold;" | Недостатки|-| Ядоллахи и другие (Yadollahi et al.)<ref>Emotion Ali Yadollahi, Ameneh Gholipour Shahraki, and Osmar R. Zaiane. Current State of Text Sentiment Analysis from Twitter Opinion to Emotion Mining. ACM Computing Surveys (CSUR), 50(2):25:1-25:33, 2017.</ref>| Исследование| -| Существующие методы распознавания эмоций| Основные теории эмоций| Существующие словарь, множества данных для анализа, методы анализа для Твиттера, анализ для английского и других языков; хорошо структурированные исследование и классификация эмоциональных данных| -|-| Бинали и другие (Binali et al.)<ref>Haji Binali, Chen Wu, and Vidyasagar Potdar. Computational Approaches for Emotion Detection in Text. Digital Ecosystems and Technologies (DEST), 2010 4th IEEE International Conference on, pages 172-177, 2010.</ref>| Исследование и предложение подходаSailunaz| Комбинация методов, Kashfiaоснованных на ключевых словах и обучении| Методы, 2018основанные на ключевых словах и обучении| Основные теории эмоций| Описание вычислительных подходов для распознования эмоций в тексте; улучшение распознования эмоций благодаря комбинированию семантической и синтаксической информации| -|-| Каналес и другие (Canales et al.)<ref>Lea Canales, httpsand Patricio Martinez-Barco. Emotion Detection from Text:A Survey. Processing in the 5th Information Systems Research Working Days (JISIC 2014), pages 37-43, 2014.</ref>| Исследование| -| Методы, основанные на лексике и машинном обучении| Основные теории эмоций| Подборка существующих работ, основанных на лексике или машинном обучении как с учителем, так и без; сравнение подходов, основанных на лексике и машинном обучении, и ограничений существующих систем| Предложено новое направление в глубоком анализе, но не объяснено в деталях|-| Чопаде и другие (Chopade at al.)<ref>Chetan R. Chopade. Text Based Emotion Recognition: A Survey. International Journal of Science and Research (IJSR), 4(6):409-414, 2015.</prismref>| Исследование| -| Комбинация методов, основанных на ключевых словах (поиск ключевых слов), лексике (лексическое сходство) и машинном обучении| Основыные теории эмоций| Применение тестовых способов распознавания эмоций; ограничение существующих подходов; техники нормализации текстов| -|-| Трипати и другие (Tripathi et al.)<ref>Vaibhav Tripathi, Aditya Joshi, and Pushpak Bhattacharyya.ucalgaryEmotion Analysis from Text: A Survey.cahttp:/bitstream/handlewww.cfilt.iitb.ac.in/1880resources/107533surveys/ucalgary_2018_sailunaz_kashfiaemotion-analysissurvey-2016-vaibhav.pdf.</ref>| Исследование| -| Обнаружение ключевых слов, лексическое сходство, статистическая обработка естественного языка| Базовые эмоции, их свойства представления и моделей| Эмоциональный потенциал текста, определение и генерация множества данных и словарей, список существующих работ по определению эмоций в тексте, приложение для эмоциональногоо анализа, возможные будующие направления | -|-| Као и другие (Kao et al.)<ref>Edward Chao-Chun Kao, Chun-Chieh Liu, Ting-Hao Yang, Chang-Tai Hsieh, and Von-Wun Soo. Towards Text-Based Emotion Detection a Survey and Possible Improvements. Information Management and Engineering, 2009. ICIME’09. International Conference on, IEEE, pages 70-74, 2009.</ref>| Исследование и предложение подхода| Метод логического обоснования| Комбинация методов, основанных на ключевых словах и машинном обучении| 22 эмоции из [[Извлечение эмоций#Эмоциональные модели|модели]] OCC| Формально определена задача распознавания эмоций, существующие подходы и их недостатки, возможные решения; новый подход с семантическим анализом и методом логического обоснования| Предложенный метод не был реализован|-| Шивхаре и другие (Shivhare et al.)<ref>Shiv Naresh Shivhare, and Saritha Khethawat. Emotion Detection from Text. 2012.</ref>| Исследование и предложение подхода| Алгоритм детектора эмоций, основанный на эмоциональной онтологии| Комбинация методов, основанных на ключевых словах (поиск ключевых слов), лексике (лексическое сходство) и машинном обучении| -| Обсуждение разлиных техник детекции эмоций, их недостатков; разработка нового алгоритма, основанного на онтологии| Предложенный метод не был реализован|-| Гупта и другие (Gupta et al.)<ref>Umang Gupta, Ankush Chatterjee, Radhakrishnan Srikanth, and Puneet Agrawal. A Sentiment-and-Semantics-Based Approach for Emotion Detection in Textual Conversations. Neu-IR: Workshop on Neural Information Retrieval, SIGIR 2017, ACM, arXiv preprint arXiv:1707.06996., 2017.</ref>| Новый подход| Модель глубого обучения, основанная на [[Долгая краткосрочная память|LSTM]]| Машинное обучение ([[Метод опорных векторов (SVM)|метод опорных векторов]], [[Дерево решений и случайный лес#Дерево решений|дерево решений]], [[Байесовская классификация#Наивный байесовский классификатор|наивный байесовский классификатор]]| Злой, счастливый, грустный, другие| Сочетание смысловых и эмоциональных вложений; опережение большинства базовых подходов машинного обучени| Невозможность учитывания контекста|-| Десмет и другие (Desmet et al.)<ref>Bart Desmet, and VeRonique Hoste. Emotion Detection in Suicide Notes. Expert Systems with Applications, 40(16):6351-6358, 2013.</ref>| Новый подход| Обработка естественного языка и анализ настроения| [[Метод опорных векторов (SVM)|Метод опорных векторов]]| Насилие, гнев, обвинение, страх, прощение, вина, счастье, оптимизм, безнадежность, сообщение инофрмации, инструкции, любовь, гордость, скорбь, благодарность| Использование машинного обучения для распознавания эмоций в записках самоубийц; использование семантических и лексических элементов таких как [[Векторное представление слов#word2vec|"сумка слов"]], маркирование частями речи и триграм| Недостаточно данных;jsessionid=92537BF3ACE14E77D0D02CB537FA8B74?sequence=1невозможно определить редкие эмоции; не содержит отрицаний|-| Дини и другие (Dini et al.)<ref>Luca Dini, and Andre Bittar. Emotion Analysis on Twitter: The Hidden Challenge. Language Resources and Evaluation Conference (LREC), 2016.</ref>| Новый подход| Символьный подход и машинное обучение| Методы, основанные на лексике и машнном обучении| Гнев, отвращение, страх, удовольствие, грусть, удивление| Создание эмоционального корпуса твитов для классификации (англ. ETCC) и для релевантности (англ. ETCR); использование слов, лемм, именованных словосочетаний, зависимостей между частями речи как признаков| Проверка качества нуждается в двух новых корпусах|-| Мохаммад и другие (Mohammad et al.)<ref>Saif M. Mohammad, and Felipe Bravo-Marquez. Emotion Intensities in Tweets. Proceedings of the Sixth Joint Conference on Lexical and Computational Semantics (*Sem), 2017.</ref>| Новый подход| Лучшее худшее масштабирование (англ. Best Worst Scaling)| Регрессия| Гнев, страх, удовольствие, грусть| Определение интенсивности эмоций; создание 4 множеств данных, содержащих твиты; показана корреляция между парами эмоций; использована n-грамы слова, символьные n-грамы, вложения слов и влияние лексики на эмоции | Точность не проверена|-| Сумма и другие (Summa et al.)<ref>Anja Summa, Bernd Resch, Geoinformatics-Z. GIS, and Michael Strube. Microblog Emotion Classification by Computing Similarity in Text, Time, and Space. Proceedings of the Workshop on Computational Modeling of People’s Opinions, Personality, and Emotions in Social Media, pages 153-162, 2016.</ref>| Новый подход| Междисциплинарный подход| [[Обучение с частичным привлечением учителя#Алгоритмы на основе графов|Обучение с частичным привлечением учителя на основе графов]], обработка естественного языка| Гнев, счастье, отвращение, страх, грусть, удивление, остутствие эмоций| Комбинация лингвистической, временной (о времени) и территориальной информации; вычисление сходства между двумя вершинами| Точность не высока; выбор парметров случаен|-| Сен и другие (Sen et al.)<ref>Anirban Sen, Manjira Sinha, Sandya Mannarswamy, and Shourya Roy. Multi-Task Representation Learning for Enhanced Emotion Categorization in Short Text. PacificAsia Conference on Knowledge Discovery and Data Mining, Springer, Cham, pages 324-336, 2017.</ref>| Новый подход| Совместно обучаемая модель для эмоций и настроения| Машинное обучение ([[Метод опорных векторов (SVM)|метод опорных векторов]], [[Сверточные нейронные сети|сверточные нейронные сети]])| Эмоции: гнев, удовольствие, волнение, счастье, надежда, любовь, грусть; настроение: позитивное, негативное, нейтральное, остутствие настроения| Использование настроения как дополнительного входа для распознования эмоций в тексте; использование многозадачной нейронной сети для встраиваемого обучения| -|-| Джейн и другие (Jain et al.)<ref>Vinay Kumar Jain, Shishir Kumar, and Steven Lawrence Fernandes. Extraction of Emotions from Multilingual Text using Intelligent Text Processing and Computational Linguistics. Journal of Computational Science, 2017.</ref>| Исследование и предложение подхода| Машинное обучение (метод опорных веторов, наивный байесовский классификатор)| Интеллектуалная обработка текста| Основные теории эмоций, модель Экмана (для фреймворка)| Обобщение различных существующих методов распознавания эмоций; детальное исследование прогнозирования выбора твита; комбинирование признаков, основанных на корпусе твитов и связанных с эмоциями, для распознавания эмоций в многоязыковых текстах| Предложенный фреймворк фокусируется только на темах, связанных с политикой, здоровьем или спортом|-| Канг и другие (Kang et al.)<ref>Xin Kang, Fuji Ren, and Yunong Wu. Exploring Latent Semantic Information for Textual Emotion Recognition in Blog Articles. IEEE/h2CAA Journal of Automatica Sinica, 2017.</ref>| Новый подход| Байесовская модель| Байесовский метод принятия решения| Гнев, тревога, ожидание, ненависть, удовольствие, любовь, скорбь, удивление| Работа с контекстной информацией для получения скрытого смыслового аспекта; предсказание эмоции для слова и документа; применяются две байесовские модели: DWET и HDWET; DWET превзошел все базовые методы | Байесовские модели никогда не сойдутся, если смысловой аспект увеличиться слишком сильно; работает только с китайским языком|}
<h2>Пример: извлечение эмоций из твитов<ref>Emotion and Sentiment Analysis from Twitter Text Sailunaz, Kashfia, 2018, https://prism.ucalgary.ca/bitstream/handle/1880/107533/ucalgary_2018_sailunaz_kashfia.pdf;jsessionid=92537BF3ACE14E77D0D02CB537FA8B74?sequence=1</ref></h2> Процесс извлечения извлечение эмоций из твитов приминительно к полу и местоположению человека, написавшего пост, состоит из нескольких последовательных шагов: предобработка, маркирование . Перед использованием твитов для распознования эмоций их следует предобработать. После этого нужна маркировка частями речидля выбора слов, эмоциональный на которых нужно фокусироваться в дальнейшем. Эмоциональный словарь, распознавание требуется в соответствие с выбором выбором эмоционального класса модели. После распознования эмоциональных униграм и , их классификацияследует классифицировать соответствующими эмоциональными классами.
<h3>Предобработка текстов</h3>
<h3>POS маркировка</h3>
Происходит маркировка каждого слова частью речи, к которой он оно относится. Было использовано 36 частей речи: координирующий союз, количественное числительное, опеределяющее слово, there, указывающее на существование чего-либо (конструкция there + to be), иностранное слово, предлог или подчиняющий союз, прилагательное, прилагательное в сравнительной степени, прилагательное в превосходной степени, маркер элемента списка, модальный глагол, существвительное - в единственном числе или неисчисляемое, существительное - во множественном числе, имя собственное - в единственном числе, имя собственное - во множественном числе, предопределитель (слово, иногда использующееся перед определяющим словом для передачи дополнительной информации о существительном в словосочетании, например: опеределительное словоall в all these children), притяжательное окончание (например 's в the class's hours), личное местоимение, иностранное притяжательное метоимение, наречие, наречие в сравнительной степени, наречие в превосходной степени, частица, условное обозначение, частица to, междометие, глагол - в базовой форме, глагол - прошедшее время, глагол - герундий или причастие настоящего времени, глагол - причастие прошедшего времени, глагол - настоящее время не 3 лица единственного числа, глагол - настоящее время 3 лицо единственное число, определяющее слово , начинающееся с wh, местоимение, начинающееся с wh, притяжательное местоимение, начинающееся с wh, наречие, начинающееся с wh и тдругое.дСлова твита маркируются, и каждое слово хранится в одном из 37 классов.
<h3>Эмоциональный словарь</h3>
Существующие системы распознавания эмоций используют различные [[Извлечение эмоций#Эмоциональные модели|эмоциональные модели ]] соответсвенно их требованиям. Наиболее используемые: Экмана (Ekman)<ref>P Ekman. An Argument for Basic Emotions. Cognition and emotion, 6(3-4):169–200,1992.</ref>, ДжонсонДжонсона-лайрд Лайрда и Оатли (Johnson-laird and Oatley)<ref>Keith Oatley, and Philip N. Johnson-Laird. Towards a Cognitive Theory of Emotions.Cognition and Emotion, 1(1):29{50, 1987.</ref>, Циркумплекс (circumplex)<ref>James A. Russell. A Circumplex Model of Affect. Journal of Personality and SocialPsychology, 39(6):1161{1178, 1980.</ref>. Главным ограничением недостатком этих моделей является их фокусировка только на нескольких базовых эмоциях. Самая широко используемая модель - Циркумплекс - работает с 28 эмоциями. Существует также модель, называемая "Колесо эмоций Плутчика"<ref>Robert Plutchik. Emotion: A Psychoevolutionary Synthesis. Harper and Row, 1980.</ref>, она распознает 32 эмоции: принятие, восхищение, агрессивность, изумление, злость, раздражение, предвкушение, опасение, трепет, скука, презрение, неодобрение, отвращение, рассеянность, восторг, страх, горе, интерес, наслаждение, ненависть, любовь, оптимизм, задумчивость, ярость, раскаяниие, грусть, спокойствие, подчинение, удивление, ужас, доверие, настороженность.
Эмоциональный словарь был построен на базе перечисленных 32 эмоций. Синонимы для каждого эмоционального слова подбирались были подобраны как из нескольких обычных онлайн словарей английского. После добавления слов из словарей, также добавлялись распространенные в твитах синонимы так и из словарей, основанных исключительно именно на твитах. В конце добавляются Также были добавлены распростаненные акронимы, найденные в различных источниках. После всех этих действий словарь содержит более 20 синонимов для каждой эмоции.
<h3>Выбор униграм и аннотация данных</h3>
<h3>Эмоциональная классификация</h3>
Последним шагом распознования эмоций была классификация, использующая эмоциональный словарь. Обычно для эмоциональной классификации используются [[Метрический_классификатор_и_метод_ближайших_соседей|метод ближайших соседей]], [[Байесовская_классификация#Наивный байесовский классификатор|наивный байесовский классификатор]] и [[Дерево_решений_и_случайный_лес#Дерево решений|дерево решений]]. В большинстве случаев наивный байесовский классификатор давал наиболее точные результаты, и именно поэтому он был использован в данной работе. \begin{aligned}p(C_k|x_1,...x_n) = \frac{p(C_k)}{p(x)}\prod_{i=1}^{n}p(x_i|C_k)\end{aligned}
\begin{aligned}
\end{aligned}
Формулы выще представляют наивный байесовский классификатор. Где $C_k$ {{---}} эмоциональный класс и $k$ изменяется соответсвенно от 1 до 32, $x_i$ {{---}} униграма, используемая для определения эмоций. При этом 70% аннотированных данных используется как обучающая подвыборка, остальные 30% как проверочная.
<h2>Смотри также</h2>
* https://www.kdnuggets.com/2019/10/sentiment-emotion-analysis-beginners-types-challenges.html
* https://www.researchgate.net/publication/319362855_Emotion_analysis_A_survey
* https://en.wikipedia.org/wiki/Emotion_classification
[[Категория: Машинное обучение]]
[[Категория: Обработка естественного языка]]