Изменения

Анализ социальных сетей

187 байт добавлено, 21:54, 9 января 2021

большая часть исправлений

==Общая информация==

Информация в социальных сетях отличается от информации, полученной из баз данных, с которой обычно работают системы анализа и [[Машинное обучение | машинного обучения]] , своей спецификой.

Прежде всего следует учитывать, что под пользователями социальных сетей понимаются виртуальные личности, созданные реальными людьми.

В связи с этим информация в социальных сетях формируется пользователем в рамках создания виртуального образа с учетом конфиденциальности и представлениях о безопасности конкретного человека.

Таким образом, вопрос достоверности данных, получаемых для дальнейшего анализа , становится весьма актуальным. Следовательно любые данные из социальных сетей должны обрабатываться с дополнительным параметром, характеризующим вероятность их достоверности.

Хотя мы и видим настойчивые попытки владельцев и модераторов сетей идентифицировать пользователей и требовать от них доказательства их реальности, но практика показывает, что нередки случаи использования людьми сразу нескольких аккаунтов в рамках одной социальной сети. Это происходит из-за того, что пользователи стараются физически обособить свои различные интересы, по-разному раскрывающие их личность. Как правило, такие аккаунты имеют разные характеристики, интересы, круги общения.

Люди иногда являются пользователями сразу нескольких соцсетей~~. Соответственно~~ , соответственно заводят аккаунты в каждой из них. Данные одного человека в разных соцсетях могут дополнять друг друга, тем самым дать более полную информацию о нем.

Кроме того, не следует забывать о фейковых аккаунтах и ботах, создаваемых для введения в заблуждение людей и искажения статистической информации аналитических систем.

Таким образом, идентификация пользователя, включающая в себя группировку разных аккаунтов одного реального человека и исключения фейков является важной задачей анализа данных социальных сетей.

Достоверность этой информации тем выше, чем дольше существует активность в этой группе.

Во внимание берутся:

* ~~Посты.~~ посты;* ~~Комментарии.~~ комментарии; * ~~Лайки.~~ лайки; * ~~Дизлайки.~~ дизлайки; * ~~Анализируются~~ анализируются ссылки на группу в тематических контентах. ; * ~~Интересы~~ интересы других пользователей этих групп.;

Таким образом формируется список интересов анализируемого пользователя.

Достоверность этого списка подтверждается наличием постов и комментариев на данную тематику, а также выявлением круга его знакомых, интересующихся данной тематикой.

Данным , получившим подтверждение из независимых источников , присваивается коэффициент достоверности больший, чем данным, подтверждение которым пока найти не удалось.

Данные, замеченные в фальсификации, получают негативный коэффициент достоверности. Эти данные исключаются из дальнейшей обработки, а пользователю снижается его общий коэффициент доверия.

Количество собираемых данных может быть расширено за счет анализа реакции клиентов на обращения к тем или иным темам. Например, относительное количество кликов на показанную пользователю рекламу и т.д. Это может несколько увеличить эффективность взаимодействия с пользователем.

<br>Принципиально новый подход к взаимодействию с пользователем возможен благодаря использованию более широкого анализа характеристик его личности.

Фундаментальную теорию такого анализа можно почерпнуть из смежных наук , таких как классическая и современная психология.

На житейском уровне мы привыкли разделять характеры людей по дихотомии:

* Рефлексивные {{---}} это меланхолики и флегматики.

==Большая пятерка==

Академическая психология использует [https://ru.wikipedia.org/wiki/%D0%91%D0%BE%D0%BB%D1%8C%D1%88%D0%B0%D1%8F_%D0%BF%D1%8F%D1%82%D1%91%D1%80%D0%BA%D0%B0_(%D0%BF%D1%81%D0%B8%D1%85%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%8F) Большую пятёрку] {{---}} диспозициональная (от англ. disposition — {{---}} предрасположенность) модель [https://ru.wikipedia.org/wiki/%D0%9B%D0%B8%D1%87%D0%BD%D0%BE%D1%81%D1%82%D1%8C личности] человека, отражающей восприятие людей друг другом. В соответствии с названием, модель предполагает, что личность человека включает в себя пять общих и относительно независимых черт.

В ней используют показатели:

* [https://ru.wikipedia.org/wiki/%D0%AD%D0%BA%D1%81%D1%82%D1%80%D0%B0%D0%B2%D0%B5%D1%80%D1%81%D0%B8%D1%8F ~~экстраверсии~~ Экстраверсии (противоположность {{- --}} интроверсия)],.

* Доброжелательности - дружелюбия, способности прийти к согласию (противоположность - конфликтность).

* Добросовестности - сознательности (противоположность - несознательность).

*Большое количество поздравлений с праздниками.

*Портрет/Селфи – превалирует селфи.

*Большое количество фотографий ~~outside~~вне дома.

*Активная лицевая экспрессия на фото, особенно на аватаре.

*Большое количество непостановочных, неожиданных фотографий с активными занятиями спортом, тусовками и прочее.

*Друзья преимущественно своего пола.

*Неуказанные контакты и невозможность отправить сообщение на страницу. Превалирующее количество технического контента в аккаунте.

*Пользователь не поздравляет никого с ДР Днем Рождения в соцсети и сам мало получает таких поздравлений.

*Такое же относительно праздников.

*Неотмеченные геолокации и отсутствие чек-~~иннов~~инов.

*Большое количество фотографий в помещении, отсутствие людей на фото.

*Скупая и сдержанная лицевая экспрессия на лице аватара и других фото.

*Большое количество записей на стене сделанных пользователем.

*Большое количество фото пользователя с другими людьми.

*Использование мессенджера ФБ и ВК в качестве основного мессенджера.*Использование широкого спектра функций ФБсоциальных сетей.

*Частая игра в онлайн игры.

*Высокое разнообразие контекстов на фотографиях и в постах.

Существуют обоснованные и детерминированные признаки для всех этих психотипов и моделей личности, согласно которым пользователи социальных сетей с достаточной степенью достоверности могут быть к ним причислены.

Задача эта вполне решаема с помощью современных методов машинного обучения. Компьютерный анализ текстов, поиск в них заранее определенных паттернов и сигнатур, стиля речи и особенности общения, характерных для тех или иных психотипов пользователя, его эмоциональные реакции и комментарии на чужие тексты, внешний вид и мимика на его фотографиях с высокой достоверностью могут быть причислены к одному из вышеперечисленных психотипов. Кроме того, для каждого из этих психотипов досконально изучены их поведенческие особенности, позволяющие прогнозировать их поведение в зависимости от возникающей ситуации.

Сформированные таким образом предварительные данные несут в себе достаточный потенциал для эффективного решения ставящихся перед нами задач воздействия на реальных людей. Это увеличивает вероятность положительного результата воздействия на сформированные кластеры пользователей, независимо от того , какой области это касается , будь-то коммерческие предложения, политология, социальные опросы или социальные исследования.

Эти технологии вполне современны и активно используются в данный момент.

Возможности наработок смежных гуманитарных дисциплин для воздействия на людей не ограничиваются только использованием психотипов в качестве дополнительных характеристик личности. Например, использование давно отработанной технологии: [https://ru.wikipedia.org/wiki/%D0%9D%D0%B5%D0%B9%D1%80%D0%BE%D0%BB%D0%B8%D0%BD%D0%B3%D0%B2%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B5_%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5 нейролингвистического программирования ] может дать более существенные и эффективные результаты.

Правда для этого следует несколько видоизменить характер сбора и анализа данных. Помимо семантического анализа текстов пользователя предполагается проведение их частотного, лингвистического и стилистического анализа.

Обращение к конкретному пользователю или группам пользователей должны быть автоматически составлены с такими же характеристиками речи, с использованием их словарного запаса, стилистических оборотов и с учетом привычных для них объемов текста, завершенные конкретным призывом к действию.

Особенностями вышеперечисленных методик является:

* Заранее определенный и ограниченный перечень возможных характеристик пользователей соцсетей;.* Автоматический сбор данных с целью назначения пользователю тех или иных характеристик;.

* Прогнозирование и оптимизация реакции пользователя на наш с ним контакт.

Следует отметить, что возможности машинного обучения значительно шире реализации описанных выше технологий.

В частности, представляется возможным осуществление недоступных ранее схем обратной связи. Рассмотрим существующую совокупность интересных нам людей, полностью удовлетворяющих нашим требованиям. Например: покупатели, купившие наш уникальный товар, избиратели, поддержавшие наше общественное движение, и т.д.

Методом машинного обучения возможен анализ активности , характерной для этих людей в социальных сетях , и выявление кластеров параметров, характерных этой совокупности людей. При этом, найденные кластеры могут не иметь ни вербального, ни логического обоснования и вообще их количество заранее не определено. Например, вполне может выясниться~~, так~~, что люди купившие ваш дорогой, уникальный товар по непонятной причине одновременно интересуются рыбалкой, делают одинаковые грамматические ошибки, часто используют букву “Ж”. Это совокупное свойство не имеет названия и не может быть объяснено логически, но может помочь в поиске дополнительных клиентов. Разумеется такие гипотезы, найденные компьютером , нуждаются в проверке и в подтверждении.

==Примеры использования данных социальных сетей==

*Соответствующая платежеспособность.

*Положительное реагирование на рекламные предложения.

~~----~~==Оценка надёжности и платёжеспособности кандидатов на получение кредитов==

С этой задачей ежедневно сталкиваются все банки, занимающиеся выдачей кредитов. Необходимость в автоматизации этого процесса назрела давно, ещё в 1960–1970-е годы, когда в США и других странах начался бум кредитных карт.

Лица, запрашивающие у банка заём, – это объекты, а вот признаки будут отличаться в зависимости от того, физическое это лицо или юридическое. Признаковое описание частного лица, претендующего на кредит, формируется на основе данных анкеты, которую оно заполняет. Затем анкета дополняется некоторыми другими сведениями о потенциальном клиенте, которые банк получает по своим каналам. Часть из них относятся к бинарным признакам (~~пол,~~ наличие телефонного номера), другие — {{---}} к порядковым (образование, должность), большинство же являются количественными (величина займа, общая сумма задолженностей по другим банкам, возраст, количество членов семьи, доход, трудовой стаж) или номинальными (имя, название фирмы-работодателя, профессия, адрес).

Для машинного обучения составляется выборка, в которую входят кредитополучатели, чья кредитная история известна. Все заёмщики делятся на классы, в простейшем случае их 2 – «хорошие» заёмщики и «плохие», и положительное решение о выдаче кредита принимается только в пользу «хороших».

* [[Рекомендательные системы]]

==Источники Информации==

* Cuperman, R., & Ickes, W. (2009). Big Five predictors of behavior and perceptions in initial dyadic interactions: Personality similarity helps extraverts and introverts, but hurts «disagreeables». ''Journal of Personality and Social Psychology, 97'', ~~667—684~~667{{---}}684.

[[Категория: Машинное обучение]]

[[Категория: Анализ социальных сетей]]

MaximOsadchiy

118

правок

Изменения

Анализ социальных сетей

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты