Изменения

Перейти к: навигация, поиск

Анализ социальных сетей

80 байт добавлено, 23:27, 20 декабря 2020
Нет описания правки
Первое {{---}} парсинг и семантический анализ данных, оставленных в соцсетях виртуальными пользователями.
Прежде всего это личные данные:
-* фамилия, имя, отчество;- * контактные данные;- * анкетные данные.
Следует отметить, что для хозяев соцсетей есть дополнительные возможности для получения информации о пользователе такие как:
- * IP-адреса;- * геолокация;- * характеристика устройства и т.д., недоступные для внешних аналитиков.
Кроме того, важно зафиксировать кто является друзьями и подписчиками пользователя и на кого пользователь сам подписан.
Анализируются:
- * группы, в которых пользователь участвует, - * их тематика; - * активность пользователя в них, его сообщения;- * комментарии к чужим сообщениям.
Немаловажное значение имеют данные с собственных страниц пользователя:
- * подписчики этих страниц;- * тематика страницы;- * размещаемый на них контент;- * фотографии и собственные видео;- * комментарии пользователя и подписчиков.
Сбор данных осуществляется на постоянной основе. Данные пополняются по мере появления новой информации.
Верификация этих данных происходит путем сравнения анкетных данных, оставленных этим пользователем, с информацией из разных независимых источников.
Это такие как:
- * IP - адреса пользователя;- * геолокация и временной пояс пользователя;- * время оставляемых им сообщений;
Могут быть использованы существующие базы персональных данных реальных людей:
- * базы паспортов;- * фотографий;- * прописок;- * автовладельцев;- * налоговых;- * имущественных.
В свете появления новых технологий поиска людей по их изображениям, перспективным является анализ достоверности фотографии, представленной пользователем.
Достоверность фотографии может быть подтверждена путем сравнения ее с лицами, представленными на других фотографиях и видео аккаунта. Также осуществляется поиск по фото- и видео, выложенных в аккаунтах друзей. Поиск точной копии фото в интернете может помочь избежать фейков, либо найти другие аккаунты этого же пользователя.
Достоверность этой информации тем выше, чем дольше существует активность в этой группе.
Во внимание берутся:
- * посты;- * комментарии; - * лайки; - * дизлайки; - * анализируются ссылки на группу в тематических контентах; - * интересы других пользователей этих групп.
Таким образом формируется список интересов анализируемого пользователя.
Достоверность этого списка подтверждается наличием постов и комментариев на данную тематику, а также выявлением круга его знакомых, интересующихся данной тематикой.
* [[доброжелательность]] (дружелюбие, способность прийти к согласию),
* [[добросовестность]] (сознательность),
* [https://ru.wikipedia.org/wiki/%D0%9D%D0%B5%D0%B9%D1%80%D0%BE%D1%82%D0%B8%D0%B7%D0%BC нейротизм] (противоположный полюс {{- --}} эмоциональная стабильность)
* [[открытость опыту]] (интеллект).
Психотипология оперирует конкретными психотипами. Такие, как
- * истероидный психотип;- * эпилептоидный психотип;- * паранойяльный психотип;- * эмотивный психотип;- * шизоидный психотип;- * гипертимный психотип;-* депрессивно - печальный психотип;- * тревожно- мнительный психотип.
Существуют обоснованные и детерминированные признаки для всех этих психотипов и моделей личности, согласно которым пользователи соц. сетей с достаточной степенью достоверности могут быть к ним причислены.
Задача эта вполне решаема с помощью современных методов машинного обучения. Компьютерный анализ текстов, поиск в них заранее определенных паттернов и сигнатур, стиля речи и особенности общения, характерных для тех или иных психотипов пользователя, его эмоциональные реакции и комментарии на чужие тексты, внешний вид и мимика на его фотографиях с высокой достоверностью могут быть причислены к одному из вышеперечисленных психотипов. Кроме того, для каждого из этих психотипов досконально изучены их поведенческие особенности, позволяющие прогнозировать их поведение в зависимости от возникающей ситуации.
Обращение к конкретному пользователю или группам пользователей должны быть автоматически составлены с такими же характеристиками речи, с использованием их словарного запаса, стилистических оборотов и с учетом привычных для них объемов текста, завершенные конкретным призывом к действию.
Особенностями вышеперечисленных методик является:
- заранее * Заранее определенный и ограниченный перечень возможных характеристик пользователей соцсетей;- автоматический * Автоматический сбор данных с целью назначения пользователю тех или иных характеристик;- прогнозирование * Прогнозирование и оптимизация реакции пользователя на наш с ним контакт.
Следует отметить, что возможности машинного обучения значительно шире реализации описанных выше технологий.
В частности, представляется возможным осуществление недоступных ранее схем обратной связи. Рассмотрим существующую совокупность интересных нам людей, полностью удовлетворяющих нашим требованиям. Например: -* покупатели, купившие наш уникальный товар, -* избиратели, поддержавшие наше общественное движение, и т.д.
Методом машинного обучения возможен анализ активности характерной для этих людей в социальных сетях и выявление кластеров параметров, характерных этой совокупности людей.
При этом, найденные кластеры могут не иметь ни вербального, ни логического обоснования и вообще их количество заранее не определено. Например, вполне может выясниться, так, что люди купившие ваш дорогой, уникальный товар по непонятной причине одновременно интересуются рыбалкой, делают одинаковые грамматические ошибки, часто используют букву “Ж”. Это совокупное свойство не имеет названия и не может быть объяснено логически, но может помочь в поиске дополнительных клиентов. Разумеется такие гипотезы, найденные компьютером нуждаются в проверке и в подтверждении.
[[Категория: Машинное обучение]]
[[Категория: Анализ социальных сетей]]
Анонимный участник

Навигация