Рекомендательные системы — различия между версиями

Версия 12:18, 25 марта 2020

Рекомендательные системы - программы, которые пытаются предсказать, какие объекты будут интересны пользователю, имея определенную информацию о его профиле.

Содержание

1 Обзор и постановка задачи
2 Кластеризация пользователей
3 User-based и item-based алгоритмы
4 Алгоритм SVD

Обзор и постановка задачи

Основная задача рекомендательных систем - проинформировать пользователя о товаре или услуге, которая будет для него наиболее инетерсной и акутальной. Разнообразие таких систем можно проиллюстрировать основными характеристиками:

Предмет рекомендации.
Цель рекомендации.
Контекст рекомендации.
Источник рекомендации.
Степень персонализации.
Прозрачность.
Формат рекомендации.
Алгоритмы.

В центре таких систем лежит матрица предпочтений. В этой матрице одна из осей отвечает за пользователей, вторая за обхекты рекомендации. Заполнена же эта матрица значениями по заданной шкале (например от 1 до 5). Каждый клиент с малой долей вероятностью оценивал все объекты рекомендации, поэтому задача системы - это обобщение информации и предсказание, какое отношение к рекомендуемому обхекту будет у пользователя.

Пользовательские оценки, необходимые для составления матрицы предпочтений, можно получить двумя способами:

явно (explicit ratings)
неявно (implicit ratings)

Очевидно, что явное оценивание лучше, так как сам пользователь определяет насколько ему интересен тот или иной объект, однако из-за непостоянства в получении явных оценок от пользователей, на практике используется оба подхода.

Формализуем задачу. Имеется множество пользователей [math] u \in U [/math], множество объектов [math] i \in I [/math] и множество событий (действия, которые совершают пользователи с объектами). Каждое событие задается пользователем [math] u [/math], объектом [math] i [/math], своим результатом [math] r_{ui} [/math] и, возможно, но не обяхательно, другими харакетристиками. По итогу требуется:

предсказать предпочтение:
персональные рекомендации:
похожие объекты:

Кластеризация пользователей

Определение:

Коллаборативная фильтрация (англ. collaborative filtering) — это один из методов построения прогнозов (рекомендаций) в рекомендательных системах, использующий известные предпочтения (оценки) группы пользователей для прогнозирования неизвестных предпочтений другого пользователя.

Основная идея метода - похожим пользователям нравятся похожие объекты.

Алгоритм можно разбить на следующие шаги:

Выберем условную меру схожести пользователей по истории их оценок [math] sim(u, v) [/math]
Объеденим пользователей в группы так, чтобы похожие пользователи оказывались в одном кластере [math] u \mapsto F(u) [/math]
Оценку пользователя предскажем как среднюю оценку кластера этому объекту

Проблемы алгоритма:

Нечего рекомендовать новым пользователям, их невозможно определить к какому-нибудь кластеру,а значит и рекомендовать им нечего.
Не учитывается контекст и специфика пользователя.
Если в кластере нет оценки объекта, то предсказание невозможно.

User-based и item-based алгоритмы

Заменим жесткую кластеризацию на предположение, что фильм понравится пользователю, если он понравился его друзьям.

Однако у этого алгоритма есть недостатки:

Холодный старт.
Нечего рекомендовать новым/нетипичным пользователям.

Так же имеется абсолютно симметричный алгоритм. Теперь будем считать, что фильм понравится пользователю, если ему понравились похожие фильмы.

У такого подхода остается недостаток в виде холодного старта и при этом рекомендации становятся тривиальными.

Так же стоит отметить ресурсоемкость вычислений такими методами. Для предсказаний необходимо держать в памяти все оценки всех пользователей.

Алгоритм SVD

Определение:

SVD (Single Value Decomposition) — у любой матрицы размера существует разложение трех матриц: :

@@ Строка 54: / Строка 54: @@
 <tex> \hat{r_{ui}} = \bar{r_u} + \frac{\sum_{v \in U_i}{}{sim(u, v)(r_{vi} - \bar{r_v})}}{\sum_{v \in {U_i}}{}{sim(u, v)}} </tex>
+Однако у этого алгоритма есть недостатки:
+* Холодный старт.
+* Нечего рекомендовать новым/нетипичным пользователям.
+Так же имеется абсолютно симметричный алгоритм. Теперь будем считать, что фильм понравится пользователю, если ему понравились похожие фильмы.
+<tex> \hat{r_{ui}} = \bar{r_i} + \frac{\sum_{j \in I_u}{}{sim(i, j)(r_{uj} - \bar{r_j})}}{\sum_{j \in {I_u}}{}{sim(i, j)}} </tex>
+У такого подхода остается недостаток в виде холодного старта и при этом рекомендации становятся тривиальными.
+Так же стоит отметить ресурсоемкость вычислений такими методами. Для предсказаний необходимо держать в памяти все оценки всех пользователей.
+==Алгоритм SVD==
+{{Определение
+|definition=
+'''SVD''' (''Single Value Decomposition'') {{---}} у любой матрицы <tex> A </tex> размера <tex> n \times m </tex> существует разложение трех матриц: <tex> U, \Sigma, V^T </tex>:
+<tex> A_{n \times m} = U_{n \times n} \times \Sigma_{n \times m} \times V^T_{m \times m} </tex>
+}}

Рекомендательные системы — различия между версиями

Версия 12:18, 25 марта 2020

Содержание

Обзор и постановка задачи

Кластеризация пользователей

User-based и item-based алгоритмы

Алгоритм SVD

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты