192
правки
Изменения
→Генеративные модели
=== Генеративные модели ===
Генеративные модели в полуавтоматическом обучении можно рассматривать как расширение обучения с учителем (классификация и информация о $p(x)$, или как расширение обучения без учителя (кластеризация и некоторые метки).
Основное предположение генеративных моделей заключается в том, что распределения принимают форму $p(x|y, \theta)$, параметризованную вектором $\theta$.
'''Идея'''
* Интересующая величина: $p(X_l, Y_l, X_u|\theta) = \sum_{Y_u}p(X_l, Y_l, X_u, Y_u|\theta)$
* Найти для $\theta$ оценку макcсимального правдоподобия, оценить апостериорный максимум или использовать теорему Байеса.
'''Пример генеративной модели'''
Параметры модели: $\theta = \{w_1, w_2, \mu_1, \mu_2, \sum_1, \sum_2\}$
Модель:
$p(x, y|\theta) = p(y|\theta)p(x|y,\theta) = w_yN(x;\mu_y,\sum_y)$
Классификация:
$p(y|x,\theta) = \frac{p(x,y|\theta)}{\sum_{y'}p(x,y'|\theta)}$
'''Достоинства'''
* Гереативные модели очень эффективны, если составленная модель близка к правильной
'''Недостатки'''
* Трудно определить корректность модели
* Неразмеченные данные могут навредить при использовании неверной генеративной модели
=== Полуавтоматические SVM ===