Изменения

Перейти к: навигация, поиск

Обучение с частичным привлечением учителя

1823 байта добавлено, 19:19, 4 сентября 2022
м
rollbackEdits.php mass rollback
* Негативное влияние ошибочных прогнозов усиливается с обучением. В таком случае существуют эвристические решения, например "удаление" метки с объекта, достоверность прогноза которого оказалась ниже определённого порога
* Трудно достичь сходимости алгоритма.  Однако, существуют частные случаи, когда самообучение эквивалентно работе [[EM-алгоритм|EM-алгоритма]], а также при использовании например его модификация под байесовский классификатор, использующий неразмеченные данные. Также у задач, использующих некоторые классы функций (например, линейныхлинейные), где известно решение существуют решения в виде сходящегося алгоритма.
=== Совместное обучение (Co-training) ===
=== Алгоритмы на основе [[Теория графов|графов]] ===
 
[[File:digits Euclidean.png|thumb|400px|Изображения рукописных цифр. <br>Слева {{---}} две цифры с большим евклидовым расстоянием, но одинаковой меткой класса. <br>Справа {{---}} те же цифры, "соединённые" неразмеченной последовательностью (путь в графе), где каждые две соседние цифры имеют малое евклидово расстояние.]]
 
[[File:digits Euclidean graph.png|thumb|400px|Граф, построенный на множестве рукописных цифр "1" и "2".]]
Данные можно представить в виде графа, построенного с использованием знаний в предметной области или на основе сходства объектов.
'''Пример'''
[[File:digits EuclideanГрафы, формирующиеся в процессе обучения, как правило, достаточно объёмны для графического отображения и человеческого восприятия.png|thumb|400px|Изображения Для большей ясности рассмотрим множество данных, состоящее только из рукописных цифр"1" и "2". <br>Слева {{Критерием сходства объектов послужит евклидово расстояние, которое бывает особенно полезно при поиске локального сходства. Если такое расстояние между объектами достаточно мало, мы можем предположить, что объекты принадлежат одному классу. На основе расстояния можно построить [[Метрический классификатор и метод ближайших соседей|KNN]]---}} две цифры граф (см. иллюстрацию), где объекты с большим малым евклидовым расстояниембудут соединены рёбрами. Чем больше имеется неразмеченных данных, но одинаковой меткой классасхожих с размеченными (см. <br>Справа {{---}} те же цифры, пример с цифрой "соединённые2" неразмеченной последовательностью (путь в графе), где каждые две соседние цифры имеют малое евклидово расстояние.]] [[File:digits Euclidean graph.png|thumb|400px|Графтем больше соотвествующих рёбер, построенный на множестве рукописных цифр "1" и "2", следовательно, более высокая точность классификации.]] 
'''Достоинства алгоритмов на графах'''
'''Недостатки'''
* Низкая эффективность при плохом постоении построении графа
* Зависимость от структуры графа и весов рёбер
# [https://www.molgen.mpg.de/3659531/MITPress--SemiSupervised-Learning.pdf MIT Press {{---}} Semi-Supervised Learning]
# [http://web.mit.edu/cocosci/Papers/man_nips.pdf Mapping a manifold of perceptual observations]
# [http://pages.cs.wisc.edu/~jerryzhu/pub/thesis.pdf Semi-Supervised Learning with Graphs]
[[Категория:Машинное обучение]]
[[Категория:Обучение с частичным привлечением учителя]]
1632
правки

Навигация