Дерево решений и случайный лес
Версия от 17:21, 20 января 2019; Sokolova (обсуждение | вклад)
Дерево решений
| Определение: |
Дерево решений (англ. decision tree, DT) — алгоритм классификации , задающийся деревом (связным ациклическим графом):
|
| Определение: |
Бинарное решающее дерево — частный случай дерева решений, для которого .
|
Y classify(x): while : ((x)) ; return
Алгоритм построения решающего дерева ID3
Идея алгоритма (англ. Induction of Decision Tree) заключается в последовательном дроблении выборки на две части до тех пор, пока в каждой части не окажутся объекты только одного класса. Проще всего записать этот алгоритм в виде рекурсивной процедуры , которая строит дерево по заданной подвыборке и возвращает его корневую вершину. TODO: возможные StopCriterion, Major
V TreeGrowing(): if StopCriterion()then return новый лист , взяв := Major() выбрать признак, наиболее выгодный для ветвления дерева: Gain(, ) if Gain(, ) then return новый лист взяв := Major() создать новую внутреннюю вершину с функцией for (): := TreeGrowing() return
Мера неопределенности распределения
Критерий ветвления
Критейрий Джини
Энтропийный критерий
Разновидности решающих деревьев
Тип задачи
Критерии ветвления
Критерии останова
Что находится во внутренних вершинах
Что находится в листьях
Передача информации между вершинами
- (alternating decision tree)
Рецукция решающих деревьев
Оценивание вероятностей
Полужадный синтез
Алгоритмы построения решающих деревьев
Обобщающая способность решающих деревьев
Композиции решающих деревьев
- Решающий лес
- Бустинг над решающими деревьями
История
Ссылки
- Classification and Regression Trees — лекции Cosma Shalizi, ноябрь 2009.