Дерево решений и случайный лес
Версия от 17:21, 20 января 2019; Sokolova (обсуждение | вклад)
Дерево решений
Определение: |
Дерево решений (англ. decision tree, DT) — алгоритм классификации
| , задающийся деревом (связным ациклическим графом):
Определение: |
Бинарное решающее дерево — частный случай дерева решений, для которого
| .
Y classify(x):while : ( (x)) ; return
Алгоритм построения решающего дерева ID3
Идея алгоритма
(англ. Induction of Decision Tree) заключается в последовательном дроблении выборки на две части до тех пор, пока в каждой части не окажутся объекты только одного класса. Проще всего записать этот алгоритм в виде рекурсивной процедуры , которая строит дерево по заданной подвыборке и возвращает его корневую вершину. TODO: возможные StopCriterion, MajorV TreeGrowing(): if StopCriterion( )then return новый лист , взяв := Major( ) выбрать признак, наиболее выгодный для ветвления дерева: Gain( , ) if Gain( , ) then return новый лист взяв := Major( ) создать новую внутреннюю вершину с функцией for ( ): := TreeGrowing( ) return
Мера неопределенности распределения
Критерий ветвления
Критейрий Джини
Энтропийный критерий
Разновидности решающих деревьев
Тип задачи
Критерии ветвления
Критерии останова
Что находится во внутренних вершинах
Что находится в листьях
Передача информации между вершинами
- (alternating decision tree)
Рецукция решающих деревьев
Оценивание вероятностей
Полужадный синтез
Алгоритмы построения решающих деревьев
Обобщающая способность решающих деревьев
Композиции решающих деревьев
- Решающий лес
- Бустинг над решающими деревьями
История
Ссылки
- Classification and Regression Trees — лекции Cosma Shalizi, ноябрь 2009.