Изменения

Перейти к: навигация, поиск

Дерево решений и случайный лес

862 байта добавлено, 00:38, 24 января 2019
Алгоритмы построения деревьев решения
== Алгоритмы построения деревьев решения ==
Недостатки рассмотренного алгоритма ID3:
* Применим только для дискретных значений признаков
* Переобучение
* На каждом шаге решение принимается по одному атрибуту
* === Алгоритм C4CART (англ.5''Classification And Regression Trees'')===** В отличие от ID3 работает и с непрерывными значениями признаков: устанавливает на каждом шаге построения дерева последовательно сравнивает все возможные разбиения для них пороговые значения всех атрибутов и выбирает наилучший атрибут и по ним разбивает наилучшее разбиение для него. Разбивает объекты на две части.** Использует редукцию, чтобы избежать для избежания переобучения.** Обрабатывает пропущенные или аномальные значения признаков.*  === Алгоритм CART (англC4. ''Classification And Regression Trees'')5 ===На * Также работает и с непрерывными значениями признаков: на каждом шаге построения дерева алгоритм последовательно сравнивает все возможные выбирает правило разбиения для всех атрибутов и выбирает наилучший атрибут и наилучшее разбиение для негопо одному из признаков. Разбивает объекты на несколько частей по этому правилу, рекурсивно запускается из полученных подмножеств.* Использует редукцию, чтобы избежать переобучения.* Обрабатывает пропущенные или аномальные значения признаков.
== Случайный лес ==
635
правок

Навигация