Изменения

Перейти к: навигация, поиск

Дерево решений и случайный лес

33 байта добавлено, 20:06, 20 января 2019
Нет описания правки
* Пример <tex>\beta_v = [f_j(x) > a_j]</tex>, где <tex>f_j(x)</tex> - значение <tex>j</tex>-ого признака объекта <tex>x \in X</tex>
}}
[[Файл:BinDT1BinDT.jpg |300px|thumb|right|Классификация объекта <tex> x \in X </tex> бинарным решающим деревом]]
'''Y''' classify(x):
Для реализации постредукции контрольная выборка <tex>X^k</tex> пропускается через
построенное дерево. При этом в каждой внутренней вершине <tex>v</tex> запоминается подмножество <tex>S_v \subseteq X_k</tex> попавших в неё контрольных объектов. Если <tex>S_v = \emptyset </tex>, то вершина <tex>v</tex> считается ненадёжной и заменяется терминальной по ''мажоритарному правилу'': <br>
в качестве <tex>c_vy_v</tex> берётся тот класс, объектов которого больше всего в обучающей подвыборке <tex>U</tex>, пришедшей в вершину <tex>v</tex>.<br>
Затем для каждой внутренней вершины <tex>v</tex> вычисляется число ошибок, полученных при классификации выборки <tex>S_v</tex> следующими способами: <br>
* <tex>r(v)</tex> — классификация поддеревом, растущим из вершины <tex>v</tex>;
* <tex>r_L(v)</tex> — классификация поддеревом левой дочерней вершины <tex>S_v(0)L_v</tex>;* <tex>r_R(v)</tex> — классификация поддеревом правой дочерней вершины S_v(1)<tex>R_v</tex>;
* <tex>r_c(v)</tex> — отнесение всех объектов выборки <tex>S_v</tex> к классу <tex>y \in Y</tex>. <br>
Эти величины сравниваются, и, в зависимости от того, какая из них оказалась
минимальной, принимается, соответственно, одно из четырёх решений: <br>
* сохранить поддерево вершины <tex>v</tex>;
* заменить поддерево вершины <tex>v</tex> поддеревом левой дочерней вершины Lv<tex>L_v</tex>;* заменить поддерево вершины <tex>v</tex> поддеревом правой дочерней вершины Rv<tex>R_v</tex>;
* заменить поддерево <tex>v</tex> терминальной вершиной класса <tex>y_v = \mathrm{arg}\min_{y\in Y}r_c(v) </tex>.
Анонимный участник

Навигация