Изменения

Перейти к: навигация, поиск

Дерево решений и случайный лес

10 байт добавлено, 21:53, 20 января 2019
Критерии информативности
* максимальна, когда <tex>p_y = \frac{1}{|Y|}</tex> для всех <tex>y \in Y</tex>
* не зависит от перенумерации классов
<tex>Ф(U) = \sum\nolimits_{y \in Y} p_y L(p_y) = \frac{1}{|U|} \sum\nolimits_{x_i \in U}L(P(y_i | x_i \in U)) \rightarrow min</tex>, <br> где <tex>L(p)</tex> убывает и <tex>L(1) = 0</tex>, например: <tex>-loglog_2(p)</tex>, <tex>1 - p</tex>, <tex>1 - p^2</tex>
}}
Примеры:
* Энтропия: <tex>Ф(U) = -\sum\nolimits_{i}p_i log_2p_i</tex>
* Критерий Джини: <tex>Ф(U) = \sum\nolimits_{i != j}p_i p_j = \sum\nolimits_{i}p_i*(1-p_i)</tex>
{{Определение
|id=def1
|definition=
'''Информационный выигрыш от ветвления вершины <tex>v</tex>''' <br>
<tex>Gain(\beta, U) = Ф(U) - Ф(U_1, ... ,U_{|D_v|}) = Ф(U) - \sum\nolimits_{k \in D_v} \frac{|U_k|}{|U|}Ф(U_k) \rightarrow max_{f \beta \in FB} </tex>
}}
 
====Отделение одного класса====
 
 
====Критейрий Джини====
52:57 https://www.youtube.com/watch?v=qk-9KHobGHA
 
====Энтропийный критерий====
== Рецукция решающих деревьев ==
635
правок

Навигация