Изменения

Перейти к: навигация, поиск

Алгоритмы сэмплирования

1689 байт добавлено, 09:13, 20 марта 2020
Дополнительные
==== Дополнительные ====
* Under-sampling with Cluster Centroids<ref>[http://www.sciencedirect.com/science/article/pii/S0957417408003527 Show-Jane Yen, Yue-Shi Lee,Cluster-based under-sampling approaches for imbalanced data distributions, Expert Systems with Applications, Volume 36, Issue 3, Part 1, 2009, Pages 5718-5727, ISSN 0957-4174]</ref> {{---}} уменьшает количество примеров мажоритарного класса, заменяя некоторые кластеры примеров мажоритарного класса их представителем (центроидом кластера).
* NearMiss <math>(1 \And 2 \And 3)</math><ref> [https://enI. Mani, J.wikipediaZhang.org Sampling_(statistics)]</ref>* Edited Nearest Neighbours<ref> [https“kNN approach to unbalanced data distributions://enA case study involving information extraction,” In Proceedings of the Workshop on Learning from Imbalanced Data Sets, pp.wikipedia1-7, 2003.org Sampling_(statistics)]</ref>* Instance Hardness Threshold<ref> {{---}} удаляет примеры мажоритарного класса, для которых среднее расстояние до ближайших соседей ([[https://enМетрический_классификатор_и_метод_ближайших_соседей|KNN]]) миноритарного класса является наименьшим.wikipediaТакже может использоваться расстояние до самых дальних соседей, либо среднее расстояние до всех соседей.org Sampling_(statistics)]</ref>* Repeated Edited Nearest Neighbours<ref> [https://enD.wikipediaWilson, “Asymptotic Properties of Nearest Neighbor Rules Using Edited Data,” IEEE Transactions on Systems, Man, and Cybernetrics, vol.org Sampling_2(statistics3)], pp. 408-421, 1972.</ref>{{---}} удаляет примеры мажоритарного класса, если при классификации методом [[Метрический_классификатор_и_метод_ближайших_соседей|KNN]] они определяются как примеры миноритарного класса.* AllKNNNeighboorhood Cleaning Rule<ref> [https://enJ. Laurikkala, “Improving identification of difficult small classes by balancing class distribution,” Proceedings of the 8th Conference on Artificial Intelligence in Medicine in Europe, pp.wikipedia63-66, 2001.org Sampling_(statistics)]</ref>{{---}} улучшение предыдущего алгоритма, в дополнение к удалению неверно классифицируемых примеров мажоритарного классов, удаляются все соседи примеров миноритарного класса, которые влияют на их неправильную классификацию методом [[Метрический_классификатор_и_метод_ближайших_соседей|KNN]].
=== Передискретизации (увеличение числа примеров миноритарного класса) ===
302
правки

Навигация