80
правок
Изменения
Нет описания правки
== Уменьшение размерности ==
Под '''уменьшением размерности''' (англ. ''dimensionality reduction'') в машинном обучении подразумевается уменьшение числа признаков набора данных. Наличие в нем признаков избыточных, неинформативных или слабо информативных может понизить эффективность модели, а после такого преобразования она упрощается, и соответственно уменьшается размер набора данных в памяти и ускоряется работа алгоритмов ML на нем. Уменьшение размерности может быть осуществлено методами выбора признаков (англ. ''feature selection'') или выделения признаков (англ. ''feature extraction'').
}}
* Ускорение обучения и обработки
* Борьба с шумом и мультиколлинеарностью
* Интерпретация и визуализация данных
* Увеличиваются требования к памяти и вычислительной мощности
* Данные становятся более разреженными
* Проще найти гипотезы, не имеющие отношения к реальности
}}
===Когда применяется===
*Меньше памяти для хранения*Уменьшение времени обработки*Увеличение качества обработки*Понимание природы признаков [[Файл:Таблица_1.jpg|600px|thumb|right|Методы уменьшения размерности]] ===Два основных подхода уменьшения размерности===
'''Два основных подхода уменьшения размерностиИзвлечение признаков'''(''feature extraction'') включает все другиеметоды (в том числе даже те, у которых $k > n$).* в целом, дольше работают;* могут извлекать сложные признаки.
====Цели выбора признаков:====
*Уменьшение переобучения и улучшение качества предсказания*Улучшение понимания моделей
===Типы ненужных признаков===
Существуют также два типа признаков, которые не являются необходимыми:
*Избыточные (''redundant'') признаки не привносятдополнительной информации относительно существующих*Нерелевантные (''irrelevant'') признаки простонеинформативны
==Встроенные методы==