Изменения

Перейти к: навигация, поиск

Обсуждение участника:Gen05

68 байт добавлено, 13:54, 28 июня 2022
Нет описания правки
Под '''уменьшением размерности''' (англ. ''dimensionality reduction'') в машинном обучении подразумевается уменьшение числа признаков набора данных. Наличие в нем признаков избыточных, неинформативных или слабо информативных может понизить эффективность модели, а после такого преобразования она упрощается, и соответственно уменьшается размер набора данных в памяти и ускоряется работа алгоритмов ML на нем. Уменьшение размерности может быть осуществлено методами выбора признаков (англ. ''feature selection'') или выделения признаков (англ. ''feature extraction'').
 {{Определение|definition=Объекты описаны признаками $F = (f1f_1, . . . , fnf_n)$.<br>Задачей является построить множество признаков $G = (g1g_1, . . . , gkg_k) : k < n $ (часто$k << n$), переход к которым сопровождается наименьшей потерейинформации.}}
'''Зачем нужно?'''
*Ускорение обучения и обработки*Борьба с шумом и мультиколлинеарностью*Интерпретация и визуализация данных
===Проклятие размерности (''curse of dimensionality'')===Проклятие размерности (''curse of dimensionality'') — это набор
проблем, возникающих с ростом размерности
*Увеличиваются требования к памяти и вычислительной мощности*Данные становятся более разреженными*Проще найти гипотезы, не имеющие отношения к реальности
===Когда применяется===
*Меньше памяти для хранения
80
правок

Навигация