Обсуждение участника:Gen05 — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
Строка 4: Строка 4:
  
  
''Задача уменьшения размерности''
+
===Задача уменьшения размерности===
  
 
Объекты описаны признаками F = (f1, . . . , fn).
 
Объекты описаны признаками F = (f1, . . . , fn).
Строка 10: Строка 10:
 
k ≪ n), переход к которым сопровождается наименьшей потерей
 
k ≪ n), переход к которым сопровождается наименьшей потерей
 
информации.
 
информации.
Ускорение обучения и обработки
+
*Ускорение обучения и обработки
Борьба с шумом и мультиколлинеарностью
+
*Борьба с шумом и мультиколлинеарностью
Интерпретация и визуализация данных
+
*Интерпретация и визуализация данных
''Проклятие размерности (curse of dimensionality)''
+
===Проклятие размерности (curse of dimensionality)===
Проклятие размерности (curse of dimensionality) — это набор
+
Проклятие размерности (curse of dimensionality) — это набор
 
проблем, возникающих с ростом размерности
 
проблем, возникающих с ростом размерности
Увеличиваются требования к памяти и вычислительной мощности
+
*Увеличиваются требования к памяти и вычислительной мощности
Данные становятся более разреженными
+
*Данные становятся более разреженными
Проще найти гипотезы, не имеющие отношения к реальности
+
*Проще найти гипотезы, не имеющие отношения к реальности
 +
===Ситуации применения===
 +
Уменьшение размерности — шаг в предобработке данных
 +
*Меньше памяти для хранения
 +
*Уменьшение времени обработки
 +
*Увеличение качества обработки
 +
*Понимание природы признаков
 +
===Методы уменьшения размерности===
 +
[[Файл:]]

Версия 16:29, 26 июня 2022

Выбор признаков (Feature selection)

Уменьшение размерности

Задача уменьшения размерности

Объекты описаны признаками F = (f1, . . . , fn). Задачей является построить множество признаков G = (g1, . . . , gk) : k < n (часто k ≪ n), переход к которым сопровождается наименьшей потерей информации.

  • Ускорение обучения и обработки
  • Борьба с шумом и мультиколлинеарностью
  • Интерпретация и визуализация данных

Проклятие размерности (curse of dimensionality)

Проклятие размерности (curse of dimensionality) — это набор проблем, возникающих с ростом размерности

  • Увеличиваются требования к памяти и вычислительной мощности
  • Данные становятся более разреженными
  • Проще найти гипотезы, не имеющие отношения к реальности

Ситуации применения

Уменьшение размерности — шаг в предобработке данных

  • Меньше памяти для хранения
  • Уменьшение времени обработки
  • Увеличение качества обработки
  • Понимание природы признаков

Методы уменьшения размерности

[[Файл:]]