Изменения

Перейти к: навигация, поиск

Машинное обучение в медицине

120 байт добавлено, 17:33, 9 января 2021
Уменьшение размерности при работе с данными экспрессии генов
===Уменьшение размерности при работе с данными экспрессии генов===
[[Файл:Melif scheme.png|400px|thumb|Рисунок 6. Описание алгоритма MeLiF.<ref>[http://fppo.ifmo.ru/?page1=16&page2=86&number_file=E63E46A38DD44C84B7B9446996EB225F Сметанников Иван Борисович, Метод и алгоритмы выбора признаков в предсказательном моделировании фенотипических характеристик на основе транскриптомных данных]</ref>]]
Для уменьшения размерности в случае биологических данных применяются методы, основным критерием которых становится их скорость. Поскольку количество генов очень велико, чаще всего нет возможности опробовать [[Уменьшение размерности#Встраиваемые методы|встраиваемые ]] и [[Уменьшение размерности#Оберточные методы|оберточные методы]]. Чаще всего, используют фильтры.
Одним из примеров моделей, основанных на фильтрах является модель MeLiF<ref>[https://www.researchgate.net/publication/317201206_MeLiF_Filter_Ensemble_Learning_Algorithm_for_Gene_Selection| Smetannikov et al., MeLiF: Filter Ensemble Learning Algorithm for Gene Selection]</ref> (рис. 6), которая берет несколько фильтров <tex>M_i</tex> с соответствующими функциями измерения релевантности признака <tex>\mu_i</tex>, после чего строит новую меру значимости как <tex>\mu=\sum_{i=1}^{|M|} \alpha_{i} \mu_{i}</tex>, где <tex>\left\{\alpha_{i}\right\}_{i=1}^{|M|}</tex> {{---}} набор вещественных коэффициентов. После получения новой меры значимости происходит оценка модели на <tex>t</tex> лучших выбранных признаках. В случае удовлетворительного результата алгоритм завершается, возвращая текущий набор признаков, иначе {{---}} возвращается снова к получению новой меры на <tex>t+1</tex> признаках.
174
правки

Навигация