Изменения

Перейти к: навигация, поиск

Машинное обучение в медицине

1 байт добавлено, 13:30, 7 января 2021
Экспрессия генов. Анализ транскриптомных данных
Основные отрасли медицины, где применяются новые принципы — онкология, фармация и фармакогеномика. Последняя занимается изучением реакций организма на медицинские препараты в зависимости от индивидуальных наследственных факторов.
===Экспрессия генов. Анализ и анализ транскриптомных данных===
[[Файл:Gene expression based cnn.jpg|400px|thumb|Примеры архитектур сверточных сетей, предсказывающих вероятность рака по экспрессии генов. Источник: https://bmcmedgenomics.biomedcentral.com/articles/10.1186/s12920-020-0677-2]]
Многие модели ориентируются на данные экспрессии генов<ref>[https://ru.wikipedia.org/wiki/%D0%AD%D0%BA%D1%81%D0%BF%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F_%D0%B3%D0%B5%D0%BD%D0%BE%D0%B2 Википедия: Экспрессия генов]</ref> (в широком смысле {{---}} процесс получения белка из последовательности ДНК). Известно, что от количества некоторых белков напрямую зависит возможность клеток становиться раковыми, а также порождать другие заболевания. Совокупность изменений в большом количестве различных белков может приводить к заболеванию. Именно поэтому модели персонализированной медицины основываются на данных экспрессии. Часто в качестве основы используют сверточные нейронные сети, располагая гены, отвечающие за похожие по своей функции белки, рядом друг с другом.
Транскриптом {{---}} совокупность всех молекул РНК, которые присутствовали в клетке после завершения процесса трансрипции (получение РНК с матрицы ДНК).
Прямой анализ экспрессии генов {{---}} трудная и дорогостоящая задача, поэтому часто обращаются к транскриптомным данным. Транскриптомные данные чаще всего получают с помощью РНК-секвенирования (RNA-seq) или ДНК-микрочипов (DNA-microarray). С помощью специальных процедур из взятой у пациента пробы выделяют мРНК, которая затем наносится на ДНК-микрочип, где цепочки мРНК зацепляются, образуя двухцепочечные молекулы. Число цепочек мРНК, зацепившихся за определенный участок ДНК-микрочипа, определяет интенсивность свечения этого участка при сканировании. Так косвенно определяют экспрессию каждого из генов. Следующая проблема, с которой сталкиваются исследователи {{---}} слишком большое количество генов (например, у человека их около 28000). Вследствие этого очень тяжело обучать модели, поэтому приходится прибегать к [[Уменьшение размерности|уменьшению размерности]].
===Уменьшение размерности===
174
правки

Навигация