Изменения

Перейти к: навигация, поиск

Машинное обучение в медицине

3654 байта добавлено, 18:34, 6 января 2021
Персонализированная медицина
Основные отрасли медицины, где применяются новые принципы — онкология, фармация и фармакогеномика. Последняя занимается изучением реакций организма на медицинские препараты в зависимости от индивидуальных наследственных факторов.
===Экспрессия генов. Анализ транскриптомных данных===
[[Файл:Gene expression based cnn.jpg|400px|thumb|Примеры архитектур сверточных сетей, предсказывающих вероятность рака по экспрессии генов. Источник: https://bmcmedgenomics.biomedcentral.com/articles/10.1186/s12920-020-0677-2]]
Многие модели ориентируются на данные экспрессии генов<ref>[https://ru.wikipedia.org/wiki/%D0%AD%D0%BA%D1%81%D0%BF%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F_%D0%B3%D0%B5%D0%BD%D0%BE%D0%B2 Википедия: Экспрессия генов]</ref> (в широком смысле {{---}} процесс получения белка из последовательности ДНК). Известно, что от количества некоторых белков напрямую зависит возможность клеток становиться раковыми, а также порождать другие заболевания. Совокупность изменений в большом количестве различных белков может приводить к заболеванию. Именно поэтому модели персонализированной медицины основываются на данных экспрессии. Часто в качестве основы используют сверточные нейронные сети, располагая гены, отвечающие за похожие по своей функции белки, рядом друг с другом.
Транскриптом {{---}} совокупность всех молекул РНК, которые присутствовали в клетке после завершения процесса трансрипции (получение РНК с матрицы ДНК).
 
Прямой анализ экспрессии генов {{---}} трудная и дорогостоящая задача, поэтому часто обращаются к транскриптомным данным. Транскриптомные данные чаще всего получают с помощью РНК-секвенирования (RNA-seq) или ДНК-микрочипов (DNA-microarray). С помощью специальных процедур из взятой у пациента пробы выделяют мРНК, которая затем наносится на ДНК-микрочип, где цепочки мРНК зацепляются, образуя двухцепочечные молекулы. Число цепочек мРНК, зацепившихся за определенный участок ДНК-микрочипа, определяет интенсивность свечения этого участка при сканировании. Так косвенно определяют экспрессию каждого из генов. Следующая проблема, с которой сталкиваются исследователи {{---}} слишком большое количество генов (например, у человека их около 28000). Вследствие этого очень тяжело обучать модели, поэтому приходится прибегать к [[Уменьшение размерности|уменьшению размерности]].
 
===Уменьшение размерности===
[[Файл:Melif scheme.png|400px|thumb|Описание алгоритма MeLiF]]
Для уменьшения размерности в случае биологических данных применяются методы, основным критерием которых становится их скорость. Поскольку количество генов очень велико, чаще всего нет возможности опробовать встраиваемые и оберточные методы. Чаще всего, используют фильтры.
 
Одним из примеров моделей, основанных на фильтрах является модель MeLiF, которая берет несколько фильтров <tex>M_i</tex> с соответствующими функциями измерения релевантности признака <tex>\mu_i</tex>, после чего строит новую меру значимости как <tex>\mu=\sum_{i=1}^{|M|} \alpha_{i} \mu_{i}</tex>, где \left\{\alpha_{i}\right\}_{i=1}^{|M|} {{---}} набор вещественных коэффициентов. После получения новой меры значимости происходит оценка модели на <tex>t</tex> лучших выбранных признаках. В случае удовлетворительного результата алгоритм завершается, возвращая текущий набор признаков, иначе {{---}} возвращается снова к получению новой меры на <tex>t+1</tex> признаках.
===Медицинская карта===
Другая задача {{---}} предсказать, заболеет ли человек в будущем. Для этого часто используется электронная медицинская карта пациента, и на вход сети подаются данные о пациенте, результаты исследований, его генеалогическое древо и другая медицинская информация. Основываясь на полученных данных, модель должна предсказать вероятность того, что человек может заболеть каждым болезнью из приведенного набора. Если вероятность хотя бы по одному из маркеров превышает некоторое значение {{---}} такая модель рекомендует пациенту обратиться к специалисту и относит его в группу высокого риска по этому параметру. В свою очередь специалист может подтвердить или же опровергнуть опасения модели, отдавая ей результат {{---}} права модель или нет. Таким образом, эта проблема относится к классу задач обучения с подкреплением В таких задачах часто используют [[метод опорных векторов (SVM)]] или [[глубокое обучение]].
174
правки

Навигация