174
правки
Изменения
Нет описания правки
==Диагностика заболеваний по результатам рентгенологических и УЗИ исследований==
[[Файл:Covid cnn recognition.png|thumb|Рисунок 1. Пример вероятностной классификации КТ грудной клетки. <ref>[https://arxiv.org/ftp/arxiv/papers/2004/2004.04931.pdf CoroNet: A deep neural network for detection and diagnosis of COVID-19 from chest x-ray images, 2020]</ref>]][[Файл:Spine x ray cnn.png|thumb|Рисунок 2. Пример локализации шейного отдела позвоночника на рентгене. Источник: <ref>[https://lhncbc.nlm.nih.gov/system/files/pub9781.pdf Zhiyun Xue et al., Gender Detection from Spine X-ray Images Using Deep Learning, 2018]</ref>]]
===Диагностика по изображению===
[[Файл:Brain tumor mri cnn.jpg|thumb|left|200px|Рисунок 3. Пример классификации результатов МРТ на изображения с опухолью и без опухоли. <ref>[https://biomedpharmajournal.org/vol11no3/brain-tumor-classification-using-convolutional-neural-networks/ Seetha J, Raja S. S. Brain Tumor Classification Using Convolutional Neural Networks. Biomed Pharmacol J 2018;11(3).]</ref>]]
В диагностике заболеваний есть большое количество задач, которые можно решить при помощи машинного обучения, а в частности, при помощи анализа результатов различных исследований, таких как рентген, УЗИ или МРТ. В основном задача любой модели сводится к предсказанию, болен ли человек сейчас (иногда обычная мультиклассовая классификация, иногда {{---}} вероятностная классификация).
===Генерация результатов исследований===
[[Файл:3d mri models comparison.png|450px|thumb|Рисунок 4. Сравнение различных моделей для генерации 3D изображений МРТ исследований<ref>[https://arxiv.org/pdf/1908.02498.pdf Generation of 3D Brain MRI Using Auto-Encoding Generative Adversarial Networks]</ref>.]]
Для обучения сверточных нейронных сетей необходимо большое количество данных, которые очень часто достаточно тяжело или даже невозможно получить из-за запрета на использование данных исследований даже в анонимном формате без согласия пациента. Поэтому сейчас для получения достаточно больших датасетов стали применять [[Generative Adversarial Nets (GAN)|генеративные состязательные сети]].
===Экспрессия генов и анализ транскриптомных данных===
[[Файл:Gene expression based cnn.jpg|400px|thumb|Рисунок 5. Примеры архитектур сверточных сетей, предсказывающих вероятность рака по экспрессии генов. <ref>[https://bmcmedgenomics.biomedcentral.com/articles/10.1186/s12920-020-0677-2 Convolutional neural network models for cancer type prediction based on gene expression]</ref>]]
Многие модели ориентируются на данные экспрессии генов<ref>[https://ru.wikipedia.org/wiki/%D0%AD%D0%BA%D1%81%D0%BF%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F_%D0%B3%D0%B5%D0%BD%D0%BE%D0%B2 Википедия: Экспрессия генов]</ref> (в широком смысле {{---}} процесс получения белка из последовательности ДНК). Известно, что от количества некоторых белков напрямую зависит возможность клеток становиться раковыми, а также порождать другие заболевания. Совокупность изменений в большом количестве различных белков может приводить к заболеванию. Именно поэтому модели персонализированной медицины основываются на данных экспрессии. Часто в качестве основы используют сверточные нейронные сети, располагая гены, отвечающие за похожие по своей функции белки, рядом друг с другом.
===Уменьшение размерности при работе с данными экспрессии генов===
[[Файл:Melif scheme.png|400px|thumb|Рисунок 6. Описание алгоритма MeLiF.<ref>[http://fppo.ifmo.ru/?page1=16&page2=86&number_file=E63E46A38DD44C84B7B9446996EB225F Сметанников Иван Борисович, Метод и алгоритмы выбора признаков в предсказательном моделировании фенотипических характеристик на основе транскриптомных данных]</ref>]]
Для уменьшения размерности в случае биологических данных применяются методы, основным критерием которых становится их скорость. Поскольку количество генов очень велико, чаще всего нет возможности опробовать встраиваемые и оберточные методы. Чаще всего, используют фильтры.
При поиске новых лекарственных средств часто прибегают к помощи машинного обучения в таких задачах, как предсказание молекулярных свойств потенциальной молекулы лекарства, формы какого-либо белка, активности взаимодействия между веществами.
===Предсказание молекулярных свойств===
[[Файл:MoleculeGNN.PNG|400px|thumb|Рисунок 7. Молекулярный граф]][[Файл:Morgan fingerprint.jpg|400px|thumb|Рисунок 8. Пример Morgan Fingerprint для молекулы<ref>[https://www.sciencedirect.com/science/article/abs/pii/S1046202314002631 Adrià Cereto-Massagué et al., Molecular fingerprint similarity search in virtual screening, 2015]</ref>.]]
Одна из главных задач машинного обучения при поиске новых лекарств {{---}} сужение круга их поиска. Чаще всего фармацевтические компании имеют на руках библиотеки с огромным количеством веществ, которые они потенциально могут синтезировать и опробовать в качестве лекарства. Но обычно размеры этих библиотек составляют тысячи молекул, поэтому синтезировать и проверить каждую из них не представляется возможным. В этом случае прибегают к предсказанию некоторых свойств этих молекул, которые точно определяют, может ли молекула быть использована как лекарство. Для предсказания свойств молекул обычно используют молекулярный граф {{---}} графическое представление молекулы (ее атомов и связей).
===Предсказание формы белка===
[[Файл:AlphaFold 2 block design.png|400px|thumb|Рисунок 9. Архитектура AlphaFold2, модели для предсказания пространственной структуры белка<ref>[https://en.wikipedia.org/wiki/AlphaFold Wikipedia: AlphaFold]</ref>.]]
Секвенирование {{---}} процесс получения нуклеотидной последовательности из молекулы ДНК. <ref>[https://en.wikipedia.org/wiki/Sequencing Википедия: Секвенирование]</ref>
Из нуклеотидной последовательности можно получить аминокислотную последовательность, которая в свою очередь кодирует любой белок в организме.
===Генерация молекулярных структур===
[[Файл:Ranc scheme.png|thumb|Рисунок 10. Пример генеративной состязательной сети для лекарственных молекул. Сеть RANC (Reinforced Adversarial Neural Computer) <ref>[https://pubs.acs.org/doi/10.1021/acs.jcim.7b00690 Evgeny Putin et al., Reinforced Adversarial Neural Computer for de Novo Molecular Design, 2018]</ref>.]]
Еще одна задача, которая есть сейчас в мире машинного обучения {{---}} генерировать новые молекулы, которые могут потенциально быть лекарствами. Для этого используют [[Generative Adversarial Nets (GAN)|генеративные состязательные сети]]. Основное преимущество такого подхода заключается в том, что при работе с библиотеками уже синтезированных лекарств есть вероятность "пропустить" важное соединение просто потому, что в этой библиотеке его не было. Поэтому используется абсолютно другой подход {{---}} предлагается наоборот генерировать различные молекулы, а уже потом проверять, действительно ли их можно использовать как лекарство и насколько сложно их синтезировать. Часто эти свойства вносят в метрику качества генератора.