Изменения

Перейти к: навигация, поиск

Машинное обучение в медицине

8 байт добавлено, 13:39, 29 декабря 2020
Поиск лекарств
==Поиск лекарств==
Поиск лекарств (англ. drug discovery, drug design) {{- --}} процесс поиска новых лекарственных средств, часто основанный на знаниях о биологической мишени.При поиске новых лекарстенных лекарстdенных средств часто прибегают к помощи машинного обучения в таких задачах, как предсказание молекулярных свойств потенциальной молекулы лекарства, формы какого-либо белка, активности взамодействия взаимодействия между друмя молеулами двумя молекулами и т.д.
===Предсказание молекулярных свойств===
[[Файл:MoleculeGNN.PNG|400px|thumb|Молекулярный граф]]
Одна из главных задач машинного обучения при поиске новых лекарств {{---}} сужение круга их поиска. Чаще всего, фармацевтические компании имеют на руках библиотеки с огромным количеством веществ, которые они потенциально могут синтезировать и опробовать в качестве лекарства. Но обычно размеры этих библиотек составляют тысячи молекул, поэтому ситезировать синтезировать и проверить каждую из них не представлятся представляется возможным. В этом случае прибегают к предсказанию некоторых свойств этих молекул, которые точно определяют, может ли молекула быть использована как лекарство. Для предсказания свойств молекул обычно используют молекулярный граф {{---}} графическое представление молекулы (ее атомов и связей).
[[https://ars.els-cdn.com/content/image/1-s2.0-S1046202314002631-fx1.jpg]]
Первые нейронные сети для предсказания молекулярных свойств использовали Моргановские фингерпринты (англ. Morgan fingerpints), которые для каждого атома в моекуле молекуле выделяли всех его соседей на каком-то пределенном определенном расстоянии (гиперпараметр) и смотрели на наличие такой подструктуры в молекуле. Получался аналог некоторого оne-hot кодирования. Прорыв в этой области случился с появлением сети NeuralFingerprints ([[https://arxiv.org/abs/1509.09292 Duvenaud et al. Convolutional Networks on Graphs for Learning Molecular Fingerprints]]), где фингерпринты получались путем учитывания учета важности подструктур из Моргановских фингерпринтов, то есть были добавлены веса у каждой из возмоных возможных подструктур.
Эта сеть была одной из первых в этой области, и сейчас используется как baseline метод в огромном количестве статей. В основу же новых методов сейчас чаще всего ложатся [[графовые нейронные сети]].
===Предсказание формы белка===
Предсказание формы белка {{---}} другая очень важная задача машинного обучения в фармацевтике. С возникновением технологий секвенирования ДНК у сообщества появилась возможность быстро и достаточно качественно прочитывать белковые последовательности, но получать пространственную структуру полученных белков экспериментально все еще можно очень трудоемко и дорого. Пространственная же структура белка важна для генерации мишеней под этот белок, поэтому задача предсказания стуруктуры структуры является очень важной. Например, при подборе потенциальной вакцины, необходимо точно знать форму антитела, чтобы понимать сможет ли это соединение захватить свою мишень, не дав ей закрепиться в организме пациента.
Предсказание формы белков основано на нейронных сетях, которые как вход используют очень длинную аминокислотную последовательность (размер алфавита ограничен - всего различных аминокислот 20), а на выходе должны предсказать значения торсионных углов между аминокислотами. В декабре 2020 года DeepMind (исследовательское подразделение Google) заявили, что решили проблему пространственной структуры белка.<ref>[https://meduza.io/feature/2020/12/13/fundamentalnaya-problema-belka-reshena-uchenye-bilis-nad-ney-polveka-no-vse-sdelali-programmisty-google-i-eto-mozhet-byt-ochen-vazhno-dlya-meditsiny Фундаментальная «проблема белка» решена]</ref> Авторы модели утверждают, что значение метрики глобального расстояния (англ. global distance test) превысело превысило 90%. Метрика глобального расстояния {{---}} метрика, которая вычисляется для каждой аминокислоты как процент атомов углерода из главной цепи белка, которые в сгенерированном белке расположены не более чем на расстоянии какого-то определенного количества ангстрем от соответствующего атома углерода в исходном белке. Обычно это значение берется равным 1, 2, 4 или 8 ангстрем.
==См. также==
Анонимный участник

Навигация