Изменения

Перейти к: навигация, поиск

Машинное обучение в медицине

719 байт добавлено, 12:43, 30 декабря 2020
Предсказание молекулярных свойств
Одна из главных задач машинного обучения при поиске новых лекарств {{---}} сужение круга их поиска. Чаще всего фармацевтические компании имеют на руках библиотеки с огромным количеством веществ, которые они потенциально могут синтезировать и опробовать в качестве лекарства. Но обычно размеры этих библиотек составляют тысячи молекул, поэтому синтезировать и проверить каждую из них не представляется возможным. В этом случае прибегают к предсказанию некоторых свойств этих молекул, которые точно определяют, может ли молекула быть использована как лекарство. Для предсказания свойств молекул обычно используют молекулярный граф {{---}} графическое представление молекулы (ее атомов и связей).
Первые нейронные сети для предсказания молекулярных свойств использовали Моргановские фингерпринты (англ. Morgan fingerpints), которые для каждого атома в молекуле выделяли всех его соседей на каком-то определенном расстоянии (которое является гиперпараметром) и смотрели на наличие такой подструктуры в молекуле. Получался аналог некоторого оne-hot кодирования. Впоследствии этот метод был несколько усовершенствован, и стали смотреть не на наличие подструктуры, а на то, сколько раз она встречается в молекуле. Прорыв в этой области случился с появлением сети NeuralFingerprints ([<ref>[https://arxiv.org/abs/1509.09292 Duvenaud et al. , Convolutional Networks on Graphs for Learning Molecular Fingerprints, 2015]])</ref>, где фингерпринты получались путем учета важности подструктур из Моргановских фингерпринтов, то есть были добавлены веса у каждой из возможных подструктур.
Эта сеть была одной из первых в этой области, и сейчас используется как базовый baseline метод в огромном количестве статей. В основу же новых методов сейчас чаще всего ложатся [[графовые нейронные сети]]. Подходы графовых нейронных сетей адаптируют под молекулярный граф путем поиска элементов на расстоянии не более, чем N (где N является гиперпараметром), или последовательным рассмотрением каждой вершины и усреднением полученых значений.
===Предсказание формы белка===
174
правки

Навигация