Изменения

← Предыдущая правка

Машинное обучение в медицине

172 байта убрано, 19:30, 4 сентября 2022

м

rollbackEdits.php mass rollback

Еще одна задача, которая есть сейчас в мире машинного обучения {{---}} генерировать новые молекулы, которые могут потенциально быть лекарствами. В отличие от подхода с анализом уже существующих библиотек лекарств, такай метод исключает возможность "пропустить" хорошо походящее вещество из-за того, что оно не было включено в библиотеку для анализа.

Для кодирования молекулярной структуры существует специальная нотация SMILES (Simplified Molecular Input Line Entry System, с англ. — «система упрощённого представления молекул в строке ввода») {{---}} система правил для однозначного описания состава и структуры молекулы химического вещества с использованием строки символов (рис. 10). Таким образом, задача моделей состоит в генерации строки, правильной с точки зрения SMILES. Стоит отметить, что есть возможность сгенерировать правильные SMILES-строки с точки зрения синтаксиса, но не правильные по валентности<ref>[https://ru.wikipedia.org/wiki/%D0%92%D0%B0%D0%BB%D0%B5%D0%BD%D1%82%D0%BD%D0%BE%D1%81%D1%82%D1%8C Википедия: Валентность]</ref> (например, ~~утом~~ атом углерода не может иметь валентность больше, чем 4, но можно сгенерировать SMILES, где валентность углерода {{---}} 5.)

Для генерации молекулярных структур используют [[Generative Adversarial Nets (GAN)|генеративные состязательные сети]] (рис. 11). Общую идею подхода можно описать так {{---}} предлагается генерировать различные молекулярные структуры в формате SMILES-строки (это делает генератор), а уже потом проверять, действительно ли их можно использовать как лекарство и насколько сложно их синтезировать (это делает дискриминатор {{---}} пытается отличить сгенерированный SMILES от настоящего).

Дискриминатор обычно проверяет схожесть с ~~лекарственнымы~~ лекарственными средствами (по набору физических свойств, таких как растворимость<ref>[https://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D1%82%D0%B2%D0%BE%D1%80%D0%B8%D0%BC%D0%BE%D1%81%D1%82 Википедия: Растворимость]</ref>, гидрофильность<ref>[https://ru.wikipedia.org/wiki/%D0%93%D0%B8%D0%B4%D1%80%D0%BE%D1%84%D0%B8%D0%BB%D1%8C%D0%BD%D0%BE%D1%81%D1%82%D1%8C Википедия: Гидрофильность]</ref>, липофильность<ref>[https://ru.wikipedia.org/wiki/%D0%9B%D0%B8%D0%BF%D0%BE%D1%84%D0%B8%D0%BB%D1%8C%D0%BD%D0%BE%D1%81%D1%82%D1%8C Википедия: Липофильность]</ref>) и синтезируемость молекулы с данной SMILES-строкой (по валентностям атомов, ~~крастности~~ кратности связей, заряду молекулы). Таким образом, задача генератора {{---}} сгенерировать такую строку SMILES для молекулы, чтобы дискриминатор не отличил ее от настоящей. Архитектура дискриминатора чаще всего остается очень похожей на архитектуру обычной сети, предсказывающей молекулярные свойства. ~~Таким образом, в~~ В качестве дискриминатора часто используются графовые или сверточные нейронные сети. Для генератора же ~~часто~~ обычно используют [[Долгая краткосрочная память|механизм долгой краткосрочной памяти]]~~, чтобы сеть помнила, какие части уже были сгенерированы, и отталкивалась от них~~.

==См. также==

Maintenance script

1632

правки

Изменения

Машинное обучение в медицине

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты