Обсуждение участника:Qrort

Материал из Викиконспекты
Перейти к: навигация, поиск

Машинное обучение в астрономии

Астрономия переживает стремительный рост объема и сложности данных. Соответственно, в последние годы алгоритмы машинного обучения становятся все более популярными среди астрономов и в настоящее время используются для решения самых разнообразных задач. В этой статье кратко приводится практическая информация о применении инструментов машинного обучения к астрономическим данным. В этом документе я освещаю основные темы контролируемого машинного обучения, включая отбор и предварительную обработку входного набора данных, методы оценки и три популярных алгоритма контролируемого обучения, машины опорных векторов, случайные леса и неглубокие искусственные нейронные сети. Mymain фокусируется на неконтролируемых алгоритмах машинного обучения,которые используются для выполнения кластерного анализа, уменьшения размерности, визуализации и обнаружения выбросов. Алгоритмы неконтролируемого обучения имеют особое значение для научных исследований, поскольку они могут быть использованы для извлечения новых знаний из существующих наборов данных и могут способствовать новым открытиям.

Обучение с учителем

В этом разделе рассматриваются алгоритмы, наиболее часто встречающиеся в научных работах астрономической тематики, и конкретные модели этих работ.

Метод опорных векторов

Метод опорных векторов (англ. support vector machine, SVM) является популярным алгоритмом для решения задач классификации. Астрономы используют метод опорных векторов для определения типа галактик по их морфологическим признакам [1], обучая модели на изображениях далёких галактик. Дополнительной сложностью вышеприведённой и прочих работ на ту же тему являются визуальные ограничения имеющихся изображений, такие, как мерцание, смещение, размытие и красное смещение.

Метод опорных векторов также может быть использован для классификации корональных выбросов массы (Qu et al. 2003), определения их силы, источника и направления по данным LASCO, или для классификации звёзд и планет (Kovacs & Szapudi, 2015)

Случайные леса

Случайные леса (англ. random forest) также используются как классификаторы. В пример можно привести следующие исследования:

Нейронные сети

Обучение без учителя

Алгоритмы обучения без учителя применительно к астрономии имеют особое значение для научных исследований, поскольку они могут быть использованы для извлечения новых знаний из существующих наборов данных и могут способствовать новым открытиям.

Кластеризация

Уменьшение размерности

Визуализация и обнаружение выбросов

Источники информации

  1. M. Huertas-Company, L. Tasca, D. Rouan, D. Pelat, J.P.Kneib, O.LeFèvre, P. Capak, J. Kartaltepe, A.Koekemoer, H. J. McCracken, M.Salvato, D.B.Sanders, and C. Willott A robust morphological classification of high-redshift galaxies using support vector machines on seeing limited images, 2009