Обсуждение участника:Qrort — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Случайные леса)
(Ссылки)
Строка 38: Строка 38:
  
 
==Ссылки==
 
==Ссылки==
[
+
* http://www.astroml.org/

Версия 21:15, 9 января 2021

Машинное обучение в астрономии

Астрономия переживает стремительный рост объема и сложности данных. Существует множество проектов, исследующих и собирающих многоспектральные изображения неба, разновременную и многоволновую информацию, например, SDSS. Соответственно, в последние годы алгоритмы машинного обучения становятся все более популярными среди астрономов и в настоящее время используются для решения самых разнообразных задач. В этой статье кратко приводится практическая информация о применении инструментов машинного обучения к астрономическим данным.

Обучение с учителем

В этом разделе рассматриваются алгоритмы, наиболее часто встречающиеся в научных работах астрономической тематики, и примеры таких работ.

Метод опорных векторов

Метод опорных векторов (англ. support vector machine, SVM) является популярным алгоритмом для решения задач классификации. Астрономы используют метод опорных векторов для определения типа галактик по их морфологическим признакам [1], обучая модели на изображениях далёких галактик. Дополнительной сложностью вышеприведённой и прочих работ на ту же тему являются визуальные ограничения имеющихся изображений, такие, как мерцание, смещение, размытие и красное смещение.

Метод опорных векторов также может быть использован для классификации[2] корональных выбросов массы, определения их силы, источника и направления по данным LASCO, или для классификации звезд и галактик (возможности отличать первые от вторых).[3]

Cлучайные леса

Список признаков объекта, использующийся в классификации звезд и галактик

Случайные леса (англ. random forest) используются для решения задач классификации и регрессии. В пример можно привести следующие исследования:

  • Определение величины красного смещения по изображению[4]
  • Классификация[5] кратковременных астрономических событий и переменных звезд
  • Классификация звезд и галактик[6]

Нейронные сети

Нейронные сети (англ. Artificial neural networks, ANN) используются для решения задач классификации и регрессии. В пример можно привести следующие исследования:

Обучение без учителя

Алгоритмы обучения без учителя применительно к астрономии имеют особое значение для научных исследований, поскольку они могут быть использованы для извлечения новых знаний из существующих наборов данных и могут способствовать новым открытиям.

Случайные леса

Случайные леса могут быть использованы для определения некоей меры схожести объектов без меток[12]: переданные в классификатор похожие объекты будут отнесены к одному классу, а сильно отличающиеся — к разным. Этим свойством метода можно пользоваться, например, для нахождения в больших объемах данных объектов, не похожих на большинство других, для отдельного их изучения. Например, с помощью такого алгоритма можно найти необычные типы галактик.[13]

Кластеризация

Уменьшение размерности

Визуализация и обнаружение выбросов

Источники информации

  1. Huertas-Company, M., Rouan, D., Tasca, L.,Soucail, G., & Le F`evre, O. 2008, A&A, 478,971
  2. Qu, M., Shih, F.Y., Jing, J. et al. Automatic Detection and Classification of Coronal Mass Ejections. Sol Phys 237, 419–431 (2006)
  3. Kov ́acs, A., & Szapudi, I. 2015, MNRAS, 448,1305
  4. Carliles, S., Budav ́ari, T., Heinis, S., Priebe, C., &Szalay, A. S. 2010, ApJ, 712, 511
  5. Bloom, J. S., Richards, J. W., Nugent, P. E., et al.2012, PASP, 124, 1175
  6. Miller, A. A., Kulkarni, M. K., Cao, Y., et al.2017, AJ, 153, 73
  7. Vanzella, E., Cristiani, S., Fontana, A., et al.2004, A&A, 423, 761
  8. Banerji, M., Lahav, O., Lintott, C. J., et al. 2010,MNRAS, 406, 342
  9. Ellison, S. L., Teimoorinia, H., Rosario, D. J., &Mendel, J. T. 2016, MNRAS, 458, L34
  10. Mahabal, A., Sheth, K., Gieseke, F., et al. 2017,ArXiv e-prints, arXiv:1709.06257
  11. Huertas-Company, M., Primack, J. R., Dekel, A.,et al. 2018, ApJ, 858, 114
  12. Shi, T., & Horvath, S. 2006, Journal ofComputational and Graphical Statistics, 15, 118
  13. Baron, D., & Poznanski, D. 2017, MNRAS, 465,4530

Ссылки