Обсуждение участника:Qrort — различия между версиями

Материал из Викиконспекты
Перейти к: навигация, поиск
(Классификация астрономических объектов по изображениям)
(Классификация корональных выбросов массы)
Строка 30: Строка 30:
 
==== Классификация корональных выбросов массы====
 
==== Классификация корональных выбросов массы====
 
[[Файл:CoronalMassParams.png|300px|thumb|right|Признаки, использующиеся для классификации корональных выбросов массы]]
 
[[Файл:CoronalMassParams.png|300px|thumb|right|Признаки, использующиеся для классификации корональных выбросов массы]]
Метод опорных векторов может быть использован для классификации<ref>''Qu, M., Shih, F.Y., Jing, J. et al.'' Automatic Detection and Classification of Coronal Mass Ejections. Sol Phys 237, 419–431 (2006)</ref> [https://ru.wikipedia.com/Корональные_выбросы_массы корональных выбросов массы], определения их силы, источника и направления по данным [https://en.wikipedia.org/wiki/Large_Angle_and_Spectrometric_Coronagraph LASCO], или для классификации звезд и галактик (возможности отличать первые от вторых).<ref>Kov ́acs, A., & Szapudi, I. 2015, MNRAS, 448,1305</ref>
+
Машинное обучение может быть использовано для классификации<ref>''Qu, M., Shih, F.Y., Jing, J. et al.'' Automatic Detection and Classification of Coronal Mass Ejections. Sol Phys 237, 419–431 (2006)</ref> [https://ru.wikipedia.com/Корональные_выбросы_массы корональных выбросов массы], определения их силы, источника и направления. Метод состоит в выборке определенного набора параметров выброса по данным спектрометрического коронографа [https://en.wikipedia.org/wiki/Large_Angle_and_Spectrometric_Coronagraph LASCO], а затем применения к этим данным метода опорных векторов.
 +
 
 +
Работа имеет большое практическое значение, так как корональные выбросы массы могут прерывать радиопередачу, наносить повреждения спутникам и линиям электропередачи, если они направлены в сторону Земли и имеют достаточную скорость и объем, чтобы достичь ее атмосферы<ref>https://en.wikipedia.org/wiki/Coronal_mass_ejection</ref>.
 +
 
 +
 
 +
==== heading ====
 +
или для классификации звезд и галактик (возможности отличать первые от вторых).<ref>Kov ́acs, A., & Szapudi, I. 2015, MNRAS, 448,1305</ref>
  
 
==== Cлучайные леса ====
 
==== Cлучайные леса ====

Версия 16:25, 12 января 2021


Машинное обучение в астрономии

Астрономия переживает стремительный рост объема и сложности данных. Существует множество проектов, исследующих и собирающих многоспектральные изображения неба, разновременную и многоволновую информацию, например, SDSS. Такие проекты предоставляют оцифрованные изображения неба, соответственно, в последние годы алгоритмы машинного обучения становятся все более популярными среди астрономов и в настоящее время используются для решения самых разнообразных задач; причиной этому служит большое количество доступных данных. В этой статье кратко приводится практическая информация о применении инструментов машинного обучения к астрономическим данным.

Классификация астрономических объектов по изображениям

Наличие в наборах данных большого количества объектов одного типа, но различных подтипов позволяет применить машинное обучение для решения задачи классификации на этих объектах.

Морфологическая классификация галактик

Классификация галактик, последовательность Хаббла

Одной из самых популярных тем классификации является морфологическая классификация галактик, позволяющая разделить их на различные типы по визуальным признакам. Для обучения моделей, призванных решать эту задачу, часто используют набор данных Galaxy Zoo, который является результатом волонтерского сотрудничества (ручной классификации галактик). Существует множество работ на эту тематику, использующих различные алгоритмы машинного обучения, как то: случайные леса[1], метод опорных векторов[2], нейронные сети[3]. Применение подходов машинного обучения в этом случае довольно прямолинейно, а разница между работами состоит в основном в представлении данных, выборе гиперпараметров и признаков классификации. Дополнительной сложностью вышеприведённых и прочих работ на ту же тему являются визуальные ограничения имеющихся изображений, такие, как мерцание, смещение, размытие и красное смещение.

Этой задачей следует заниматься, так как возможность находить тип галактик необходима для изучения их эволюции, а также является необходимым умением для множества задач наблюдательной космологии (англ. Observational cosmology), например, для нахождения красного смещения и кривых блеска.

Точность классификации различных алгоритмов на данных Galaxy Zoo[4]






Выявление аномалий

Интересной возможностью некоторых классификаторов является способ с помощью них найти объекты, которые трудно поддаются классификации, соответственно, могут принадлежать к новым, неизученным типам галактик. Рассмотрим в качестве примера случайные леса.

Случайные леса могут быть использованы для определения некоей меры схожести объектов без меток[5]. Чтобы перейти от задачи обучения без учителя к задаче обучения с учителем,которую можно решать с помощью случайного леса, применяется следующая идея:

  1. Пусть набор данных имеет вид таблицы [math]N \cdot M[/math], где каждая строка представляет объект с [math]M[/math] признаками. Построим другую матрицу размера [math]N \cdot M[/math], где значениями каждого столбца будет выборка из частного распределения соответствующего признака в исходном наборе данных. Такая матрица называется синтетическим набором данных (англ. synhtetic dataset). Альтернативным вариантом построения такой матрицы является случайная перестановка каждого столбца исходной матрицы.
  2. Пометим каждый объект исходного набора данных как принадлежащий классу [math]A[/math], а каждый объект синтетического набора данных как принадлежащий классу [math]B[/math]. Обучим случайный лес на этой выборке.

На этом этапе случайный лес способен определять наличие ковариации, ведь она присутствует только в исходном наборе данных. Как следствие, самыми важными признаками объектов будут являться признаки, имеющие корреляцию с другими. Расстояние между объектами определяется следующим образом: Каждая пара объектов передается во все решающие деревья случайного леса, и их схожесть описывается как количество деревьев, которые классифицировали оба объекта как принадлежащие классу [math]A[/math], причем оба объекта должны достигнуть одного и того же листа в дереве.

Таким методом можно пользоваться, например, для нахождения в больших объемах данных объектов, не похожих на большинство других, для отдельного их изучения. В частности, с помощью такого алгоритма можно найти необычные типы галактик[6].

Классификация корональных выбросов массы

Признаки, использующиеся для классификации корональных выбросов массы

Машинное обучение может быть использовано для классификации[7] корональных выбросов массы, определения их силы, источника и направления. Метод состоит в выборке определенного набора параметров выброса по данным спектрометрического коронографа LASCO, а затем применения к этим данным метода опорных векторов.

Работа имеет большое практическое значение, так как корональные выбросы массы могут прерывать радиопередачу, наносить повреждения спутникам и линиям электропередачи, если они направлены в сторону Земли и имеют достаточную скорость и объем, чтобы достичь ее атмосферы[8].


heading

или для классификации звезд и галактик (возможности отличать первые от вторых).[9]

Cлучайные леса

Список признаков объекта, использующийся в классификации звезд и галактик

Случайные леса (англ. random forest) используются для решения задач классификации и регрессии. В пример можно привести следующие исследования:

  • Определение величины красного смещения по изображению[10]
  • Классификация[11] кратковременных астрономических событий и переменных звезд
  • Классификация звезд и галактик[12]

Нейронные сети

Нейронные сети (англ. Artificial neural networks, ANN) используются для решения задач классификации и регрессии. В пример можно привести следующие исследования:

Обучение без учителя

Алгоритмы обучения без учителя применительно к астрономии имеют особое значение для научных исследований, поскольку они могут быть использованы для извлечения новых знаний из существующих наборов данных и могут способствовать новым открытиям.

K-means

Понятно, что классические алгоритмы кластеризации также могут быть применены к астрономическим данным. K-means применяется в астрономии в разных контекстах, например, для изучения спектральных классов звезд, галактик и астероидов, рентгеновского спектра объектов и так далее.[18][19][20]

Иерархическая кластеризация

Иерархическая кластеризация также применима к астрономическим данным, например, к рентгеновским спектрам, изображениям галактик и спектрам поглощения межзвездного газа.[21][22][23][24]

Примечания

Источники информации

  1. https://arxiv.org/pdf/1611.07526.pdf
  2. Huertas-Company, M., Rouan, D., Tasca, L.,Soucail, G., & Le F`evre, O. 2008, A&A, 478,971
  3. Banerji, M., Lahav, O., Lintott, C. J., et al. 2010,MNRAS, 406, 342
  4. arXiv:1901.07047 [astro-ph.IM]
  5. Shi, T., & Horvath, S. 2006, Journal ofComputational and Graphical Statistics, 15, 118
  6. Baron, D., & Poznanski, D. 2017, MNRAS, 465,4530
  7. Qu, M., Shih, F.Y., Jing, J. et al. Automatic Detection and Classification of Coronal Mass Ejections. Sol Phys 237, 419–431 (2006)
  8. https://en.wikipedia.org/wiki/Coronal_mass_ejection
  9. Kov ́acs, A., & Szapudi, I. 2015, MNRAS, 448,1305
  10. Carliles, S., Budav ́ari, T., Heinis, S., Priebe, C., &Szalay, A. S. 2010, ApJ, 712, 511
  11. Bloom, J. S., Richards, J. W., Nugent, P. E., et al.2012, PASP, 124, 1175
  12. Miller, A. A., Kulkarni, M. K., Cao, Y., et al.2017, AJ, 153, 73
  13. Vanzella, E., Cristiani, S., Fontana, A., et al.2004, A&A, 423, 761
  14. Banerji, M., Lahav, O., Lintott, C. J., et al. 2010,MNRAS, 406, 342
  15. Ellison, S. L., Teimoorinia, H., Rosario, D. J., &Mendel, J. T. 2016, MNRAS, 458, L34
  16. Mahabal, A., Sheth, K., Gieseke, F., et al. 2017,ArXiv e-prints, arXiv:1709.06257
  17. Huertas-Company, M., Primack, J. R., Dekel, A.,et al. 2018, ApJ, 858, 114
  18. Hojnacki, S. M., Kastner, J. H., Micela, G.,Feigelson, E. D., & LaLonde, S. M. 2007, ApJ,659, 585
  19. Galluccio, L., Michel, O., Bendjoya, P., & Slezak,E. 2008, in American Institute of Physics
  20. Simpson, J. D., Cottrell, P. L., & Worley, C. C.2012, MNRAS, 427, 1153
  21. Hojnacki, S. M., Kastner, J. H., Micela, G.,Feigelson, E. D., & LaLonde, S. M. 2007, ApJ,659, 585
  22. Baron, D., Poznanski, D., Watson, D., et al. 2015,MNRAS, 451, 332
  23. Hocking, A., Geach, J. E., Davey, N., & Sun, Y.2015, ArXiv e-prints: 1507.01589,arXiv:1507.01589
  24. Peth, M. A., Lotz, J. M., Freeman, P. E., et al.2016, MNRAS, 458, 963