<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
		<id>http://neerc.ifmo.ru/wiki/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Mrucher</id>
		<title>Викиконспекты - Вклад участника [ru]</title>
		<link rel="self" type="application/atom+xml" href="http://neerc.ifmo.ru/wiki/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Mrucher"/>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A1%D0%BB%D1%83%D0%B6%D0%B5%D0%B1%D0%BD%D0%B0%D1%8F:%D0%92%D0%BA%D0%BB%D0%B0%D0%B4/Mrucher"/>
		<updated>2026-04-25T23:54:44Z</updated>
		<subtitle>Вклад участника</subtitle>
		<generator>MediaWiki 1.30.0</generator>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%9E%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B3%D0%B5%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B8_%D0%B8%D0%B7%D0%BE%D0%B1%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F&amp;diff=78779</id>
		<title>Определение геометрии изображения</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%9E%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B3%D0%B5%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B8_%D0%B8%D0%B7%D0%BE%D0%B1%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F&amp;diff=78779"/>
				<updated>2021-01-18T10:37:45Z</updated>
		
		<summary type="html">&lt;p&gt;Mrucher: Новая страница: «{{В разработке}} Определение геометрии изображения {{---}} одна из ключевых подзадач компью…»&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;{{В разработке}}&lt;br /&gt;
Определение геометрии изображения {{---}} одна из ключевых подзадач компьютерного зрения, заключающаяся в определении основных геометрических фигур на изображении, их взаимном расположении и пространстве.&lt;br /&gt;
&lt;br /&gt;
== Области применения ==&lt;br /&gt;
Извлечение информации об изображенных на изображении геометрических фигурах позволяет решать множество прикладных задач, таких как:&lt;br /&gt;
&lt;br /&gt;
#'''Навигация беспилотных транспортных средств: ''' Определение плоскости дороги, определение линии горизонта и объектах на дороге позволяют системам управления осуществлять работу.&lt;br /&gt;
#'''Дополненная реальность: '''определение различных плоскостей позволяет приложениям с дополненной реальностью взаимодействовать с пространством и дополнять его максимально реалистично.&lt;br /&gt;
#'''Построение 3D моделей по изображениям: '''имея плоское изображение, например фотографию комнаты, можно создать 3D модель, определив плоскости и карту глубин изображения.&lt;br /&gt;
&lt;br /&gt;
== Определения геометрии изображения с использованием машинного обучения ==&lt;br /&gt;
&lt;br /&gt;
Для определения геометрии изображения необходимо предсказать нормали поверхности (англ. surface normal prediction). В настоящее время для этого активно используются [[Сверточные нейронные сети|сверточных нейронных сетей (англ. ''Convolutional Neural Network, CNN'')]], например GroundNet&amp;lt;ref&amp;gt;[https://arxiv.org/pdf/1811.07222.pdf GroundNet: Monocular Ground Plane Normal Estimationwith Geometric Consistency ]&amp;lt;/ref&amp;gt;, позволяющая определить линию горизонта по изображению улицы.&lt;br /&gt;
&amp;lt;div style=&amp;quot;text-align: center&amp;quot;&amp;gt;&lt;br /&gt;
[[Файл:GroundNet.png|600px|thumb|center| Рис. 1 Сеть GroundNet]]&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
Данная сеть сначала сегментирует участок земли, а затем независимо предсказывает нормали к участку земли и карту глубин для этого участка. По карте глубин вычисляются нормали, используя метод наименьших квадратов ([https://en.wikipedia.org/wiki/Least_squares Least squares]) или метод [https://en.wikipedia.org/wiki/Random_sample_consensus RANSAC]. Затем нормали, вычисленные ранее сравнивают, чтобы разница между ними была минимальна и после этого определяется линия горизонта. &lt;br /&gt;
&lt;br /&gt;
== Различные улучшения сетей ==&lt;br /&gt;
&lt;br /&gt;
=== Spatial Transformer Networks ===&lt;br /&gt;
'''Spatial Transformer Networks (STN)&amp;lt;ref&amp;gt;[https://proceedings.neurips.cc/paper/2015/file/33ceb07bf4eeb3da587e268d663aba1a-Paper.pdf Spatial Transformer Networks ]&amp;lt;/ref&amp;gt;''' {{---}} модуль, который можно встроить для улучшения нейросети. STN, применяя обучаемое аффинное преобразование с последующей интерполяцией, лишает изображения пространственной инвариантности. Задача STN состоит в том, чтобы так повернуть или уменьшить-увеличить исходное изображение, чтобы основная сеть-классификатор смогла проще определить нужный объект.   Использование данного модуля в сетях, предназначенных для в сетях для определения геометрии, позволяет получать более качественные результат.&lt;br /&gt;
&amp;lt;div style=&amp;quot;text-align: center&amp;quot;&amp;gt;&lt;br /&gt;
[[Файл:STN.png|500px|thumb|center| Рис. 2 Пример работы Spatial Transformer Networks]]&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
=== Dense Conditional Random Field  ===&lt;br /&gt;
&lt;br /&gt;
'''Dense Conditional Random Field (DCRF) &amp;lt;ref&amp;gt;[https://proceedings.neurips.cc/paper/2016/file/65ded5353c5ee48d0b7d48c591b8f430-Paper.pdf SURGE: Surface Regularized Geometry Estimationfrom a Single Image]&amp;lt;/ref&amp;gt;''' {{---}} еще один встраиваемый модуль для улучшения нейронных сетей, предназначенный для осуществления согласованности между картой глубин изображения и картой нормалей. &lt;br /&gt;
&amp;lt;div style=&amp;quot;text-align: center&amp;quot;&amp;gt;&lt;br /&gt;
[[Файл:DCRF.png|500px|thumb|center| Рис. 3 Пример работы Dense Conditional Random Field]]&lt;br /&gt;
&amp;lt;/div&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Данные для обучения ==&lt;br /&gt;
#'''KITTI'''[http://www.cvlibs.net/datasets/kitti/] {{---}} популярный набор данных с изображениями улиц и дорог.&lt;br /&gt;
#'''ApolloScape '''[http://apolloscape.auto/] {{---}} другой известный и большой набор данных с различными разметками.&lt;br /&gt;
#'''NYU v2 '''[https://cs.nyu.edu/~silberman/datasets/nyu_depth_v2.html] {{---}} набор с изображениями помещений. Помимо RGB изображений, содержит записи с глубинных камер.&lt;br /&gt;
#'''SharinGAN&amp;lt;ref&amp;gt;[https://openaccess.thecvf.com/content_CVPR_2020/papers/PNVR_SharinGAN_Combining_Synthetic_and_Real_Data_for_Unsupervised_Geometry_Estimation_CVPR_2020_paper.pdf SharinGAN: Combining Synthetic and Real Data for Unsupervised GeometryEstimation]&amp;lt;/ref&amp;gt; '''{{---}} метод, позволяющий объединять наборы из реальных и синтетических изображений, основанный на отбрасывании нерелевантных свойств каждого из типа данных и объединении релевантных. В конечном итоге данный метод позволяет легко получать наборы данных путем синтетического создания, так как их легко получить и разметить, но при этом эти наборы будут применимы для обучения сети, пригодной к использованию на реальных данных.&lt;br /&gt;
&lt;br /&gt;
==См. также==&lt;br /&gt;
*[[Глубокое обучение]]&lt;br /&gt;
*[[Сверточные нейронные сети]]&lt;br /&gt;
== Примечания ==&lt;br /&gt;
&amp;lt;references/&amp;gt;&lt;br /&gt;
== Источники информации==&lt;br /&gt;
&lt;br /&gt;
* [https://habr.com/ru/company/newprolab/blog/339484/ Spatial Transformer Networks.]&lt;br /&gt;
&lt;br /&gt;
{{В разработке}}&lt;br /&gt;
&lt;br /&gt;
[[Категория:Машинное обучение]]&lt;/div&gt;</summary>
		<author><name>Mrucher</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:DCRF.png&amp;diff=78778</id>
		<title>Файл:DCRF.png</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:DCRF.png&amp;diff=78778"/>
				<updated>2021-01-18T10:28:51Z</updated>
		
		<summary type="html">&lt;p&gt;Mrucher: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;/div&gt;</summary>
		<author><name>Mrucher</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:STN.png&amp;diff=78777</id>
		<title>Файл:STN.png</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:STN.png&amp;diff=78777"/>
				<updated>2021-01-18T10:22:30Z</updated>
		
		<summary type="html">&lt;p&gt;Mrucher: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;&lt;/div&gt;</summary>
		<author><name>Mrucher</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:GroundNet.png&amp;diff=78776</id>
		<title>Файл:GroundNet.png</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A4%D0%B0%D0%B9%D0%BB:GroundNet.png&amp;diff=78776"/>
				<updated>2021-01-18T10:00:31Z</updated>
		
		<summary type="html">&lt;p&gt;Mrucher: Сеть GroundNet&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;Сеть GroundNet&lt;/div&gt;</summary>
		<author><name>Mrucher</name></author>	</entry>

	</feed>