<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
		<id>http://neerc.ifmo.ru/wiki/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=45.56.197.43&amp;*</id>
		<title>Викиконспекты - Вклад участника [ru]</title>
		<link rel="self" type="application/atom+xml" href="http://neerc.ifmo.ru/wiki/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=45.56.197.43&amp;*"/>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%A1%D0%BB%D1%83%D0%B6%D0%B5%D0%B1%D0%BD%D0%B0%D1%8F:%D0%92%D0%BA%D0%BB%D0%B0%D0%B4/45.56.197.43"/>
		<updated>2026-04-28T02:26:20Z</updated>
		<subtitle>Вклад участника</subtitle>
		<generator>MediaWiki 1.30.0</generator>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BD%D0%BE%D0%B5_%D0%B7%D1%80%D0%B5%D0%BD%D0%B8%D0%B5&amp;diff=73018</id>
		<title>Компьютерное зрение</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BD%D0%BE%D0%B5_%D0%B7%D1%80%D0%B5%D0%BD%D0%B8%D0%B5&amp;diff=73018"/>
				<updated>2020-03-21T08:30:29Z</updated>
		
		<summary type="html">&lt;p&gt;45.56.197.43: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;'''Компьютерное зрение''' {{---}} это научное направление в области искусственного интеллекта и связанные с ним технологии получения изображений объектов реального мира, их обработки и использования полученных данных для решения разного рода прикладных задач без участия (полного или частичного) человека.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
=Задачи компьютерного зрения=&lt;br /&gt;
&lt;br /&gt;
==Идентификация==&lt;br /&gt;
Задача идентификации состоит в том, чтобы классифицировать изображение целиком. Для этого на изображении выделяются ключевые области на изображении и по ним происходит классификация, например с помощью решающих деревьев, или [[Сверточные нейронные сети |сверточных нейронных сетей]]&lt;br /&gt;
&lt;br /&gt;
==Распознавание объектов==&lt;br /&gt;
Задача состоит в том, чтобы по изображению суметь выделить на нем некоторый набор объектов. Пока задача не решена в общем случае – алгоритм не может классифицировать случайные объекты на изображении. Однако способен распознавать заранее заученный набор объектов с достаточно высокой точностью.&lt;br /&gt;
&lt;br /&gt;
Самым простым методом детекции объектов является метод скользящего окна[[R-CNN|(R-CNN)]], при котором мы проходимся некоторым окном фиксированного размера по каждому кусочку картинки, и применяем к нему простой классификатор, обученный распознавать заранее определенный набор объектов. Модификации этого метода, такие как [[Faster R-CNN | Faster R-CNN]] применяются до сих пор&lt;br /&gt;
&lt;br /&gt;
==Сегментация изображения==&lt;br /&gt;
Задача похожая на детекцию объектов, но в отличие от нее требуется не окружить найденные объекты рамками, а выделить пиксели, которые этот объекты составляют. Сегментация применяется во многих областях, например, в производстве для индикации дефектов при сборке деталей, в медицине для первичной обработки снимков, также для составления карт местности по снимкам со спутников. Самый простой алгоритм сегментации – [[WaterShred | WaterShred]], заключающийся в разделении на куски функции от координат пикселей, начиная с минимумов этой функции &lt;br /&gt;
&lt;br /&gt;
==Оценка положения(Pose Estimation)==&lt;br /&gt;
Задача, в некотором роде продолжающая задачу сегментации. Заключается в выделении некоторого каркаса объекта и предсказании его дальнейшего движения. Чаще всего применяется к обработке.  Положения людей на фотографии. В зависимости от количества рассматриваемых людей различают ''single-person'' и ''multi-person'' [[pose estimatiom |pose estimation]]  . Различие состоит в том, что во втором случае необходимо также учитывать, что объекты могут накладываться. Друг на друга. Для выполнения этой задачи сначала обрезается фон, оставляя только изображения непосредственно объектов, а затем для каждого из объектов с помощью сверточных нейронных сетей выделяются области суставов, которые затем соединяются.&lt;br /&gt;
&lt;br /&gt;
==Распознавание текста==&lt;br /&gt;
Одна из ключевых задач компьютерного зрения. Сначала с помощью алгоритмов детекции выделяется область в которой текст написан, затем производится непосредственно распознавание текста например с помощью алгоритмов сегментации. При этом задачи распознавания текста написанного на листе бумаги, и распознавания текста написанного где-то на изображении (“in the wild”), сильно различаются, в силу наличия в последнем случае помех,  которые мешают выделить конкретные буквы. В этом случае может помочь, например обучение предсказания буквы по остальным буквам в слове.&lt;br /&gt;
&lt;br /&gt;
==Генерация объектов==&lt;br /&gt;
Задача состоит в том, чтобы по известному набору объектов научится создавать похожие объекты, но при этом не совпадающие ни с одним из тестовых. Например создавать анимационных персонажей в стилистике мультфильма, нарисовав руками только пару из них. Для этого применяют такие архитектуры как [[Generative Adversarial Nets (GAN) | GAN]], при которой сеть делится на две, одна из которых стремится создать объект, а вторая его отбраковать, или [[Вариационный автокодировщик|вариационный автокодировщик]].&lt;br /&gt;
&lt;br /&gt;
=Примечания=&lt;br /&gt;
=Ссылки=&lt;br /&gt;
#[https://nanonets.com/blog/human-pose-estimation-2d-guide/] - задача Pose Estimation&lt;br /&gt;
#[https://habr.com/ru/post/274725/] - Статья на Хабре, краткий обзор задач компьютерного зрения&lt;br /&gt;
#[http://neerc.ifmo.ru/wiki/index.php?title=%D0%A1%D0%B5%D0%B3%D0%BC%D0%B5%D0%BD%D1%82%D0%B0%D1%86%D0%B8%D1%8F_%D0%B8%D0%B7%D0%BE%D0%B1%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D0%B9] - Статья на кики по сегментации изображений&lt;br /&gt;
&lt;br /&gt;
[[Категория: Машинное обучение]]&lt;br /&gt;
&lt;br /&gt;
[[Категория: Компьютерное зрение]]&lt;/div&gt;</summary>
		<author><name>45.56.197.43</name></author>	</entry>

	<entry>
		<id>http://neerc.ifmo.ru/wiki/index.php?title=%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BD%D0%BE%D0%B5_%D0%B7%D1%80%D0%B5%D0%BD%D0%B8%D0%B5&amp;diff=73017</id>
		<title>Компьютерное зрение</title>
		<link rel="alternate" type="text/html" href="http://neerc.ifmo.ru/wiki/index.php?title=%D0%9A%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BD%D0%BE%D0%B5_%D0%B7%D1%80%D0%B5%D0%BD%D0%B8%D0%B5&amp;diff=73017"/>
				<updated>2020-03-21T08:28:55Z</updated>
		
		<summary type="html">&lt;p&gt;45.56.197.43: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;'''Компьютерное зрение''' {{---}} это научное направление в области искусственного интеллекта и связанные с ним технологии получения изображений объектов реального мира, их обработки и использования полученных данных для решения разного рода прикладных задач без участия (полного или частичного) человека.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
=Задачи компьютерного зрения=&lt;br /&gt;
&lt;br /&gt;
==Идентификация==&lt;br /&gt;
Задача идентификации состоит в том, чтобы классифицировать изображение целиком. Для этого на изображении выделяются ключевые области на изображении и по ним происходит классификация, например с помощью решающих деревьев, или [[Сверточные нейронные сети |сверточных нейронных сетей]]&lt;br /&gt;
&lt;br /&gt;
==Распознавание объектов==&lt;br /&gt;
Задача состоит в том, чтобы по изображению суметь выделить на нем некоторый набор объектов. Пока задача не решена в общем случае – алгоритм не может классифицировать случайные объекты на изображении. Однако способен распознавать заранее заученный набор объектов с достаточно высокой точностью.&lt;br /&gt;
&lt;br /&gt;
Самым простым методом детекции объектов является метод скользящего окна[[R-CNN|(R-CNN)]], при котором мы проходимся некоторым окном фиксированного размера по каждому кусочку картинки, и применяем к нему простой классификатор, обученный распознавать заранее определенный набор объектов. Модификации этого метода, такие как [[Faster R-CNN | Faster R-CNN]] применяются до сих пор&lt;br /&gt;
&lt;br /&gt;
==Сегментация изображения==&lt;br /&gt;
Задача похожая на детекцию объектов, но в отличие от нее требуется не окружить найденные объекты рамками, а выделить пиксели, которые этот объекты составляют. Сегментация применяется во многих областях, например, в производстве для индикации дефектов при сборке деталей, в медицине для первичной обработки снимков, также для составления карт местности по снимкам со спутников. Самый простой алгоритм сегментации – [[WaterShred | WaterShred]], заключающийся в разделении на куски функции от координат пикселей, начиная с минимумов этой функции &lt;br /&gt;
&lt;br /&gt;
==Оценка положения(Pose Estimation)==&lt;br /&gt;
Задача, в некотором роде продолжающая задачу сегментации. Заключается в выделении некоторого каркаса объекта и предсказании его дальнейшего движения. Чаще всего применяется к обработке.  Положения людей на фотографии. В зависимости от количества рассматриваемых людей различают ''single-person'' и ''multi-person'' [[pose estimatiom |pose estimation]]  . Различие состоит в том, что во втором случае необходимо также учитывать, что объекты могут накладываться. Друг на друга. Для выполнения этой задачи сначала обрезается фон, оставляя только изображения непосредственно объектов, а затем для каждого из объектов с помощью сверточных нейронных сетей выделяются области суставов, которые затем соединяются.&lt;br /&gt;
&lt;br /&gt;
==Распознавание текста==&lt;br /&gt;
Одна из ключевых задач компьютерного зрения. Сначала с помощью алгоритмов детекции выделяется область в которой текст написан, затем производится непосредственно распознавание текста например с помощью алгоритмов сегментации. При этом задачи распознавания текста написанного на листе бумаги, и распознавания текста написанного где-то на изображении (“in the wild”), сильно различаются, в силу наличия в последнем случае помех,  которые мешают выделить конкретные буквы. В этом случае может помочь, например обучение предсказания буквы по остальным буквам в слове.&lt;br /&gt;
&lt;br /&gt;
==Генерация объектов==&lt;br /&gt;
Задача состоит в том, чтобы по известному набору объектов научится создавать похожие объекты, но при этом не совпадающие ни с одним из тестовых. Например создавать анимационных персонажей в стилистике мультфильма, нарисовав руками только пару из них. Для этого применяют такие архитектуры как [[Generative Adversarial Nets (GAN) | GAN]], при которой сеть делится на две, одна из которых стремится создать объект, а вторая его отбраковать, или [[Вариационный автокодировщик|вариационный автокодировщик]].&lt;br /&gt;
&lt;br /&gt;
=Примечания=&lt;br /&gt;
=Ссылки=&lt;br /&gt;
#[https://nanonets.com/blog/human-pose-estimation-2d-guide/] - задача Pose Estimation&lt;br /&gt;
#[https://habr.com/ru/post/274725/] - Статья на Хабре, краткий обзор задач компьютерного зрения&lt;br /&gt;
&lt;br /&gt;
[[Категория: Машинное обучение]]&lt;br /&gt;
&lt;br /&gt;
[[Категория: Компьютерное зрение]]&lt;/div&gt;</summary>
		<author><name>45.56.197.43</name></author>	</entry>

	</feed>