Изменения

Перейти к: навигация, поиск

Сегментация изображений

986 байт добавлено, 19:14, 28 января 2019
Метод нормализованных срезов (англ. Normalized cuts)
[[Файл:grephEdges.png|880px|thumb|center|''на первом изображении'' {{---}} исходная пиксельная сетка черно-белого изображения; ''на втором'' {{---}} межпиксельные связи, где более толстые линии указывают на более сильные связи; ''на третьем'' {{---}} сетка после одного уровня огрубления, когда каждый исходный пиксель сильно связан с одним из узлов грубого уровня; ''на четвертом'' {{---}} после двух уровней огрубления. Источник: Shaw, D. and Barnes, N. «Perspective rectangle detection. In Workshop on Applications of Computer Vision.» [https://www.researchgate.net/publication/6975028_Hierarchy_and_adaptivity_in_segmenting_visual_scenes]]]
Каждый пиксель на первом изображении соответствует узлу на графе вершине графа на втором изображении, который связан которая связа с каждым из его ее четырех соседей в соответствии с их сходством по уровню яркости. Цель состоит в том, чтобы «разрезать» этот граф на части. Далее можно найти ''сильно связное'' подмножество, которое минимизирует отношение <tex>[*]</tex>. Но несмотря на свою концептуальную полезностьзначимость, минимизация этого ''нормализованного разреза'' является вычислительно непомерной, а стоимость увеличивается экспоненциально с размером изображения. Приближения к оптимальному разрезу могут быть получены с использованием спектральных методов, при этом наиболее эффективное на сегодняшний день приближение имеет вычислительную стоимость, пропорциональную <tex>n^{\frac{2}{3}}</tex>, где <tex>n</tex> {{---}} количество пикселей. Эта сверхлинейная сложность может быть чрезвычайно полезна, когда дело касается очень больших изображений.
Как только набор грубых переменных был выбранТак как количество вершин графа на втором изображении велико и работать с каждым из них чрезвычайно дорого, межуровневая интерполяционная матрица необходимо выделить подмножество вершин-предводителей для каждого из подможеств и далее работать уже с ними. Мы начнем с элементамивыбора примерно половины пикселей в качестве представителей, подобными <tex>\frac{\sum_{j \in C}w_{ij}}{\sum_{j \in V}w_{ij}}</tex>которые назовем ''начальными числами'': они выбираются таким образом, используется для определения сокращенной версии задачи чтобы каждый пиксель в исходном изображении был ''нормализованных разрезовсильно связан''. В дополнение к вычислению матрицы весов по крайней мере с одним соседним с использованием интерполяции используются дополнительные статистические данные области для модуляции весов. После того, как ним ''нормализованный разрезначальным числом'' был вычислен (см. третье изображение). Далее процесс продолжается рекурсивно (см. четвертое изображжение), количество вершин на самом каждом новом более грубом уровне, значения уменьшается. Значения узлов более нижнего уровня вычисляются путем интерполяции родительских значений и сопоставления значений <tex> \epsilon = 0,1</tex> в пределах от 0 и 1 до Boolean значений. Выраженные сегменты появляются на соответствующем уровне как узлы, которые слабо связаны со своими соседями. Следовательно, задача минимизации упрощается до поиска вершин-предводителей на всех уровнях.
Результат работы данного алгоритма:
38
правок

Навигация