Progowanie

 

przygotował
Cezary Aniśko
cezary@anisko.net

 
 
        Segmentacja obrazu przez progowanie jasności jest podstawową metodą przy segmentacji obrazu. Polega ona na określeniu wartości progowej T (w skali jasności obrazu), po czym każdy element obrazu (piksel) jest przydzielany do jednej z dwóch kategorii: o wartości większej bądź równej wartości progowej T {f(x,y) >= T} lub wartości mniejszej od  wartości progowej {f(x,y) < T}. Po operacji progowania otrzymuje się tak zwany obraz binarny, składający się z samych zer i jedynek ({f(x,y) >= T} = 0 i {f(x,y) < T} = 1 lub odwrotnie). Wartość zero może oznaczać kolor czarny, a wartość jeden – kolor biały (jest to jednak tylko wybór autora).



Wybór wartości progowej dokonuje się zwykle na podstawie histogramu (omawianego w podrozdziale „histogram” [narzędzia->histogram]). Jednak jest to o wiele bardziej złożony problem, o którym w dalszej części tego rozdziału.
Przeanalizujmy obraz składający się z dwóch obszarów, jednego w przeważającej części jasnego i drugiego ciemnego np., jasne obiekty na ciemnym tle. Można oczekiwać, że jego histogram będzie miał dwa szczyty, tak jak pokazano na rys poniżej. Jeden szczyt histogramu mówi o tym, że część pikseli ma kolor ciemny, zaś drugi szczyt mówi o tym, że część pikseli jest w kolorze jaśniejszym.



Wartość progową T można wówczas wybrać z wartości między dwoma szczytami. Zbiór wszystkich elementów obrazu, których wartości są poniżej progu T, to obszar zakwalifikowany do jednej z kategorii (o wartości mniejszej niż wartość progowa), a elementy obrazu, których wartości są większe od wartości progowej T, to obszar należący do drugiej kategorii pikseli.

Gdy wartość progu jest ustalana na podstawie całego obrazu to mówimy, że mamy do czynienia z wyznaczaniem progu globalnego – globalny próg jasności.
Gdy wartość progu zależy od współrzędnych przestrzennych (x,y) obrazu to mówimy, że próg jest ustalany dynamicznie – dynamiczny próg jasności.
Ponadto, gdy próg jest zarówno zależny od treści obrazu, tj. wartości f(x,y) oraz od pewnej cechy obrazu p(x,y), - np. średniej jasności obrazu w pewnym otoczeniu, to próg jest określany mianem lokalnego – lokalny próg jasności.

Dla tzw. progowania wielopoziomowego, wartości odpowiednich poziomów progowania są elementami wektora T=[T1,T2,...,TN]. W wyniku takiego progowania obraz podlega segmentacji na obszary o N+1 różnych jasnościach, np. progowanie dwupoziomowe wyznacza trzy takie obszary:



W przykładzie tym mamy wyznaczone dwa różne progi: T1 i T2, które po analizie obrazu wyodrębnią z niego obszary:
 - A1 są to wszystkie elementy obrazu, których wartości są mniejsze bądź równe wartości progu T1,
 - A2 są to wszystkie elementy obrazu, których wartości są większe od wartości progu T1, jednak nie większe niż wartość progu T2,
 - A3 są to wszystkie elementy obrazu, których wartości są większe od wartości progu T2.

Teoretycznie progowanie jasności można uogólnić do progowania wielowymiarowego, które może mieć zastosowanie w segmentacji obrazów kolorowych, kodowanych w systemach reprezentacji kolorów RGB (ang. Red, Green, Blue) lub HSI (ang. Hue, Saturation, Intensity). Poszczególne wartości progów można określić na podstawie histogramu trójwymiarowego utworzonego z trzech składowych kolorów. Niestety takie podejście ciągnie za sobą sporą moc obliczeniową i złożoność algorytmiczną.
 


Zdjęcie po lewej stronie, to typowe zdjęcie lotnicze, (tzn. wykonane z samolotu) – przedstawia „molo” w mieście Sopot. Oryginalne zdjęcie było kolorowe jednak, aby było możliwe poprawne przeprowadzenie progowania jednopoziomowego, zamieniono je na czarno-białe (zdjęcie w odcieniach szarości). Zdjęcie po prawej stronie ukazuje wyniki operacji progowania na zdjęciu z lewej strony, przy wartości progu T=100. Widać, że kolorem czarnym algorytm progowania zaznaczył obszary wyraźnie ciemniejsze, a białym kolory jasne. Poniżej te samo zdjęcie po obróbce algorytmem progowania z wartością progu odpowiednio: T=50 i T=220.



Automatyczne oszacowanie wartości progowej jest problemem złożonym. Występowanie dwóch wyraźnych szczytów na histogramie nie jest zjawiskiem typowym. Nawet dla tego samego obrazu możemy uzyskać różne wykresy histogramu, jeśli obraz ten zostanie poddany obróbce przez różnego rodzaju filtry.
Idealna wartość progowa to taka, dla której liczba błędnie segmentowanych punktów obrazu osiągnie wartość minimalną.

Aby pokazać trudności w automatycznym doborze odpowiedniej wartości progu, przyjrzyjmy się bliżej wcześniejszemu przykładowi, kiedy to obraz zawierał dwa obszary: jaśniejszy i ciemniejszy.
Niech:
 - każdy z tych obszarów ma rozkład Gaussowski N(0,σ)
 - wartości średnie tych obszarów będą oznaczone odpowiednio m1 (obiekty) i m2 (tło)
 - obszary te występują w obrazie w proporcjach P1 i P2, przy czym P1 + P2 = 1
Należy określić wartość progową T minimalizującą całkowity błąd segmentacji obrazu (tj. liczby punktów obrazu należących do obiektu i zaliczonych do tła (ang. false positive) oraz liczby punktów należących do tła i zaliczonych do obiektu (ang. false negative))



Prawdopodobieństwo całkowite:



Jak wcześniej wspomniałem: wartość progu T, dla której liczba błędnie segmentowanych punktów obrazu osiągnie wartość minimalną jest wartością najlepszą. Takiej wartości poszukujemy w naszym przykładzie.

Prawdopodobieństwo błędnej segmentacji:



Minimum błędu poszukujemy przyrównując pochodną błędu względem T, do zera:



Otrzymujemy:


Stąd:



Dla równych wariancji rozkładu jasności tła i obiektów (σ1=σ2=σ) wartość progu minimalizująca błąd segmentacji ma  postać:



Dla P1=P2 optymalna wartość progu segmentacji jest równa średniej arytmetycznej ze średnich jasności i tła.
Przykład ten ilustruje jak trudno znaleźć automatycznie najlepszą wartość progową T dla obrazu. Biorąc pod uwagę, że obrazy (zdjęcia lotnicze lub satelitarne) mogą być wykonane w nocy (gdzie przeważa kolor ciemny), w dzień (gdzie przeważa kolor jasny), ze skierowaniem obiektywu na ląd (gdzie mamy do czynienia z lasami - kolor zielony, brązowy, żółty – wszystko to też zależy od pory roku), wodę (kolor niebieski, granatowy, a czasami zielony), lub na ocean, etc… - problem doboru progu staje się bardzo złożony.
 
 

  literatura (źródła)


 powrót do góry