| |
|
Segmentacja obrazu przez progowanie jasności jest podstawową metodą
przy segmentacji obrazu. Polega ona na określeniu wartości progowej
T (w skali jasności obrazu), po czym każdy element obrazu (piksel)
jest przydzielany do jednej z dwóch kategorii: o wartości większej
bądź równej wartości progowej T {f(x,y) >= T} lub wartości
mniejszej od wartości progowej {f(x,y) < T}. Po operacji progowania otrzymuje się tak zwany obraz
binarny, składający się z samych zer i jedynek ({f(x,y) >= T} = 0
i {f(x,y) < T} = 1 lub odwrotnie). Wartość zero może oznaczać
kolor czarny, a wartość jeden – kolor biały (jest to jednak tylko
wybór autora). |
|

|
Wybór wartości progowej dokonuje się zwykle na podstawie histogramu
(omawianego w podrozdziale „histogram”
[narzędzia->histogram]). Jednak jest to o wiele
bardziej złożony problem, o którym w dalszej części tego rozdziału.
Przeanalizujmy obraz składający się z dwóch obszarów, jednego w
przeważającej części jasnego i drugiego ciemnego np., jasne obiekty
na ciemnym tle. Można oczekiwać, że jego histogram będzie miał dwa
szczyty, tak jak pokazano na rys poniżej. Jeden szczyt histogramu
mówi o tym, że część pikseli ma kolor ciemny, zaś drugi szczyt mówi
o tym, że część pikseli jest w kolorze jaśniejszym. |
|

|
Wartość progową T można wówczas wybrać z wartości między dwoma
szczytami. Zbiór wszystkich elementów obrazu, których wartości są
poniżej progu T, to obszar zakwalifikowany do jednej z
kategorii (o wartości mniejszej niż wartość progowa), a elementy obrazu,
których wartości są większe od wartości progowej T, to obszar należący do
drugiej kategorii pikseli.
Gdy wartość progu jest ustalana na podstawie całego obrazu to
mówimy, że mamy do czynienia z wyznaczaniem progu globalnego –
globalny próg jasności.
Gdy wartość progu zależy od współrzędnych przestrzennych (x,y)
obrazu to mówimy, że próg jest ustalany dynamicznie – dynamiczny
próg jasności.
Ponadto, gdy próg jest zarówno zależny od treści obrazu, tj.
wartości f(x,y) oraz od pewnej cechy obrazu p(x,y), - np. średniej
jasności obrazu w pewnym otoczeniu, to próg jest określany mianem
lokalnego – lokalny próg jasności.
Dla tzw. progowania wielopoziomowego, wartości odpowiednich poziomów
progowania są elementami wektora T=[T1,T2,...,TN]. W wyniku takiego progowania obraz
podlega segmentacji na obszary o N+1 różnych jasnościach, np.
progowanie dwupoziomowe wyznacza trzy takie obszary: |
|

|
W przykładzie tym mamy wyznaczone dwa różne progi: T1 i T2, które po
analizie obrazu wyodrębnią z niego obszary:
- A1 są to wszystkie elementy obrazu, których wartości są mniejsze
bądź równe wartości progu T1,
- A2 są to wszystkie elementy obrazu, których wartości są większe od
wartości progu T1, jednak nie większe niż wartość progu T2,
- A3 są to wszystkie elementy obrazu, których wartości są większe od
wartości progu T2.
Teoretycznie progowanie jasności można uogólnić do progowania
wielowymiarowego, które może mieć zastosowanie w segmentacji obrazów
kolorowych, kodowanych w systemach reprezentacji kolorów RGB (ang.
Red, Green, Blue) lub HSI
(ang. Hue, Saturation, Intensity). Poszczególne wartości progów
można określić na podstawie histogramu trójwymiarowego utworzonego z
trzech składowych kolorów. Niestety takie podejście ciągnie za sobą
sporą moc obliczeniową i złożoność algorytmiczną. |
| |
|
 |
Zdjęcie po lewej stronie, to typowe zdjęcie lotnicze, (tzn. wykonane
z samolotu) – przedstawia „molo” w mieście Sopot. Oryginalne zdjęcie
było kolorowe jednak, aby było możliwe poprawne przeprowadzenie
progowania jednopoziomowego, zamieniono je na czarno-białe (zdjęcie
w odcieniach szarości). Zdjęcie po prawej stronie ukazuje wyniki
operacji progowania na zdjęciu z lewej strony, przy wartości progu
T=100. Widać, że kolorem czarnym algorytm progowania zaznaczył
obszary wyraźnie ciemniejsze, a białym kolory jasne. Poniżej te samo
zdjęcie po obróbce algorytmem progowania z wartością progu
odpowiednio: T=50 i T=220. |
|

|
Automatyczne oszacowanie wartości progowej jest problemem złożonym.
Występowanie dwóch wyraźnych szczytów na histogramie nie jest
zjawiskiem typowym. Nawet dla tego samego obrazu możemy uzyskać
różne wykresy histogramu, jeśli obraz ten zostanie poddany obróbce
przez różnego rodzaju filtry.
Idealna wartość progowa to taka, dla której liczba błędnie
segmentowanych punktów obrazu osiągnie wartość minimalną.
Aby pokazać trudności w automatycznym doborze odpowiedniej wartości
progu, przyjrzyjmy się bliżej wcześniejszemu przykładowi, kiedy to
obraz zawierał dwa obszary: jaśniejszy i ciemniejszy.
Niech:
- każdy z tych obszarów ma rozkład Gaussowski N(0,σ)
- wartości średnie tych obszarów będą oznaczone odpowiednio m1
(obiekty) i m2 (tło)
- obszary te występują w obrazie w proporcjach P1 i P2, przy czym P1
+ P2 = 1
Należy określić wartość progową T minimalizującą całkowity błąd
segmentacji obrazu (tj. liczby punktów obrazu należących do obiektu
i zaliczonych do tła (ang. false positive) oraz liczby punktów
należących do tła i zaliczonych do obiektu (ang. false negative)) |
|

|
Prawdopodobieństwo całkowite: |
|

|
Jak wcześniej wspomniałem: wartość progu T, dla której liczba
błędnie segmentowanych punktów obrazu osiągnie wartość minimalną
jest wartością najlepszą. Takiej wartości poszukujemy w naszym
przykładzie.
Prawdopodobieństwo błędnej segmentacji: |
|

|
Minimum błędu poszukujemy przyrównując pochodną błędu względem T, do
zera: |
|

|
Otrzymujemy: |
|

|
| Stąd: |
|

|
Dla równych wariancji rozkładu jasności tła i obiektów (σ1=σ2=σ)
wartość progu minimalizująca błąd segmentacji ma postać: |
|

|
Dla P1=P2 optymalna wartość progu segmentacji jest równa średniej
arytmetycznej ze średnich jasności i tła.
Przykład ten ilustruje jak trudno znaleźć automatycznie najlepszą
wartość progową T dla obrazu. Biorąc pod uwagę, że obrazy (zdjęcia
lotnicze lub satelitarne) mogą być wykonane w nocy (gdzie przeważa
kolor ciemny), w dzień (gdzie przeważa kolor jasny), ze skierowaniem
obiektywu na ląd (gdzie mamy do czynienia z lasami - kolor zielony,
brązowy, żółty – wszystko to też zależy od pory roku), wodę
(kolor niebieski, granatowy, a czasami zielony), lub na ocean, etc…
- problem doboru progu staje się bardzo złożony. |
|
|
|