Processamento Digital de Imagens

A figura a seguir dá uma visão geral da relação entre a área de processamento digital de imagens e outras disciplinas.

(BERND GIROD, G. W. Digital Image Processing. Stanford University (notas de aula))

Modelo matemático de formação de imagem

Uma imagem pode ser definida como uma função bidimensional em que e são coordenadas espaciais (plano) e a amplitude de em qualquer par de coordenadas é chamada intensidade ou nível de cinza da imagem nesse ponto. Quando , e os valores de intensidade de são quantidades finitas e discretas, chamamos de imagem digital.

A função pode ser caracterizada por dois componentes:

  1. iluminação: representada por , indica a quantidade de iluminação da fonte que incide na cena que está sendo vista; e
  2. refletância: representada por , indica a quantidade de iluminação refletida pelos objetos na cena.

Ao combinar as duas funções temos:

onde:

Os limites da refletância são chamados de:

  • : absorção total
  • : refletância total

Amostragem e quantização de imagens

A figura a seguir mostra uma imagem contínua que queremos converter em formato digital. Para isso, temos de fazer a amostragem da função em ambas as coordenadas e na amplitude. A digitalização dos valores de coordenada é chamada amostragem. A digitalização dos valores de amplitude é chamada de quantização.

A figura a seguir ilustra o resultado do processo de amostragem e quantização.

Representação do pixel (valores de intensidade)

A forma mais comum de representar é na forma de uma matriz em que cada elemento está associado a um pixel na coordenada . Nessa representação, e .

Outra forma de representar é utilizando um vetor em que a relação entre o índice do vetor e o pixel da matriz é dada por:

As posições e de um pixel para um índice do vetor podem ser obtidas por:

A imagem digital é composta por elementos chamados pixels, cada qual armazenando um valor de intensidade. O valor de intensidade é representado em um intervalo:

onde representa a quantidade de bits ou a profundidade de bits da imagem. Geralmente, este valor é limitado em 8 bits por banda do espectro de cor.

No caso de imagens monocromáticas, há apenas uma banda (por isso são geralmente chamadas imagens em tons de cinza).

No caso de imagens coloridas, pode haver mais de duas bandas. O sistema de cor RGB (do inglês Red, Green, Blue) representa três bandas baseadas nas cores primárias vermelho, verde e azul.

Padrões de representação da imagem em programação (e algoritmos)

Ao adotarmos a forma de representação da imagem por uma matriz costumamos trabalhar com os índices , para linhas, e , para colunas. Assim, o algoritmo a seguir ilustra um percurso por todos os pixels da imagem:

para i de 0 até (M - 1) faça
    para j de 0 até (N - 1) faça
        I(i,j) representa o pixel da linha i, coluna j
    fim-para
fim-para

Relacionamentos entre pixels

Vizinhos de um pixel

Um pixel na coordenada tem quatro vizinhos horizontais e verticais, cujas coordenadas são dadas por:

Esse conjunto de pixels, chamado de vizinhança-4 de é expresso por .

Os quatro vizinhos diagonais de têm coordenadas:

que são expressas por . A união desses conjuntos forma a vizinhança-8 de p, expressa por .

Adjacência e conectividade, regiões e fronteiras

Expressamos por o conjunto de valores de intensidade utilizados para definir a adjacência. Há três tipos:

  • adjacência-4: dois pixels e com valores pertencendo a são adjacentes se estiver no conjunto ;
  • adjacência-8: dois pixels e com valores pertencendo a são adjacentes-8 se estiver no conjunto ;
  • adjacência-m: dois pixels e com valores pertencendo a são adjacentes-m se: a) estiver em ; ou b) estiver em e o conjunto não contiver nenhum pixel cujos valores pertençam a .

A figura a seguir ilustra esse conceito.

Um caminho (ou curva) do pixel com coordenadas para o pixel com coordenadas é uma sequência de pixels distintos com coordenadas:

onde e os pixels e são adjacentes para . Nesse caso, é o comprimento do caminho. Se , o caminho é fechado.

Com representando um subconjunto de pixels em uma imagem, dizemos que dois pixels e sao conexos em se houver um caminho entre eles consistindo inteiramente de pixels em . Para qualquer pixel em , o conjunto de pixels que são conectados a ele em é chamado de um componente conexo de . Se existir apenas um componente conectado, o conjunto é chamado de conjunto conexo.

Com representando um subconjunto de pixels em uma imagem, chamamos de uma região da imagem se for um conjunto conexo. Duas regiões e são consideradas adjacentes se sua união formar um conjunto conexo. As regiões que não são adjacentes são disjuntas.

A fronteira (borda ou contorno) de uma região é o conjunto de pontos adjacentes aos pontos do complemento de , ou seja, a fronteira de uma região é o conjunto de pixels da região que tem pelo menos um vizinho no fundo da imagem.

Medidas de distância

Para os pixels , e , com coordenadas , , , respectivamente, é uma função distância ou medida de distância se:

a. , com se
b. ; e
c. .

A Distância Euclidiana entre e é definida como:

Para essa medida de distância, os pixels que possuem distância de menor ou igual a um valor são os pontos contidos em um disco de raio centrado em .

Sugestão de leitura: Capítulos 1 e 2 de (GONZALEZ e WOODS, 2011)

results matching ""

    No results matching ""