Retificação de imagem

Retificação de imagem é uma técnica que consiste em aplicar uma série de transformações a duas ou mais imagens de forma que os pontos correspondentes estejam na mesma coordenada-y em todas elas. Esta técnica é muito usada em visão computacional especialmente para otimizar o processo de encontrar pontos correspondentes nas imagens.

Visão Computacional[editar | editar código-fonte]

Dentro de visão computacional é muito utilizado como base os princípios da estereoscopia para na geometria epipolar para que, a partir de duas ou mais imagens, seja possível determinar a distância de um objeto. Nesse contexto, a retificação de imagens torna-se uma técnica muito importante.

Retificar as imagens significa aplicar transformações às elas de forma que as figuras obtidas possuam projeções epipolares correspondentes.^[1] Em outras palavras, essas imagens são manipuladas de forma que linhas epipolares correspondentes se tornem colineares e paralelas ao eixo-x da imagem. Desta forma, o espaço de busca é reduzido à apenas uma dimensão. As vantagens de executar esta técnica vão além de simplesmente tornar a área de busca numa linha horizontal.^[2]

Ao fazer a retificação baseada na geometria epipolar das imagens, também é possível garantir outras restrições, acelerando e tornando mais consistente a procura por correspondências. A primeira restrição garante que todos os pontos de uma linha epipolar aparecerão na mesma ordem nas imagens retificadas, desde que esses objetos sejam opacos. Uma outra diz que cada ponto possui um único correspondente nas imagens seguintes.

Algoritmos[editar | editar código-fonte]

Mesmo a retificação de imagens sendo um problema clássico da área de visão computacional, existem poucos métodos para executar esta tarefa. Basicamente existem apenas três: a retificação planar,^[3] a retificação cilíndrica^[4] e a retificação polar.^[5]^[6] Todas elas determinam que as imagens a serem retificadas devam ser reorganizadas a partir de uma re-projeção, divergindo apenas na forma como elas serão re-projetadas.

Retificação planar[editar | editar código-fonte]

Este método de retificação é relativamente simples, tendo como ideia básica re-projetar todas as imagens num plano em comum paralelo à baseline. Assim, quando a figura for mapeada numa região em comum deste plano, têm-se a garantia que linhas epipolares correspondentes estarão na mesma altura.

Existem infinitos planos paralelos à baseline que poderiam ser usados para a retificação. Por simplicidade de cálculos, é escolhido um a partir da rotação dos planos de imagem, de forma que eles se tornem co-planares. Esta operação resulta numa nova matriz de projeção, baseada na original, e a garantia de que epipolos estão no infinito e, consequentemente, linhas epipolares são paralelas.

Este método de retificação de imagens é bem simples, além de possuir uma execução rápida, pois depende apenas do cálculo de uma matriz de transformação para cada imagem. Porém, ele não é robusto o suficiente para qualquer tipo de movimento de câmera, como no caso onde a distância entre elas é muito grande. Já se for muito pequeno esse espaço, os epipolos tendem a se aproximar da imagem, gerando imagens cada vez maiores. Ela pode chegar ao extremo de falhar totalmente quando os epipolos ficam dentro da imagem, que ocorre quando a câmera dá um zoom na imagem.

Retificação cilíndrica[editar | editar código-fonte]

Esta técnica é mais robusta e geral para retificar imagens, pois funciona com qualquer movimento de câmera. Ela se diferencia da retificação planar, principalmente, por, ao invés de usar um plano em comum, usar um cilindro em comum para re-projetar o par de imagens.

O método consiste em determinar um cilindro de raio unitário que tem a baseline com eixo de revolução e, em seguida, mapear cada pixel da imagem numa coordenada (z, θ) de um sistema de coordenadas cilíndrico. Desta feita, cada ponto (z, θ) da imagem retificada é usado normalmente, como se fosse um ponto (u, v) na imagem.

Apesar de mais robusto, este método é bastante custoso, pois todos os cálculos, que são relativamente complexos, são realizados num espaço tridimensional e devem ser feitos para cada pixel da imagem. Por isso, apesar de tratar todos os movimentos de câmera, a retificação cilíndrica exige um tempo de execução altíssimo, já que toda linha epipolar deve ser rotacionada e projetada.

Retificação polar[editar | editar código-fonte]

Faz uso das informações da geometria projetiva e epipolar para simplificar a retificação cilíndrica, deste modo todos os cálculos sejam feitos no plano de imagem, e evitando assim operações tridimensionais.

A ideia deste método é a mesma do anterior: reparametrizar a imagem num sistema de coordenadas cilíndrico. Entretanto, ele difere no cilindro escolhido. Enquanto nela o cilindro é centrado na baseline, na polar as transformações ocorrem ao redor dos epipolos e, como estes estão no mesmo plano da imagem, nenhuma operação ocorrerá no espaço tridimensional.^[5]

Referências[editar | editar código-fonte]

↑ Richard Hartley and Andrew Zisserman (2004). Multiple View Geometry in computer vision (em inglês). [S.l.]: Cambridge University Press. ISBN 0521540518
↑ Rafael Roberto and Veronica Teichrieb (2009). «Retificação Cilíndrica: Uma Forma Eficiente Para a Retificação de um Par de Imagens» (PDF). Consultado em 5 de março de 2011
↑ Andrea Fusiello, Emanuele Trucco and Alessandro Verri (2 de março de 2000). «A compact algorithm for rectification of stereo pairs» (PDF). Machine Vision and Applications (em inglês). 12: 16–22. Consultado em 8 de junho de 2010
↑ Daniel Oram (2001). «Rectification for Any Epipolar Geometry» (PDF) (em inglês). Consultado em 8 de junho de 2010
↑ ^a ^b Marc Pollefeys, Reinhard Koch and Luc Van Gool (1999). «A simple and efficient rectification method for general motion» (PDF). Proc. International Conference on Computer Vision (em inglês): 496-501. Consultado em 19 de janeiro de 2011
↑ Rafael Roberto, Veronica Teichrieb and Judith Kelner (2009). «Retificação Cilíndrica: um método eficente para retificar um par de imagens» (PDF). Workshops of Sibgrapi 2009 - Undergraduate Works. Consultado em 5 de março de 2011. Arquivado do original (PDF) em 6 de julho de 2011

[HARTLEY2004-1] Richard Hartley and Andrew Zisserman (2004). Multiple View Geometry in computer vision (em inglês). [S.l.]: Cambridge University Press. ISBN 0521540518

[ROBERTO2009_1-2] Rafael Roberto and Veronica Teichrieb (2009). «Retificação Cilíndrica: Uma Forma Eficiente Para a Retificação de um Par de Imagens» (PDF). Consultado em 5 de março de 2011

[FUSIELLO2000-3] Andrea Fusiello, Emanuele Trucco and Alessandro Verri (2 de março de 2000). «A compact algorithm for rectification of stereo pairs» (PDF). Machine Vision and Applications (em inglês). 12: 16–22. Consultado em 8 de junho de 2010

[ORAM2001-4] Daniel Oram (2001). «Rectification for Any Epipolar Geometry» (PDF) (em inglês). Consultado em 8 de junho de 2010

[POLLEFEYS1999-5] Marc Pollefeys, Reinhard Koch and Luc Van Gool (1999). «A simple and efficient rectification method for general motion» (PDF). Proc. International Conference on Computer Vision (em inglês): 496-501. Consultado em 19 de janeiro de 2011

[ROBERTO2009_2-6] Rafael Roberto, Veronica Teichrieb and Judith Kelner (2009). «Retificação Cilíndrica: um método eficente para retificar um par de imagens» (PDF). Workshops of Sibgrapi 2009 - Undergraduate Works. Consultado em 5 de março de 2011. Arquivado do original (PDF) em 6 de julho de 2011

[1]

[2]

[3]

[4]

[5]

[6]

v d e Inteligência artificial / Inteligência computacional
Temas	Alinhamento de IA Aprendizado de IA Aprendizagem profunda Ética na IA Explosão de IA Progresso da IA Segurança da IA
Tópicos	Alucinação Cérebro artificial Cérebro positrônico Comportamento da Máquina Computação bioinspirada Computação evolucionária Computação social Raciocínio automatizado Raciocínio baseado em casos Rebelião das máquinas Robótica em nuvem
Tipos	Inteligência computacional IA Distribuída IA Explicável IA Generativa IA Geral IA para TI Inteligência de conteúdo Inteligência de enxame Máquina autorreplicadora Máquina Moral Máquina de vetores de suporte Sistema de reconhecimento facial Sistema especialista Sistema multiagente Sistema Tutorial Inteligente Sistemas de Processamento de Informações Neurais Sistemas periciais
Heurísticas	A* Subida de encosta
Meta-heurísticas	Algoritmo genético Pesquisa tabu Colônia de formigas Enxame de partículas GRASP
Aplicações	Adestramento de Cães Arte na IA Classificação estatística Corretor gramatical Governo por algoritmo IA na Música Processamento de linguagem natural Retificação de imagem Reconhecimento de entidade mencionada Reconhecimento de fala Reconhecimento ótico de caracteres
Categoria