Transformação linear direta

Origem: Wikipédia, a enciclopédia livre.

Transformação linear direta (DLT) é um algoritmo que calcula um conjunto de variáveis a partir de um conjunto de relações de semelhança:

em que e são vetores conhecidos, denota igualdade a menos de uma multiplicação por um escalar desconhecido, e é uma matriz (ou transformação linear) que contém as incógnitas a serem calculadas.

Este tipo de relação aparece frequentemente em geometria projetiva. Exemplos práticos incluem a relação entre pontos 3D em uma cena e a sua projeção sobre o plano da imagem de uma câmera pinhole, e homografias.

Introdução[editar | editar código-fonte]

Uma equação linear ordinária

pode ser resolvida, por exemplo, reescrevendo-a como uma equação matricial na qual as matrizes e contêm os vetores e em suas respectivas colunas. Dado que existe uma única solução, ela é dada por

As soluções também podem ser descritas nos casos em que as equações são sobredeterminadas ou subdeterminadas.

O que torna o problema da transformação linear direta diferente do caso padrão acima é o fato de que os lados esquerdo e direito das equações que o definem podem diferir por um fator multiplicativo desconhecido que é dependente de k. Como consequência, não pode ser calculada como no caso padrão. Em vez disso, as relações de semelhança são reescritas como equações lineares homogêneas apropriadas que podem então ser resolvidas por um método padrão. A combinação da reescrita das equações de semelhança como equações lineares homogêneas com a sua resolução por métodos padrão é conhecida como algoritmo de transformação linear direta ou algoritmo DLT. A sigla DLT é atribuída a Ivan Sutherland. [1]

Exemplo[editar | editar código-fonte]

Sejam e dois conjuntos de vetores conhecidos e o problema é encontrar uma matriz de ordem tal que que

onde é o fator escalar desconhecido relacionado à equação k.

Para se livrar dos escalares desconhecidos e obter equações homogêneas, defina a matriz antissimétrica

e multiplique ambos os lados da equação pela esquerda por
Como tem-se as seguintes equações homogêneas, que já não contêm os escalares desconhecidos:
A fim de obter a partir deste conjunto de equações, considere os elementos dos vetores e e a matriz
e a equação homogênea acima torna-se
Isso também pode ser escrito como
em que tanto quanto são vetores de 6 dimensões definidos como
  e  

Este conjunto de equações homogêneas também pode ser escrito em forma matricial como

onde é uma matriz que contém os vetores em suas linhas. Isto significa que pertence ao espaço nulo de e pode ser determinado, por exemplo, por meio de uma decomposição em valores singulares de é um vetor singular à direita de correspondente a um valor singular nulo. Uma vez que foi determinado, os elementos de podem ser encontrados por uma simples reorganização do vetor de 6 dimensões na forma de uma matriz Note que o fator escalar de ou não é importante (exceto por ter que ser diferente de zero) uma vez que as equações que as definem já levam em conta o escalar desconhecido.

Na prática, os vetores e pode conter ruído, o que significa que as equações de semelhança são apenas aproximadamente válidas. Como consequência, pode não existir um vetor que seja uma solução exata da equação homogênea Nestes casos, uma solução de mínimos quadrados totais pode ser utilizada escolhendo como um vetor singular à direita correspondente ao menor valor singular de

Casos mais gerais[editar | editar código-fonte]

O exemplo acima tem e mas a estratégia geral para reescrever as relações de semelhança como equações lineares homogêneas pode ser generalizada para casos em que tanto quanto têm dimensões arbitrárias.

Se e as expressões anteriores ainda podem levar a uma equação

onde agora é Cada k fornece uma equação nos elementos desconhecidos de e juntas, essas equações podem ser escritas na forma com a matriz B de ordem N x 2q que é conhecida e o vetor de incógnitas de dimensão 2q. Este vetor pode ser encontrado de forma similar à que foi feita anteriormente.

No caso mais geral, e A principal diferença em relação ao caso anterior é que a matriz agora é e antissimétrica. Quando o espaço de tais matrizes não é mais unidimensional, mas sim de dimensão

Isso significa que cada valor de k fornece M equações homogêneas do tipo

onde é uma base de dimensão M do espaço de matrizes antissimétricas.

Exemplo p = 3[editar | editar código-fonte]

No caso em que p = 3, podem ser escolhidas as três matrizes a seguir

Neste caso particular, as equações lineares homogêneas podem ser escritas como
onde é a representação matricial do produto vetorial. Observe que esta última equação é em valores vetoriais; o lado esquerdo é o elemento zero em

Cada valor de k fornece três equações homogêneas nos elementos desconhecidos de No entanto, como tem posto 2, no máximo duas equações são linearmente independentes. Na prática, portanto, é comum usar apenas duas das três matrizes, por exemplo, para m=1, 2. No entanto, a dependência linear entre as equações é dependente de o que significa que em certos casos seria melhor escolher, por exemplo, m=2,3. Assim, se o número de equações não é uma preocupação, pode ser melhor usar as três equações ao construir a matriz

A dependência linear entre as equações lineares homogêneas é uma preocupação geral para o caso p > 2 e tem de ser tratada reduzindo o conjunto de matrizes antissimétricas ou então permitindo que se torne maior do que o necessário para determinar

Referências

  1. Sutherland, Ivan E. (abril de 1974), «Three-dimensional data input by tablet», Proceedings of the IEEE, 62 (4): 453–461, doi:10.1109/PROC.1974.9449 
  • Richard Hartley and Andrew Zisserman (2003). Multiple View Geometry in computer vision. [S.l.]: Cambridge University Press. ISBN 978-0-521-54051-3 

Ligações externas[editar | editar código-fonte]