Matriz diagonalizável

Em álgebra linear, uma matriz quadrada A é chamada de diagonalizável se é semelhante a uma matriz diagonal, isto é, se existe uma matriz invertível P tal que P⁻¹AP seja uma matriz diagonal. Se V é um espaço vetorial de dimensão finita n, então um operador linear T : V → V é chamado de diagonalizável se existe uma base ordenada de V, formada por n autovetores, em relação à qual T é representado por uma matriz diagonal. Diagonalização é o processo de encontrar uma matriz diagonal correspondente a uma matriz ou operador diagonalizável.^[1] Uma matriz quadrada que não é diagonalizável é chamada defectiva.

Matrizes e operadores diagonalizáveis são de interesse porque matrizes diagonais são especialmente fáceis de manusear; uma vez que seus autovalores e autovetores sejam conhecidos, pode-se elevar uma matriz diagonal a uma certa potência simplesmente elevando as entradas da diagonal à mesma potência, e o determinante de uma matriz diagonal é simplesmente o produto de todas as entradas da diagonal. Geometricamente, uma matriz diagonalizável é uma dilatação não homogênea (ou mudança de escala anisotrópica) — ela muda a escala do espaço, tal como uma dilatação homogênea, mas por um fator diferente, em cada direção, determinados pelos fatores de escala em cada eixo (entradas da diagonal).

Caracterização[editar | editar código-fonte]

O fato fundamental sobre operadores e matrizes diagonalizáveis é expresso pelo seguinte:

Uma matriz A de ordem n×n sobre o corpo F é diagonalizável se, e só se, a soma das dimensões de seus autoespaços é igual a n, o que é o caso se, e somente se, existe uma base de Fⁿ consistindo de autovetores de A. Se tal base for encontrada, pode-se formar a matriz P que tem esses vetores da base como colunas, e P⁻¹AP será uma matriz diagonal. As entradas da diagonal desta matriz são os autovalores de A.
Um operador linear T : V → V é diagonalizável se, e só se, a soma das dimensões de seus autoespaços é igual a dim(V), o que é o caso se, e somente se, existe uma base de V consistindo de autovetores de T. Com respeito a esta base, T será representada por uma matriz diagonal. As entradas da diagonal desta matriz são os autovalores de T.

Outra caracterização: Uma matriz ou operador linear é diagonalizável sobre o corpo F se, e somente se, o seu polinômio minimal é um produto de fatores lineares distintos sobre F. (Colocado de outra forma, uma matriz é diagonalizável se e só se todos os seus divisores elementares são lineares.)

A seguinte condição suficiente (mas não necessária) muitas vezes é útil.

Uma matriz A de ordem n×n é diagonalizável sobre o corpo F se ela tem n autovalores distintos em F, ou seja, se o seu polinômio característico tem n raízes distintas em F; no entanto, a recíproca pode ser falsa. Considere, por exemplo,
${\begin{bmatrix}-1&3&-1\\-3&5&-1\\-3&3&1\end{bmatrix}},$
que tem autovalores 1, 2, 2 (não todos distintos) e é diagonalizável com forma diagonal (semelhante a A)
${\begin{bmatrix}1&0&0\\0&2&0\\0&0&2\end{bmatrix}}$
e matriz de mudança de base P
${\begin{bmatrix}1&1&-1\\1&1&0\\1&0&3\end{bmatrix}}.$
A recíproca falha quando A tem um autoespaço de dimensão maior do que 1. Neste exemplo, o autoespaço de A associado ao autovalor 2 tem dimensão 2.
Um operador linear T : V → V com n = dim(V) é diagonalizável se ele tem n autovalores distintos, ou seja, se o seu polinômio característico tem n raízes distintas em F.

Seja A uma matriz sobre F. Se A é diagonalizável então o mesmo vale para qualquer potência de A. Por outro lado, se A é invertível, F é algebricamente fechado, e Aⁿ é diagonalizável para algum n que não seja um múltiplo inteiro da característica de F, então A é diagonalizável. Prova: Se Aⁿ é diagonalizável, então A é anulada por algum polinômio $\left(x^{n}-\lambda _{1}\right)\cdots \left(x^{n}-\lambda _{k}\right),$ que não tem raiz múltipla (desde que $\lambda _{j}\neq 0$ ) e é dividido pelo polinômio minimal de A.

Como regra geral, sobre C quase toda matriz é diagonalizável. Mais precisamente: o conjunto das matrizes complexas de ordem n×n que não são diagonalizáveis sobre C, considerado como um subconjunto de C^n×n, tem medida de Lebesgue zero. Pode-se dizer também que as matrizes diagonalizáveis formam um subconjunto denso com respeito à topologia de Zariski: o complemento fica no interior do conjunto em que o discriminante do polinômio característico se anula, o que é uma hipersuperfície. Disso também resulta a densidade na topologia normal (forte) dada por uma norma. O mesmo não é verdade sobre R.

A decomposição de Jordan–Chevalley expressa um operador como a soma de suas partes semisimples (i.é., diagonalizável) e nilpotente. Portanto, uma matriz é diagonalizável se e só se a sua parte nilpotente é zero. Colocado de outra forma, uma matriz é diagonalizável se cada bloco em sua forma de Jordan não tem parte nilpotente; isto é, cada "bloco" é uma matriz um por um.

Diagonalização[editar | editar código-fonte]

Se uma matriz A pode ser diagonalizada, isto é,

P^{-1}AP={\begin{pmatrix}\lambda _{1}&0&\dots &0\\0&\lambda _{2}&\dots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\dots &\lambda _{n}\end{pmatrix}},

então:

AP=P{\begin{pmatrix}\lambda _{1}&0&\dots &0\\0&\lambda _{2}&\dots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\dots &\lambda _{n}\end{pmatrix}}.

Escrevendo P como uma matriz de blocos de seus vetores coluna ${\vec {\alpha }}_{i}$

P={\begin{pmatrix}{\vec {\alpha }}_{1}&{\vec {\alpha }}_{2}&\cdots &{\vec {\alpha }}_{n}\end{pmatrix}},

a equação acima pode ser reescrita como

A{\vec {\alpha }}_{i}=\lambda _{i}{\vec {\alpha }}_{i}\qquad (i=1,2,\cdots ,n).

Assim, os vetores coluna de P são autovetores à direita de A, e a entrada diagonal correspondente correspondente é o autovalor associado. A invertibilidade de P também sugere que os autovetores são linearmente independentes e formam uma base de Fⁿ. Esta é a condição necessária e suficiente para a diagonabilidade e a abordagem canônica para a diagonalização. Os vetores linha de P⁻¹ são os autovetores à esquerda de A.

Quando uma matriz complexa A^[a] é uma matriz Hermitiana (ou uma matriz real^[b], uma matriz simétrica), podem ser escolhidos autovetores de A para formar uma base ortonormal de ℂⁿ (ou ℝⁿ no caso de uma matriz real). Neste caso, P será uma matriz unitária (respectivamente matriz ortogonal) e P⁻¹ é igual à conjugada transposta de P (se real, então é a transposta de P).

Para a maioria dos trabalhos práticos as matrizes são diagonalizadas numericamente utilizando softwares de computador. Existem muitos algoritmos para fazer isso.

Diagonalização simultânea[editar | editar código-fonte]

Um conjunto de matrizes é dito ser simultaneamente diagonalizável se existe uma única matriz invertível P tal que P⁻¹AP seja uma matriz diagonal para cada A no conjunto. O seguinte teorema caracteriza as matrizes simultaneamente diagonalizáveis: Um conjunto de matrizes diagonalizáveis comutam se, e somente se, o conjunto é simultaneamente diagonalizável.^[2]

O conjunto de todas a matrizes n×n diagonalizáveis (sobre C), com n > 1 não é simultaneamente diagonalizável. Por exemplo, as matrizes

{\begin{bmatrix}1&0\\0&0\end{bmatrix}}\quad {\text{e}}\quad {\begin{bmatrix}1&1\\0&0\end{bmatrix}}

são diagonalizável, mas não simultaneamente diagonalizáveis porque elas não comutam.

Um conjunto é composto de matrizes normais que comutam se, e somente se, ele é simultaneamente diagonalizável por uma matriz unitária; isto é, existe uma matriz unitária U tal que U*AU é diagonal para cada A no conjunto.

Na linguagem da teoria de Lie, um conjunto de matrizes simultaneamente diagonalizáveis gerar uma álgebra de Lie toral.

Exemplos[editar | editar código-fonte]

Matrizes diagonalizáveis[editar | editar código-fonte]

Involuções são diagonalizáveis sobre os reais (e, de fato, sobre qualquer corpo de característica diferente de 2), com ±1 na diagonal.
Endomorfismos de ordem finita são diagonalizáveis sobre C (ou qualquer corpo algebricamente fechado cuja característica não divida a ordem do endomorfismo) com raízes da unidade na diagonal. Isto segue do fato de o polinômio minimal ser separável, porque as raízes da unidade são distintas.
As projeções são diagonalizáveis, com 0s e 1s na diagonal.
Matrizes simétrica reais são diagonalizáveis por matrizes ortogonais, isto é, dada uma matriz simétrica real A, Q^TAQ é diagonal para alguma matriz ortogonal Q. Mais geralmente, as matrizes são diagonalizável por matrizes unitárias se, e somente se, elas são normais. No caso de matrizes reais simétricas, tem-se que A = A^T, então, claramente, vale AA^T = A^TA. Exemplos de matrizes normais são as matrizes simétricas (ou antissimétricas) reais (por exemplo, matrizes de covariância) e as matrizes Hermitianas (ou anti-Hermitianas). Ver teoremas espectrais para generalizações para espaços vetoriais de dimensão infinita.

Matrizes que não são diagonalizáveis[editar | editar código-fonte]

Em geral, uma matriz de rotação não é diagonalizável sobre os reais, mas todas as matrizes de rotação são diagonalizáveis sobre o corpo dos complexos. Mesmo se uma matriz não é diagonalizável, é sempre possível "fazer o melhor possível", e encontrar uma matriz com as mesmas propriedades consistindo de autovalores na diagonal principal, e uns ou zeros no diagonal imediatamente acima – conhecida como forma normal de Jordan.

Algumas matrizes não são diagonalizáveis sobre qualquer corpo, mais notavelmente as matrizes nilpotentes não nulas. Isso acontece mais geralmente se as multiplicidades algébrica e geométrica de um autovalor não coincidem. Por exemplo, considere

C={\begin{bmatrix}0&1\\0&0\end{bmatrix}}.

Esta matriz não é diagonalizável: não há matriz U tal que U⁻¹CU seja uma matriz diagonal. De fato, C tem um autovalor (a saber, o zero) e este autovalor tem multiplicidade algébrica 2 e multiplicidade geométrica 1.

Algumas matrizes reais não são diagonalizáveis sobre os reais. Considere, por exemplo, a matriz

B={\begin{bmatrix}0&1\\-1&0\end{bmatrix}}.

A matriz B não tem quaisquer autovalores reais, portanto, não há uma matriz real Q tal que Q⁻¹BQ seja uma matriz diagonal. No entanto, podemos diagonalizar B se permitirmos números complexos. De fato, se tomarmos

Q={\begin{bmatrix}1&{\textrm {i}}\\{\textrm {i}}&1\end{bmatrix}},

então Q⁻¹BQ é diagonal. É fácil descobrir que B é a matriz de rotação que gira no sentido anti-horário pelo ângulo $θ$ = 3 $π$ /2

Observe que os exemplos acima mostram que a soma de matrizes diagonalizáveis não precisa ser diagonalizável.

Como diagonalizar uma matriz[editar | editar código-fonte]

Considere uma matriz

A={\begin{bmatrix}1&2&0\\0&3&0\\2&-4&2\end{bmatrix}}.

Esta matriz tem autovalores

\lambda _{1}=3,\quad \lambda _{2}=2,\quad \lambda _{3}=1.

A é uma matriz 3×3 com 3 autovalores diferentes; portanto, ela é diagonalizável. Observe que, se existem exatamente n autovalores distintos de uma matriz n×n, então, esta matriz é diagonalizável.

Estes valores são os valores que aparecem na forma diagonalizada da matriz A, então, encontrando-se os autovalores de A, faz-se a sua diagonalização. Poderíamos parar por aqui, mas é uma boa verificação usar os autovetores para diagonalizar A.

Os autovetores de A são

v_{1}={\begin{bmatrix}-1\\-1\\2\end{bmatrix}},\quad v_{2}={\begin{bmatrix}0\\0\\1\end{bmatrix}},\quad v_{3}={\begin{bmatrix}-1\\0\\2\end{bmatrix}}.

Pode-se facilmente verificar que $Av_{k}=\lambda _{k}v_{k}.$

Agora, seja P a matriz que tem estes autovetores como suas colunas:

P={\begin{bmatrix}-1&0&-1\\-1&0&0\\2&1&2\end{bmatrix}}.

Observe que não há nenhuma ordem de preferência para os autovetores em P; alterando a ordem dos autovetores em P apenas muda a ordem dos autovalores na forma diagonalizada de A.^[3]

Então, P diagonaliza A, como pode ser confirmado por um simples cálculo, tendo calculado P^-1 por qualquer método apropriado:

P^{-1}AP={\begin{bmatrix}0&-1&0\\2&0&1\\-1&1&0\end{bmatrix}}{\begin{bmatrix}1&2&0\\0&3&0\\2&-4&2\end{bmatrix}}{\begin{bmatrix}-1&0&-1\\-1&0&0\\2&1&2\end{bmatrix}}={\begin{bmatrix}3&0&0\\0&2&0\\0&0&1\end{bmatrix}}.

De fato, isto resulta abstratamente do fato de que, para a base canônica $e_{1},e_{2},e_{3}$ tem-se

P^{-1}APe_{k}=P^{-1}Av_{k}=P^{-1}\lambda _{k}v_{k}=\lambda _{k}e_{k}.

em que usado o fato de que $Pe_{k}=v_{k}$ é a k-ésima coluna de $P$ e, portanto, $P^{-1}v_{k}=e_{k}.$ Note que os autovalores $\lambda _{k}$ aparecem na matriz diagonal.

Uma aplicação[editar | editar código-fonte]

A diagonalização pode ser usada para calcular as potências de uma matriz A de forma eficiente, desde que a matriz seja diagonalizável. Suponha que tenha sido encontrado que

P^{-1}AP=D\Rightarrow PP^{-1}APP^{-1}=PDP^{-1}\Rightarrow A=PDP^{-1}

em que $D$ é uma matriz diagonal. Então, como o produto matricial é associativo,

{\begin{aligned}A^{k}&=\left(PDP^{-1}\right)^{k}=\left(PDP^{-1}\right)\cdot \left(PDP^{-1}\right)\cdots \left(PDP^{-1}\right)\\&=PD\left(P^{-1}P\right)D\left(P^{-1}P\right)\cdots \left(P^{-1}P\right)DP^{-1}\\&=PD^{k}P^{-1}\end{aligned}}

e esta última expresso é fácil de calcular, pois envolve apenas as potências de uma matriz diagonal. Esta abordagem pode ser generalizada para a exponencial matricial e outras funções matriciais que podem ser definidas como séries de potências.

Isto é particularmente útil para encontrar expressões de forma fechada para os termos de sequências recursivas lineares, tais como os números de Fibonacci.

Aplicação particular[editar | editar código-fonte]

Por exemplo, considere a seguinte matriz:

M={\begin{bmatrix}a&b-a\\0&b\end{bmatrix}}.

O cálculo das diferentes potências de M revela um padrão surpreendente:

M^{2}={\begin{bmatrix}a^{2}&b^{2}-a^{2}\\0&b^{2}\end{bmatrix}},\quad M^{3}={\begin{bmatrix}a^{3}&b^{3}-a^{3}\\0&b^{3}\end{bmatrix}},\quad M^{4}={\begin{bmatrix}a^{4}&b^{4}-a^{4}\\0&b^{4}\end{bmatrix}},\quad \ldots

O fenômeno acima pode ser explicado pela diagonalização de M. Para fazer isso, é preciso uma base do R² que consista de autovetores de M. Uma tal base de autovetores é dada por

\mathbf {u} ={\begin{bmatrix}1\\0\end{bmatrix}}=\mathbf {e} _{1},\quad \mathbf {v} ={\begin{bmatrix}1\\1\end{bmatrix}}=\mathbf {e} _{1}+\mathbf {e} _{2},

em que e_i denota a base canônica de Rⁿ. A mudança de base inverso é dada por

\mathbf {e} _{1}=\mathbf {u} ,\qquad \mathbf {e} _{2}=\mathbf {v} -\mathbf {u} .

Cálculos diretos mostram que

M\mathbf {u} =a\mathbf {u} ,\qquad M\mathbf {v} =b\mathbf {v} .

Assim, a e b são os autovalores correspondentes a u e v, respectivamente. Pela linearidade da multiplicação de matrizes, tem-se que

M^{n}\mathbf {u} =a^{n}\,\mathbf {u} ,\qquad M^{n}\mathbf {v} =b^{n}\,\mathbf {v} .

Voltando para a base canônica, tem-se

{\begin{aligned}M^{n}\mathbf {e} _{1}&=M^{n}\mathbf {u} =a^{n}\mathbf {e} _{1},\\M^{n}\mathbf {e} _{2}&=M^{n}\left(\mathbf {v} -\mathbf {u} \right)=b^{n}\mathbf {v} -a^{n}\mathbf {u} =\left(b^{n}-a^{n}\right)\mathbf {e} _{1}+b^{n}\mathbf {e} _{2}.\end{aligned}}

As relações anteriores, expressas na forma matricial, são

M^{n}={\begin{bmatrix}a^{n}&b^{n}-a^{n}\\0&b^{n}\end{bmatrix}},

explicando assim o fenômeno acima.

Aplicação a mecânica quântica[editar | editar código-fonte]

Nos cálculos da mecânica quântica e da química quântica a diagonalização de matrizes é um dos processos numéricos aplicados mais frequentemente. O motivo básico é que a equação de Schrödinger independente do tempo é uma equação de autovalores, embora na maioria das situações físicas em um espaço de dimensão infinita (um espaço de Hilbert).

Uma forma aproximada muito comum é obtida truncando o espaço de Hilbert para uma dimensão finita, depois do que a equação de Schrödinger pode ser formulada como um problema de autovalores de uma matriz real simétrica, ou Hermitiana complexa. Formalmente, esta aproximação é baseada no princípio variacional, válido para Hamiltonianos que são limitados inferiormente.

A teoria de perturbações de primeira ordem também levam a problemas de autovalores de matrizes para estados degenerados.

Ver também[editar | editar código-fonte]

Matriz defectiva
Escalonamento
Matriz triangular
Operador semissimples
Grupo diagonalizável
Forma canônica de Jordan
Módulo de peso – generalização em álgebras associativas
Diagonalização ortogonal

Notas[editar | editar código-fonte]

↑ A em ℂ^n×n
↑ A em ℝ^n×n

Referências[editar | editar código-fonte]

↑
Horn & Johnson, 1985
↑
Horn & Johnson, 1985, pp. 51-53
↑ Anton, H.; Rorres, C. (22 de fevereiro de 2000). Elementary Linear Algebra (Applications Version). [S.l.: s.n.] ISBN 978-0-471-17052-5

Horn, Roger A.; Johnson, Charles R. Matrix Analysis. [S.l.: s.n.] ISBN 978-0-521-38632-6

Ligações externas[editar | editar código-fonte]

Diagonalization, PlanetMath.org.

[2] A em ℂ^n×n

[3] A em ℝ^n×n

[1] 
Horn & Johnson, 1985

[4] 
Horn & Johnson, 1985, pp. 51-53

[5] Anton, H.; Rorres, C. (22 de fevereiro de 2000). Elementary Linear Algebra (Applications Version). [S.l.: s.n.] ISBN 978-0-471-17052-5

[1]

[a]

[b]

[2]

[3]