Hessiano
Em matemática, a matriz Hessiana de uma função "f" de n variáveis é a matriz quadrada com "n" colunas e "n" linhas (n X n) das derivadas parciais de segunda ordem da função. Por isto, esta matriz descreve a curvatura local da função "f". Matrizes Hessianas são usadas em larga escala em problemas de otimização que não usam métodos Newtonianos.
A matriz hessiana foi desenvolvida no século XIX pelo alemão Ludwig Otto Hesse, razão porque mais tarde James Joseph Sylvester lhe deu este nome. O próprio Hesse, ao contrário, usava o termo "determinantes funcionais".
Índice |
Definição formal em termos matemáticos [editar]
Dada uma função real de n variáveis reais
, sendo que x (em negrito) indica o vetor de dimensão nX1 das variáveis
.
Lembre-se da notação para as derivadas parciais da função em relação às variáveis:
| Em linguagem matemática | Em Português | Exemplo: função com n=2: ![]() |
|---|---|---|
![]() |
derivada parcial de primeira ordem da função "f" em relação a uma variável ![]() |
![]() |
![]() |
A derivada da derivada (=derivada de segunda ordem): primeiro tomou-se a derivada da função "f" em relação à variável e depois derivou-se esta derivada em relação à variável 1 . |
![]() ![]() ![]() |
Se todas as derivadas parciais de "f" existirem, então a matriz hessiana de f é a matriz quadrada das derivadas de segunda ordem de f:2
Uma outra definição equivalente é: dado o vetor gradiente nX1, a matriz hessiana é sua derivada3 . Por isso, há outras representações para a mesma matriz hessiana H acima:
Propriedades da matriz hessiana [editar]
- Dimensão:Como uma função com "n" variáveis tem n2 derivadas parciais de segunda ordem, a matriz hessiana também terá n2 elementos. Por isto, ela sempre será uma matriz quadrada de dimensão nXn.
- Fora da diagonal principal, uma matriz hessiana é composta por derivadas mistas de f.
- Simetria: Se as "segundas derivadas" de f são todas contínuas em uma região dada
, consequentemente a hessiana de f é uma matriz simétrica em cada ponto de
, dado que, pelo teorema de Young6 e pelo teorema de Schwartz, nestes casos a ordem de diferenciação não importa (veja, a este respeito, simetria da segunda derivada e Teorema de Schwartz):
Para variáveis genéricas xi e xj, esta igualdade pode ser rescrita como:
Pontos Críticos e Discriminante [editar]
Se o gradiente da função f é zero em um ponto x que pertence ao domínio da função, então f em x possui um ponto crítico. O determinante do hessiano em x é chamado de discriminante em x. Se este determinante for zero, x será chamado de ponto crítico degenerado de f. Do contrário, o ponto não será degenerado.
Concavidade de funções [editar]
A matriz hessiana é útil para identificar a concavidade de funções duas vezes diferenciáveis. Seja
uma função de n variáveis com derivadas parciais de primeira e segunda ordem contínuas em um conjunto convexo aberto S.
- A função é côncava (e portanto semicôncava também) se e somente se a matriz hessiana for semidefinida negativa
- Se a matriz hessiana for é definida negativa, então a função é estritamente côncava. Isso não significa, no entanto, que se a função for estritamente côncava, então H(f) é negativa definida para todo x pertencente a S 7 .
- Se a matriz hessiana for é definida positiva, então a função é estritamente convexa
- A função é convexa se a matriz hessiana é semidefinida positiva
| Propriedade da função | Propriedade da matriz hessiana | |||
|---|---|---|---|---|
| Semidefinida | Definida | |||
| Positiva | Negativa | Positiva | Negativa | |
| Função côncava (e portanto também quasicôncava) | X | |||
| Função convexa | X | |||
| Função estritamente côncava | X | |||
| Função estritamente convexa | X | |||
Exemplo simples: como encontrar a matriz hessiana [editar]
Considere a função
definida no conjunto de todos os pares de números. Sua matriz hessiana é:
= 
que é uma matriz negativa semidefinida, portanto f é côncava. note que neste caso o Hessiano não depende de x e y, mas em geral depende7 .
Uso da matriz hessiana para caracterizar pontos críticos [editar]
Dada a função
, a condição necessária para que um determinado ponto
seja um ponto crítico é que todas as derivadas parciais, calculadas naquele ponto específico, sejam iguais a zero6 . No entanto, para definir se este ponto crítico é um ponto de máximo, mínimo ou de sela, é preciso calcular o determinante da matriz hessiana e seus menores principais. Para isso, pode-se seguir os seguintes passos:
- Calcular as "n" derivadas de primeira ordem da função f. O resultado serão "n" funções das variáveis do vetor n × 1
. - Igualar cada uma das "n" funções do item 1 a zero. Com isso, serão descobertos valores para cada uma das variáveis
. Chamaremos estes valores, cujas coordenadas compõem o ponto crítico, de
. Igualmente, o vetor nX1 destes valores (números) será chamado de
. Reservar este ponto crítico. - A partir das derivadas de primeira ordem calculadas no item 1, calcular as derivadas de segunda ordem da função f e montar a matriz hessiana nXn. Notar que é possível que muitos elementos desta matriz sejam função das variáveis
. - Substitua as variáveis
, presentes na matriz hessiana montada no item 3, pelos valores correspondentes do ponto crítico, ou seja, pelos valores do vetor
. A matriz resultante não terá mais variáveis, somente números. Por exemplo, a derivada da função f em relação à variável
, por sua vez derivada em relação à variável
, calculada para o vetor
, será representado por
e significa um número. - A partir da matriz resultante do item 4, calcular os menores principais. Os resultados serão números.
,

- ...
=determinante da matriz hessiana calculada no item 4.
- Verificar o sinal dos menores principais do item 58 :
Condição A matriz H O ponto crítico 

É positiva definida É ponto de mínimo. 
É negativa definida É ponto de máximo.
Ver também [editar]
Notas [editar]
- ↑ SIMON & BLUME (2004), p. 339.
- ↑ SIMON & BLUME (2004), p. 340.
- ↑ INTRILIGATOR (1971), p. 498.
- ↑ INTRILIGATOR (1971), p. 499.
- ↑ MAS-COLELL, Andreu; WHINSTON, Michael D, e GREEN, Jerry R. Microeconomic Theory. Oxford University press, 1995. ISBN-13 978-0-19-507340-9. Mathematiocal Appendix, "M.A Matrix Notation for Derivatives", p. 927.
- ↑ a b CHIANG (1984), p. 332.
- ↑ a b Concave and convex functions of many variables. Disponível em: <http://www.economics.utoronto.ca/osborne/MathTutorial/CVN.HTM#p:CcvConds>. Acesso em 10 de abril de 2011.
- ↑ CHIANG (1984), p. 333.
Referências [editar]
- SIMON, Carl P., e BLUME, Lawrence. Mátemática para economistas. Porto Alegre: Bookman, 2004. Reimpressão 2008. ISBN 978-85-363-0307-9.
- INTRILIGATOR, Michael D. Mathematical Optimization and Economic Theory. 1971, Prentice-Hall. Inc. Englewood Cliffs, N.J. printed in the United states of America 13-561753-7. Library of Congress Catalog Card Number: 72-127059. Appendix B, "Matrices".
- CHIANG, Alpha C. Fundamental Methods in Mathematical Economics. 3ª edição. McGraw-Hill, Inc. 1984. ISBN 0-07-010813-7. Seção 11.4, "Objective functions with more than two variables".
, sendo que x (em negrito) indica o
.








![H \left [ f({x_1}, {x_2}, {x_3}, ..., x_n) \right] = \begin{bmatrix}
\frac{\partial^2 f}{\partial {x_1}^2} & \frac{\partial^2 f}{\partial {x_1}\,\partial {x_2}} & \cdots & \frac{\partial^2 f}{\partial {x_1}\,\partial x_n} \\ \\
\frac{\partial^2 f}{\partial {x_2}\,\partial {x_1}} & \frac{\partial^2 f}{\partial {x_2}^2} & \cdots & \frac{\partial^2 f}{\partial {x_2}\,\partial x_n} \\ \\
\vdots & \vdots & \ddots & \vdots \\ \\
\frac{\partial^2 f}{\partial x_n\,\partial {x_1}} & \frac{\partial^2 f}{\partial x_n\,\partial {x_2}} & \cdots & \frac{\partial^2 f}{\partial x_n^2}
\end{bmatrix}](http://upload.wikimedia.org/math/4/f/9/4f92bd87be0404fb87b8751795f88669.png)
![H=D \left [\nabla f \left ( \mathbf{x} \right ) \right ] =D^2f_\mathbf{x}=D^2f \left ( \mathbf{x} \right )=\frac{\partial^2 f}{\partial (\mathbf{x})}(\mathbf{x})](http://upload.wikimedia.org/math/7/3/a/73a16cdc7481259cb1117947d00bcc6b.png)
, consequentemente a hessiana de f é uma


= 
.
. Chamaremos estes valores, cujas coordenadas compõem o
. Igualmente, o
. Reservar este
.
, presentes na
. A
, será representado por
e significa um
,

=determinante da 
