Teste Kolmogorov-Smirnov

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa
Question book.svg
Este artigo não cita fontes fiáveis e independentes. (desde Março de 2012). Por favor, adicione referências e insira-as corretamente no texto ou no rodapé. Conteúdo sem fontes poderá ser removido.
Encontre fontes: Google (notícias, livros e acadêmico)

Em estatística, o teste Kolmogorov-Smirnov é usado para determinar se duas distribuições de probabilidade subjacentes diferem uma da outra ou se uma das distribuições de probabilidade subjacentes difere da distribuição em hipótese, em qualquer dos casos com base em amostras finitas.

O nome é uma referência aos matemáticos russos Andrey Kolmogorov e Vladimir Ivanovich Smirnov.

A função distribuição acumulada Fn para n observações yi é definida por

F_n(x)={1 \over n}\sum_{i=1}^n \left\{\begin{matrix}1 & \mathrm{if}\ y_i\leq x, \\ 0 & \mbox{caso contrario}.\end{matrix}\right.

As duas estatísticas de teste Kolmogorov-Smirnov de apenas um lado são dadas por

D_n^{+}=\max(F_n(x)-F(x))\,
D_n^{-}=\max(F(x)-F_n(x))\,

onde F(x) é a distribuição em hipótese ou outra distribuição empírica. As distribuições de probabilidade destas duas estatísticas, dado que a hipótese nula de igualdade das distribuições é verdadeira, não depende daquilo que a distribuição em hipótese é, desde que ela seja contínua. Donald Knuth faz uma descrição detalhada de como analisar a significância deste par de estatísticas. Muitas pessoas usam max(Dn+, Dn) alternativamente, mas a distribuição desta estatística é de uso mais difícil.

Notar que quando a variável independente subjacente é cíclica, como em dias da semana, então o teste de Kuiper é mais apropriado.

Note-se ainda que o teste Kolmogorov-Smirnov é mais sensível em pontos próximos da mediana da distribuição do que nas caudas. O teste Anderson-Darling é um teste que providencia igual sensibilidade nas caudas.

Pacotes estatísticos[editar | editar código-fonte]