Teste de Kruskal-Wallis

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa
Text document with red question mark.svg
Este artigo ou secção contém uma ou mais fontes no fim do texto, mas nenhuma é citada no corpo do artigo, o que compromete a confiabilidade das informações. (desde fevereiro de 2014)
Por favor, melhore este artigo introduzindo notas de rodapé citando as fontes, inserindo-as no corpo do texto quando necessário.

Em estatística, o teste de Kruskal-Wallis (nomeado após William Kruskal e W. Allen Wallis) é um método não paramétrico usado para testar se um conjunto de amostras provêm da mesma distribuição, sendo uma extensão do teste U de Mann–Whitney para mais de duas amostras. Ele é usado para testar a hipótese nula de que todas as populações possuem funções de distribuição iguais contra a hipótese alternativa de que ao menos duas das populações possuem funções de distribuição diferentes.

O equivalente paramétrico ao teste de Kruskal-Wallis é o teste F utilizado na ANOVA 1 fator. Enquanto a análise de variância dos testes depende da hipótese de que todas as populações em confronto são independentes e normalmente distribuídas, o teste de Kruskal-Wallis não coloca nenhuma restrição sobre a comparação. Quando o teste de Kruskal-Wallis conduz a resultados significativos, então pelo menos umas das amostras é diferente das restantes. O teste não identifica onde ocorrem e quantas são as diferenças.

Método[editar | editar código-fonte]

  1. A estatística é dada por: K = (N-1)\frac{\sum_{i=1}^g n_i(\bar{r}_{i\cdot} - \bar{r})^2}{\sum_{i=1}^g\sum_{j=1}^{n_i}(r_{ij} - \bar{r})^2}, onde:
    • n_{i} é o número de observações no grupo i
    • r_{ij} é a classificação (entre todas as observações) de observação j no grupo i
    • N é o número total de observações em todos os grupos
    • \bar{r}_{i\cdot} = \frac{\sum_{j=1}^{n_i}{r_{ij}}}{n_i},
    • \bar{r} =(N+1)/2 é a média de r_{ij}.
      Note que o denominador da expressão K é exatamente \frac{(N-1)N(N+1)}{12}. LogoK = \frac{12}{N(N+1)}\sum_{i=1}^g n_i(\bar{r}_{i\cdot} - \bar{r})^2.
  2. Você pode fazer uma correção para valores repetidos, dividindo K por 1 - \frac{\sum_{i=1}^G (t_{i}^3 - t_{i})}{N^3-N}, onde G é o número de grupos de diferentes intervalos de repetição e t_{i} é o número de observações repetidas dentro do grupo i por ter repetido as observações para um determinado valor. Esta correção faz mudançaK muito pequena a menos que exista um grande número de medições repetidas.
  3. Finalmente, o valor p é aproximado por \Pr(\chi^2_{g-1} \ge K). Se algum n_{i} é menor (<5) a Distribuição de probabilidade de K não pode ser definida pela Distribuição Chi-quadrado.

Ver também[editar | editar código-fonte]

Referências

  • William H. Kruskal and W. Allen Wallis. Uso de fileiras em análise de variância com um critério. Journal of the American Statistical Association 47 (260): 583–621, Dezembro de 1952.
  • Sidney Siegel and N. John Castellan, Jr. (1988). Nonparametric Statistics for the Behavioral Sciences (second edition). New York: McGraw-Hill.
  • Este artigo foi inicialmente traduzido do artigo da Wikipédia em inglês, cujo título é «Kruskal–Wallis one-way analysis of variance».
Ícone de esboço Este artigo sobre matemática é um esboço. Você pode ajudar a Wikipédia expandindo-o.