Teste de Wilcoxon

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

O teste de Wilcoxon ou teste dos postos sinalizados de Wilcoxon é um teste de hipóteses não paramétrico utilizado quando se deseja comparar duas amostras relacionadas, amostras emparelhadas ou medidas repetidas em uma única amostra para avaliar se os postos médios populacionais diferem (i.e. é um teste de diferenças pareadas). Pode ser usado como uma alternativa ao teste t de Student, teste t para pares correspondentes ou o teste t para amostras dependentes quando não se pode assumir que a população é normalmente distribuída.[1] Um teste dos postos sinalizados de Wilcoxon é um teste não paramétrico que pode ser usado para determinar se duas amostras dependentes foram selecionadas a partir de populações que têm a mesma distribuição. Um teste da soma dos postos de Wilcoxon é um teste não paramétrico que pode ser usado para determinar se duas amostras independentes foram selecionadas a partir de populações que têm a mesma distribuição.

História[editar | editar código-fonte]

O teste é nomeado para Frank Wilcoxon (1892-1965), que em um único papel propôs o teste de soma dos postos para duas amostras independentes (Wilcoxon, 1945).[2] O teste foi popularizado por Sidney Siegel (1956) em seu influente livro sobre estatística não-paramétrica.[3] Siegel usou o símbolo para um valor relacionado, mas não igual a . Em consequência, o teste é por vezes referido como o teste T de Wilcoxon e o teste estatístico é relatado como um valor de .

Pressupostos[editar | editar código-fonte]

  1. Os dados são pareados e provêm da mesma população;
  2. Cada par é escolhido aleatoriamente e de forma independente;
  3. Os dados são medidos pelo menos em uma escala ordinal (i.e., eles não podem ser nominais).

Procedimentos do teste[editar | editar código-fonte]

Seja  o tamanho da amostra, i.e., o número de pares. Assim, há um total de pontos de dados. Para os pares , e indicam as medidas.

: A diferença entre os pares segue uma distribuição simétrica em torno de zero;
: A diferença entre os pares não segue uma distribuição simétrica em torno de zero.
  1. Para , calcule  e, onde  é a função sinal.
  2. Exclua os pares com . Seja  o tamanho da amostra reduzida.
  3. Ordene os  pares remanescentes da menor diferença absoluta para a maior diferença absoluta, .
  4. Atribua postos aos pares, começando com o menor como 1. Valores repetidos recebem um posto igual a média dos postos que eles abrangem. Seja  denotando o posto do par i.
  5. Calcule o teste estatístico 
    , a soma dos postos sinalizados.
  6. Sob a hipótese nula,  segue uma distribuição específica sem uma expressão simples. Esta distribuição tem um valor esperado valor esperado de 0 e uma variância de .
     pode ser comparado com um valor crítico da tabela de referência.[1]
    O teste bicaudal consiste em rejeitar  se .
  7. Conforme  aumenta, a distribuição amostral de  converge a uma distribuição normal. Portanto, 
    Para , um valor-z pode ser calculado como .
    Em um teste bicaudal, rejeita-se  se .
    Alternativamente, testes monocaudais podem ser feitos tanto com a distribuição exata quanto com a aproximada. p-valores também podem ser calculados.

Teste Original[editar | editar código-fonte]

A proposta original de Wilcoxon utilizava uma estatística diferente. Denotado por Siegel como a estatística , é a menor das duas somas de postos de sinal dado; no exemplo dado abaixo, portanto, será igual a . Valores baixos de são necessários para a significância. Como será óbvio a partir do exemplo abaixo, é mais fácil de calcular a mão do que e o teste é equivalente ao teste bicaudal descrito acima; no entanto, a distribuição da estatística sob tem de ser ajustada.

Exemplo[editar | editar código-fonte]

1 125 110 1 15
2 115 122  –1 7
3 130 125 1 5
4 140 120 1 20
5 140 140 0
6 115 124  –1 9
7 140 123 1 17
8 125 137  –1 12
9 140 135 1 5
10 135 145  –1 10
ordene por diferenças absolutas
5 140 140 0
3 130 125 1 5 1.5 1.5
9 140 135 1 5 1.5 1.5
2 115 122  –1 7 3  –3
6 115 124  –1 9 4  –4
10 135 145  –1 10 5  –5
8 125 137  –1 12 6  –6
1 125 110 1 15 7 7
7 140 123 1 17 8 8
4 140 120 1 20 9 9
é a função sinal,  é o valor absoluto e é o posto. Observe que os pares 3 e 9 são iguais em valor absoluto. Eles estariam classificados como 1 e 2, então cada um recebe a média desses postos, 1.5.
,
Rejeita-se .

Implementações[editar | editar código-fonte]

  • ALGLIB inclui a implementação do teste de Wilcoxon em C++, C#, Delphi, Visual Basic, etc;
  • O software estatístico livre R inclui uma implementação de teste como wilcox.test(x,y, paired=TRUE), onde x e y são vetores de mesmo comprimento;[4]
  • GNU Octave implementa várias versões mono e bicaudais do teste na função wilcoxon_test;
  • SciPy inclui uma implementação do teste de Wilcoxon em Python;
  • Acord.NET inclui uma implementação do teste de Wilcoxon em C# para aplicações .NET.

Veja também[editar | editar código-fonte]

  • Teste de Mann–Whitney-Wilcoxon (o teste variante para duas amostras independentes)
  • Teste de sinal (Como o teste de Wilcoxon, mas sem a suposição de distribuição simétrica das diferenças em torno da mediana, e sem usar a magnitude da diferença)

Referências[editar | editar código-fonte]

  1. a b Lowry, Richard. «Concepts & Applications of Inferential Statistics». Consultado em 19 de maio de 2017 
  2. Wilcoxon, Frank (1945). «Individual comparisons by ranking methods» (PDF). Biometrics Bulletin. 1 (6): 80-83 
  3. Siegel, Sidney. Non-parametric statistics for the behavioral sciences. Nova Iorque: McGraw-Hill. pp. 75–83 
  4. Dalgaard, Peter (2008). Introductory Statistics with R. [S.l.]: Springer Science & Business Media. pp. 99–100. ISBN 978-0-387-79053-4