Quarteto de Anscombe

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa
Todos os quatro conjunto de dados são idênticos quando examinado usando estatística básica, mas variam consideravelmente quando graficados.

Quarteto de Anscombe é o nome dado a quatro conjuntos de dados que aparentam ser idênticos quando descritos por certas técnicas de estatística descritiva (como a média e a variância), mas que são muito distintos quando exibidos graficamente. Ele leva o nome do estatístico F.J. Anscombe que o publicou pela primeira vez em 1973[1] , com o objetivo de demonstrar tanto a importância de se visualizar os dados antes de analisá-los quanto o efeito dos outliers nas propriedades estatísticas.

Para os quatro conjunto de dados:

Propriedade Valor
Média de x em cada caso 9 (exato)
Variância de x em cada caso 11 (exato)
Média de y em cada caso 7,50 (em até duas casas decimais)
Variância de y em cada caso 4,122 ou 4,127 (em até 3 casas decimais)
Correlação entre x e y em cada caso 0,816 (em até 3 casas decimais)
Linha de regressão linear em cada caso y=3,00 + 0,500x (em até 2 e 3 casas decimais, respectivamente)

Referências

  1. F.J. Anscombe, "Graphs in Statistical Analysis," American Statistician, 27 (February 1973), 17-21.