Quarteto de Anscombe
Origem: Wikipédia, a enciclopédia livre.
Quarteto de Anscombe é o nome dado a quatro conjuntos de dados que aparentam ser idênticos quando descritos por certas técnicas de estatística descritiva (como a média e a variância), mas que são muito distintos quando exibidos graficamente. Ele leva o nome do estatístico F.J. Anscombe que o publicou pela primeira vez em 19731 , com o objetivo de demonstrar tanto a importância de se visualizar os dados antes de analisá-los quanto o efeito dos outliers nas propriedades estatísticas.
Para os quatro conjunto de dados:
| Propriedade | Valor |
|---|---|
| Média de x em cada caso | 9 (exato) |
| Variância de x em cada caso | 11 (exato) |
| Média de y em cada caso | 7,50 (em até duas casas decimais) |
| Variância de y em cada caso | 4,122 ou 4,127 (em até 3 casas decimais) |
| Correlação entre x e y em cada caso | 0,816 (em até 3 casas decimais) |
| Linha de regressão linear em cada caso | (em até 2 e 3 casas decimais, respectivamente) |
Referências
- ↑ F.J. Anscombe, "Graphs in Statistical Analysis," American Statistician, 27 (February 1973), 17-21.
(em até 2 e 3 casas decimais, respectivamente)