Paradoxo de Simpson

O paradoxo de Simpson (ou reversão de Simpson, efeito Yule-Simpson, paradoxo de amalgamação ou paradoxo de reversão ^[1]) é um fenômeno em probabilidade e estatística, em que uma tendência aparece em diversos grupos de dados, mas desaparece ou reverte quando esses grupos são combinados.

Este tipo de resultado é encontrado frequentemente em análises estatísticas de pesquisas tanto em ciências sociais quanto ciências médicas^[2]^[3]^[4] e é particularmente problemático quando dados de frequência são interpretados como causais.^[5] O paradoxo pode ser resolvido quando relações causais são abordadas apropriadamente na modelagem estatística.^[5]^[6] Ele é usado para tentar informar o público não especialista sobre os enganos causados por aplicação errônea da estatística.^[7]^[8] Martin Gardner escreveu um relato popular sobre o paradoxo de Simpson em sua coluna Mathematical Games março de 1976 na revista Scientific American.^[9]

Edward H. Simpson descreveu este fenômeno pela primeira vez em um artigo técnico em 1951,^[10] mas os estatísticos Karl Pearson et al., em 1899,^[11] e Udny Yule, em 1903,^[12] já haviam mencionado efeitos semelhantes anteriormente. O nome paradoxo de Simpson foi introduzido por Colin R. Blyth em 1972.^[13]

Exemplos[editar | editar código-fonte]

Viés de gênero da Universidade de Berkeley[editar | editar código-fonte]

Um dos exemplos mais conhecidos do paradoxo de Simpson é um estudo de preconceito de gênero entre admissões de pós-graduação na Universidade da Califórnia, em Berkeley. Os números de admissão para o outono de 1973 mostraram que os homens que se candidatavam eram mais propensos do que as mulheres a serem admitidos, e a diferença era tão grande que era improvável que fosse devido ao acaso.^[14]^[15]

	Total		Homens		Mulheres
	Candidatos	Admitido	Candidatos	Admitido	Candidatos	Admitido
Total	12,763	41%	8,442	44%	4,321	35%

Mas ao examinar os departamentos individualmente, seis dos 85 departamentos mostrou um viés estatisticamente contra a admissão de homens, enquanto apenas quatro tinham viés contra mulheres. De fato, os dados agrupados e corrigidos mostraram um “viés pequeno, mas estatisticamente significativo, em favor das mulheres”.^[15] Os dados dos seis maiores departamentos estão listados abaixo:

Departamento	Total		Homens		Mulheres
Departamento	Candidatos	Admitidos	Candidatos	Admitidos	Candidatos	Admitidos
A	933	64%	825	62%	108	82%
B	585	63%	560	63%	25	68%
C	918	35%	325	37%	593	34%
D	792	34%	417	33%	375	35%
E	584	25%	191	28%	393	24%
F	714	6%	373	6%	341	7%
Total	4526	39%	2691	45%	1835	30%
Legenda: A porcentagem de candidatos que admitidos é maior que o outro gênero A quantidade de candidatos é maior que o outro gênero Negrito: Os dois departamentos com mais candidatos de cada gênero

O trabalho de pesquisa de Bickel et al.^[15] concluíram que as mulheres tenderam, nesse caso, a se inscrever em departamentos competitivos com baixas taxas de admissão mesmo entre candidatos qualificados (como no Departamento de Inglês), enquanto os homens tendem a se inscrever em departamentos menos competitivos com altas taxas de admissão entre os candidatos qualificados (como em engenharia e química).

Tratamento de pedra nos rins[editar | editar código-fonte]

Este é um exemplo real de um estudo médico^[16] comparando as taxas de sucesso de dois tratamentos para cálculos renais.^[17]

A tabela abaixo mostra as taxas de sucesso e o número de tratamentos para cálculos renais pequenos e grandes, onde o Tratamento A inclui todos os procedimentos cirúrgicos abertos e o Tratamento B é a nefrolitotomia percutânea (que envolve apenas uma pequena punção). Os números entre parênteses indicam o número de casos de sucesso sobre o tamanho total do grupo.

	Tratamento A	Tratamento B
Pequenas pedras	Grupo 1 93% (81/87)	Grupo 2 87% (234/270)
Pedras grandes	Grupo 3 73% (192/263)	Grupo 4 69% (55/80)
Ambos	78% (273/350)	83% (289/350)

A conclusão paradoxal é que o tratamento A é mais eficaz quando usado em pedras pequenas, e também quando usado em pedras grandes, mas o tratamento B é mais eficaz ao considerar os dois tamanhos ao mesmo tempo. Neste exemplo, a variável “à espreita” (ou variável de confusão) é a gravidade do caso. Há uma tendência dos médicos de favorecer o tratamento B para casos menos graves, e a importância disso que não era previamente conhecida como importante até que seus efeitos fossem incluído.

Qual tratamento é considerado melhor é determinado por uma desigualdade entre duas razões (sucessos / total). A inversão da desigualdade entre as razões, que cria o paradoxo de Simpson, acontece porque dois efeitos ocorrem juntos:

Os tamanhos dos grupos, que são combinados quando a variável oculta é ignorada, são muito diferentes. Os médicos tendem a dar aos casos graves (pedras grandes) o melhor tratamento (A), e os casos mais leves (pedras pequenas) ao tratamento inferior (B). Portanto, os totais são dominados pelos grupos 3 e 2, e não pelos dois grupos muito menores 1 e 4.
A variável oculta tem um grande efeito nas proporções; ou seja, a taxa de sucesso é mais fortemente influenciada pela gravidade do caso do que pela escolha do tratamento. Portanto, o grupo de pacientes com cálculos grandes utilizando o tratamento A (grupo 3) teve pior prognóstico que o grupo com cálculos pequenos (grupos 1 e 2), mesmo quando estes utilizaram o tratamento inferior B (grupo 2).

O paradoxo surge da supressão do efeito causal da gravidade no sucesso do tratamento. O resultado paradoxal pode ser reformulado mais precisamente da seguinte forma: quando o tratamento menos eficaz (B) é aplicado com maior frequência a casos menos graves, pode parecer um tratamento mais eficaz.

Médias de rebatidas[editar | editar código-fonte]

Um exemplo comum do paradoxo de Simpson envolve as médias de rebatidas dos jogadores no beisebol profissional. Um jogador pode ter uma média de rebatidas mais alta que outro a cada ano por vários anos, mas no fim, tenha uma média de rebatidas quando o todo é considerado. Esse fenômeno pode ocorrer quando há grandes diferenças no número de 'at bats' entre os anos. (A mesma situação se aplica ao cálculo das médias de rebatidas para a primeira metade da temporada de beisebol, e durante a segunda metade, e depois combinando todos os dados para a média de rebatidas da temporada.)

Um exemplo real é fornecido por Ken Ross^[18] e envolve a média de rebatidas de dois jogadores de beisebol, Derek Jeter e David Justice , durante os anos de 1995 e 1996: ^[19]

Nos anos de 1995 e 1996, David Justice teve uma média de rebatidas mais alta (em negrito) do que a de Jeter. No entanto, quando as duas temporadas de beisebol são combinadas, Jeter mostra uma média de rebatidas maior do que a de Justice. Segundo Ross, esse fenômeno seria observado aproximadamente uma vez por ano entre possíveis comparações de jogadores de beisebol interessantes.

O paradoxo de Simpson também pode ser ilustrado usando o espaço vetorial bidimensional.^[20] Uma taxa de sucesso de ${\overrightarrow {A}}=(q,p)$ , com uma inclinação de $\textstyle {\frac {p}{q}}$ . Um declive maior, significando uma direção vetorial mais acentuada, representa uma semana com um maior taxa de sucesso. Se duas taxas $\textstyle {\frac {p_{1}}{q_{1}}}$ e $\textstyle {\frac {p_{2}}{q_{2}}}$ são combinados, como acima, o resultado pode ser representado pela soma dos vetores $(q_{1},p_{1})$ e $(q_{2},p_{2})$ , que conforme a regra do paralelogramo é o vetor $(q_{1}+q_{2},p_{1}+p_{2})$ com declive $\textstyle {\frac {p_{1}+p_{2}}{q_{1}+q_{2}}}$ . O paradoxo de Simpson diz que mesmo se um vetor ${\overrightarrow {L_{1}}}$ (em laranja na figura) tem uma inclinação menor do que outro vetor ${\overrightarrow {B_{1}}}$ (em azul) e ${\overrightarrow {L_{2}}}$ tem uma inclinação menor do que ${\overrightarrow {B_{2}}}$ , a soma dos dois vetores ${\overrightarrow {L_{1}}}+{\overrightarrow {L_{2}}}$ pode ainda ter uma inclinação maior do que a soma dos dois vetores ${\overrightarrow {B_{1}}}+{\overrightarrow {B_{2}}}$ , como mostrado no exemplo.

Correlação entre variáveis[editar | editar código-fonte]

O paradoxo de Simpson também pode surgir para correlações. Nesse caso, duas variáveis que aparentam ter (digamos) uma correlação positiva uma com a outra, na verdade têm uma correlação negativa devido a alguma variável de confusão “à espreita”. Berman et al.^[21] fornece um exemplo no contexto da economia, onde um conjunto de dados sugeriria que a demanda total estaria positivamente correlacionada com o preço (ou seja, preços mais altos levam a mais demanda), em contradição com a expectativa. Uma análise detalhada revela que o tempo é a variável de confusão: a plotagem de preço e demanda versus tempo revela a correlação negativa esperada em vários períodos. Se a influência do tempo for ignorada pela simples plotagem da demanda em relação ao preço, a correlação se inverte.

Implicações para tomada de decisão[editar | editar código-fonte]

O significado prático do paradoxo de Simpson fica claro nas situações de tomada de decisão, onde ele apresenta o seguinte dilema: Quais dados devemos consultar ao escolher uma ação, o agregado ou o particionado? No exemplo médico acima, fica claro que se alguém for diagnosticado com “Pedras Pequenas” ou “Pedras Grandes”, os dados para a respectiva subpopulação devem ser consultados e o Tratamento A será preferido ao Tratamento B. Mas e se o tamanho da pedra não é conhecido? Seria apropriado consultar os dados agregados e administrar o Tratamento B? Isso seria contrário ao senso comum; um tratamento que é preferido tanto sob uma condição quanto sob sua negação também deve ser preferido quando a condição é desconhecida.

Por outro lado, se os dados particionados devem ser preferidos a priori, o que impede que alguém particione os dados em subcategorias arbitrárias (digamos, baseadas na cor dos olhos ou na dor pós-tratamento) artificialmente construídas para produzir escolhas erradas de tratamentos? Pearl^[5] mostra que, de fato, em muitos casos, são os dados agregados, não os particionados, que dão a escolha correta da ação. Pior ainda, dada a mesma tabela, às vezes deve-se seguir os dados particionados e, às vezes, agregados, dependendo da história por trás dos dados, com cada história ditando sua própria escolha. Pearl^[5] considera que este é o verdadeiro paradoxo por trás da reversão de Simpson.

Quanto ao porquê e como uma história, e não dados, deve ditar escolhas, a resposta é que é a história que codifica as relações causais entre as variáveis. Uma vez que explicamos essas relações e as representamos formalmente, podemos testar qual partição dá a preferência de tratamento correta. Por exemplo, se representarmos relacionamentos causais em um grafo chamado “diagrama causal” (ver redes bayesianas), podemos testar se os nós que representam a partição proposta interceptam caminhos espúrios no diagrama. Esse teste, chamado de “porta dos fundos” (“backdoor”), reduz o paradoxo de Simpson a um exercício de teoria dos grafos.^[22]

Psicologia[editar | editar código-fonte]

O interesse psicológico no paradoxo de Simpson visa explicar por que as pessoas consideram a reversão de sinais como impossível no início, estranhando a ideia de que uma ação escolhida tanto em uma condição quanto em sua negação, deveria ser rejeitada quando a condição é desconhecida. A questão é de onde as pessoas obtêm essa forte intuição e como ela está codificada na mente.

O paradoxo de Simpson demonstra que essa intuição não pode ser derivada da lógica clássica ou do cálculo de probabilidade. Isso levou os filósofos a especular que ela seria apoiada por uma lógica causal inata que guia as pessoas no raciocínio sobre as ações e suas consequências. O princípio de certeza de Savage^[13] é um exemplo do que tal lógica pode implicar. Uma versão qualificada do princípio de certeza de Savage pode ser derivada do do-calculus de Pearl^[5] e diz: “Uma ação A que aumenta a probabilidade de um evento B em cada subpopulação C_i de C também deve aumentar a probabilidade de B a população como um todo, desde que a ação não altere a distribuição das subpopulações.” Isto sugere que o conhecimento sobre ações e consequências é armazenado em uma forma semelhante à das Redes Bayesianas Causais.

Probabilidade[editar | editar código-fonte]

Um artigo escrito por Pavlides e Perlman apresenta uma prova, que em uma tabela aleatória 2 × 2 × 2 com distribuição uniforme, o paradoxo de Simpson irá ocorrer com uma probabilidade de exatamente ^_1/60. ^[23] Um estudo de Kock sugere que a probabilidade de que o paradoxo de Simpson ocorra aleatoriamente em modelos de trajetória (ou seja, modelos gerados pela análise de trajetória) com dois preditores e uma variável de critério é de aproximadamente 12,8%; ligeiramente maior que 1 ocorrência por 8 modelos de caminho.^[24]

Referências[editar | editar código-fonte]

↑ «The Amalgamation and Geometry of Two-by-Two Contingency Tables». The Annals of Statistics. 15. ISSN 0090-5364. JSTOR 2241334. doi:10.1214/aos/1176350369
↑ «Simpson's Paradox in Real Life». The American Statistician. 36. JSTOR 2684093. doi:10.2307/2684093
↑ Holt, GB (2016). Potencial paradoxo de Simpson em estudo multicêntrico de quimioterapia intraperitoneal para câncer de ovário. Journal of Clinical Oncology, 34 (9), 1016-1016.
↑ «Post-transcriptional regulation across human tissues». PLOS Computational Biology. 13. ISSN 1553-7358. doi:10.1371/journal.pcbi.1005535
↑ ^a ^b ^c ^d ^e Judea Pearl. Causality: Models, Reasoning, and Inference, Cambridge University Press (2000, 2nd edition 2009). ISBN 0-521-77362-8.
↑ Kock, N., & Gaskins, L. (2016). Paradoxo de Simpson, moderação e o surgimento de relações quadráticas em modelos de caminhos: uma ilustração de sistemas de informação. Revista Internacional de Ciência Não Linear Aplicada, 2 (3), 200-234.
↑ Robert L. Wardrop (fevereiro de 1995). "Paradoxo de Simpson e a mão quente no basquete". The American Statistician , 49 (1) : pp. 24–28.
↑ Alan Agresti (2002). "Categorical Data Analysis" (Second edition). John Wiley and Sons ISBN 0-471-36093-7
↑ «MATHEMATICAL GAMES: On the fabric of inductive logic, and some probability paradoxes» (PDF). Scientific American. 234. doi:10.1038/scientificamerican0376-119
↑ «The Interpretation of Interaction in Contingency Tables». Journal of the Royal Statistical Society, Series B. 13
↑ «Genetic (reproductive) selection: Inheritance of fertility in man, and of fecundity in thoroughbred racehorses». Philosophical Transactions of the Royal Society A. 192. doi:10.1098/rsta.1899.0006
↑ «Notes on the Theory of Association of Attributes in Statistics». Biometrika. 2. doi:10.1093/biomet/2.2.121
↑ ^a ^b «On Simpson's Paradox and the Sure-Thing Principle». Journal of the American Statistical Association. 67. JSTOR 2284382. doi:10.2307/2284382
↑ David Freedman, Robert Pisani, and Roger Purves (2007), Statistics (4th edition), W. W. Norton. ISBN 0-393-92972-8.
↑ ^a ^b ^c «Sex Bias in Graduate Admissions: Data From Berkeley» (PDF). Science. 187. PMID 17835295. doi:10.1126/science.187.4175.398
↑ «Comparison of treatment of renal calculi by open surgery, percutaneous nephrolithotomy, and extracorporeal shockwave lithotripsy». Br Med J (Clin Res Ed). 292. PMC 1339981. PMID 3083922. doi:10.1136/bmj.292.6524.879
↑ «Confounding and Simpson's paradox». BMJ. 309. PMC 2541623. PMID 7804052. doi:10.1136/bmj.309.6967.1480
↑ Ken Ross. "A Mathematician at the Ballpark: Odds and Probabilities for Baseball Fans (Paperback)" Pi Press, 2004. ISBN 0-13-147990-3. 12–13
↑ Estatísticas disponíveis em Baseball-Reference.com : Data for Derek Jeter ; Dados para David Justice .
↑ «Proofs without Words: Simpson's Paradox» (PDF). Mathematics Magazine. 74. JSTOR 2691038. doi:10.2307/2691038. Consultado em 30 de março de 2019. Arquivado do original (PDF) em 12 de junho de 2010
↑ Berman, S. DalleMule, L. Greene, M., Lucker, J. (2012), " Paradoxo de Simpson: Um Conto Preventivo em Análises Avançadas ", Significância .
↑ «Understanding Simpson's paradox» (PDF). UCLA Cognitive Systems Laboratory, Technical Report R-414
↑ «How Likely is Simpson's Paradox?». The American Statistician. 63. doi:10.1198/tast.2009.09007
↑ Kock, N. (2015). Qual a probabilidade do paradoxo de Simpson em modelos de caminho? International Journal of e-Collaboration, 11 (1), 1-7.

Ligações externas[editar | editar código-fonte]

Enciclopédia de Stanford da filosofia : " Paradoxo de Simpson " - por Gary Malinas.
Primeiros usos conhecidos de algumas das palavras da matemática: S
- Para uma breve história das origens do paradoxo, veja as entradas "Paradoxo de Simpson" e "Correlação Espúria".
Pearl, Judea , " " A Arte e Ciência de Causa e Efeito. " Uma apresentação de slides e uma palestra tutorial.
Pearl, Judea , "Paradoxo de Simpson: uma anatomia" ( PDF )
Pearl, Judea , "O Princípio da Coisa Certa" ( PDF )
Artigos curtos de Alexander Bogomolny em Cut-the-knot:
- " Frações Mediantes " .
- " Paradoxo de Simpson. "
A coluna do Wall Street Journal "The Numbers Guy"de 2 de dezembro de 2009 tratou de casos recentes do paradoxo de Simpson nas notícias. Notavelmente o paradoxo de Simpson na comparação das taxas de desemprego da recessão de 2009 com a recessão de 1983.
Como resolver o paradoxo de Simpson?pergunta sobre estatísticas Q & A site CrossValidated
At the Plate, um Puzzler Estatístico: Entendendo o Paradoxo de Simpsonpor Arthur Smith, 20 de agosto de 2010
«Simpson's Paradox» (video). YouTube

[1] «The Amalgamation and Geometry of Two-by-Two Contingency Tables». The Annals of Statistics. 15. ISSN 0090-5364. JSTOR 2241334. doi:10.1214/aos/1176350369

[2] «Simpson's Paradox in Real Life». The American Statistician. 36. JSTOR 2684093. doi:10.2307/2684093

[3] Holt, GB (2016). Potencial paradoxo de Simpson em estudo multicêntrico de quimioterapia intraperitoneal para câncer de ovário. Journal of Clinical Oncology, 34 (9), 1016-1016.

[VogelFranks2017-4] «Post-transcriptional regulation across human tissues». PLOS Computational Biology. 13. ISSN 1553-7358. doi:10.1371/journal.pcbi.1005535

[pearl-5] Judea Pearl. Causality: Models, Reasoning, and Inference, Cambridge University Press (2000, 2nd edition 2009). ISBN 0-521-77362-8.

[6] Kock, N., & Gaskins, L. (2016). Paradoxo de Simpson, moderação e o surgimento de relações quadráticas em modelos de caminhos: uma ilustração de sistemas de informação. Revista Internacional de Ciência Não Linear Aplicada, 2 (3), 200-234.

[7] Robert L. Wardrop (fevereiro de 1995). "Paradoxo de Simpson e a mão quente no basquete". The American Statistician , 49 (1) : pp. 24–28.

[8] Alan Agresti (2002). "Categorical Data Analysis" (Second edition). John Wiley and Sons ISBN 0-471-36093-7

[9] «MATHEMATICAL GAMES: On the fabric of inductive logic, and some probability paradoxes» (PDF). Scientific American. 234. doi:10.1038/scientificamerican0376-119

[10] «The Interpretation of Interaction in Contingency Tables». Journal of the Royal Statistical Society, Series B. 13

[11] «Genetic (reproductive) selection: Inheritance of fertility in man, and of fecundity in thoroughbred racehorses». Philosophical Transactions of the Royal Society A. 192. doi:10.1098/rsta.1899.0006

[yule-12] «Notes on the Theory of Association of Attributes in Statistics». Biometrika. 2. doi:10.1093/biomet/2.2.121

[blyth-72-13] «On Simpson's Paradox and the Sure-Thing Principle». Journal of the American Statistical Association. 67. JSTOR 2284382. doi:10.2307/2284382

[freedman-14] David Freedman, Robert Pisani, and Roger Purves (2007), Statistics (4th edition), W. W. Norton. ISBN 0-393-92972-8.

[Bickel-15] «Sex Bias in Graduate Admissions: Data From Berkeley» (PDF). Science. 187. PMID 17835295. doi:10.1126/science.187.4175.398

[16] «Comparison of treatment of renal calculi by open surgery, percutaneous nephrolithotomy, and extracorporeal shockwave lithotripsy». Br Med J (Clin Res Ed). 292. PMC 1339981. PMID 3083922. doi:10.1136/bmj.292.6524.879

[17] «Confounding and Simpson's paradox». BMJ. 309. PMC 2541623. PMID 7804052. doi:10.1136/bmj.309.6967.1480

[18] Ken Ross. "A Mathematician at the Ballpark: Odds and Probabilities for Baseball Fans (Paperback)" Pi Press, 2004. ISBN 0-13-147990-3. 12–13

[19] Estatísticas disponíveis em Baseball-Reference.com : Data for Derek Jeter ; Dados para David Justice .

[20] «Proofs without Words: Simpson's Paradox» (PDF). Mathematics Magazine. 74. JSTOR 2691038. doi:10.2307/2691038. Consultado em 30 de março de 2019. Arquivado do original (PDF) em 12 de junho de 2010

[21] Berman, S. DalleMule, L. Greene, M., Lucker, J. (2012), " Paradoxo de Simpson: Um Conto Preventivo em Análises Avançadas ", Significância .

[pearl-2013-r414-22] «Understanding Simpson's paradox» (PDF). UCLA Cognitive Systems Laboratory, Technical Report R-414

[23] «How Likely is Simpson's Paradox?». The American Statistician. 63. doi:10.1198/tast.2009.09007

[24] Kock, N. (2015). Qual a probabilidade do paradoxo de Simpson em modelos de caminho? International Journal of e-Collaboration, 11 (1), 1-7.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]