Nonada, escrito em 19 de Pós-matemática de 3174 YOLD por Peterson Espaçoporto às 5:23:31
O Paradoxo de Simpsons!
Estava eu perambulando pela Wikipédia quando vi algo interessante, e repentinamente “achei” meu primeiro post na série “Leitores S.A.” deste blog =)
O Paradoxo de Simpsons parece vir do desenho animado – mas não, na verdade não tem nada (ou quem sabe?) a ver com os Simpsons – tanto que outro nome dado a ele é o Efeito Yule-Simpson.
Todos nós, leitores deste blog, sabemos que um olhar superficial sobre as coisas pode muitas vezes levar a conclusões erradas. Sobre essa questão de lógica todos os dias temos muitas oportunidades de desfazer falácias de causalidade – uma das piores por sua variável sutileza e difÃcil aceitação por parte de alguns. Hume, filósofo que gera controvérsia em meus gostos filosóficos, fez um bom trabalho mostrando um grande problema com a indução e dedução. Mas há ainda outros fatores a se considerar quando se quer estabelecer uma relação causal.
O Paradoxo de Simpson é um paradoxo estatÃstico onde o ’sucesso’ de A sobre B em intervalos de tempo sucessivos, considerados individualmente, pode ser na verdade revertido quando os intervalos são considerados conjuntamente.
Ou seja: vamos pegar o caso das médias de rebatidas em jogos de Baseball. Em 1995, David Justice rebateu 25,3% das bolas, enquanto Derek Jeter rebateu 25%. Ou seja, Justice vence. Em 96, Justice rebateu 32,1%, enquanto Derek rebateu 31,4%. Ou seja, novamente, vitória de Justice.
Mas, se você considera os dois anos, 95 e 96, você observa que Jeter rebateu 31% enquanto Justice rebateu 27%. Ou seja, Jeter vence!!!
Interessante, não? Para os que já estão mais ou menos no mundo da estatÃstica isso pode não ser novidade – a Wikipédia avisa que muitos livros introdutórios de estatÃstica incluem isso. Mas ainda assim, isso não é muito conhecido pelos leigos.
Um outro exemplo que evidencia como isso pode originar falácias de causalidade que, enfim, sabe-se lá como podem acabar, e que mostra outro “jeito” como essa questão de “grupos isolados” e “grupos considerados conuntamente” funciona, só que de modo reverso:
Em 2006, a Universidade de Berkeley, na Califórnia, foi processada por preconceito contra mulheres “tentando a graduação” (como o sistema nos Estados Unidos é diferente do daqui não sei exatamente o que isso significa, não tenho como traduzir, pois. Pelo que vi é mais ou menos como o doutorado por aqui). As estatÃsticas de “admissão” no ano de 1973 mostraram que 44% dos homens conseguiam, enquanto 35% das mulheres conseguiam – sendo assim “descartada” hipótese de coincidência.
Entretanto, quando os “departamentos” foram avaliados separadamente, viu-se que isso não ocorria. Na verdade… Havia um pequeno preconceito contra os homens.
A explicação foi simples: Mulheres tendiam a tentar uma vaga em departamentos mais competitivos, com taxas de admissão menores até mesmo para alunos qualificados. Já os homens tendiam a procurar vagas em departamentos menos competitivos, com taxas de admissão maiores para alunos mais qualificados.
Ou seja, é incrÃvel avaliar as conseqüências disso. Será que podemos verificar isso no dia-a-dia? E quanto à s conseqüências filosóficas? Se poderÃamos considerar a matemática um padrao, se não confiável, pelo menos mais objetivo, para ver “quem foi o melhor” (como no caso dos rebatedores) isso cai por terra, afinal, temos que considerar qual ponto de vista? Os dois anos juntos ou os anos separados? Aà é possÃvel dizer “Bom, depende se você estiver considerando quem foi melhor no ano ou nos dois anos”. Mas e essa flutuação ocorrer também em bimestres? É melhor quem mais vezes foi melhor ou quem em geral foi melhor? Eu tendo a aceitar que é melhor quem foi melhor “no geral”, mas realmente não vejo uma explicação clara para que possamos abandonar a alternativa. E no caso dos dois anos, a mesma coisa: quem foi durante dois anos consecutivos o melhor não seria o melhor jogador em dois anos?
Enfim, interessante, hum?
Paradoxo de Simpson na Wikipédia (em inglês, que isso nem tem em português lá)










URL
20 de Pós-matemática de 3174 YOLD às 0:48:31
Permalink
Essa mudança de probabilidades acontece por variação do espaço amostral, não é?
URL
20 de Pós-matemática de 3174 YOLD às 0:48:31
Permalink
Essa mudança de probabilidades acontece por variação do espaço amostral, não é?
URL
20 de Pós-matemática de 3174 YOLD às 4:19:71
Permalink
EstatÃstica é interessantÃssima e me lembrou um erro clássico que cometi quando quis fazer as somas individuais das médias de várias amostras e dividir pelo número de amostras para achar a média global. Evidentemente que esse cálculo é equivocado, pois a média global é diferente da soma das médias individuais.
Realmente, ótimo texto mesmo caro Peterson!!!!!
Grande abraço.
URL
21 de Pós-matemática de 3174 YOLD às 0:10:02
Permalink
Obrigado! =D E não sei ao certo cara, pode-se dizer que sim. Verificar amostras individualmente / verificar em grupo, seria isso variação do espaço amostral? =S
Santaum: Obrigado! =D Você já caiu nesse erro? Eu não uso tanto a estatÃstica – no sentido de “trabalhar” com ela, então nunca me peguei num erro desse tipo. Será que todo mundo um dia já caiu nele?
URL
21 de Pós-matemática de 3174 YOLD às 4:62:71
Permalink
Sobre sua última pergunta, acho meio difÃcil, mas não foram poucas que depararam com uma situação parecida não.
Grande abraço.
URL
21 de Pós-matemática de 3174 YOLD às 5:36:82
Permalink
URL
22 de Pós-matemática de 3174 YOLD às 5:07:69
Permalink
URL
22 de Pós-matemática de 3174 YOLD às 7:10:59
Permalink
URL
25 de Pós-matemática de 3174 YOLD às 6:66:68
Permalink
URL
25 de Pós-matemática de 3174 YOLD às 9:04:49
Permalink
E metendo o bedelho na sua discussão com o Santaum, creio que esse paradoxo esteja presente em toda avaliação estatÃstica, o que possibilitaria dizer que todo mundo que analisa algo estatisticamente comete erro. Isso porque geralmente podemos subdividir o espaço amostral[acho que isso causaria o erro no "sentido inverso"], e quase sempre é possÃvel aumentá-lo[provocando o erro como descrito anteriormente]. Não sei se fui claro.
Agora quero conversar com minha professora de estatÃstica ahuehuaheuaheuaheuhau
Abraço!
URL
25 de Pós-matemática de 3174 YOLD às 9:04:49
Permalink
E metendo o bedelho na sua discussão com o Santaum, creio que esse paradoxo esteja presente em toda avaliação estatÃstica, o que possibilitaria dizer que todo mundo que analisa algo estatisticamente comete erro. Isso porque geralmente podemos subdividir o espaço amostral[acho que isso causaria o erro no "sentido inverso"], e quase sempre é possÃvel aumentá-lo[provocando o erro como descrito anteriormente]. Não sei se fui claro.
Agora quero conversar com minha professora de estatÃstica ahuehuaheuaheuaheuhau
Abraço!
URL
28 de Pós-matemática de 3174 YOLD às 5:85:60
Permalink
URL
28 de Pós-matemática de 3174 YOLD às 6:26:84
Permalink
URL
29 de Pós-matemática de 3174 YOLD às 4:85:38
Permalink
Caceeete Evandro, GRANDE exemplo!!!! Como foi que não falei disso? EstatÃsticas mostradas por polÃticos podem conter muitos desses erros!!!!!