Regressão estatística e ciências humanas: atração fatal
É possível usar uma equação matemática para prever que países correm mais risco de sofrer violência interna contra o Estado? Andam dizendo que sim: a corporação Milcord afirma ter desenvolvido um "modelo de regressão" que analisa diversos dados publicamente disponíveis e prevê o risco de intensificação da violência política em todo o mundo, entre 2010 e 2014. Regressão, hum? Continue lendo.
No dia 7 de janeiro de 2012, quando estiver completando um ano, este blog receberá exatamente 5.847 visitas. Com base em quê afirmo disso? Num modelo de regressão.
Para fazer esse tipo de análise, você pega um conjunto de dados (por exemplo, o número de visitas ao blog a cada dia) lança-o num gráfico, traça uma curva que passe por todos os pontos -- ou, ao menos, bem perto da maioria deles -- e pede ao computador que deduza uma equação capaz de produzir exatamente aquela curva (ou uma aproximação razoável).
Aí (esta é a parte bonita da história) você usa a equação para descobrir as coordenadas de pontos da curva localizados no futuro. Foi o que fiz: pedi ao computador que me desse a ordenada correspondente à abscissa 365 e, voilà!, cheguei a 5.847.
Se você está achando isso tudo muito estranho e bem pouco digno de crédito, parabéns: regressão estatística é uma técnica muito útil em diversos contextos, mas como toda ferramenta tem lá seus limites. E o meu pequeno exercício certamente leva-a além de qualquer ponto razoável. E o fato é que não estou sozinho em forçar a barra.
O jornalista Charles Seife, em seu livro Proofiness: The Dark Arts of Mathematical Deception, cita um artigo publicado em 2004 na revista Nature onde um grupo de pesquisadores aplicava regressão aos tempos dos velocistas olímpicos e concluía que, em 2156, o recorde mundial feminino dos 100 metros rasos teria um tempo menor que o masculino. Seife diverte-se ao apontar que a mesma equação prevê que em 2600 as mulheres terão quebrado a barreira do som, e alguns anos mais tarde, estarão correndo mais rápido que a luz.
O que é patentemente absurdo.
O caso da Nature não é isolado. Economistas, especialistas em saúde pública e cientistas políticos, em especial, sentem uma atração fatal pela regressão, o que suspeito que representa uma modalidade daquilo que se convencionou chamar "inveja da Física".
A ideia é que as chamadas ciências "humanas" ou "moles" invejam o poder da Física, uma ciência onde equações são capazes de prever eventos com uma precisão fenomenal -- por mais que se fale na "incerteza quântica", a teoria gera previsões que já foram confirmadas a várias casas decimais.
Economistas são especialmente vulneráveis à sedução das equações. Seife cita o caso de Ray Fair, da Universidade Yale, que depois de aplicar regressão aos resultados das eleições presidenciais americanas de 1912 a 1976 chegou a uma equação que teria o poder de prever o resultado das eleições futuras. Ela acertou o desfecho dos pleitos de 1980, 1984, 1988 e... fracassou solenemente em prever a vitória de Bill Clinton em 1992. E errou de novo em 1996. "A equação de Fair é um modelo sofisticado para encontar padrões nos dados, mas o padrão era praticamente sem sentido", resume Seife.
No caso da Milcord, eles chegaram a uma lista de 37 países, com Irã no topo e a Bélgica no pé, que correm o risco de assistir a atos de "violência política até cinco anos no futuro". Sem querer ser chato mas já sendo, 37 países são 20% do total de 192 membros das Nações Unidas, e cinco anos é um bocado de tempo.
A chance de um número razoável de acertos ocorrer por puro acaso -- ainda mais que a lista inclui várias nações onde qualquer leitor casual dos jornais pode esperar ver encrenca, como Irã, Israel, México e Sudão -- está longe de ser desprezível.
A Milcord mantém um blog de acompanhamento dos resultados do modelo, e considera que eventos recentes na Tunísia e na Itália (onde manifestações contra Silvio Berlusconi ficaram um tanto quanto agressivas em meados de dezembro) são indicadores preliminares de sucesso.
Mas serão mesmo? Como todo vidente profissional sabe, é muito fácil ganhar reputação de profeta bem-sucedido: basta fazer um grande número de previsões, a maioria genérica e preferencialmente plausível (um avião vai cair, um membro da Academia Brasileira de Letras vai morrer, a presidente Dilma enfrentará dificuldades no meio do ano) e uma ou duas específicas e improváveis (o PMDB via romper com o governo, os juros vão cair) e, depois, contar os sucessos e esquecer de mencionar os fracassos.
As previsões improváveis valem a pena porque, se por acaso uma delas se confirmar, você está feito: como alguém poderia saber que isso ia acontecer? O cético Benjamin Radford é muito bem nisso.
O modelo da Milcord tem algumas semelhanças com esse padrão. O fato de um quebra-quebra na Itália (nada muito incomum, até onde os italianos vão) e uma revolução na Tunísia serem ambos consideardos sinais de sucesso mostra que o espectro de "sucesso" é generoso -- um gol enorme, onde a bola teria de se esforçar para não entrar.
É curioso, por isso mesmo, ver onde o modelo falhou: nele, EUA e Brasil aparecem como países de risco extremamente baixo. Bem, então o que explica a onda de violência do crime organizado contra o Estado do Rio em 2010 e o atentado recente contra a deputada Gabrielle Giffords no Arizona?
No dia 7 de janeiro de 2012, quando estiver completando um ano, este blog receberá exatamente 5.847 visitas. Com base em quê afirmo disso? Num modelo de regressão.
Para fazer esse tipo de análise, você pega um conjunto de dados (por exemplo, o número de visitas ao blog a cada dia) lança-o num gráfico, traça uma curva que passe por todos os pontos -- ou, ao menos, bem perto da maioria deles -- e pede ao computador que deduza uma equação capaz de produzir exatamente aquela curva (ou uma aproximação razoável).
Aí (esta é a parte bonita da história) você usa a equação para descobrir as coordenadas de pontos da curva localizados no futuro. Foi o que fiz: pedi ao computador que me desse a ordenada correspondente à abscissa 365 e, voilà!, cheguei a 5.847.
Se você está achando isso tudo muito estranho e bem pouco digno de crédito, parabéns: regressão estatística é uma técnica muito útil em diversos contextos, mas como toda ferramenta tem lá seus limites. E o meu pequeno exercício certamente leva-a além de qualquer ponto razoável. E o fato é que não estou sozinho em forçar a barra.
O jornalista Charles Seife, em seu livro Proofiness: The Dark Arts of Mathematical Deception, cita um artigo publicado em 2004 na revista Nature onde um grupo de pesquisadores aplicava regressão aos tempos dos velocistas olímpicos e concluía que, em 2156, o recorde mundial feminino dos 100 metros rasos teria um tempo menor que o masculino. Seife diverte-se ao apontar que a mesma equação prevê que em 2600 as mulheres terão quebrado a barreira do som, e alguns anos mais tarde, estarão correndo mais rápido que a luz.
O que é patentemente absurdo.
O caso da Nature não é isolado. Economistas, especialistas em saúde pública e cientistas políticos, em especial, sentem uma atração fatal pela regressão, o que suspeito que representa uma modalidade daquilo que se convencionou chamar "inveja da Física".
A ideia é que as chamadas ciências "humanas" ou "moles" invejam o poder da Física, uma ciência onde equações são capazes de prever eventos com uma precisão fenomenal -- por mais que se fale na "incerteza quântica", a teoria gera previsões que já foram confirmadas a várias casas decimais.
Economistas são especialmente vulneráveis à sedução das equações. Seife cita o caso de Ray Fair, da Universidade Yale, que depois de aplicar regressão aos resultados das eleições presidenciais americanas de 1912 a 1976 chegou a uma equação que teria o poder de prever o resultado das eleições futuras. Ela acertou o desfecho dos pleitos de 1980, 1984, 1988 e... fracassou solenemente em prever a vitória de Bill Clinton em 1992. E errou de novo em 1996. "A equação de Fair é um modelo sofisticado para encontar padrões nos dados, mas o padrão era praticamente sem sentido", resume Seife.
No caso da Milcord, eles chegaram a uma lista de 37 países, com Irã no topo e a Bélgica no pé, que correm o risco de assistir a atos de "violência política até cinco anos no futuro". Sem querer ser chato mas já sendo, 37 países são 20% do total de 192 membros das Nações Unidas, e cinco anos é um bocado de tempo.
A chance de um número razoável de acertos ocorrer por puro acaso -- ainda mais que a lista inclui várias nações onde qualquer leitor casual dos jornais pode esperar ver encrenca, como Irã, Israel, México e Sudão -- está longe de ser desprezível.
A Milcord mantém um blog de acompanhamento dos resultados do modelo, e considera que eventos recentes na Tunísia e na Itália (onde manifestações contra Silvio Berlusconi ficaram um tanto quanto agressivas em meados de dezembro) são indicadores preliminares de sucesso.
Mas serão mesmo? Como todo vidente profissional sabe, é muito fácil ganhar reputação de profeta bem-sucedido: basta fazer um grande número de previsões, a maioria genérica e preferencialmente plausível (um avião vai cair, um membro da Academia Brasileira de Letras vai morrer, a presidente Dilma enfrentará dificuldades no meio do ano) e uma ou duas específicas e improváveis (o PMDB via romper com o governo, os juros vão cair) e, depois, contar os sucessos e esquecer de mencionar os fracassos.
As previsões improváveis valem a pena porque, se por acaso uma delas se confirmar, você está feito: como alguém poderia saber que isso ia acontecer? O cético Benjamin Radford é muito bem nisso.
O modelo da Milcord tem algumas semelhanças com esse padrão. O fato de um quebra-quebra na Itália (nada muito incomum, até onde os italianos vão) e uma revolução na Tunísia serem ambos consideardos sinais de sucesso mostra que o espectro de "sucesso" é generoso -- um gol enorme, onde a bola teria de se esforçar para não entrar.
É curioso, por isso mesmo, ver onde o modelo falhou: nele, EUA e Brasil aparecem como países de risco extremamente baixo. Bem, então o que explica a onda de violência do crime organizado contra o Estado do Rio em 2010 e o atentado recente contra a deputada Gabrielle Giffords no Arizona?
A regra básica para usar regressões com responsabilidade é ater-se ao intervalo usado para obter a equação. Usei com muito sucesso regressões polinomiais para prever o grau de maturação de variedades de cana-de-açúcar, como parte de um modelo matemático baseado em pesquisa operacional, com o objetivo de maximizar o retorno econômico de uma safra. Qualquer extrapolação configura-se absurda...
ResponderExcluir