Prezado Berto,
Não sou estatístico, mas usuário dessa importantíssima ferramenta de trabalho – a estatística – no tratamento de resultados analíticos, dentro da minha profissão e para o ensino.
Como estamos em tempos de pandemia e de uma profusão descomunal de números e de … “estatísticas”, e obviamente, interpretações e especulações – para não dizer, “chutometria” – feitas ao bel prazer (ideológico) do freguês, gostaria muito de trazer ao nosso JBF um texto que já utilizo há bastante tempo em aulas diversas.
É daqueles textos sem uma origem ou fonte específica, contado de diferentes formas, e que com o advento da internet, já circulou bastante e pode ser facilmente encontrado em buscas na rede.
A versão que apresento a vocês foi extraída do endereço, da ABAS (Associação Brasileira de Águas Subterrâneas).
Quem assina é um professor da USP, conhecido meu, que trabalha na área de hidrogeologia.
É extremamente didático e, na verdade, é uma grande lição básica do Método Científico.
Gostaria de dedicá-lo aos nossos vários colunistas fubânicos, que usam tão bem os números, sem “torturá-los”, para que eles “confessem” aquilo que se quer ouvir deles.
Um forte abraço a todos,
* * *
AS CEGONHAS, OS BEBÊS E O MÉTODO CIENTÍFICO – Ricardo Hirata
Em uma pequena cidade portuária na Inglaterra foi constatada uma forte correlação entre a chegada das cegonhas, que construíam seus ninhos sobre as casas, e o aumento na taxa de nascimento de bebês. Durante mais de três anos foi contado, por estudantes de graduação de um curso de biologia, o número de ninhos ao longo do ano e verificou-se que, através de comparação com o registro de nascimento da cidade, nos meses em que se observava o aumento de ninhos também se verificava o aumento no número de bebês. A conclusão de tal estudos foi que as cegonhas obviamente não estavam trazendo as crianças ao mundo, mas induziam inexplicavelmente a taxa de nascimento da cidade.
Por parecer estranho, os dados foram questionados e se provou que embora houvesse correlação entre ninhos de cegonha e nascimento de crianças, as coisas ocorriam independentemente. Havia inter-relação entre os fatores, mas um não era causa do outro. A explicação correta é que a sazonalidade climática induzia a chegada das cegonhas e, por ser uma vila de pescadores em um país frio, a vida dos habitantes era também controlada pelos períodos de pesca e outras atividades, induzindo o aumento de concepções dos casais.
A estória acima mostra bem um erro bastante comum das teses, dissertações e relatórios técnicos apresentados às universidades ou aos órgãos de controle ambiental.
Os profissionais e cientistas buscam relações entre parâmetros, normalmente utilizando-se de técnicas estatísticas como correlações lineares ou não, diagramas de Pearson, ou análise fatorial, e quando as encontram, acabam por concluir o que parece mais óbvio. No caso das cegonhas todos sabem que por princípio não existe causa-efeito, mas quando estamos trabalhando com algo pouco óbvio, as conclusões, mesmo erradas, podem parecer plausíveis. A inter-relação entre duas variáveis, mesmo que altíssima, não é por si só um indicativo de que um é condição da existência do outro ou que ambos tenham o mesmo controle, que até era verdade no caso das cegonhas-bebês.
O entendimento das causas do fenômeno é necessário, mas não suficiente para provar alguma coisa. É como se você como delegado tivesse que prender alguém somente com algumas provas circunstanciais e só porque o fulano tinha motivos concretos de matar a vítima.
Quando estamos trabalhando com hidrogeologia, as evidências não são tão claras e a busca de dados geralmente é difícil e cara. O meio geológico é bastante variável no espaço e tempo e muitas vezes temos algumas peças em um complexo quebra-cabeças. Isso complica a vida da gente, na medida que diminui o número de dados e o acesso à informação.
Mas como então ter certeza que determinado fenômeno realmente se processa de uma forma e não de outra? Como ter uma boa aproximação da verdade científica?
Um método bastante aceito por vários pesquisadores que trabalham em hidrogeologia é provar por duas formas independentes que o fenômeno ocorre. Por isso vários projetos de pesquisa nas universidades tentam obter constatações em campo e depois tentam reproduzir em laboratório esses mesmos fenômenos, através de modelos físicos ou numéricos, por exemplo.
Isso permite que, embora possamos estar erroneamente concluindo que cegonhas trazem bebês, estamos bastante longe de fazê-lo facilmente.
Ricardo Hirata é professor e pesquisador do Instituto de Geociências da USP e do CEPAS- IGc-USP.
Que fique bem claro:
“Embora houvesse correlação entre ninhos de cegonha e nascimento de crianças, as coisas ocorriam independentemente.”
Ébom frisar bem, caríssimo Rômulo, pois do jeito que anda a educação nestas terras brasilis, pode alguém começar a defender a tese que são as cegonhas que trazem s rebentos…
Abraço grande
Exatamente, Sancho.
O objetivo é exatamente este.
É mostrar que, apesar de haver uma forte correlação estatística positiva (r (Pearson) = + 0,99999) entre as duas variáveis A (nascimento de bebes) e B (número de cegonhas), isso não quer dizer que haja uma relação de causa-efeito entre elas, ou relação de causalidade.
A estorinha é justamente para mostrar algo extremamente absurdo, de que são as cegonhas que trazem os bebês.
O site “spurious correlations” (https://www.tylervigen.com/spurious-correlations) tem vários exemplos muito engraçados dessas correlações estatísticas sem relação de causalidade. Por exemplo, há uma correlação estatística forte, em um estado americano, no consumo de margarina com o número de casos de divórcio. Será que isso tem alguma relação de causalidade ? Obviamente que não.
A questão é que, hoje em dia, estão fazendo verdadeiros absurdos com resultados estatísticos. Na área ambiental então, nem se fala. Tema para outras publicações.
Pois é, Rômulo, no meio dessa pandemia tenho visto muito disse pela internet afora. Um monte de gente dizendo que temos que fazer tudo aquilo que o governo manda, porque é baseado em “ciência” e “modelos matemáticos”.
Eu já perguntei mais de uma vez: um modelo matemático sobre o contágio e a disseminação da covid se baseia em que dados? Existem estatísticas da gripe espanhola de 1917, por exemplo?
Fazer um modelo matemático é tão simples quanto colocar umas fórmulas no excel. O X da questão é saber quais os dados que servem de parâmetros para essas fórmulas.
E meu amigo Sancho pode ficar tranquilo. Ninguém vai achar que os bebês vêm das cegonhas, afinal todos já sabem que as meninas vêm das rosas e os meninos, dos repolhos…
Marcelo, para analisar é preciso ter dados. Eu esperei um mês pra começar a modelar. Pelo que vi, os modelos falharam porque se perdeu a aleatoriedade. A modelagem base das pandemias é o SIR (suscetíveis-infecção-recuperados) proposto por Kermarck e McKendrick, em 1927.
Rômulo, eu sempre conto nas minhas aulas de Econometria o caso do cara que regrediu a capacidade da bacia leiteira de um estado contra o número de vacas, pasto, vacinas, ração e um monte de outras. As variáveis não deram significativas e ele saiu testando o modelo. tirava uma variável rodava, botava aquela tirava outra e nada de significância. Até que tirou o número de vacas e os parâmetros deram significativos. Então, leite não depende de vaca..
Sobre correlação, tem o caso da regressão de suicídios contra casamento, com um coeficiente de determinação de 0,99%.
Semana passada, durante a aula, baixei o número de tuberculose em 2018 e 2019. A média caiu, mas estatisticamente não havia diferença. Fizemos um bom debate sobre interpretação de dados.
Ano passado um residente de oncologia me procurou querendo calcular a correlação entre sistozoma e câncer de colo retal. Pra convencer que havia uma causalidade e não uma correlação foi complicado, mas acabou num artigo. Abraços
Excelentes exemplos, caros Marcelo e Maurício.
Porém, o derradeiro, que eu estava “me segurando”, para não lançar….
Mas não tem jeito, já estou apanhando mesmo, de todos os lados.
Lá vai:
É que o aumento da concentração de CO2 – e eventualmente outros gases do efeito estufa – pode não ter absolutamente nada a ver com o aquecimento global.
Mas vamos deixar para depois, outros artigos, quem sabe, pois isso faz parte de um dos maiores dogmas da atualidade, pertencente a seita xiita do “ambientalismo global dos últimos dias”, que é irmã siamesa da seita lulo-petista-esquerdista-castrista-chavista-maoista-*.ista et alli.
Depois da queda do muro de Berlim em 1989, da reunificação das Alemanhas em 1990, e do fim da antiga União Soviética, em 1991, a orfandade precisava, urgentemente, de novos paradigmas globais. E assim, no ano seguinte, em 1992, a Rio-92 nos brindou com um dos maiores desastres para o meio ambiente, que foi a inauguração do politicamente correto em uma das áreas ou questões mais fundamentais para o ser (des)humano, que é a questão ambiental.
E o assunto vai longe….
Forte abraço.
Essa é boa. Tem o pessoal que defende que oxigênio vem mais dos oceanos do que da floresta. Enfim, muito interessante a abordagem. Vou usar na aula de amanhã
Um dos meus exercícios prediletos, quando eu ainda tinha saco para ensinar, era inventar um monte de aberrações BEEEEMMMMM absurdas e prová-las com modelo matemático.
Depois, pedia à classe: – Provem-me que eu estou errado!
Um das minhas crias prediletas era a estória que eu niventei sobre a mais recente descoberta científica: AS TOXINAS AQUÍFERAS!
Descobriu-se que a água, qualquer água, era portadora deste novo tipo de toxina até então desconhecida da ciência. O mais interessante a respeito desta mais nova descoberta era que o seu efeito era muito semelhante à radiação. Era cumulativo. Você ia bebendo água, ao longo de toda a sua vida e, paulatinamente, se contaminando.Lá pelos 50 ou 60 anos de idade, os efeitos adversos começariam a se manifestar de forma gradual.
Obesidade, artrite, diabetes, problemas cardíacos e renais, vista curta, glaucoma, sucessivas infecções bacterianas e viroses oportunistas, queda acentuada na potência sexual, e por aí vai toda uma lista imensa de mazelas.
Os estudos encontraram uma correlação SIMPLESMENTE PERFEITA e igual a UM! Todo os humanos, e até os animais também, que bebem água, MORREM DA MANEIRA DESCRITA ACIMA.
É INEXORÁVEL!!! Nunca um estudo científico encontrou uma correlação tão perfeita entre o vetor de uma doença e a própria.
ONDE ESTÁ O MEU ERRO, GALERA?
Fatores genéticos podem causar esse distúrbios e pessoas morrem antes de 50 ou 60. Então, não foi a água
Simplesmente estariam se antecipando aos efeitos das toxinas da água.