O hambúrguer de coelho e os testes para COVID-19

 Ah pronto! Tudo a ver!

Em 1954, o escritor estadunidense Darrell Huff publicou o best seller "Como mentir com estatística",[1] no qual ele conta como é fácil utilizar informações estatísticas de formas muito variadas e criativas para se provar seja lá o que você quiser provar. Na verdade, nesse meio sórdido da manipulação de opiniões, de prova mesmo não há nada, apenas um enorme emaranhado de números e porcentagens e gráficos, com pouco ou nenhum direito de estarem todos no mesmo parágrafo de um texto, mas que facilmente enganam uma mente despreparada.

Muito do que Huff conta no livro tem a ver com a forma de apresentar resultados, a qual é escolhida de modo a passar um sentimento específico, mas não exatamente contar uma mentira. Vamos supor que um governante tenha decidido aumentar um dado imposto (só para variar) de 0,0001% sobre um dado valor para 0,0002%. Para convencer os congressistas a aceitarem essa medida, ele prepara uma longa apresentação de power-point enfatizando em todos os slides que ele apenas aumentou 0,0001%, o que é algo muito pequeno. Mas a oposição também gostaria de convencer os congressistas a votarem contra esse aumento de imposto, e, para isso, também montaram uma apresentação, mas enfatizaram que, já que o imposto dobrou de valor, o aumento é absurdo, tendo sido de 100%!

Nesse exemplo, nenhuma das duas apresentações está errada, mas cada uma delas passa sensações diferentes sobre essa proposta de aumento. Em relação ao imposto anterior, o aumento foi de fato de 100%, mas em termos de valores, o contribuinte passa a pagar mais 0,0001% sobre o valor no qual esse imposto incide. Resta aos congressistas acreditarem ou não que esse aumento é de fato necessário.

Outra forma de passar informações duvidosas é apresentar gráficos completamente diferentes em uma mesma figura e tirar conclusões analisando-se os dois gráficos ao mesmo tempo. Podemos imaginar uma situação hipotética na qual um gerente muito mal intencionado vai apresentar ao seu chefe os resultados das vendas de um dado produto em sua loja ao longo de um mês. No início do mês, esse produto custava 10 reais, mas como a loja não estava indo muito bem, o gerente resolveu aumentar o preço do produto em 20 centavos por dia, chegando a 16 reais no fim do mês. No primeiro dia, esse produto vendeu 100 unidades, mas como a loja já não estava vendendo bem, depois de dois dias, ele vendeu apenas 99, e depois de mais 2 dias, ele vendeu 98, e assim por diante, chegando a vender apenas 85 unidades no último dia do mês. Então o gerente monta um gráfico com duas informações no mesmo eixo y (o eixo vertical do gráfico) e com o dia do mês no eixo x (o eixo horizontal). Ele coloca nesse gráfico o valor do preço unitário e o valor do lucro do dia. O lucro no primeiro dia é de 1000 reais, enquanto o lucro no último dia é de 1360. Assim, apesar de as vendas terem caído, como o gerente aumentou o preço gradualmente, o lucro diário aumentou. Como esses valores variam na ordem das centenas, ele dividiu o eixo y em intervalos de 100 reais. Agora vem o pulo do gato: a segunda informação que o gerente colocou no gráfico foi o preço diário dos produtos, que não variam na ordem das centenas, mas sim na ordem das unidades! Ou seja, varia cem vezes menos! Ao colocar essas duas informações no gráfico, enquanto o lucro aumenta visivelmente, o preço diário parece constante! O gerente mostra esse gráfico para o patrão e conta que ele conseguiu aumentar as vendas da loja, vendendo 36 unidades a mais no último dia do mês do que no primeiro.

Claro que um bom patrão não seria facilmente comprado com esse gráfico, ele teria acesso a todas as movimentações do mês e poderia por si só constatar que o seu gerente é um péssimo gerente. Mas imagine alguém passando informações parecidas pela televisão. A maior parte dos telespectadores não irá conferir as informações de forma minuciosa após o telejornal, sendo assim facilmente convencidas de uma mentira.

Mas existe ainda um outro jeito muito comum de se contar lorotas com propriedade: as correlações. Dizemos que dois acontecimentos possuem alta correlação, se toda vez que um deles acontece, o outro também acontece. Por exemplo, podemos pensar no aumento do volume de chuvas e no aumento de enchentes em ambientes urbanos. Sempre que aumenta o volume de chuva, aumentam-se as enchentes. Isso porque os sistemas de drenagem de água das ruas não da conta do enorme volume de água que vem com as chuvas.[2] Temos nesse caso uma situação de causa e efeito. O aumento das chuvas aumenta o número de enchentes, de modo que essas duas medidas possuem o que chamamos de relação causal. 

Mas nem todas as correlações possuem relações de causa e efeito. O consumo de margarina nos EUA, por exemplo, decresceu entre os anos de 2000 e 2009 da mesma maneira que a taxa de divórcios do Maine (que é um estado americano) caiu.[3] Quem sabe alguém ainda argumente que a margarina une as famílias, mas eu prefiro não pensar muito sobre isso. Esse exemplo (e tantos outros interessantíssimos) ilustram a famosa máxima "correlações não implicam causalidade", o que significa que nem sempre que duas grandezas são correlacionadas, isso ocorre porque uma é a causa da outra. Apesar do enorme sucesso do livro de Darrell Huff, Huff também ficou famoso por ser um grande lobista da indústria do cigarro,[4] se aproveitando de máximas como essa para dizer coisas como "não é porque pessoas que fumam morrem mais de problemas respiratórios do que as que não fumam, que é o cigarro que tenha feito mal". Na verdade, esse fato nos traz um grande ensinamento: a existência de correlações merece alguma investigação e após encontrada e justificada cientificamente uma relação causal, essa não deve ser descartada.

Contudo, eu acredito que a maneira de contar as melhores mentiras envolvendo estatística é introduzir as probabilidades no meio do discurso. Os matemáticos já aprenderam há um tempo que ao lidar com problemas que envolvem probabilidades, é necessário redigir de forma muito minuciosa a pergunta que se quer responder, caso contrário, facilmente calculamos a probabilidade errada, e na maior parte dos casos, o problema reside nas chamadas "probabilidades condicionais", que nada mais são do que as probabilidades de um dado evento acontecer, dada uma condição específica. Por exemplo, podemos perguntar qual a chance de ao jogar um dado ele cair em um número par. A resposta para essa pergunta é igual a 1/2 (ou 50%), pois metade das faces de um dado é um número par. Mas poderíamos perguntar também: dado que a jogada resultou em um número maior que 3, qual a chance de ele ser um número par? Nesse caso, existem 3 resultados possíveis, os números 4, 5 ou 6. Desses, apenas 2 são pares, de modo que nesse caso, a resposta seja 2/3 (ou 66,6%). Veja como dar uma condição muda tudo!

Ainda, a probabilidade de um evento A, dada a ocorrência de um evento B, é diferente da probabilidade de um evento B, dada a ocorrência de um evento A. E os farmacêuticos devem saber muito bem sobre esse assunto. Um teste de farmácia para identificar alguma doença, como os testes sorológicos para a COVID-19, possuem duas informações importantes: a sensibilidade e a especificidade.[5] Quanto mais sensível um teste, maior é a chance de ele acertar quando o indivíduo está doente. Ou seja, a sensibilidade dá a probabilidade de um teste dar positivo dado que o indivíduo realmente está doente. Já a especificidade é a probabilidade de um teste dar negativo, dado que o indivíduo não está doente. Assim, quanto mais sensível, mais o teste acerta quando as pessoas estão doentes, sendo baixo o número de falsos-negativos; e quando mais específico, mais o teste acerta quando as pessoas não estão doentes, sendo baixo o número de falsos-positivos.[5]

"Vitor, eu fiz o teste na farmácia e o resultado deu positivo, qual a chance de eu estar doente? A sensibilidade do teste é de 90%, então a chance de eu estar doente é de 90%?" Não! Vamos voltar um pouco: sensibilidade de 90% quer dizer que existe chance de 90% de o teste dar positivo dado que você está doente. A sua pergunta é o inverso: queremos saber a chance de você estar doente dado que o teste deu positivo. Repare que antes a condição era "dado que você está doente" e agora a condição é "dado que o teste deu positivo", e essa probabilidade não é dada pelo fabricante do teste. Para calcular essa probabilidade é necessário conhecer a incidência da doença na população e fazer uso de uma fórmula matemática chamada de "Teorema de Bayes".[6]

O uso errado dessas informações de sensibilidade e especificidade pode fazer com que pessoas sejam diagnosticadas erroneamente. Leonard Mlodinow, em seu livro "O andar do bêbado",[7] conta como foi diagnosticado com AIDS devido à interpretação incorreta dessas informações pelo seu médico. Segundo o seu médico, a chance de que Leonard estivesse saudável (ou seja, que o teste tivesse errado) era de 1 em mil, quando, na verdade, a chance era de 10 em 11, quase 1000 vezes maior do que a que o médico havia calculado!

Mlodinow também conta em seu livro como a matemática errada de probabilidades pode ser uma arma em tribunais, contando o caso de Janet Collins, julgado na Suprema Corte da Califórnia, em 1968. Com o uso incorreto dessa matemática e mais alguns indícios, a acusação chegou a dizer que a chance de os réus serem inocentes era de 1 em 12 milhões. O júri comprou a argumentação e acabou condenando os réus. Na realidade, com base apenas nos indícios matemáticos analisados, a chance de os réus serem inocentes era por volta de 50%, de modo que não dava para serem condenados apenas com base nesses pontos. Por fim, a suprema corte acabou revogando a condenação.

Pudemos ver que o uso errado de probabilidades é tão catastrófico quanto o uso de argumentos estatísticos sem detalhamento e zelo pode ser maldoso. Mas se você chegou até aqui, creio que queira saber qual é o lance com o hambúrguer de coelho. Essa é uma das anedotas contadas por Darrell Huff em seu livro, a qual vale a pena ser contada. Ela é mais ou menos assim: "Existia uma pequena venda na beira da estrada com um enorme letreiro: Vendemos hambúrguer de coelho por 99 centavos! Todos paravam para comprar os hambúrgueres pois o preço era muitíssimo barato. Um dia, um cliente mais astuto perguntou ao dono "como você consegue manter um preço tão baixo em um produto tão nobre?" E o vendedor respondeu: "meu caro cliente, você tem razão, vou te contar meu segredo. A carne de coelho é muito cara, então eu misturo a carne de coelho com um pouco de carne de cavalo. Mas pode confiar! É 50% de cada. Em cada remessa, eu misturo um coelho e um cavalo".




Referências:

[1] Huff, D. (2016). Como mentir com estatística. Editora Intrinseca.

[2] https://brasilescola.uol.com.br/geografia/enchentes.htm, acessado em 14/12/2020.

[3] https://tylervigen.com/old-version.html, acessado em 14/12/2020

[4] Reinhart, Alex (2020): Huff and puff. Carnegie Mellon University. Preprint. https://doi.org/10.1184/R1/13120292.v1 

[5] Kawamura, T. (2002). Interpretação de um teste sob a visão epidemiológica: eficiência de um teste. Arquivos Brasileiros de Cardiologia, 79(4), 437-441.

[6] Magalhães, M. N. (2006). Probabilidade e variáveis aleatórias. Edusp.

[7] Mlodinow, L. (2009). O andar do bêbado: como o acaso determina nossas vidas. Editora Schwarcz-Companhia das Letras.

Comentários

Postagens mais visitadas deste blog

O código da vida de Bender

Quando a Biologia encontra a Matemática

Todo bêbado guarda uma moeda no bolso