Terminei de ler… O andar do bêbado

DSC01075.JPG


“Alguns anos atrás, um homem ganhou na loteria nacional espanhola com um bilhete que terminava com o número 48. Orgulhoso por seu feito, ele revelou a teoria que o levou à fortuna.
“Sonhei com o número 7 por 7 noites consecutivas”, disse, “e 7 vezes 7 é 48”
O primeiro parágrafo de O Andar do Bêbado de Leonard Mlodinow da um exemplo de quão grande é a nossa capacidade de abstrair a realidade em prol da nossa percepção da realidade.
Se você acha que uma coisa é, então ela será, não importa que ela não seja.

Entre os bons livros que tenho lido nos últimos tempos, esse é o que eu mais recomendaria, para um maior número de pessoas. Não importa se você é cientista, jogador e futebol, analista da bolsa de valores, advogado, jornalista, médico ou professor. Ao contrário do que prega Kardec, o acaso existe sim, e além de ser um fator determinante nas nossas vidas, é provavelmente o que menos pessoas conseguem entender.
Mas Leonard consegue te explicar sem nenhuma equação, em 90% do tempo sem nenhuma fórmula, ainda que use bastante números. Mas são números interessantíssimos e nada daquela chatice de dados e urnas (ainda que sim, esteja cheio de dados e urnas nos exemplos do livro).
Por exemplo, você sabia que a análise matemática das demissões de técnicos após o fracasso de seus times, em todos os grandes esportes, mostrou que, em média, elas não tiveram nenhum efeito no desempenho da equipe?
O maior desafio à compreensão do papel da aleatoriedade na vida é o fato de que, embora os princípios básicos dela surjam da lógica cotidiana, muitas das consequências que se seguem a esses princípios provam-se contraintuitivas. Que em qualquer série de eventos aleatórios, há uma grande probabilidade de que um acontecimento extraordinário (bom ou ruim) seja seguido, em virtude puramente do acaso, por um acontecimento mais corriqueiro.
Outro ponto importantíssimo levantado por Leonar é a importância da quantidade de informações. Enquanto a falta pode levar à concorrência entre diferentes interpretações, o excesso pode diferenciar o vencedor. Se os detalhes que recebemos em uma história se adequarem à imagem mental que temos de alguma coisa, então, quanto maior o número de detalhes, mais real ela parecerá (isso porque consideraremos que ela seja mais provável, muito embora o ato de acrescentarmos qualquer detalhe do qual não tenhamos certeza a torne menos provável)
O livro ainda faz pouco das pseudo-ciências que tentam ignorar o acaso. No caso da astrologia, o exemplo veio da Roma Antiga:
“Cícero, (…) Irritado com o fato de que, apesar de ilegal em Roma, a astrologia ainda continuasse viva e popular, (…)observou que [quando] Aníbal (…) trucidouum exército romano (…), abatendo mais de 60 mil de seus 80 mil soldados. “Todos os romanos que caíram em Canas teriam, por acaso, o mesmo horóscopo?”, perguntou? “Ainda assim, todos tiveram exatamente o mesmo fim”.
Mas acho que Leonard encontrará também bastante resistência, porque ele acaba com muitas das estatísticas dos esportes. Todos eles! Veja essa passagem e imagine como se aplicaria ao campeonato brasileiro:
“Se um dos times for [55%] melhor que o outro (…), ainda assim o time mais fraco vencerá uma melhor de 7 jogos cerca de 40% das vezes (…). E se o time superior for capaz de vencer seu oponente em 2 de cada 3 partidas, em média, o time inferior ainda vencerá uma melhor de 7 cerca de uma vez a cada 5 disputas. (…). Assim, as finais dos campeonatos esportivos podem ser divertidas e empolgantes, mas o fato de que um time leve o troféu não serve como indicação confiável de que realmente é o melhor time do campeonato.:
Que foi claramento o que aconteceu com o Flamengo no Brasileiro e com o Botafogo no Estadual. 😉
Mas a sacaneada mais bacana está nos médius:
[em uma roleta] O trabalho do apostador é simples: adivinhar em qual compartimento cairá a bolinha. A existência de roletas é uma demonstração bastante boa de que não existem médiuns legítimos, pois emMonte CarIo, se apostarmos USD 1,00 em um compartimento e a bolinha cair ali, a casa nos pagará USD 35,00 (além do USD 1,00 que apostamos). Se os médiuns realmente existissem, nós os veríamos em lugares assim, rindo, dançando e descendo a rua com carrinhos de mão cheios de dinheiro, e não na internet, com nomes do tipo Zelda Que Tudo Sabe e Tudo Vê, oferecendo conselhos amorosos 24h, competindo com os outros 1,2 milhões de médiuns da internet.”
Mas falando mais sério, o livro é uma aula de matemática, história, estatística e ciências. Ele explica o ‘Triangulo de Pascal’, as ‘Provas de Bernoulli’, o ‘Teorema Áureo’, o surreal ‘Teorema dos pequenos números’, a ‘Distribuição Normal’ e o ‘Teorema do Limite Central’. E de forma que a gente entende.
Um fato que me chamou atenção, porque relacionei com a educação e com a avaliação de alunos, é ilustrado abaixo:
“Um diretor de empresa que tenha 60% de anos de sucesso, deve apresentar 60% de sucessos em um Periodo de 5 anos (que seriam aproximdamente 3)? Na verdade não! (vai ler o livro pra ver a explicação!) Na verdade é mais provável que 2/3 dos diretores tenham um resultado mais guiado pelo acaso do que pelas suas habilidade. Nas palavras do matemático Bernoulli: “Não deveríamos avaliar as ações humanas com base nos resultados:”. E sim nas suas habilidades

Um dos monstros da estatística praticamente desconhecido do público geral e louvado no livro é Bayes. Esse monge jamais publicou um único artigo científico e provavelmente realizou seu trabalho para satisfação própria. Bayes desenvolveu a probabilidade condicional em uma tentativa de resolver o problema: como podemos inferir a probabilidade subjacente a partir da observação?
Ou como traduziu Leonard: “Se um medicamento acabou de curar 45 dos 60 pacientes num estudo clínico, o que isso nos informa sobre a chance de que funcione no próximo paciente?
Novamente, não é uma questão fácil. Assim como eu que já fiz umas duas disciplinas de estatística Bayesiana garanto a vocês: Bayes é demais, mas é difícil demais.
Para Leonard, uma das pequenas contradições da vida é o fato de que, embora a medição sempre traga consigo a incerteza, esta raramente é discutida quando medições são citadas:
“Se uma policial de trânsito um tanto exigente diz ao juiz que, segundo o radar, você estava trafegando a 60km/h numa rua em que a velocidade máxima permitida é de 55km/h, você provavelmente será multado, ainda que as medições de radares com frequência apresentem variações de muitos quilômetros por hora.”

Ah… um capítulo a parte é o papel do acaso na avaliação de vinhos (também tem um sobre vodcas e outro sensacional sobre o efeito placebo da glicosamida), mas esses são tão bons que merecerão um post a parte
Finalmente ele aborda a questão com a qual inicia o livro: nossa habilidade para reconherce padrões, chamada de Heurística. Para Leonard, “Buscar padrões e atribuir-lhes significados faz parte da natureza Humana”.A heurística é muito útil, mas assim como nosso modo de processar informações ópticas pode levar às ilusões ópticas, a heurística também pode levar a erros sistemáticos. Ou erros de vieses.
“Todos nós utilizamos a heurística e padecemos de seus vieses. E o que é pior, temos o costume de avaliar equivocadamente o papel do acaso em nossas vidas, tomando decisões comprovadamente prejudiciais aos nossos interesses.”
Um desses exemplos é a ‘Falácia da Boa Fase’, experimentada por atletas de qualquer esporte (mas principalmente os mais assistidos); mas o mais chocante é o ‘Viés da confirmação’.
“Quando estamos diante de uma ilusão – ou em qualquer momento em que tenhamos uma nova ideia -, em vez de tentarmos provar que nossas ideias estão erradas, geralmente tentamos provar que estão corretas.”
Essa tendenciosidae representaria um grande impedimento à nossa tentativa de nos libertarmos da interpretação errônea da aleatoriedade. Como afirmou o filósofo Francis Bacon em 1620,
“a compreensão humana, após ter adotado uma opinião, coleciona quaisquer instâncias que a confirmem, e ainda que as instâncias contrárias possam ser muito mais numerosas e influentes, ela não as percebe, ou então as rejeita, de modo que sua opinião permaneça inabalada”.

Se o acaso é inevitável e a sorte é fundamental, então o diferencial pode não ser o talento (ainda que ele seja necessário), mas a persistencia.
“O primeiro Harry Potter, de J.K. Rowling, foi rejeitado por nove editores e o manuscrito de “A firma’, de John Grisham só atraiu o interesse de editores depois que uma cópia pirata que circulava em Hollywood lhe rendeu uma oferta de US$600 mil pelos direitos para a produção do filme.
Como observou Thomas Edison “muitos dos fracassos da vida ocorrem com pessoas que não perceberam o quão perto estavam do sucesso no momento em que desistiram!”
Não deixem de ler, absolutamente!

Sangue do meu sangue

Na mesa do almoço de Domingo, com a extraordinária presença do meu primo Felipe, meu pai, que adora uma polêmica (e o Eurico Miranda), interveio criando grande dúvida: Afinal, primos de 2º grau são os filhos de dois primos irmãos (mesma geração) ou pais e os filhos de primos irmãos (duas gerações)? Confesso que na hora fiquei decidido a achar a informação e escrever um texto contando resolvendo a pendenga, mas como já escrevi aqui, é impressionante como uma idéia (ou um texto) toma vida, e sendo assim, resolvi mudar o enfoque.

Sorry Pap’s, a pendenga vai continuar em aberto.

As relações de parentes alcançam maior comoção em humanos do que em qualquer outro animal.

Eu adoro minha família, mas nossos laços são mais do que de sangue. Quando morei na Itália, os primos do meu tio, marido da irmã da minha mãe (ou seja, um tio não consangüíneo), me trataram em Florença mais que como um sobrinho distante. Maria Luiza, Patrizia, Graziano e Mario cuidaram de mim como se cuida de um filho. Riccardo e Raffaella como um fratello. E se eu estivesse em Roma, Humberto e Giulia, cujo vínculo comigo era minha amizade com sua filha Margheritta, me recebiam aos domingos para o almoço de família, com direito a irmãos, irmãs, sobrinhos, sobrinhas, cunhados, cunhadas. Além do risoto da Margheritta, aquilo diminuía a ‘saudade’ palavra que só existe no português e que só a gente parece saber exatamente o que quer dizer.


Biologicamente, será que faz algum sentido? Jared Diammond conta em “Armas, germes e aço” que na Nova Guiné, dois estranhos que se encontram na rua, ficam discutindo horas até encontrarem algum parentesco em comum, o que é a única desculpa para não se matarem. Qualquer um que nõ é um parente é um competido e deve ser eliminado. Essa é a lógica.

Nos anos 70, Richard Dawkins desenvolveu a teoria do ‘gene egoísta’. De acordo com ela, nos somos apenas máquinas altamente especializadas a serviço da propagação dos nossos genes. Mas importante do que cada um de nós como indivíduos, é a individualidade dos genes que carregamos.

Se vocês se lembram um pouquinho da genética, cada um de nós possui (ou pelo menos deveria possuir, leia aqui) 23 pares de cromossomos (46 no total). Herdamos metade de nosso pai e metade de nossa mãe, e doamos metade dos nossos para nossos filhos.

Com uma matemática relativamente simples, podemos entender porque a palavra em inglês para parentes ‘relatives’ é mais adequada do que a em português. Nossa relação com os outros pode ser medida pelo número de genes que temos em comum. Esse não é o critério apenas dos Papua da Nova Guiné, mas de todo o reino animal.

Pais e filhos, irmãos e irmãs tem o maior número de genes em comum: 50%. Avôs e netos, tios e sobrinhos vêm em segundo com 25%. Os primos irmãos e bisnetos vêm a seguir com 12,5% e já para o final na árvore genealógica estão os primos de segundo grau, que aqui diferem de uma geração, com 3,12%. Parentes distantes como primos de terceiro grau tem tanta probabilidade de ter genes em comum com você do que com um estranho qualquer: 0,78%. Agora vejam, os gêmeos idênticos tem 100% dos genes iguais. Do ponto de vista genético, a vida do seu irmão gêmeo vale tanto quanto a sua própria. E a do seu irmão tanto quanto a do seu filho. Mas você escolheria o seu irmão ao seu filho? Pergunta difícil não é? Apesar dos números igualarem as prioridades, a resposta mais comum seria a escolha do filho. Por que?

Porque para os genes, o tempo restante de vida é importante, já que aumenta as chances de reprodução de mais uma geração e de perpetuação desses genes. Em uma escolha como essa, a vida de quem tem mais chances de passar os genes adiante deve ser privilegiada, mesmo que em detrimento da sua própria.

Esse cálculo de probabilidades pode ficar complicado, e outros animais não têm como fazê-lo antes de decidirem se defendem ou atacam outro indivíduo com base no parentesco. Por isso, usam outros artifícios. A distância física por exemplo. Territorialismo e outros tipos de comportamentos animais acabam favorecendo, ainda que indiretamente, o reconhecimento do grupo familiar e, conseqüentemente, por quem vale a pena lutar e por quem vale a pena morrer. Tente entrar em um grupo de babuínos, ou no seletíssimo grupo das meninas da biologia da UFRJ turma de 89/1 e você vai ver do que estou falando: vai levar uma corrida!

Apesar disso, os humanos são extremamente permissíveis a indivíduos externos ao grupo familiar e a explicação mais plausível para isso é o altruísmo recíproco (veja aqui). Raffaella e Manoele me hospedaram e me levaram pra tomar gelatto em San Gimminiano quando eu estive em Florença, e eu hospedei e levei eles pra tomar caipirinha no Rio Scenarium quando estiveram no Rio. Não é justificativa mais do que suficiente?

Qual a diferença entre 1 e 4.500.000.000,00 (quatro bilhões e meio)?

Procurei uma metáfora para demonstrar à uns amigos porque tenho certeza da seleção natural.

O que você faria com R$ 1,00? E com R$ 4.500.000.000,00 (quatro bilhões e meio de reais)?

Eu diria que com um não dá pra fazer quase nada e com outro, quase qualquer coisa que você queira. Pois bem, a Terra tem 4,5 bilhôes de anos. O que a gente acha impossível da natureza ter feito em um ano, ou em 100, é o mesmo que a gente acha impossível conseguir fazer com apenas R$1,00. Já se a gente tivesse os bilhões…

Só que a Terra teve. E é por isso que as coisas estão todas ai.

Deus, é o tempo.

Quantas vezes o Vasco ainda vai perder do Botafogo?


Uma das coisas que me irrita nas transmissões de futebol são as estatísticas. Só perdem pro Galvão Bueno.

“Desde 1932, Vasco e Botafogo se enfrentaram 763 vezes, com 22% de vitórias para um, 44% de empates e 34% de vitórias para o outro”. Não, não sei se esses são os números corretos. Está tarde e estou com preguiça de procurar. Mas não importa.

E não importa porque, nesse caso, essa estatística não se aplica!

A probabilidade pode ser calculada para eventos repetitivos. Um dado sendo jogado muitas vezes permite apenas um determinado número de possibilidades, eventos, que se repetem exaustivamente. Esse é um evento repetititvo, onde todo o universo de possibilidades é conhecido.

Mas mutios outros eventos, a maioria dos eventos da vida real, não são repetitivos e as probabilidades associadas a eles não dependem de quantas vezes você repete, mas sim da aquisição de novas informações.

O fato de chover todo o dia 15 de junho nos últimos 23 anos, não define nenhuma probabilidade de que va chover hoje. As massas de ar, pressão atmosférica, temperatura, umidade… isso sim, pode te ajudar a decidir se vai sair com guarda chuva ou não

“O Botafogo não perde para o Vasco há mais de 10 jogos”

Essa parece uma estatística um pouco melhor. Porque os times devem ser os mesmos, assim como os técnicos, táticas de jogo… Mesmo assim, basta um jogador torcer o pé, outro comer feijão demais que… acaba toda a ‘repetibilidade’ do evento.

As estatísticas furadas são mais um motivo para você desligar o som da TV quando está assistindo futebol. Elas não ajudam a prever… NADA! E com isso só posso torcer para que a maré de sorte do Botafogo termine logo!

O que é a normalidade?


Alguns termos realizam todo o seu sentido apenas a luz da estatística. “Significativo” por exemplo, é um termo estatístico. Dizer que a diferença entre duas coisas é significativa, é dizer que a alteração (aumento ou redução) nessa grandeza foi testada com uma probabilidade de erro conhecida. Digamos, minha chance de estar errado é de… 5% (estatisticamente, essa é uma probabilidade aceitável de estar errado).

A mesma coisa serve para a normalidade. O termo “normal” certamente apareceu antes do seu significado estatístico, mas apenas na estatística ele se realizou plenamente.

Uma característica normal é aquela que se distribui em uma população seguindo uma curva gaussiana. Ops, compliquei. Refraseando, curva em forma de sino. Como na figura abaixo. Mas o que essa curva em forma de sino quer dizer?

Imagine que você pudesse medir a altura de todos os seus amigos. A não ser que você goste de sair por ai apenas com a galera do time de basquete, alguns poucos amigos devem ser muito altos. Da mesma forma, se seus outros amigos não são jóqueis, então outros poucos devem ser muito baixos. Alguns um pouco menos altos e outros um pouco menos baixos. Se você calcular a média (ah… esse sim é um termo estatístico que todo mundo conhece), vai descobrir que a maior parte dos seus amigos tem uma altura próxima ao valor da média. Vamos fazer um gráfico disso (minha namorada pergunta se eu vou desenhar pra ela entender melhor)?

A maioria das coisas que pode ser medida continuamente em uma escala, quando a gente avalia em uma população grande, apresenta uma distrubuição com essa forma de sino. E por isso, essa distribuição é chamada normal. Por que é normal que seja assim!

Mas a distribuição normal tem outras características importantíssimas. Ela é paramétrica: o lado direito da curva é igual ao lado esquerdo. Ou, da “média para baixo” é igual à “da média para cima”.

Já sei, você nunca gostou de matemática, não está entendendo onde eu quero chegar, e está quase desistindo. Mas enquanto a matemática tenta colocar tudo em números, a estatística quer explicar o mundo. E isso aqui é estatística. Me dá mais 1 min…

A questão é que o fato da curva ser paramétrica torna possível fazer um monte de… previsões (ahh… agora que eu falei em previsões, vocês gostaram, não é mesmo?!). Acordar, comer, cagar, ir pro trabalho, voltar pra casa… as vezes parece que nada muda. Todas essas são coisas “normais” e justamente porque não mudam, são previsíveis.

A normalidade está totalmente ligada a previsibilidade. Algo imprevisível… é anormal. Pelo menos a luz da estatística.

Essa previsibilidade da curva Gaussiana, permitiu o desenvolvimento de um monte de “ferramentas” estatísticas muito poderosas para estudar as variáveis que apresentam características normais. A média é uma dessas poderosas ferramentas. Fácil de calcular, muito descritiva e, principalmente, muito intuitiva. Todo mundo entende o que a média quer dizer.

O problema é que essas ferramentas só se aplicam aos dados com distribuição Gaussiana. Traduzindo: A média só pode ser usada no que é normal! E, apesar da altura dos seua amigos apresentarem uma distribuição normal… aposto que nem eles todos eles são.

E como fazer para lidar com as coisas (e amigos) que não são normais? Essa pergunta eu deixo para outro texto!

Contadores Sitemeter

Sobre ScienceBlogs Brasil | Anuncie com ScienceBlogs Brasil | Política de Privacidade | Termos e Condições | Contato


ScienceBlogs por Seed Media Group. Group. ©2006-2011 Seed Media Group LLC. Todos direitos garantidos.


Páginas da Seed Media Group Seed Media Group | ScienceBlogs | SEEDMAGAZINE.COM