A internet inteira numa bola de gude? É possível.

A internet produz uma quantidade colossal de informação a cada dia — em 2013 eram 5 exabytes por dia, equivalente a tudo que havia sido criado pela humanidade até 2003. Novos experimentos — do LHC às fotos em HD da New Horizons — também recolhem uma montanha de informação em frações de segundos. Antes de processar e analisar todos esses exabytes, é preciso resolver um problema mais básico: onde e como armazenar tudo isso?

Jogar tudo na “nuvem” é uma ilusão, jovem padawan. A “nuvem” não é um sistema de armazenamento abstrato situado em alguma terra mágica e operado por unicórnios. O que empresas como o Dropbox fazem é vender espaço disponível em fazendas com milhares, milhões de HDs não muito diferentes dos que existem dentro de cada computador.

Como toda mídia física, os HDs estão expostos a duas fraquezas fundamentais: o decaimento físico e a limitação de espaço. Como os livros — e os rolos de filme, as fitas cassete, as betamax, os VHS, os DVDs, os blu-rays — os HDs estragam, consomem energia e ocupam muito, muito, muito, muito espaço.

Quem tem desenvolvido os sistemas de armazenamento são basicamente os físicos. Talvez seja hora de passar o bastão para os biólogos — mais especificamente, os engenheiros da bioinformática. Já faz alguns anos que o armazenamento de informação no DNA vem sendo estudado nos laboratórios. Como notamos num post de 2012, o armazenamento genético

é incrivelmente denso (1 bit por base, sendo que as bases têm apenas alguns átomos de “comprimento”); é volumétrico (armazenamento em três dimensões; um disco de HD usa apenas duas) e é estável.

Se não parece grande coisa, vamos lembrar que um grama de DNA pode guardar 455 exabytes de informação — o equivalente a todos os dados do Google, Facebook e todas as maiores redes sociais, com espaço de sobra. Mas e quanto à estabilidade de tudo isso? Não adiantaria converter a internet para DNA se ela não durasse mais que alguns dias.

Dois pesquisadores da Suíça encontraram um método que pode preservar todo o Facebook ou a Wikipédia num pequeno espaço por uma eternidade. Robert Grass e Reinhard Heckel, ambos do Instituto Federal de Tecnologia de Zurique, sabem que o DNA não é uma mídia perfeita porque também pode decair. O decaimento do DNA se dá em contato com água e oxigênio. Mas esse não é o caso do material genético encontrado nos fósseis.

Em lugar de ossos enterrados, Grass propõe um sistema que põe o HD-DNA dentro de vidraria hermeticamente fechada. Levando-se em conta a densidade de informação do material genético sintético, seria possível guardar a internet inteira numa bolinha de gude. Com os devidos cuidados, essa mídia poderia sobreviver por milhões de anos.

Mesmo nessas condições quase perfeitas parte do material armazenado pode acabar corrompido ou se desintegrar — por exposição a radiações nucleares, por exemplo. Para contornar esse obstáculo, Heckel propõe o acréscimo de um DNA redundante, que não tomaria muito mais espaço e permitiria a recuperação da informação completa.

Segundo a New Scientist, o sistema foi testado com a codificação e armazenamento de dois antigos documentos — a Carta Federal Suíça de 1291 e o Palimpsesto de Arquimedes, coletânea de textos gregos datada do século X. Com apenas 83kb, os dois arquivos foram copiados três vezes, traduzidos em 4991 segmentos de DNA, cada qual com 158 nucleotídeos e armazenados em microesferas de vidro. Essas minúsculas esferas de vidro foram então armazenadas por uma semana a temperaturas entre 60 e 70ºC para simular envelhecimento.

Os resultados publicados por Grass e Heckel e seus colaboradores em fevereiro de 2015 na Angewandte Chemie indicam que os arquivos armazenados nessas condições continuaram legíveis sem quaisquer erros. O paper sugere, porém, que o ideal seria o armazenamento a baixas temperaturas: dados em DNA armazenado por volta de 10ºC podem durar uns 2000 anos. Nos 18 graus negativos do Global Seed Vault, os mesmos dados resistiriam por 2 milhões de anos.

Apesar do sucesso, Grass reconhece que a principal limitação de seu método ainda é o preço. A codificação dos 83kb custou 1000 libras (R$ 5888 ao câmbio de hoje). Fazer o mesmo com a Wikipédia custaria bilhões — e teria de ser feito várias vezes, dada a constante atualização de tudo o que está na web. O preço do armazenamento em baixas temperaturas por um prazo virtualmente interminável também deve ser levado em conta.

Então o que deveríamos armazenar para o futuro? Para a New Scientist, Grass sugeriu que a resposta estaria com os monges copistas da Idade Média: “Se observar como vemos a Idade Média hoje, é muito influenciado pela informação que foi armazenada. É muito importante que a gente tenha uma documentação relativamente neutra do nosso tempo para armazenar”.

Referências

rb2_large_gray25GRASS, Robert N. et al. Robust Chemical Preservation of Digital Information on DNA in Silica with Error-Correcting Codes [Preservação Química Robusta de Informação Digital em DNA em sílica, com códigos corretores de erros]. Angewandte Chemie International Edition. Volume 54, Issue 8, February 16, 2015. Pages 2552–2555

Photo credit: quadrapop via Visual hunt / CC BY-NC-SA

Related Posts Plugin for WordPress, Blogger...