O genoma humano foi uma das maiores conquistas recentes da ciência. O projeto foi fundado em 1990, com prazo de conclusão de 15 anos . James D. Watson, na época chefe dos Institutos Nacionais de Saúde dos EUA, assumiu inicialmente a direção do projeto. Em 1990, o PGH tinha o envolvimento de mais de 5000 cientistas, de 250 diferentes laboratórios, que contavam com um orçamento, segundo diferentes fontes, que variou de US$ 3 bilhões a US$ 53 bilhões. Em 14 de abril de 2003, um comunicado de imprensa conjunto anunciou que o projecto fora concluído com sucesso, com o sequênciamento de 99% do genoma humano com uma precisão de 99,99%.
Empresas como a 23andme estão em uma nova corrida do Genoma. O desafio agora é desvendar os segredos do genoma de cada indivíduo para poder prever futuros problemas de saúde um dos primeiros passos para uma medicina personalizada. O 23andme não realiza um sequenciamento completo do genoma, mas foca em partes importantes que podem revelar doenças. O serviço tem uma infraestrutura computacional intensiva e um dos seus maiores investidores é o Google.
Mas que relação existe entre o Projeto Genoma Humano e o Hadoop ? Muitos dos custos iniciais de sequenciar inicialmente o Genoma eram custos computacionais e estes custos cairam significativamente ao longo dos anos. A facilidade de usar ferramentas Big Data como o Hadoop vai permitir que um número muito maior de descobertas sejam feitas explorando os dados gerados pelo sequenciamento de DNA. Quem nunca parou para pensar que nossos smartphones de hoje são tão poderosos quanto os nossos desktops de antigamente ? O barateamento do poder computacional vai provocar impactos muito maiores do que video games mais poderosos e computadores menores.
Segundo estimativas do National Human Genome Research Institute o custo total de sequenciar o genoma humano vai cair para $1000 até 2014 e segundo alguns especialistas pode chegar até $100. Este barateamento vai gerar uma explosão no volume de dados relacionados ao genoma e muitas oportunidades.
Estamos sempre falando de Big Data aqui, mas um erro muito comum que é pensar em Big Data apenas como dados de redes sociais e na web. Esta tendência está apenas começando e vamos ver muitas aplicações que vão além do mundo da web.
Nesta palestra interessante do Deepak Singh vemos como aplicar o Hadoop na Bioinformática.
Hadoop for Bioinfomatics - Deepak Singh from Cloudera on Vimeo.


Dom, Abr 25, 2010
Hadoop