Tweet Podemos aprender muitas coisas apenas lendo documentação e tutorias na web mas um livro completo e organizado nos ajuda a estruturar nosso aprendizado. Assim podemos tirar maior proveito das informações que dispomos livremente na web. Pensando nisto vamos começar a recomendar alguns livros para vocês. Ja recomendamos os melhores livros sobre nosql e agora recomendo [...]
Continuar Lendo...25. Outubro 2010
Tweet O genoma humano foi uma das maiores conquistas recentes da ciência. O projeto foi fundado em 1990, com prazo de conclusão de 15 anos . James D. Watson, na época chefe dos Institutos Nacionais de Saúde dos EUA, assumiu inicialmente a direção do projeto. Em 1990, o PGH tinha o envolvimento de mais de [...]
Continuar Lendo...5. Outubro 2010
Tweet Aqui no Escalabilidade estamos acompanhando de perto tudo que se relaciona a esta era de Big Data. Muitas empresas já estão se aproveitando de quantidades massivas de dados para gerar valor para os seus clientes. Uma das ferramentas mais poderosas desta era sem dúvida é o Hadoop. Já falamos aqui de como o Twitter [...]
Continuar Lendo...29. Setembro 2010
Tweet Existem estimativas de que o volume de spam global este ano vai crescer de 30% a 40% em relação a 2009. Recentemente o nível de SPAM chegou a 92% de todas as mensagens de e-mail. Os spammers passaram a visar as midias sociais também. Em 2008 o Facebook praticamente não era alvo de mensagens [...]
Continuar Lendo...28. Setembro 2010
Tweet No post anterior falamos sobre como o Hadoop pode ser usado em uma infinidade de aplicações. Uma das areas de maior preocupação na web é como tornar a publicidade mais relevante já que muitos dos sites e aplicativos dependem desta forma de adquirir receita. Não só no nas empresas o Hadoop tem sido utilizado [...]
Continuar Lendo...27. Setembro 2010
Tweet O Hadoop é o framework de computação distribuída mais usado quando se pensa em BIG Data. Já até fizemos aqui no escalabilidade uma introdução ao Hadoop. Muitos desenvolvedores tem a curiosidade de saber em que tipo de problemas o Hadoop pode ser usado. Compilamos uma lista de cenários possíveis para aplicação deste framework que [...]
Continuar Lendo...30. Junho 2010
Tweet O Hadoop cresceu de um pequeno subprojeto para um grande framework para computação distribuída em poucos anos. No nosso post anterior contamos um pouco da história do Hadoop e agora vamos entender como o projeto é organizado hoje em dia. O projeto Hadoop é hoje um projeto independente dentro da hierarquia de projetos da [...]
Continuar Lendo...23. Junho 2010
Tweet Já não é segredo para ninguém que o Hadoop é hoje a plataforma mais sólida para processamento de dados em larga escala. Esta semana ficamos sabendo que a Cloudera está trabalhando em conjunto com a Quest Software para fornecer uma integração dos produtos Oracle com o Hadoop. Isto demonstra mais uma vez que a [...]
Continuar Lendo...22. Junho 2010
Tweet O Hadoop foi criado por Doug Cutting. Ele também é o criador do projeto Apache Lucene, uma biblioteca de busca em texto amplamente usada. O Hadoop se originou no projeto Apache Nutch, um buscador open source que também faz parte do projeto Lucene. A tarefa de construir um buscador, que funcione na escala da [...]
Continuar Lendo...18. Maio 2010
Tweet Hoje é possível em poucas horas, com alguns dolares e com algumas máquinas processar um volume relativamente grande de dados . Em grande parte isso se deve ao Hadoop, um framework para processamento de dados em larga escala. Ele se utiliza do paradigma de programação Map Reduce para realizar computação distribuída em clusters contendo [...]
Continuar Lendo...
17. Maio 2012
2 Comentários