Tag Archive | "Hadoop"

Como o Last.fm usa o Hadoop para lhe recomendar músicas

Terça-feira, Outubro 5, 2010

0 Comments

Tweet Aqui no Escalabilidade estamos acompanhando de perto tudo que se relaciona a esta era de Big Data. Muitas empresas já estão se aproveitando de quantidades massivas de dados para gerar valor para os seus clientes. Uma das ferramentas mais poderosas desta era sem dúvida é o Hadoop. Já falamos aqui de como o Twitter [...]

Continuar Lendo...

Usando Hadoop para vencer o SPAM

Quarta-feira, Setembro 29, 2010

1 Comment

Tweet Existem estimativas de que o volume de spam global este ano vai crescer de 30% a 40% em relação a 2009. Recentemente o nível de SPAM chegou a 92% de todas as mensagens de e-mail. Os spammers passaram a visar as midias sociais também. Em 2008 o Facebook praticamente não era alvo de mensagens [...]

Continuar Lendo...

Melhorando a propaganda usando Hadoop

Terça-feira, Setembro 28, 2010

1 Comment

Tweet No post anterior falamos sobre como o Hadoop pode ser usado em uma infinidade de aplicações. Uma das areas de maior preocupação na web é como tornar a publicidade mais relevante já que muitos dos sites e aplicativos dependem desta forma de adquirir receita. Não só no nas empresas o Hadoop tem sido utilizado [...]

Continuar Lendo...

Usos práticos do hadoop

Segunda-feira, Setembro 27, 2010

3 Comments

Tweet O Hadoop é o framework de computação distribuída mais usado quando se pensa em BIG Data. Já até fizemos aqui no escalabilidade uma introdução ao Hadoop. Muitos desenvolvedores tem a curiosidade de saber em que tipo de problemas o Hadoop pode ser usado. Compilamos uma lista de cenários possíveis para aplicação deste framework que [...]

Continuar Lendo...

Introdução ao Hadoop parte III : Guia de projetos

Quarta-feira, Junho 30, 2010

1 Comment

Tweet O Hadoop cresceu de um pequeno subprojeto para um grande framework para computação distribuída em poucos anos. No nosso post anterior contamos um pouco da história do Hadoop e agora vamos entender como o projeto é organizado hoje em dia. O projeto Hadoop é hoje um projeto independente dentro da hierarquia de projetos da [...]

Continuar Lendo...

IBM lança distribuição do Hadoop

Quarta-feira, Junho 23, 2010

0 Comments

Tweet Já não é segredo para ninguém que o Hadoop é hoje a plataforma mais sólida para processamento de dados em larga escala. Esta semana ficamos sabendo que a Cloudera está trabalhando em conjunto com a Quest Software para fornecer uma integração dos produtos Oracle com o Hadoop. Isto demonstra mais uma vez que a [...]

Continuar Lendo...

Introdução ao Hadoop Parte II : Uma breve história do Hadoop

Terça-feira, Junho 22, 2010

4 Comments

Tweet O Hadoop foi criado por Doug Cutting. Ele também é o criador do projeto Apache Lucene, uma biblioteca de busca em texto amplamente usada. O Hadoop se originou no projeto Apache Nutch, um buscador open source que também faz parte do projeto Lucene. A tarefa de construir um buscador, que funcione na escala da [...]

Continuar Lendo...

Introdução ao Hadoop parte I: Porque você deveria aprender Hadoop ?

Terça-feira, Maio 18, 2010

4 Comments

Tweet Hoje é possível em poucas horas, com alguns dolares e com algumas máquinas processar um volume relativamente grande de dados . Em grande parte isso se deve ao Hadoop, um framework para processamento de dados em larga escala. Ele se utiliza do paradigma de programação Map Reduce para realizar computação distribuída em clusters contendo [...]

Continuar Lendo...

Mais dados vencem melhores algoritmos

Quarta-feira, Março 3, 2010

2 Comments

Tweet Por muito tempo o maior enfoque nas áreas de IA ( Inteligência Artificial ) focaram em algoritmos cada vez mais poderosos para conseguir extrair o máximo dos dados disponíveis. Mas em geral estes algoritmos mais poderosos são também mais complexos e não escalam bem para grandes quantidades de dados. Uma propriedade interessante do uso de datasets massivos [...]

Continuar Lendo...

IBM utiliza Hadoop em seu projeto BigSheets

Sexta-feira, Fevereiro 26, 2010

3 Comments

Tweet A IBM está trabalhando com a Biblioteca Britânica em um projeto para preservar e  analisar terabytes de informação na web antes que eles se percam para sempre. Pesquisas recentes mostram que a expectativa de vida média de uma página web é de 44  a 75 dias. A cada seis meses aproximadamente 10 por cento das paginas com domínio uk  são perdidas. [...]

Continuar Lendo...