Medo de Abelhas? Dicas e Truques para Apache Hive
Cada vez mais famoso e utilizado, o Apache Hive é um sistema de data warehouse para Hadoop. O Hive permite o resumo de dados, consultas e análise de dados. Consultas de hive são escritas em HiveQL, que é uma linguagem de consulta semelhante ao SQL. O Hivepermite que você projete estrutura em grandes volumes…
Domando o Elefante – Principais Comandos Hadoop para gerenciar o HDFS
Neste artigo, apresentarei as principais operações Hadoop para manipular o HDFS por meio de comandos shell. Para testar, você pode utilizar esses comandos usando algumas das VMs da Cloudera, Hortonworks, HDInsight, ou se você possui sua própria configuração de cluster. 1 – Criar um diretório…
Bancos NoSQL, como assim não tem Query ?
Dando continuidade a série de artigos sobre Big Data, vamos falar um pouco sobre os bancos de dados não relacionais. Particularmente quando comecei a ouvir o termo “NoSQL” minha cabeça dava um nó. “Bancos NOSQL, como assim não tem query?”, “Como fazer pra armazenar os dados?”,…
O que você precisa saber sobre Big Data e não passar vergonha no papo do Café ?
Imagine a seguinte situação, um diretor da empresa que você trabalha começa a fazer as seguintes perguntas: “Quantas vezes o nome da minha empresa é citada no Twitter ?” ou “Quais são as maiores dúvidas ou reclamações dos consumidores em nossa página no Facebook ?”…
DW com Hadoop? Como modelar seu Star Schema para o HDFS
Ao longo dos anos, os data warehouses têm sido a principal ferramenta para a tomada de decisão e análise da empresas. Estes incluem ferramentas OLAP e ETL convencionais fornecidas por inúmeros fornecedores de hardware e software, aparelhos DW criados pela combinação de bases de dados e servidores, bancos de…