Robson Motta - Computer on the beach 2014
-
Upload
robson-motta -
Category
Technology
-
view
206 -
download
0
Transcript of Robson Motta - Computer on the beach 2014
Robson Motta | [email protected]
Big Data e MapReduceAdmirável mundo novo
Mais de200 milhões
page views mensais
116 milhões de pedidos
3 bilhõesde visitas
em produtos
700 milhõesde recomendações
geradas diariamente
Como armazenar?
Como processar?
Como visualizar?
Como monitorar?
Sumário
• A Chaordic
• Chaordic + Big Data + Cloud
• Dos eventos às recomendações
• A vida não é bela: surgem os desafios
• Visualizando e monitorando
• Futuro?
+
Como tudo começou
Como fazemosComofazemos?
+
• Volume
• Velocidade
• Variedade
quantidade de dados
tempo de processamento
2010
16 M eventos 3 dias
quantidade de dados
tempo de processamento
2010 2014
16 M eventos
4500 M eventos3 dias
quantidade de dados
tempo de processamento
2010 2014
16 M eventos
4500 M eventos3 dias 7 horas
Arquitetura
Onsite
DashboardEngine
Platform
Como armazenar?
Node 1
Node 3
Node 2Node...
"Batch" Cassandra ClusterAvailability Zone - 2
Node 1
Node 3
Node 2Node...
"Online" Cassandra ClusterAvailability Zone - 1
Online Service Tier Batch Service Tier
Como processar? MapReduce
Um novo paradigmaque permite e facilitaa implementação de
algoritmos distribuídos
Data
Robson Motta Raul Seixas Ed Motta Reginaldo Rossi Nelson Mandela Valentino Rossi
Map
Motta, 1 Seixas, 1 Motta, 1 Rossi, 1 Mandela, 1 Rossi, 1
Mandela, (1) Motta, (1, 1) Rossi, (1, 1) Seixas, (1)
Reduce
Mandela, (1) Motta, (1, 1) Rossi, (1, 1) Seixas, (1)
Mandela, 1 Motta, 2 Rossi, 2 Seixas, 1
Como processar?
Data
A - B Cadeira - D Cadeira - E Cadeira - E F - A
Map
A, (B, F) B, (A) Cadeira, (D, E, E) D, (Cadeira) E, (Cadeira,Cadeira) F, (A)
Reduce
A, [B, F] B, [A] Cadeira, [E, D] D, [Cadeira] E, [Cadeira] F, [A]
Como processar?
Hadoop: HDFS e Hadoop MapReduce
• Escalável
• Custo reduzido
• Flexível
• Tolerante a falha
Como processar?
Engine
3
Como processar?
Engine Core
Platform
EC2 + EMR
S3
Uploader
5
64
2
1
recomendações
eventos
recomendações
eventos
préprocessamento
processamento
pós processamento
● produtos vistos● cliques● pedidos
etc.
• Itens muito populares• Eventos inesperados• Clientes diferentes• Sazonalidade• Ausência de eventos
Desafios
Desafios
Desafios
R$ 270,81
Usuário entrouna página paracomprar a boneca...
...e sugerimos que elelevasse junto um pneu
Compras conjuntas?
Desafios
+
Compras conjuntas?
Desafios
+
31
Dados consistentes?
Desafios
+
Dados consistentes?
Desafios
+
Bot gerando eventos?
Desafios
+
Bot gerando eventos?
Desafios
+
Kit daprópria loja?
Desafios
+
Desafios
+
Kit daprópria loja?
Destaquessimultâneos?
Desafios
+
Reduziramde preço?
Desafios
+
Reduziramde preço?
Desafios
+...só o pneu
Quandoreduziu?
Desafios
+
Quandoreduziu?
Desafios
+
Conclusão...Desafios
+
Promoção de pneu no dia das crianças
Desafios
+
Visualizandoe monitorando
Visualizare monitorar
• Consultas em bases não relacionais
• Acompanhamento de desempenho
• Visualização de logs
• Acompanhamento de custos
Visualizar
KINESIS STORM
Real Time Big Data Processing
Futuro
SHARK
In Memory Big Data Processing
Futuro
Robson [email protected]
/chaordic.com.br