Cassandra + Hadoop: Analisi Batch con Apache Cassandra

10
Cassandra + Hadoop Analisi batch con Apache Cassandra

description

 

Transcript of Cassandra + Hadoop: Analisi Batch con Apache Cassandra

Page 1: Cassandra + Hadoop: Analisi Batch con Apache Cassandra

Cassandra + Hadoop

Analisi batch con Apache Cassandra

Page 2: Cassandra + Hadoop: Analisi Batch con Apache Cassandra

Apache Cassandra

•Collezione di servers, un singolo database

•Architettura semplice

•Completamente distribuito

•Replica efficacemente fra i datacenters

•Fault tolerant

•E’ un database realtime

Page 3: Cassandra + Hadoop: Analisi Batch con Apache Cassandra

Alcuni Utenti

Page 4: Cassandra + Hadoop: Analisi Batch con Apache Cassandra

Scala Linearmente

Page 5: Cassandra + Hadoop: Analisi Batch con Apache Cassandra

Modellare I Dati

•Siamo abituati ad SQL

•Con Cassandra, si modellano i dati a seconda delle modalita’ di interrogazione

•Un column family per ciascun tipo di interrogazione

Page 6: Cassandra + Hadoop: Analisi Batch con Apache Cassandra

Altre Caratteristiche

•Fault tolerance

•Si possono perdere nodi o datacenters interi

•Ottimizzato per la scrittura dati

•Eventual consistency

•Si possono replicare i dati attraverso molti datacenters

Page 7: Cassandra + Hadoop: Analisi Batch con Apache Cassandra

Analisi Batch• Abbiamo molti dati

• Vogliamo eseguire interrogazioni ed aggregazioni complesse sui dati

• Che fare?

• Hadoop!

• Supporto per Hadoop da 2010

• Il JobTracker da i job verso nodi che hanno la suddivisione i dati

Page 8: Cassandra + Hadoop: Analisi Batch con Apache Cassandra

Workload Isolation

•Nessuna interferenza con le interrogazioni realtime

•Usiamo un datacenter per ogni workload

•Ogni workload ha la sua copia dei dati

Page 9: Cassandra + Hadoop: Analisi Batch con Apache Cassandra

Usi Specifici Con Cassandra

•Creare un nuovo modo di interrogare i dati

•Validare i dati

•Correggere i dati

Page 10: Cassandra + Hadoop: Analisi Batch con Apache Cassandra

Domande?

•Jeremy Hanna

[email protected]

•@jeromatron (twitter e irc)