Apache Cassandra

download Apache Cassandra

If you can't read please download the document

  • date post

    24-Jun-2015
  • Category

    Technology

  • view

    256
  • download

    4

Embed Size (px)

Transcript of Apache Cassandra

  • 1. Jonathan Ricardo, Ortiz Vilca 6to CicloEmpecemos a aprenderunpoco mas sobre la actualidad 06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI1

2. Jonathan Ricardo, Ortiz Vilca 6to CicloApache Cassandra06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI2 3. Jonathan Ricardo, Ortiz Vilca 6to CicloQue esApache?Cassandra06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI3 4. Jonathan Ricardo, Ortiz Vilca 6to CicloApache CassandraAntes de Responder a esta pregunta, debemos responder a Que esNoSQL? es necesario responder a esto primero, ustedes se darn cuenta del por qu, mas adelante. 06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI4 5. Jonathan Ricardo, Ortiz Vilca 6to CicloApache CassandraNoSQLLlamado en algunos casos no solo SQL, proviene de una amplia clase de gestin de base de datos que difieren del modelo clsico del Relation DataBase Management System (RDBMS), no estructuradas, siendo el mas destacado de los que no usan SQL como su principal lenguaje de consultas.106/11/2013Universidad Peruana de Ciencias e Informatica - FISEI5 6. Jonathan Ricardo, Ortiz Vilca 6to Ciclo06/11/2013Sabias que? Universidad Peruana de Ciencias e Informatica - FISEI6 7. Jonathan Ricardo, Ortiz Vilca 6to CicloApache Cassandra Sabias que ?El 95% de la informacin que se est generando actualmente en la red se corresponde con informacin no estructurada y las bases de datos relacionales tradicionales no son adecuadas para el manejo de esta informacin. Los nuevos sistemas de gestin de datos desarrollados para su manejo, que utilizan infraestructuras de supercomputacin altamente distribuidas, reciben habitualmente el nombre de NoSQL.06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI7 8. Jonathan Ricardo, Ortiz Vilca 6to CicloContrastando NoSQL y SQL? 06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI8 9. Jonathan Ricardo, Ortiz Vilca 6to CicloApache CassandraNoSQL y SQL (contraste)principal diferenciaLa radica en cmo guardan los datos (por ejemplo, almacenamiento de un recibo): En una RDBMS tendramos que partir la informacin en diferentes tablas y luego usar un lenguaje de programacin en la parte servidora para transformar estos datos en objetos de la vida real. En NoSQL, simplemente guardas el recibo: NoSQL es libre de schemas, t no diseas tus tablas y su estructura por adelantado06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI9 10. Jonathan Ricardo, Ortiz Vilca 6to CicloApache CassandraAhora que ya tenemos una base, a la respuesta a la pregunta de Que esNoSQL? nos toca contarte Que es Cassandra?.06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI10 11. Jonathan Ricardo, Ortiz Vilca 6to CicloApache CassandraQu es Apache Cassandra?un motor de bases de datos NoSQL, Open Source e implementado enEsJava. Fue originalmente creada por Facebook y donada a Apache como software libre en 2009.Es una de las base de datos NoSQLms relevantes a nivel mundial: Netflix, eBay, Twitter, Urban Airship, Constant Contact, Reddit, Cisco, OpenX, Digg, CloudKick, O oyala, 06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI11 12. Jonathan Ricardo, Ortiz Vilca 6to CicloApache CassandraQu es Apache Cassandra? Cassandra puede manejar varios terabytes de datos si lo necesita y clsterpuede, fcilmente, manejar millones de ficheros, incluso en un pequeo (Big Data). La informacin en las bases de datos relacionales, se almacenan en forma de filas, pero en Cassandra la informacin se almacena en columnas con pares key-value.06/11/2013El trmino clster (del ingls cluster, "grupo" o "racimo") se aplica a los conjuntos o conglomerados de computadoras construidos mediante la utilizacin de hardware comunes y que se Universidad Peruana de Ciencias e comportan como si fuesen una nica computadora Informatica - FISEI12 13. Jonathan Ricardo, Ortiz Vilca 6to CicloApache CassandraBien!, ya tenemos un concepto de Apache Cassandra peroCules sonsus?Caractersticas a continuacin.06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI13 14. Jonathan Ricardo, Ortiz Vilca 6to CicloApache CassandraCassandra (caractersticas)No hay un nico punto de fallo. Los datos se replican automticamente a varios nodos. Perder un nodo no causa la baja del clster.Alta disponibilidad. Los datos ests disponibles la mayor parte del tiempo gracias a la redundancia que introduce la replicacin de datos.Esquema dinmico. El esquema que define la estructura de los datos puede cambiar en tiempo de ejecucin.06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI14 15. Jonathan Ricardo, Ortiz Vilca 6to CicloApache CassandraCassandra (caractersticas)Fragmentacino de los datos. La topologa de Cassandra es la de un anillo a travs del cual se distribuyen los datos para minimizar cuellos de botella en el acceso a los mismos. Escalabilidad horizontal. Hasta un alto nmero de mquinas la capacidad de cmputo aumenta linealmente con el nmero de mquinas.Capacidad para manejar cientos de gigabytes de datos.06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI15 16. Jonathan Ricardo, Ortiz Vilca 6to CicloApache CassandraUno de las preguntas mas importantes esCul es Terminologia06/11/2013Universidad Peruana de Ciencias e Informatica - FISEIsu? 16 17. Jonathan Ricardo, Ortiz Vilca 6to CicloApache CassandraCul es su terminologa?Column. Es la unidad mas bsica en el modelo dedatos de Cassandra. Una column es un triplete de un key (un nombre) un value (un valor) y un timestamp. Los valores son todos suministrados por el cliente. El tipo de dato del key y el value son matrices de bytes de Java, el tipo de dato del timestamp es un long primitive. Las column son inmutables para evitar problemas de multithreading. Las column se organizan dentro de las columns families. Las column se ordenan por un tipo, que pueden ser uno de los siguientes: 06/11/2013AsciiType BytesType LongType TimeUUIDType UTF8TypeUniversidad Peruana de Ciencias e Informatica - FISEI17 18. Jonathan Ricardo, Ortiz Vilca 6to CicloApache CassandraCul es su terminologa? SuperColumn. Es una column cuyos values son una o mscolumns, que en este contexto se llamaran subcolumns. Las subcolumns estn ordenadas, y el numero de columnas que se puede definir es ilimitada. Las Super columns, a diferencias de las columns, no tienen un timestamp definido. Column Family. Es mas o menos anlogo a una tabla en unmodelo relacional. Se trata de un contenedor para una coleccin ordenada de columns. Cada column family se almacena en un archivo separado Keyspace. Es el contenedor para las column family. Es mas o menos anlogo a una base de datos en un modelo relacional, usado en Cassandra para separar aplicaciones. Un keyspace es una coleccin ordenada de columns family. Clster. Conjunto de mquinas que dan soporte a Cassandra y son vistas por los clientes como una nica mquina.06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI18 19. Jonathan Ricardo, Ortiz Vilca 6to CicloApache CassandraAhora veremos Cmo es la estructura de su?modelo de Datos 06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI19 20. Jonathan Ricardo, Ortiz Vilca 6to CicloApache CassandraCmo es la estructura de su modelo de datos?06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI20 21. Jonathan Ricardo, Ortiz Vilca 6to CicloApache CassandraCmo es la estructura de su modelo de datos?06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI21 22. Jonathan Ricardo, Ortiz Vilca 6to CicloApache CassandraEspero haberles servido de ayuda en algunas de sus dudasGracias por su Tiempo Hasta la proxima 06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI22 23. Jonathan Ricardo, Ortiz Vilca 6to CicloFuentes NoSQL http://es.wikipedia.org/wiki/NoSQL http://www.slideshare.net/dipina/nosqlintroduccin-a-las-bases-de-datos-noestructuradas (recomendada). Palabras informticas http://es.wikipedia.org/wiki/Cl%C3%BAster_(info rm%C3%A1tica) (clster). http://en.wikipedia.org/wiki/Attribute%E2%80%9 3value_pair (key - value) 06/11/2013Universidad Peruana de Ciencias e Informatica - FISEI23