Sunteți pe pagina 1din 11

Título

Tema 1

Tema 2

Tema 3
Dentro de los nuevos
sistemas de almacenamiento
que están surgiendo dentro
del universo Big Data,
Cassandra es uno de los
más interesantes y
reseñables. Cassandra se
define como una base de
datos NoSQL distribuida y
masivamente escalable, y
esta es su mayor virtud
desde nuestro punto de
vista, la capacidad
Historia y orígenes
El desarrollo inicial de Cassandra tiene su origen en Facebook, que lo diseñó para
potenciar la funcionalidad de búsqueda en el inbox. En 2008 fue liberado como proyecto
open source y en febrero de 2010 se convirtió en un proyecto top-level de la fundación
Apache.

Está inspirado e influenciado por los papers de Amazon Dynamo de 2007 y de Google
BigTable de 2006. Hoy en día está mantenido y desarrollado por la compañía Datastax.

Su nombre está inspirado por la sacerdotisa Cassandra de la mitología griega, que tenía el
don de la profecía, y predijo el engaño del Caballo de Troya.
Arquitectura y características

Cassandra nos proporciona tolerancia a particiones y disponibilidad, pero a cambio de


ser eventualmente consistente, tal y como define el teorema CAP. El nivel de
consistencia puede ser configurado, según nos interese, incluso a nivel de query.

Es distribuida, lo quiere decir que la información está repartida a lo largo de los nodos
del cluster. Además ofrece alta disponibilidad, de manera que si alguno de los nodos
se cae el servicio no se degradará.

Escala linealmente, lo que quiere decir que el rendimiento de forma lineal respecto al
número de nodos que añadamos. Por ejemplo, si con 2 nodos soportamos 100.000
operaciones por segundo, con 4 nodos soportaremos 200.000. Esto da mucha
predictibilidad a nuestros sistemas.
Escala de forma horizontal, lo que quiere decir que podemos escalar
nuestro sistema añadiendo nuevos nodos basados en hardware
commodity de bajo coste.

Implementa una arquitectura Peer-to-Peer, lo que elimina los puntos de


fallo único y no sigue patrones maestro-esclavo como otros sistemas de
almacenamiento.
Lenguaje CQL

Cassandra Query Language (CQL) es el lenguaje de acceso a datos en Cassandra, es


un derivado reducido de SQL. En Cassandra los datos están desnormalizados de
manera que el concepto de joins o subqueries no existe.

Podemos interactuar con Cassandra mediante CQL a través de la shell. de CQL,


cqlshell. También podemos usar herramientas gráficas como DevCenter o a través
de los drivers soportados para múltiples lenguajes de programación.
Ventajas y desventajas de Cassandra

Algunas de las ventajas de Apache Cassandra son:


• Alta disponibilidad, lo que es muy interesante para el sistema en los que una
caída sea crucial.
• Tolerancia a particiones y escalado.
• Cantidad de recursos que se tienen disponibles.

Algunas de sus desventajas:


• La conexión de nuevos nodos no es tarea fácil, ya que el mismo se tiene que
poner de acuerdo con el resto, y esto conlleva un tiempo.
• Debemos saber qué queries se van a ejecutar previamente, ya que al hacer
SELECT sufre un poco debido a la manera en la que almacena los datos.
Conclusión

Cassandra es una solución brillante para muchos casos de uso que podemos
encontrar en el mundo Big Data. Sin embargo, no es adecuada para alojar un data
warehouse convencional.

Lo ideal es tener claro desde el principio el caso de uso y el tipo de consultas que
haremos para diseñar la base de datos coherentemente, de esta manera podremos
manejar grandes volúmenes de datos y aprovecharnos de las ventajas de esta
potente base de datos distribuida.
Título

Espacio para frase


concreta.

S-ar putea să vă placă și