Sunteți pe pagina 1din 3

Qu es un appliance?

Un software appliance o dispositivo de software (aplicacin informtica) es una pila de


aplicaciones que contiene el sistema operativo, el software de aplicacin y las dependencias
necesarias, adems de la configuracin y los archivos de datos necesarios para el funcionamiento.
Todo est preinstalado, preintegrado, y listo para funcionar.

Qu es un Greenplum?
Greenplum es un Big Data empresa de anlisis en San Mateo , California . Los productos de
Greenplum incluyen Plataforma Unificada Greenplum Analytics, Greenplum Data Computing
Appliance, Greenplum Analytics Lab, Greenplum Database, Greenplum HD y Greenplum Chorus.
Greenplum fue adquirida por EMC en julio de 2010, [1] convirtindose en el fundamento de la
divisin Big Data de EMC.
La base de datos Greenplum construye sobre los cimientos de cdigo abierto base de datos
PostgreSQL . [6] It funciona principalmente como un almacn de datos y utiliza una comparticin
nula , masivamente paralelo arquitectura de procesamiento (MPP). En esta arquitectura, los datos
se divide en servidores mltiples segmentos, y cada segmento posee y gestiona una parte distinta
de los datos en general, no hay una distribucin a nivel de disco ni contencin de datos entre
segmentos.
Qu es el exadata?
el exadata es un RAC bien dimensionado que, adems ha llevado parte de la lgica del
almacenaminento al subsistema de disco.
Qu es el Netezza?
Netezza, esencialmente, es una compaa uniproducto. Si IBM no lo quiere, qu quiere pues?
(tal vez la tecnologa para netezzar DB2?)
Netezza no vende slo ceds sino mquinas en las que corre su software (a razn como de 20.000
dlares por TB, aparentemente, que viene a ser lo que cuesta un TB de RAM); y estas mquinas
son desde no hace mucho blades de IBM (podra extenderme aqu con alguna frase en la que
utilizar la palabra sinergia).
Qu es HANNA (SAP)?
Base de datos en memoria relacional por SAP para sustituir sus aplicaciones de BI bajo el
concepto de funcionar en memoria y en la actualidad todo es llamado HANNA.
Qu es SOLID DB (IBM)?
IBM solidDB es una familia de productos, desarrollado y comercializado por IBM . La familia de
productos incluye dos productos construidos en torno a un in-memory sistema de gestin de base
de datos relacional . El primer producto es un sistema de gestin de base de datos relacional
independiente titulado solidDB. El segundo producto, lanzado al mercado en 2008, es un producto
Universal Cache, acertadamente titulado solidDB Universal Cache.
Bases de Datos Columnares
Las Bases de Datos Columnares se introdujeron por primera vez en 1970 en productos como
Model 204 y ABABAS, este enfoque ha resurgido recientemente en Vertica y en cierta medida en
QD Technology.
Como su nombre lo indica, las bases de datos estn organizados de columna por columna en lugar
de la fila: es decir, todos los casos de un solo elemento de datos (por ejemplo, Nombre de cliente)
se almacenan de modo que se puede acceder como una unidad. Esto los hace especialmente
eficaz en las consultas analticas, como la lista de selecciones, que a menudo lee unos pocos
elementos de datos, pero necesitamos ver todas las instancias de estos elementos. En contraste,
una convencional base de datos relacional almacena los datos por filas, por lo que toda la
informacin de un registro (fila) es inmediatamente accesible. Esto tiene sentido para las consultas
transaccionales, que suelen referirse a un registro a la vez.

Hoy los sistemas columnares combinan su estructura columnar con tcnicas que incluyen la
indexacin, compresin y paralelizacin.

Tiempo de carga: Cunto tiempo se necesita para convertir datos de origen en el formato de
columna? Esta es la pregunta ms bsica de todas. Tiempos de carga son a menudo medidos en
gigabytes por hora, que puede ser extremadamente lento, cuando de decenas o cientos de
gigabytes de datos se trata. La cuestin a menudo carece de una respuesta sencilla, porque la
velocidad de carga puede variar en funcin de la naturaleza de los datos y las elecciones realizadas
por el usuario. Por ejemplo, algunos sistemas pueden almacenar varias versiones de los mismos
datos, ordenados en diferentes secuencias o en los diferentes niveles de agregacin. Los usuarios
pueden construir un menor nmero de versiones a cambio de una carga rpida, pero puede pagar
un precio ms adelante con consultas ms lentas. Pruebas realistas basadas en sus propios datos
son el mejor camino para una respuesta clara.

Carga Incremental: Una vez que un conjunto de datos se ha cargado, todo debe ser recargado
cada vez que hay una actualizacin. Muchos sistemas columnares permiten carga incremental,
teniendo slo los registros nuevos o modificados y la fusin de los datos anteriores. Pero la
atencin al detalle es fundamental, ya que las funciones de carga incremental varan ampliamente.
Algunas cargas incrementales tardan hasta una completa reconstruccin y algunos resultados son
el rendimiento ms lento, algunos pueden agregar registros, pero no cambiar o suprimirlos. Las
Cargas incrementales a menudo deben completarse peridicamente con una reconstruccin
completa.
Compresin de datos: Algunos sistemas columnares pueden comprimir mucho la fuente de datos
y archivos resultantes a fin de tomar una fraccin de espacio en el disco original. Puede ocasionar
en estos casos un impacto negativo en el rendimiento por la descompresin de datos a realizar la
lectura. Otros sistemas utilizan menos compresin o almacenan varias versiones de los datos
comprimidos, teniendo ms espacio en disco, pero cobrando otros beneficios a cambio. El
enfoque ms adecuado depender de sus circunstancias. Tenga en cuenta que la diferencia de los
requisitos de hardware pueden ser sustanciales.
Limitaciones estructurales: Las bases de datos columnares utilizan diferentes tcnicas para imitar
una estructura relacional. Algunos requieren la misma clave principal en todas las tablas, es decir,
la jerarqua de la base de datos est limitada a dos niveles. Los lmites impuestos por un sistema
en particular no parece tener importancia, pero recuerde que sus necesidades pueden cambiar
maana. Limitaciones que parece aceptable ahora podra evitar que la ampliacin del sistema en
el futuro.
Tcnicas de acceso: Algunas bases de datos de columnares slo se pueden acceder utilizando su
propio proveedor de lenguaje de consultas y herramientas. Estos pueden ser muy poderosos,
incluyendo capacidades que son difciles o imposibles usando el estndar SQL. Pero a veces faltan
funciones especiales, tales como las consultas que comparan valores con o en los registros. Si
necesita acceder al sistema con herramientas basadas en SQL, determine exactamente qu
funciones SQL y dialectos son compatibles. Es casi siempre un subconjunto completo de SQL y, en
particular, rara vez se dispone de las actualizaciones. Tambin asegrese de encontrar si el
rendimiento de las consultas SQL es comparable a los resultados con el sistema de la propia
herramienta de consulta. A veces, el ejecutar consultas SQL mucho ms lento.
Rendimiento: Los sistemas columnares por lo general superan a los sistemas de relaciones en casi
todas las circunstancias, pero el margen puede variar ampliamente. Las consultas que incluyen
clculos o acceso individual a los registros puede ser tan lento o ms que un sistema relacional
adecuadamente indexado.
Escalabilidad: El punto de las bases de datos columnares es obtener buenos resultados en
grandes bases de datos. Pero no puede asumir todos los sistemas pueden escalar a decenas o
centenares de terabytes. Por ejemplo, el rendimiento puede depender de determinados ndices de
carga en la memoria, de modo que su equipo debe tener memoria suficiente para hacer esto.
Como siempre, en primer lugar preguntar si el vendedor tiene en ejecucin los sistemas existentes
a una escala similar a la suya y hablar con las referencias para obtener los detalles. Si el suyo sera
ms grande que cualquiera de las instalaciones existentes, asegrese de probar antes de comprar.

S-ar putea să vă placă și