Un software appliance o dispositivo de software (aplicacin informtica) es una pila de
aplicaciones que contiene el sistema operativo, el software de aplicacin y las dependencias necesarias, adems de la configuracin y los archivos de datos necesarios para el funcionamiento. Todo est preinstalado, preintegrado, y listo para funcionar.
Qu es un Greenplum? Greenplum es un Big Data empresa de anlisis en San Mateo , California . Los productos de Greenplum incluyen Plataforma Unificada Greenplum Analytics, Greenplum Data Computing Appliance, Greenplum Analytics Lab, Greenplum Database, Greenplum HD y Greenplum Chorus. Greenplum fue adquirida por EMC en julio de 2010, [1] convirtindose en el fundamento de la divisin Big Data de EMC. La base de datos Greenplum construye sobre los cimientos de cdigo abierto base de datos PostgreSQL . [6] It funciona principalmente como un almacn de datos y utiliza una comparticin nula , masivamente paralelo arquitectura de procesamiento (MPP). En esta arquitectura, los datos se divide en servidores mltiples segmentos, y cada segmento posee y gestiona una parte distinta de los datos en general, no hay una distribucin a nivel de disco ni contencin de datos entre segmentos. Qu es el exadata? el exadata es un RAC bien dimensionado que, adems ha llevado parte de la lgica del almacenaminento al subsistema de disco. Qu es el Netezza? Netezza, esencialmente, es una compaa uniproducto. Si IBM no lo quiere, qu quiere pues? (tal vez la tecnologa para netezzar DB2?) Netezza no vende slo ceds sino mquinas en las que corre su software (a razn como de 20.000 dlares por TB, aparentemente, que viene a ser lo que cuesta un TB de RAM); y estas mquinas son desde no hace mucho blades de IBM (podra extenderme aqu con alguna frase en la que utilizar la palabra sinergia). Qu es HANNA (SAP)? Base de datos en memoria relacional por SAP para sustituir sus aplicaciones de BI bajo el concepto de funcionar en memoria y en la actualidad todo es llamado HANNA. Qu es SOLID DB (IBM)? IBM solidDB es una familia de productos, desarrollado y comercializado por IBM . La familia de productos incluye dos productos construidos en torno a un in-memory sistema de gestin de base de datos relacional . El primer producto es un sistema de gestin de base de datos relacional independiente titulado solidDB. El segundo producto, lanzado al mercado en 2008, es un producto Universal Cache, acertadamente titulado solidDB Universal Cache. Bases de Datos Columnares Las Bases de Datos Columnares se introdujeron por primera vez en 1970 en productos como Model 204 y ABABAS, este enfoque ha resurgido recientemente en Vertica y en cierta medida en QD Technology. Como su nombre lo indica, las bases de datos estn organizados de columna por columna en lugar de la fila: es decir, todos los casos de un solo elemento de datos (por ejemplo, Nombre de cliente) se almacenan de modo que se puede acceder como una unidad. Esto los hace especialmente eficaz en las consultas analticas, como la lista de selecciones, que a menudo lee unos pocos elementos de datos, pero necesitamos ver todas las instancias de estos elementos. En contraste, una convencional base de datos relacional almacena los datos por filas, por lo que toda la informacin de un registro (fila) es inmediatamente accesible. Esto tiene sentido para las consultas transaccionales, que suelen referirse a un registro a la vez.
Hoy los sistemas columnares combinan su estructura columnar con tcnicas que incluyen la indexacin, compresin y paralelizacin.
Tiempo de carga: Cunto tiempo se necesita para convertir datos de origen en el formato de columna? Esta es la pregunta ms bsica de todas. Tiempos de carga son a menudo medidos en gigabytes por hora, que puede ser extremadamente lento, cuando de decenas o cientos de gigabytes de datos se trata. La cuestin a menudo carece de una respuesta sencilla, porque la velocidad de carga puede variar en funcin de la naturaleza de los datos y las elecciones realizadas por el usuario. Por ejemplo, algunos sistemas pueden almacenar varias versiones de los mismos datos, ordenados en diferentes secuencias o en los diferentes niveles de agregacin. Los usuarios pueden construir un menor nmero de versiones a cambio de una carga rpida, pero puede pagar un precio ms adelante con consultas ms lentas. Pruebas realistas basadas en sus propios datos son el mejor camino para una respuesta clara.
Carga Incremental: Una vez que un conjunto de datos se ha cargado, todo debe ser recargado cada vez que hay una actualizacin. Muchos sistemas columnares permiten carga incremental, teniendo slo los registros nuevos o modificados y la fusin de los datos anteriores. Pero la atencin al detalle es fundamental, ya que las funciones de carga incremental varan ampliamente. Algunas cargas incrementales tardan hasta una completa reconstruccin y algunos resultados son el rendimiento ms lento, algunos pueden agregar registros, pero no cambiar o suprimirlos. Las Cargas incrementales a menudo deben completarse peridicamente con una reconstruccin completa. Compresin de datos: Algunos sistemas columnares pueden comprimir mucho la fuente de datos y archivos resultantes a fin de tomar una fraccin de espacio en el disco original. Puede ocasionar en estos casos un impacto negativo en el rendimiento por la descompresin de datos a realizar la lectura. Otros sistemas utilizan menos compresin o almacenan varias versiones de los datos comprimidos, teniendo ms espacio en disco, pero cobrando otros beneficios a cambio. El enfoque ms adecuado depender de sus circunstancias. Tenga en cuenta que la diferencia de los requisitos de hardware pueden ser sustanciales. Limitaciones estructurales: Las bases de datos columnares utilizan diferentes tcnicas para imitar una estructura relacional. Algunos requieren la misma clave principal en todas las tablas, es decir, la jerarqua de la base de datos est limitada a dos niveles. Los lmites impuestos por un sistema en particular no parece tener importancia, pero recuerde que sus necesidades pueden cambiar maana. Limitaciones que parece aceptable ahora podra evitar que la ampliacin del sistema en el futuro. Tcnicas de acceso: Algunas bases de datos de columnares slo se pueden acceder utilizando su propio proveedor de lenguaje de consultas y herramientas. Estos pueden ser muy poderosos, incluyendo capacidades que son difciles o imposibles usando el estndar SQL. Pero a veces faltan funciones especiales, tales como las consultas que comparan valores con o en los registros. Si necesita acceder al sistema con herramientas basadas en SQL, determine exactamente qu funciones SQL y dialectos son compatibles. Es casi siempre un subconjunto completo de SQL y, en particular, rara vez se dispone de las actualizaciones. Tambin asegrese de encontrar si el rendimiento de las consultas SQL es comparable a los resultados con el sistema de la propia herramienta de consulta. A veces, el ejecutar consultas SQL mucho ms lento. Rendimiento: Los sistemas columnares por lo general superan a los sistemas de relaciones en casi todas las circunstancias, pero el margen puede variar ampliamente. Las consultas que incluyen clculos o acceso individual a los registros puede ser tan lento o ms que un sistema relacional adecuadamente indexado. Escalabilidad: El punto de las bases de datos columnares es obtener buenos resultados en grandes bases de datos. Pero no puede asumir todos los sistemas pueden escalar a decenas o centenares de terabytes. Por ejemplo, el rendimiento puede depender de determinados ndices de carga en la memoria, de modo que su equipo debe tener memoria suficiente para hacer esto. Como siempre, en primer lugar preguntar si el vendedor tiene en ejecucin los sistemas existentes a una escala similar a la suya y hablar con las referencias para obtener los detalles. Si el suyo sera ms grande que cualquiera de las instalaciones existentes, asegrese de probar antes de comprar.