Sunteți pe pagina 1din 31

Cluster

BASE DE DATOS DISTRIBUIDA

Selma M. Avalos Mateos


Daniel Cruz Santos
Julio Lpez Vaca
Cenobio Monjaraz Garca

CONTENIDO

DIFERENCIA: CLUSTER Y GRID

COMPONENTES

DEFINICIN

TIPOS

ANTECEDENTES

EJEMPLO

CARACTERISTICAS GENERALES

REFERENCIAS

ARQUITECTURA

DEFINICIN
El trmino clster se aplica a los
conjuntos
de
computadoras
unidos mediante una red de alta
velocidad, construidos mediante
la utilizacin de componentes de
hardware comunes y que se
comportan como si fuesen una
nica computadora.

DEFINICIN
Consta de un conjunto de computadoras independientes, interconectadas
entre s, de tal manera que funcionan como un solo recurso
computacional. A cada uno de los elementos del cluster se le conoce como
nodo. Estos pueden tener uno o varios procesadores, memoria RAM,
interfaces de red, dispositivos de I/O, y SO.

Comnmente, en un cluster existe una mquina (con monitor, teclado,


ratn, etctera) que funciona como nodo-maestro y se encarga de
administrar, controlar y monitorear todas las aplicaciones y recursos del
sistema, en tanto que el resto de los nodos est dedicado al
procesamiento de datos o a ejecutar operaciones aritmticas. Se les
conoce como nodos-esclavos.

Clasificacin de los Sistemas Distribuidos


Una clasificacin altamente reconocida para los sistemas distribuidos es:

Sistemas de cmputo.
Sistemas de informacin.
Sistemas masivos o embebidos.
Sistemas distribuidos de cmputo
utilizan para realizar tareas de
cmputo de alto rendimiento.
Computo en cluster
Cmputo en malla(grid).

DIFERENCIAS: CLUSTER Y GRID


En un clster todos los nodos se encuentran en el
mismo lugar, conectados por una red local para as
englobar todos los recursos.
En cambio, en un grid no tienen por qu estar en el
mismo espacio geogrfico; pueden estar en diferentes
puntos del mundo.
Tambin suele llamarse GRID al resultado obtenido de
englobar las mquinas en una supercomputadora; con
un clster solo se busca mejorar el rendimiento de las
mquinas englobndolas en una sola.

ANTECEDENTES
El comienzo de Cluster fue a finales de los aos 50 y principios de
los aos 60.
En 1967 Gene Amdahl de IBM public el papel inicial de
procesamiento en paralelo.
El proyecto ARPANET en 1969 cre la primera red de
computadoras bsico basadas en el Cluster de computadoras.
1977 sali el primer producto comercial de tipo Cluster, el ARCnet
desarrollado por Datapoint.
En 1984 VAXcluster produjeron el sistema operativo VAX/VMS.

ARQUITECTURA

ARQUITECTURA
Es un tipo ms de arquitectura paralela
distribuida (MPM) pero con una
caracterstica especial: cada
computador puede utilizarse de forma
independiente.
Red de interconexin. Suele ser una red
de altas prestaciones: Gigabit Ethernet,
etc.

Sistema Operativo. Pueden utilizarse la


mayora de los S.O. del mercado: UNIX,
Linux, Windows, etc.
Protocolos rpidos de comunicacin.
Active message, Fast messages, etc.

Entornos y herramientas de
programacin paralela.
Programacin MPI, PVM, OpenMP,
DSM
Depuradores paralelos: TotalView
Anlisis de rendimiento
Administracin: Parmon

Aplicaciones
Aplicaciones paralelas o distribuidas,
secuenciales.

VENTAJAS Y DESVENTAJAS
DESVENTAJAS

VENTAJAS

Software

Alto rendimiento.

Problemas de administracin y gestin

El tamao del problema por resolver


El precio de la mquina necesaria para
resolverlo.

Escalabilidad.

Habilidad para reaccionar y


adaptarse sin perder calidad.

Alta

disponibilidad.

Infraestructura

Aplicacin

Balance de Carga.

Compartir el trabajo
realizado entre varios procesos, ordenadores,
discos, etc. Evita los cuellos de botella.

Memoria fsicamente distribuida -> utilizacin


menos eficiente.
Varias copias del sistema operativo.
La red es el cuello de botella del sistema.

TIPOS DE TRABAJO A EJECUTAR


Trabajos Secuenciales. Se ejecutan en un nico nodo.
Trabajos paralelos. Se ejecutan en mltiples nodos.
Trabajos interactivos. Ejecucin asociada a una terminal,
ejecucin inmediata.
Trabajos batch.
No necesitan respuesta inmediata
Se envan a una cola para su planificacin.

Componentes software de un clster

Nodos
Almacenamiento
Sistemas operativos

Conexiones de red
middleware
Protocolos de comunicacin y servicios
Aplicaciones

Ambientes de programacin paralela

COMPONENTES: Nodos
Un Nodo es un punto de interseccin o unin de
varios elementos que confluyen en el mismo lugar.
Nodos dedicados, los nodos no disponen de
teclado, ratn ni monitor y su uso est
exclusivamente
dedicado
a
realizar
tareas
relacionadas con el clster.

Nodos no dedicados, los nodos disponen de teclado,


ratn y monitor y su uso no est exclusivamente
dedicado a realizar tareas relacionadas con el
clster.

Los nodos pueden ser PCs, workstation o SMPs

COMPONENTES: Sistema Operativo


Un sistema operativo debe
multiproceso y multiusuario.

ser

Facilidad de uso y acceso.

Pueden utilizarse la mayora de los


S.O. del mercado: UNIX, Linux, W2k,
WXP, etc.

COMPONENTES: Conexiones de red


Los nodos de un clster pueden
conectarse mediante una simple
red Ethernet con placas comunes
(adaptadores de red o NICs), o
utilizarse tecnologas especiales de
alta velocidad como Fast Ethernet,
Gigabit
Ethernet,
Myrinet,
InfiniBand, SCI, etc.ec.

Componentes: Midleware
El middleware es un software que generalmente acta entre el sistema operativo y las
aplicaciones con la finalidad de proveer a un clster lo siguiente:
Una interfaz nica de acceso al sistema, denominada SSI (Single System Image), la
cual genera la sensacin al usuario de que utiliza un nico ordenador muy potente;
Herramientas para la optimizacin y mantenimiento del sistema: migracin de
procesos, checkpoint-restart (congelar uno o varios procesos, mudarlos de servidor
y continuar su funcionamiento en el nuevo host), balanceo de carga, tolerancia a
fallos, etc.;
Escalabilidad: debe poder detectar automticamente
conectados al clster para proceder a su utilizacin.

nuevos

servidores

Componentes: Ambientes de programacin


paralela.
Los ambientes de programacin paralela permiten implementar
algoritmos que hagan uso de recursos compartidos: CPU (central
processing unit: unidad central de proceso), memoria, datos y
servicios.
Programacin: MPI, PVM, OpenMP, DSM (Threadmarks, Linda), etc.

Depuradores paralelos: TotalView

Anlisis de rendimiento: VT (IBM SP), MPE, Pablo, Vampir, etc.

Administracin: Parmon.

TIPOS DE CLSTER
Los clster pueden clasificarse segn sus caractersticas:
HPCC (High Performance Computing Clster: clsteres de alto rendimiento).
HA o HACC (High Availability Computing Clster: clsteres de alta
disponibilidad).
HT o HTCC (High Throughput Computing Clusters: cluster de alta eficiencia).

CLUSTER DE ALTO RENDIMIENTO [HPCC]


Son clster en los cuales se ejecutan tareas que requieren de gran
capacidad computacional, grandes cantidades de memoria, o
ambos a la vez. El llevar a cabo estas tareas puede comprometer
los recursos del clster por largos periodos de tiempo.

CLUSTER DE ALTA DISPONIBILIDAD [HACC]


Son clster cuyo objetivo de diseo es el de proveer disponibilidad y
confiabilidad. Estos clster tratan de brindar la mxima disponibilidad de los
servicios que ofrecen. La confiabilidad se provee mediante software que
detecta fallos y permite recuperarse frente a los mismos, mientras que en
hardware se evita tener un nico punto de fallos..

CLUSTER DE EFICIENCIA [HTCC]


Son clster cuyo objetivo de diseo es el ejecutar la mayor cantidad
de tareas en el menor tiempo posible. Existe independencia de datos
entre las tareas individuales. El retardo entre los nodos del clster no es
considerado un gran problema.

OTRA CLASIFICACIN.
Clster comerciales (de
alta disponibilidad y alta
eficiencia).
Clster cientficos (de alto
rendimiento).

CLUSTER EXISTENTES

SE MENCIONAN ALGUNOS DE LOS ORDENADORES SPER POTENTES ACTUALES.

MARENOSTRUM
(Top 5/77)
4812 nodos
JS21: 4 cores en dos
procesadores IBM PowerPC
dual-core 970MP de 64 bits
a 2'3 GHz, 8 GB.

63830 GFlops (LINPACK).


20480 GB RAM

280 TB Disco (GPFS).


Red Myrinet x 12 Switches.
GigaEthernet x 5 Switches.

MAGERIT
(Top 34/335)

y 1204 nodos (1036 nodos eServer


BladeCenter JS20 y 168 nod os eServer
BldC a e enter JS21 ).

JS20: 2 cores en dos procesadores IBM


PowerPC single-core 970FX de 64 bits a
2'2 GHz, 4 GB.

y JS21: 4 cores en dos procesadores IBM


PowerPC dual-core 970MP de 64 bits a
2'3 GHz, 8 GB.

15955 GFlops (LINPACK).

5488 GB RAM.

65TB Disco (GPFS).

Red Myrinet x 6 Switches.

GigaEthernet x 2 Switches.

ROADRUNNER
(Top 1/2)
12240 + 6562
procesadores
QS22: IBM PowerXCell 8i.
AMD Opteron.

1.026 PFlops (LINPACK).


103.6 TB RAM.
Triblade / Infiniband.

JAGUAR
(Top 1)
Cray XT5-HE
224,256 AMD Opteron Six
Core 2.6 GHz.

1.75 PFlops (LINPACK).

10 PB Disco (Spider/Lustre).
598TB RAM.
Cray SeaStar Network.

LIMITACIONES DE LOS CLUSTERS


Sobrecarga por comunicacin
Implementaciones de grano fino: difciles de disear, difciles de afinar y mucho
ms difciles de escalar.
Las implementaciones de grano grueso son ms fciles. Pero, en este caso Se
necesitan anchos de banda espectaculares?

Mantenimiento:
La ampliacin de un clster es costosa en grandes tamaos.
Es una solucin escalable pero hasta que punto pueden hacerlo?

LIMITACIONES DE LOS CLUSTER

Recursos infrautilizados:
Los clster son instalaciones dedicadas.
Una organizacin tpica tiene desperdiciado millones de ciclos
de cmputo en sus ordenadores personales.

Siempre existe un problema ms grande.

Referencias
http://www.arcos.inf.uc3m.es/~dsd/lib/exe/fetch.php?media=cluster-grid.pdf
http://es.wikipedia.org/wiki/Cl%C3%BAster_(inform%C3%A1tica)
http://sistemasdistribuidos11.blogspot.mx/p/clusters.html
http://sistemasoperativos.wikia.com/wiki/1.4._Sistemas_distribuidos_de_alto_rendimiento_a_ba
jo_costo_(clustering)_en_sistemas_operativos_de_libre_distribuci%C3%B3n.

http://ais-sistemasdistribuidos.blogspot.mx/p/tema-10.html
http://laurel.datsi.fi.upm.es/_media/docencia/asignaturas/ccg/intro-4pp.pdf
http://www.muyinteresante.es/innovacion/tecno/articulo/el-ordenador-mas-potente-deespana-esta-en-la-universidad-politecnica-de-madrid
http://www.uhu.es/josem.bravo/AD/Tema3.pdf
http://suseos.weebly.com/uploads/1/8/7/0/18707470/23-_cluster.pdf
http://icaro.eii.us.es/descargas/segunda%20parte%20Sistemas%20Multiprocesadores%202006
_2007.pdf

CLUSTER
GRACIAS POR SU ATENCIN
PREGUNTAS Y DUDAS??

S-ar putea să vă placă și