Sunteți pe pagina 1din 23

Departamento de Ciencias de la Computacin de la Universidad Estatal de Wayne,

Detroit, MI, EE.UU.


Resumen- Cloud Computing se ha convertido en otra palabra de moda despus de
la Web 2.0. Sin embargo, hay docenas de diferentes definiciones para la nube
Informtica y parece que hay consenso sobre qu es la nube.
Por otro lado, la computacin en nube no es un concepto completamente nuevo;
tiene intrincada conexin a la relativamente nueva, pero trece aos establecida
paradigma Grid Computing, y otra correspondiente tecnologas como utility
computing, computacin en clster, y sistemas distribuidos en general. En este
trabajo se esfuerza por comparar y contrastar Cloud Computing con Grid
Computing desde varios ngulos y dar una visin de las caractersticas esenciales
de ambos.
1 100-Mile Informacin general
Cloud Computing est insinuando un futuro en el que no lo haremos calcular en
equipos locales, pero en instalaciones centralizadas operado por informticos y de
almacenamiento utilidades de terceros. Estamos seguros No se perder el software
empaquetado para desenvolver e instalar.
Huelga decir que esto no es una idea nueva. De hecho, en 1961, informtica
pionero John McCarthy predicho que "Computacin algn da puede ser
organizado como un servicio pblico" - y pas a especular cmo esto podra
ocurrir.
A mediados de 1990, el trmino de cuadrcula fue acuado para describir
tecnologas que permitan a los consumidores a obtener la informtica el poder de
la demanda. Ian Foster y otros postularon que por la estandarizacin de los
protocolos utilizados para solicitar la potencia de clculo, podramos estimular la
creacin de un Grid Computing, anlogo en forma y utilidad a la red de energa
elctrica. Investigadores posteriormente desarrollado estas ideas de muchas
maneras emocionantes, producir, por ejemplo, sistemas federados a gran escala
(TeraGrid, Open Science Grid, caBIG, EGEE, Tierra Grid System) que
proporcionar energa no slo la computacin, sino tambin los datos y software,
bajo demanda. Las organizaciones de normalizacin (por ejemplo, OGF, OASIS)
normas pertinentes definidos. Ms prosaicamente, el trmino tambin fue
cooptados por la industria como un trmino de marketing para los clsteres. Pero
no proveedores de grid computing comerciales viables surgieron, al menos
No hasta hace poco. As es el "Cloud Computing" slo un nuevo nombre para la
red? En tecnologa de la informacin, donde las escalas de tecnologa por una

orden de magnitud, y en el proceso se reinventa, cada cinco aos, no hay ninguna


respuesta clara a estas preguntas. S: la visin es el mismo para reducir el costo de
la computacin, aumentar la fiabilidad y aumentar la flexibilidad mediante la
transformacin computadoras de algo que compramos y operamos nosotros a algo
que es operado por un tercero.
Pero no: las cosas son diferentes de lo que eran hace 10 aos. Tenemos una nueva
necesidad de analizar los datos masivos, motivando as aumentado
considerablemente la demanda de la informtica. Despus de haber realizado la
beneficios de pasar de mainframes a las agrupaciones de las materias primas, nos
encontramos con que esos grupos son bastante caros de operar. Nosotros tener la
virtualizacin de bajo costo. Y, sobre todo, tenemos mltiples miles de millones
de dlares gastados por los gustos de Amazon, Google, y Microsoft para crear
sistemas de bienes comerciales a gran escala que contiene cientos de miles de
ordenadores. El prospecto de necesitar solamente una tarjeta de crdito para
obtener acceso bajo demanda a 100.000 computadoras en decenas de centros de
datos distribuidos todo el mundo de recursos que pueden aplicar a problemas con
masiva de datos, potencialmente distribuido, es emocionante! As que se opera a
una escala diferente, y operando a estos nuevos, ms escalas masivas pueden exigir
fundamentalmente diferente enfoques para abordar los problemas. Tambin
permite -en realidad es a menudo slo es aplicable a-totalmente nuevos problemas.
Sin embargo, s: los problemas son en su mayora los mismos en las nubes y
Grids. Hay una necesidad comn de ser capaces de gestionar grandes
instalaciones; para definir los mtodos por los cuales los consumidores descubren,
peticin, y utilizar los recursos proporcionados por las instalaciones centrales; y
poner en prctica los clculos a menudo altamente paralelos que ejecutar en esos
recursos. Detalles difieren, pero los dos las comunidades estn luchando con
muchos de los mismos problemas.
Definicin de Cloud Computing
Hay poco consenso sobre cmo definir la nube [49]. Nosotros aadir otra
definicin a la lista ya saturada de definiciones para Cloud Computing:
Un paradigma de computacin distribuida a gran escala que es impulsada por las
economas de escala, en la que un grupo de abstrada, virtualizado,
dinmicamente escalable, logr el poder de computacin, almacenamiento,
plataformas y servicios son entregado en la demanda de los clientes externos sobre
el Internet.

Hay algunos puntos clave en esta definicin. En primer lugar, la nube Computing
es un paradigma de computacin distribuida especializado; eso difiere de las
tradicionales en que 1) es masivamente escalable, 2) se pueden encapsular como
una entidad abstracta que ofrece diferentes niveles de servicios a los clientes fuera
de la Nube, 3) es impulsada por las economas de escala [44], y 4) los servicios
pueden ser configurado dinmicamente (a travs de la virtualizacin o otros
enfoques) y se entregan bajo demanda.
Los gobiernos, institutos de investigacin, y lderes de la industria son apresurarse
a adoptar el Cloud Computing para solucionar su en constante aumento de los
problemas de clculo y almacenamiento que surgen en el Era de Internet. Hay tres
factores principales que contribuyen a la sobretensiones y los intereses en Cloud
Computing: 1) disminucin rpida de la costo de hardware y aumento de la
potencia de computacin y almacenamiento la capacidad, y el advenimiento de la
arquitectura multi-core y moderno supercomputadoras que consisten en cientos de
miles de ncleos;
2) el crecimiento exponencial en el tamao de los datos cientficos instrumentacin
/ simulacin y publicacin en Internet y archivado; y 3) la adopcin extendida de
Servicios Informtica y aplicaciones Web 2.0.
Nubes, Sistemas Grids y Distribuidos
Muchos lectores exigentes dar cuenta de inmediato de que nuestro
definicin de Cloud Computing se superpone con muchos existente tecnologas,
como Grid Computing, Utilidad de Computacin, Servicios de Informtica y
computacin distribuida en general. Nosotros argumentan que la computacin en
nube no slo se solapa con cuadrcula Informtica, es de hecho evolucion a partir
de Grid Computing y se basa en Grid Computing como su columna vertebral y la
infraestructura apoyo. La evolucin ha sido el resultado de un cambio de enfoque
de una infraestructura que proporciona almacenamiento y cmputo recursos (tal es
el caso en Grids) a uno que es la economa based con el objetivo de ofrecer recursos
y servicios ms abstractos (Como es el caso de nubes). En cuanto a la utilidad
Computing, no es un nuevo paradigma de la infraestructura informtica; ms bien,
es una modelo de negocio en el que los recursos informticos, como cmputo y
almacenamiento, se empaquetan como servicios medidos similar a un servicio
pblico fsico, como la electricidad y el red telefnica pblica conmutada. Utility
computing es normalmente implementado usando otra infraestructura informtica
(Por ejemplo, Grids) con servicios de contabilidad y de control adicionales.

Una infraestructura de la nube puede ser utilizada internamente por una empresa o
expuesto al pblico como utility computing. Ver Figura 1 para una visin general
de la relacin entre
Nubes y otros dominios que se superponga con. Web 2.0 cubre casi todo el espectro
de servicios orientados a aplicaciones en las que la computacin en nube se
encuentra en la gran escala lado. Supercomputacin y Computacin Cluster han
sido ms centrado en aplicaciones que no son de servicio tradicionales. Cuadrcula
Computing se solapa con todos estos campos donde es generalmente considerada
de menor escala que las supercomputadoras y nubes.
Figura 1: Grids y nubes Informacin general
Grid Computing pretende "activar el uso compartido de recursos y problema
coordinada de problemas en dinmica, multi-institucional organizaciones virtuales
"[18] [20]. Hay tambin unos pocos clave caractersticas a esta definicin: En
primer lugar, las redes de proporcionar una paradigma de la computacin
distribuida o infraestructura que abarca a travs de mltiples organizaciones
virtuales (VO), donde cada uno puede VO constituido, o bien instituciones
distribuidas fsica o lgicamente relacionados con proyectos / grupos. El objetivo
de este paradigma es habilitar el uso compartido de recursos federada en dinmico,
distribuido ambientes. El enfoque adoptado por el estndar de facto aplicacin - El
Globus Toolkit [16] [23], es la construccin de un entorno informtico uniforme
de diversos recursos por la definicin de protocolos de red estndar y proporcionar
middleware para mediar el acceso a una amplia gama de recursos heterogneos.
Globus aborda diversos temas como la seguridad, los recursos descubrimiento, el
aprovisionamiento de recursos y gestin, trabajo programacin, seguimiento y
gestin de datos.
Hace media dcada, Ian Foster, dio una lista de control de tres puntos [19] para
ayudar a definir lo que es, y lo que no es un Grid: 1) las coordenadas recursos que
no estn sujetos a un control centralizado, 2) utiliza estndar,, protocolos e
interfaces de propsito general abiertos, y 3) ofrece cualidades no triviales de
servicio. Aunque el punto 3 contiene cierto para Cloud Computing, ni el punto 1,
ni el punto 2 es claro que es el caso para las nubes de hoy en da. La visin de las
nubes y Grids son similares, los detalles y las tecnologas utilizadas pueden ser
diferentes, pero las dos comunidades estn luchando con muchos de los mismos
cuestiones. En este trabajo se esfuerza por comparar y contrastar la nube
Informtica con Grid Computing desde varios ngulos y dar conocimientos sobre
las caractersticas esenciales de ambos, con la esperanza para pintar un panorama
menos nublado de lo que son las nubes, qu tipo de aplicaciones pueden Nubes
esperar para apoyar, y cules son los desafos

Nubes tendrn que hacer frente en los prximos aos a medida que adquieren
impulso y adopcin. Esperamos que esto ayudar tanto comunidades obtienen una
comprensin ms profunda de los objetivos, supuestos, el estado y las direcciones,
y proporcionar una mayor vista detallada de ambas tecnologas para el pblico
general.
2 Comparando Grids y nubes Side-by-Side
Esta seccin tiene como objetivo comparar Grids y nubes en un amplio variedad
de perspectivas, desde la arquitectura, modelo de seguridad, modelo de negocio,
modelo de programacin, la virtualizacin, los datos modelo, modelo de clculo,
a la procedencia y aplicaciones. Nosotros tambin esbozar una serie de retos y
oportunidades que la red Informtica y Cloud Computing aportar a los
investigadores y el Industria de TI, ms comn a ambos, pero algunos son
especficos para uno o el otro.
2.1
Modelo de Negocio
Modelo de negocio tradicional de software ha sido una sola vez pago por uso
ilimitado (por lo general en 1 equipo) de la software. En un modelo de negocio
basado en la nube, un cliente pagar el proveedor sobre una base de consumo, muy
parecido a la utilidad compaas cobran por los servicios pblicos bsicos, como
la electricidad, el gas, y agua, y el modelo se basa en economas de escala con el
fin de bajar los precios para los usuarios y las ganancias hasta para los
proveedores. Hoy en da, Amazon ofrece esencialmente una nube centralizada que
consiste en Compute Cloud EC2 y S3 nube de datos. El primero es pagan en base
a por instancia horas consumidas por cada tipo de instancia y la tarde se pagan
directamente por GB-mes de almacenamiento utilizado. Adems, la transferencia
de datos se cobra por TB / la transferencia de datos por mes, dependiendo de la
fuente y el destino de dicha transferencia. La perspectiva de que slo necesitan una
tarjeta de crdito para obtener acceso bajo demanda a 100.000 procesadores en
decenas de datos centros distribuidos por todo el mundo-recursos fcticos aplicada
a problemas con los datos masivos, potencialmente distribuidos, es emocionante!
El modelo de negocio para Grids (al menos la que se encuentra en el mundo
acadmico o laboratorios del gobierno) es orientado a los proyectos en los que los
usuarios o comunidad representada por esa propuesta tiene cierto nmero de
unidades de servicio (es decir, horas de CPU) que pueden gastar. Por ejemplo, el
TeraGrid opera de esta manera, y requiere cada vez ms propuestas complejas para
ser escritos creciente nmero de potencia de clculo. El TeraGrid tiene ms de una
docena

Sitios de cuadrcula, todas organizadas en diversas instituciones de todo el pas.


Qu hace que una institucin quiere unirse a la TeraGrid? Cuando una institucin
se une a la TeraGrid con un conjunto de recursos, sabe que otros en la comunidad
pueden ahora utilizar estos recursos a travs del pas. Tambin reconoce el hecho
de que gana acceso a una docena de otros sitios Grid. Este mismo modelo tiene
trabajado bastante bien durante muchos Rejillas de todo el mundo, dando
incentivos instituciones se unan varias rejillas para el acceso a recursos adicionales
para todos los usuarios de la correspondiente institucin.
Tambin hay esfuerzos para construir una economa de cuadrcula para un mundial
Infraestructura Grid que apoya el comercio, la negociacin, aprovisionamiento, y
la asignacin de recursos basado en los niveles de servicios prestados, riesgo y
costo, y las preferencias de los usuarios; Hasta aqu, intercambio de recursos (por
ejemplo, almacenamiento comercial para ciclos de clculo), subastas, la teora de
coordinacin de recursos basado en juego, virtuales monedas, corredores e
intermediarios de recursos, y varios
Se han propuesto y aplicado en otros modelos econmicos la prctica [8].
2.2 arquitectura
Rejillas ubic a mediados de los aos 90 para hacer frente a gran escala problemas
de clculo utilizando una red de intercambio de recursos mquinas de productos
bsicos que proporcionan la potencia de clculo accesible solamente por los
superordenadores y grandes grupos dedicados En ese tiempo. La principal
motivacin era que stas alta recursos de computacin de rendimiento eran caros
y difciles de tener acceso a, por lo que el punto de partida era utilizar federado
recursos que podran comprender de cmputo, almacenamiento y redes recursos
de mltiples instituciones distribuidas geogrficamente, y dichos recursos son
generalmente heterognea y dinmica. Rejillas centran en la integracin de los
recursos existentes, con su hardware, sistemas operativos, la gestin de los
recursos locales, y infraestructura de seguridad.
Con el fin de apoyar la creacin de la llamada "virtual Organizaciones ", una
entidad lgica dentro de la cual distribuye los recursos pueden ser descubiertos y
compartidos como si fueran de de la misma organizacin, Rejillas definir y
proporcionar un conjunto de protocolos estndar, middleware, herramientas y
servicios construidos sobre Adems de estos protocolos. La interoperabilidad y la
seguridad son los las preocupaciones principales de la infraestructura Grid como
recursos pueden provienen de diferentes dominios administrativos, que tienen
tanto las polticas de uso de recursos globales y locales, hardware diferente y
configuraciones de software y plataformas, y varan en disponibilidad y capacidad.

Rejillas proporcionan protocolos y servicios en cinco capas diferentes como


identificado en la arquitectura de protocolo de cuadrcula (vase la Figura 2). En
la capa de tejido, Grids proporcionar acceso a diferentes recursos tipos, tales como
computacin, almacenamiento y recursos de red, cdigo repositorio, etc. Rejillas
generalmente dependen de tejido existente componentes, por ejemplo,
administradores de recursos locales (es decir, PBS [5], Condor [48],
etc). Componentes de propsito general, como GARA (arquitectura general para
la reserva avanzada) [17], y los servicios especializados de gestin de recursos
tales como Falkon [40] (aunque estrictamente hablando, Falkon tambin
proporciona servicios ms all de la capa de tejido).
Figura 2: Red Protocolo de Arquitectura
La capa de conectividad define la comunicacin ncleo y protocolos de
autenticacin de red fcil y seguro transacciones. El (Infraestructura Red de
Seguridad) GSI [27] protocolo subyace cada transaccin cuadrcula.
La capa de recurso define protocolos para la publicacin, descubrimiento,
negociacin, supervisin, contabilidad y pago de compartir operaciones sobre los
recursos individuales. El GRAM (Grid Acceso de Recursos y Gestin) [16]
protocolo se utiliza para asignacin de recursos computacionales y para el
seguimiento y el control de la computacin en esos recursos, y GridFTP [2] para
el acceso de datos y la transferencia de datos de alta velocidad.
La capa colectiva capta las interacciones a travs de las colecciones de recursos,
servicios de directorio, como MDS (Monitoreo y Servicio Discovery) [43] permite
la supervisin y descubrimiento de recursos VO, Condor-G [24] y Nimrod-G [7]
son ejemplos de co-se distribuyen, la programacin y la intermediacin servicios
y MPICH [32] para activar la rejilla de programacin
sistemas y CAS (servicio comunitario de autorizacin) [21] para polticas de
recursos globales.
La capa de aplicacin comprende cualesquiera que sean las aplicaciones de
usuario construido en la cima de los protocolos y APIs anteriores y operar en VO
ambientes. Dos ejemplos son los sistemas de flujo de trabajo de cuadrcula, y
Portales grid (es decir Quarknet entorno de e-learning [52], Nacional Virtual
Observatorio
(Http://www.us-vo.org),
TeraGrid
Ciencia
pasarela
(http://www.teragrid.org)).
Las nubes estn desarrollando para hacer frente a la informtica a escala de Internet
problemas en los que algunos supuestos son diferentes de las de el Grids. Las nubes
se refieren generalmente como un gran nmero de informticos y / o
almacenamiento de los recursos, que se puede acceder a travs de protocolos

estndar a travs de una interfaz abstracta. Las nubes pueden ser construido en la
cima de muchos protocolos existentes, como Servicios Web (WSDL, SOAP), y
algunas avanzadas tecnologas Web 2.0 tales como el descanso, RSS, AJAX, etc.
De hecho, detrs de la cubierta, es posible que las nubes que se aplicarn sobre red
existente tecnologas que aprovechan ms de una dcada de la comunidad
esfuerzos en la normalizacin, la seguridad, la gestin de recursos, y soporte de
virtualizacin. Tambin hay varias versiones de definicin para la nube
arquitectura, definimos una arquitectura de cuatro capas de la nube Computing en
comparacin con la arquitectura de la red, compuesta de 1) la tela, 2) recursos
unificado, 3) plataforma, y 4) la aplicacin
Capas.
Figura 3: Arquitectura de la nube
La capa de tejido contiene los recursos a nivel de hardware en bruto, tales como
los recursos informticos, recursos de almacenamiento y de red recursos. La capa
de recursos unificada contiene recursos que han sido resumidas / encapsulado
(generalmente por la virtualizacin) de modo que puedan estar expuestos a los
usuarios de la capa y de extremo superior como integrada de los recursos, por
ejemplo, un ordenador / cluster virtual, un sistema de archivo lgico, un sistema
de base de datos, etc. La capa de plataforma aade en una coleccin de
herramientas especializadas, middleware y servicios en la parte superior de los
recursos unificadas para proporcionar una desarrollo y / o plataforma de
despliegue. Por ejemplo, un Web medio ambiente, un servicio de programacin,
etc. hospedaje ltimo, el capa de aplicacin contiene las aplicaciones que se
ejecutan en las nubes.
Nubes en general ofrecen servicios en tres niveles diferentes
(IaaS, PaaS y Saas [50]) de la siguiente manera, aunque algunos los proveedores
pueden optar por exponer servicios en ms de un nivel. Infraestructura como
Servicio (IaaS) de hardware [50] disposiciones, software y equipos (sobre todo en
la capa recurso unificado, pero tambin puede incluir la parte de la capa de tejido)
para entregar software entornos de aplicaciones con una fijacin de precios basada
en el uso de recursos modelo. Infraestructura puede escalar hacia arriba y abajo de
forma dinmica basado en las necesidades de recursos de aplicacin. Ejemplos
tpicos son Amazon EC2 (Elastic Cloud Computing) Servicio [3] y S3 (Simple
Storage Service) [4], donde cmputo y almacenamiento infraestructuras estn
abiertas al acceso pblico con un pago por uso modelo; Eucalyptus [15] es un
cdigo abierto Nube aplicacin que proporciona una interfaz compatible para EC2
de Amazon, y permite a las personas para establecer una nube infraestructura en
premisa y experimentar antes de comprar servicios comerciales.

Plataforma como servicio (PaaS) [50] ofrece un alto nivel entorno integrado para
construir, probar y desplegar personalizada aplicaciones. En general, los
desarrolladores tendrn que aceptar algunas restricciones sobre el tipo de software
que pueden escribir a cambio para una funcin de escalabilidad de la
aplicacin. Un ejemplo es la de Google App Engine [28], que permite a los
usuarios construir Web aplicaciones en los mismos sistemas escalables que poder
Google aplicaciones.
Software como Servicio (SaaS) [50] proporciona para fines especiales software que
es accesible de forma remota por los consumidores a travs de la Internet con un
modelo de precios basado en el uso. Salesforce es una lder de la industria en el
suministro de CRM en lnea (Cliente Relationship Management) Servicios. Live
Mesh de Microsoft permite que los archivos y carpetas que se comparten y
sincronizado a travs de mltiples dispositivos. Aunque las nubes proporcionan
servicios en tres niveles diferentes (IaaS, PaaS y SaaS), normas para las interfaces
a estas diferentes niveles an no se han definido. Esto lleva a problemas de
interoperabilidad entre nubes de hoy en da, y no hay pocos incentivos comerciales
para los proveedores de la nube para invertir recursos adicionales en la definicin
e implementacin nueva interfaces. Como Nubes maduran, y ms sofisticados
aplicaciones y servicios surgir que requieren el uso de mltiples nubes, habr cada
vez ms incentivos para adoptar interfaces estndares que faciliten la
interoperabilidad con el fin de capturar emergentes y crecientes mercados en una
nube saturada mercado.
2.3 Administracion De Recursos
En esta seccin se describe el manejo de los recursos que se encuentra en Grids y
nubes, que abarcan temas como el modelo de clculo, modelo de datos, la
virtualizacin, la supervisin, y la procedencia. Estas los temas son muy
importantes para entender la principal retos que a mbas Grids y nubes enfrentan
hoy en da, y lo har que superar en el futuro.
Calcular Modelo: La mayora de los Grids utilizar un clculo por lotes regulares
modelo, en el que un gestor de recursos local (LRM), tal como PBS, Cndor, SGE
gestiona los recursos informticos para un sitio de la red, y los usuarios envan
trabajos por lotes (a travs de GRAM) para solicitar alguna recursos durante algn
tiempo. Muchos Grids tienen polticas establecidas que hacen cumplir estos
trabajos por lotes para identificar al usuario y credenciales con las que el trabajo
tendr una duracin de contabilidad y fines de seguridad, el nmero de
procesadores necesarios, y el duracin de la asignacin. Por ejemplo, un trabajo
pudiera decir, la etapa en los datos de entrada de una direccin URL para el
almacenamiento local, ejecute el aplicacin durante 60 minutos a 100

procesadores, y organizar la resultados a algn servidor FTP. El trabajo sera


esperar en el LRM de esperar cola hasta los procesadores 100 estaban disponibles
para 60 minutos, momento en el que se asignaran los procesadores 100 y dedicada
a la solicitud de la duracin del trabajo.
Debido a las decisiones de planificacin caros, los datos en la estadificacin y
cabo, y, potencialmente, los tiempos de cola larga, muchos no lo hacen Grids
apoyar de forma nativa aplicaciones interactivas; aunque hay los esfuerzos de la
comunidad de cuadrcula para permitir latencias inferiores a recursos a travs de
la programacin de varios niveles, que permiten que las aplicaciones con muchas
tareas a corto funcionamiento para ejecutar de manera eficiente en Grids [40].
Modelo de computacin Cloud Computing probablemente ser muy diferente, con
recursos en la nube estn compartidos por todos los usuarios al mismo tiempo (en
contraste con recursos dedicados gobernados por un sistema de colas). Esto debera
permitir latencia sensibles aplicaciones funcionen de forma nativa en las nubes,
aunque garantizando un buen nivel suficiente de calidad de servicio se est
entregando a los usuarios finales no ser trivial, y probablemente ser una de las
principales desafos para el Cloud Computing como las Nubes crecen en escala, y
el nmero de usuarios.
Modelo de datos: Si bien algunas personas audazmente predican que el futuro
Informtica Internet ser hacia el Cloud Computing centralizado, en el que el
almacenamiento, computacin, y todo tipo de otros recursos principalmente
aprovisionar por la Nube, que imaginar que la prxima generacin de Internet
Informtica tomar el modelo de tringulo que se muestra en la Figura 4: Internet
Computacin voluntad centralizarse en torno datos, nublando Informtica, as
como Informtica Cliente. Cloud Computing y Client Computing coexistirn y
evolucionar de la mano, mientras que la gestin de datos (Cartografa, la particin,
de consulta, el movimiento, el almacenamiento en cach, replicacin, etc) ser
cada vez ms importante, tanto para
Cloud Computing y Computacin de cliente con el aumento de aplicaciones
intensivas de datos.
El papel fundamental de la computacin en nube es evidente, pero la importancia
de la informtica de cliente no puede ser pasado por alto o bien por varias razones:
1) Por razones de seguridad, las personas podran no estar dispuestos a ejecutar
aplicaciones de misin crtica en la Nube y enviar datos sensibles a la nube para el
procesamiento y almacenamiento; 2) Los usuarios desean obtener sus cosas por
hacer, incluso cuando el Internet y Cloud estn abajo o la comunicacin de red es
lento; 3) Con los avances de la tecnologa multi-ncleo, el prxima dcada traer

las posibilidades de tener un escritorio superordenador con 100s a 1000 de


hardware hilos / ncleos.
Adems, muchos usuarios finales tendrn diversas hardware -funcionalidades
extremo accionado, tales como la visualizacin y reproduccin multimedia, que
normalmente se ejecutar localmente.
Figura 4 El modelo de tringulo de la prxima generacin de Internet
Computacin.
La importancia de los datos ha llamado la atencin de la Red comunidad en la
ltima dcada; Datos Grids [10] han sido diseado especficamente para hacer
frente a aplicaciones de uso intensivo de datos en Entornos grid, con el concepto
de datos virtuales [22] juega un papel crucial. Datos virtual capta la relacin entre
los datos, los programas y los clculos y prescribe diversas abstracciones que una
cuadrcula de datos puede proporcionar: ubicacin la transparencia en que los datos
se pueden solicitar sin tener en cuenta ubicacin de los datos, un catlogo de
metadatos distribuido se dedica a mantener pista de la ubicacin de cada pieza de
datos (junto con su rplicas) a travs de los sitios de la red y el control de la
privacidad y el acceso son forzada; transparencia materializacin: datos puede ser
re- calculado sobre la marcha o transferido a peticin, dependiendo de la
disponibilidad de los datos y el costo para re-clculo.
Hay Tambin la transparencia representacin donde se pueden consumir datos y
producido sin importar sus formatos fsicos reales y almacenamiento estn, los
datos se asignan en algn estructural abstracta representacin y manipulado de esa
manera.
Datos Localidad: Como los ciclos de CPU se convierten en conjuntos de datos
ms barato y duplicar su tamao cada ao, el principal desafo para una eficiente
escalado de aplicaciones es la ubicacin de los datos relativos a la recursos
computacionales disponibles - que se mueven los datos repetidamente para CPUs
distantes se est convirtiendo en el cuello de botella. [46] Hay grandes diferencias
en las velocidades de IO de disco local almacenamiento para redes de rea amplia,
que puede afectar drsticamente rendimiento de las aplicaciones. Para lograr una
buena escalabilidad a Escalas de Internet para las nubes, Rejas, y sus aplicaciones,
datos deben ser distribuidos en muchos ordenadores, y clculos debe ser dirigido
hacia el mejor lugar para ejecutar con el fin de reducir al mnimo los costos de
comunicacin [46]. MapReduce de Google
[13] El sistema se ejecuta en la parte superior del sistema de archivos Google,
dentro que los datos se cargan, dividida en trozos, y cada trozo replicado. Por lo
tanto el procesamiento de datos se coubicarse con almacenamiento de datos:

cuando un archivo necesita ser procesada, el planificador de tareas consulta a un


servicio de metadatos de almacenamiento para obtener el nodo de host para cada
trozo, y despus programa un "mapa" proceso en ese nodo, por lo que los datos
localidad se explota de manera eficiente. En Rejas, almacenamiento de datos por
lo general se basa en un sistema de archivos compartidos (por ejemplo, NFS,
GPFS, PVFS, Luster), donde localidad de datos no se puede aplicar fcilmente. Un
enfoque es para mejorar programadores a ser consciente de datos, y para ser capaz
de apalancamiento localidad de datos informacin Cundo programacin tareas de
clculo; este enfoque ha demostrado que mejora el trabajo tiempo de vuelta de
manera significativa [41].
La combinacin de clculo y gestin de datos: An ms crtico es la
combinacin de la computacin y de datos de recursos gestin, que aprovecha la
localidad de datos de patrones de acceso para minimizar la cantidad de movimiento
de datos y mejorar End- rendimiento de las aplicaciones y la escalabilidad. El
intento de abordar el almacenamiento y problemas computacionales obliga
separado mucho movimiento de datos entre cmputo y almacenamiento recursos,
que no escalan a peta-escala de maana conjuntos de datos y millones de
procesadores y rendir significativa subutilizacin de los recursos primas. Es
importante programar tareas computacionales cerca de los datos, y para entender
los costos de mover el trabajo en lugar de en movimiento los datos. Programadores
de datos-aware y de dispersin de datos cerca de procesadores es fundamental para
lograr una buena escalabilidad y actuacin. Por ltimo, como el nmero de ncleos
de procesador es aumentando (las supercomputadoras ms grandes hoy en da
tienen ms de 200K procesadores y Rejillas superando 100K procesadores), hay
una nfasis cada vez mayor de apoyo de alto rendimiento la computacin con altas
tasas de expedicin y ejecucin sostenibles.
Creemos que las arquitecturas de gestin de datos son importantes para asegurar
que las implementaciones de gestin de datos escalan a los tamaos de conjuntos
de datos requeridos en el nmero de archivos, objetos y conjunto de datos de uso
de espacio en disco, mientras que al mismo tiempo, asegurando que informacin
de elemento de datos se puede recuperar con rapidez y eficacia. Rejillas han estado
haciendo avances en la combinacin de clculo y gestin de datos con los
programadores para datos [41], pero nosotros creen que las nubes se enfrentarn a
retos importantes en el manejo aplicaciones intensivas de datos sin grandes
esfuerzos invertidos en el aprovechamiento de la localidad de datos de patrones de
acceso de la aplicacin. Aunque las aplicaciones intensivas de datos pueden no ser
tpicos Nubes aplicaciones que tienen que ver con la actualidad, como las escalas
de Nubes crecen, puede ser slo una cuestin de tiempo para muchas nubes.
Virtualizacin: La virtualizacin se ha convertido en un elemento indispensable

ingrediente para casi todos Nube, las razones ms obvias son para la abstraccin y
la encapsulacin. Apenas eran las discusiones como introducido para proporcionar
a los usuarios la "ilusin", como si el ordenador corran todos los hilos
simultneamente, y cada hilo estaban utilizando todos los recursos disponibles, las
nubes tienen que ejecutar mltiples usuarios (o incluso hasta miles o millones de)
aplicaciones y todas las aplicaciones aparecen a los usuarios como si que estaban
corriendo al mismo tiempo y se poda utilizar todo el los recursos disponibles en
la nube. La virtualizacin proporciona la abstraccin necesario de tal manera que
el tejido subyacente (en bruto computacin, almacenamiento, recursos de red)
puede unificarse como una piscina
de los recursos y superposiciones de recursos (por ejemplo, servicios de
almacenamiento de datos, Entornos de hosting) web se puede construir encima de
ellos.
La virtualizacin tambin permite a cada aplicacin a encapsular de tal manera que
se pueden configurar, desplegado, comenzado, migran, suspendido, reanudado, se
detuvo, etc., y por lo tanto proporciona una mejor la seguridad, capacidad de
gestin, y el aislamiento.
Tambin hay muchas otras razones por las que las nubes tienden a adoptar
virtualizacin: 1) de servidores y aplicaciones de consolidacin, como varias
aplicaciones pueden ejecutarse en el mismo servidor, recursos puede ser utilizado
de manera ms eficiente; 2) configurabilidad, como la necesidades de recursos para
diversas aplicaciones podran diferir significativamente, algunos requieren gran
almacenamiento, algunos de cmputo, en Para configurar de forma dinmica y
paquete (agregado) recursos para diversas necesidades, la virtualizacin es
necesario ya que esto no se puede lograr a nivel de hardware; 3) aumento de la
disponibilidad de las aplicaciones, la virtualizacin permite la recuperacin rpida
de interrupciones no planificadas, como los entornos virtuales pueden ser copia de
seguridad y emigrado sin interrupcin en el servicio; 4) mayor capacidad de
respuesta: el aprovisionamiento de recursos, el seguimiento y el mantenimiento se
puede automatizar, y los recursos comunes pueden ser almacenado en cach y
reutilizada. Todas estas caractersticas de la virtualizacin servir de base para las
nubes para cumplir con estrictos SLA (Service Acuerdo de Nivel) requisitos en un
entorno de negocios, que no puede ser alcanzado fcilmente con un entorno no
virtualizado de una manera rentable como sistemas tendra que ser excesiva
aprovisionado de manejar carga y residuos recursos pico en ralent
perodos. Despus de todo, una infraestructura de virtualizacin puede ser slo
pensado como una asignacin de recursos de TI a las necesidades empresariales.
Las rejillas no se basan en la virtualizacin tanto como las nubes hacen, pero que
podran ser ms debido a la poltica y que tiene cada individuo organizacin

mantener el control total de sus recursos (es decir, por no la virtualizacin de


ellos). Sin embargo, hay esfuerzos en Grids para utilizar virtualizacin, as como
Nimbus [56] (anteriormente conocido como el Servicio de rea de trabajo virtual
[26]), que proporcionan la misma abstraccin y capacidades de despliegue
dinmicos. LA espacio de trabajo virtual es un entorno de ejecucin que puede ser
desplegado de forma dinmica y con seguridad en la Red. Nimbo proporciona dos
niveles de garantas: 1) la calidad de vida: los usuarios obtienen exactamente el
(software) medio ambiente que necesitan, y 2) la calidad de servicio: suministro y
garantizar todos los recursos de los espacio de trabajo necesita para funcionar
correctamente (CPU, memoria, disco, ancho de banda, disponibilidad), lo que
permite renegociacin dinmica para reflejar los cambios en los requisitos y
condiciones. Adicionalmente, Nimbus tambin puede aprovisionar un clster
virtual de la red aplicaciones (por ejemplo, un planificador de lote, o un sistema de
flujo de trabajo), que tambin es configurable de forma dinmica, una tendencia
creciente en Grid Computing.
Tambin vale la pena sealar que la virtualizacin - en el pasado tena las
prdidas de rendimiento significativas para algunas aplicaciones, que ha sido uno
de la desventaja principal de utilizar virtualizacin. Sin embargo, en los ltimos
aos, el procesador fabricantes como AMD e Intel han sido la introduccin de
soporte de hardware para virtualizacin, que est ayudando estrecha la diferencia
de rendimiento entre el rendimiento de las aplicaciones en virtualizado recursos ya
que se compara con el de las tradicionales sistemas operativos sin virtualizacin.
Monitoreo: Otro reto que la virtualizacin aporta a Las nubes es la dificultad
potencial en un control fino sobre el vigilancia de los recursos. Aunque muchos
Grids (como TeraGrid) tambin hacer cumplir las restricciones sobre qu tipo de
sensores o servicios de un usuario puede lanzar de larga duracin, el seguimiento
de la nube es no tan sencillo como en Rejas, Rejillas porque, en general, tener un
modelo de confianza diferente en el que los usuarios a travs de su identidad
delegacin puede acceder y navegar por los recursos a diferentes Cuadrcula sitios
y recursos grid no son muy abstrados y virtualizado como en las nubes; por
ejemplo, los ganglios [25] distribuye (y jerrquico) sistema de monitoreo puede
supervisar un federacin de clusters y Grids y ha visto una amplia adopcin en la
comunidad de cuadrcula. En una nube, diferentes niveles de servicios se puede
ofrecer a un usuario final, el usuario slo se expone a un pre- API definida, y los
recursos de nivel inferior son opacos a la usuario (especialmente a nivel PaaS y
SaaS, aunque algunos proveedores pueden optar por exponer la informacin de
monitoreo en estos niveles). El usuario no tiene la libertad para desplegar su propia
infraestructura de monitoreo, y la limitada informacin devuelto al usuario no
puede proporcionar el nivel necesario de detalles de ella para averiguar cul es el

estado de los recursos es. Los potencialmente existen mismos problemas para los
desarrolladores de la nube y administradores, ya que los recursos abstractos /
unificadas suelen ir a travs de la virtualizacin y algn otro nivel de
encapsulacin, y el seguimiento de los problemas para entrar por el software /
hardware de pila podra ser ms difcil. Monitoreo Esencialmente en nubes
requiere un delicado equilibrio de la monitorizacin de aplicaciones de negocio, la
administracin de servidores de la empresa, el seguimiento de la mquina virtual,
y mantenimiento de hardware, y ser un reto importante para Cloud Computing
que considere la adopcin y despliegues ms amplio.
Por otra parte, la vigilancia puede argumentar a ser menos importante en las nubes,
ya que los usuarios interactan con una ms capa abstracta que es potencialmente
ms sofisticado; este capa abstracta podra responder a las fallas y calidad del
servicio (QoS) de forma automtica en una forma de propsito general
independientemente de la lgica de aplicacin. En un futuro prximo, el usuario
final monitoreo podra ser un reto importante para las nubes, pero se vuelven
menos importantes como las nubes se vuelven ms sofisticado y ms automantenido y auto-sanacin.
Procedencia: Procedencia refiere a la historia de la derivacin de un producto de
datos, incluyendo todas las fuentes de datos, los datos intermedia productos, y los
procedimientos que se aplicaron para producir el producto de datos. Procedencia
informacin es de vital importancia en la comprensin, descubrir, validar y
compartir un producto de datos fiables como as como las aplicaciones y
programas utilizados para obtener la misma. En algunas disciplinas, como las
finanzas y la medicina, tambin es obligatoria para proporcionar lo que se llama
una "auditora" de propsito audicin. En Rejas, gestin de procedencia ha sido en
general, integrado en un sistema de flujo de trabajo, desde principios de los
pioneros como quimera [22], a los sistemas de flujo de trabajo cientficos
modernos, tales como Swift [53], Kepler [35], y ver [34] para apoyar la
descubrimiento y la reproducibilidad de los resultados cientficos. Tambin tiene
ha construido como un servicio independiente, como Preserv [29], para facilitar la
integracin de los componentes de procedencia en ms modelos informticos
generales y trato con problemas de confianza en afirmacin de
procedencia. Utilizando la informacin de procedencia, los cientficos puede
depurar la ejecucin del flujo de trabajo, validar o invalidar cientfica los resultados
y orientar el diseo de flujo de trabajo futuro y la exploracin de datos.
Mientras procedencia ha demostrado por primera vez su promesa en la cientfica
sistemas de flujo de trabajo [22] y los sistemas de bases de datos [47], un largo
plazo visin es que procedencia ser til en otros sistemas como as, lo que exige

el desarrollo de un estndar, abierto, y representacin universal y el modelo de


consulta. Actualmente, la serie reto procedencia [39] y la procedencia abierta
iniciativa modelo [38] proporcionar los foros activos de stos esfuerzo de
estandarizacin y la interaccin. Por otra parte,
Las nubes estn convirtiendo en el patio de recreo de futuro para la e-ciencia la
investigacin y la gestin de procedencia es muy importante con el fin de realizar
un seguimiento de los procesos y apoyar la reproducibilidad de los resultados
cientficos [45]. Procedencia sigue siendo un rea inexplorada en entornos de nube,
en la que tenemos que lidiar con incluso cuestiones ms difciles, como la
produccin de datos de seguimiento a travs de diferentes proveedores de servicios
(con diferente plataforma la visibilidad y el acceso polticas) ya travs de diferentes
programas y hardware capas de abstraccin dentro de un solo proveedor. En otro
Es decir, la captura y gestin de procedencia en la nube entornos pueden llegar a
ser ms difcil que en Rejas, ya que en este ltimo ya hay unos sistemas de
procedencia y las iniciativas, consulta procedencia embargo escalable [55] y
acceso seguro de la informacin de procedencia siguen abiertas problemas tanto
para los Grids y entornos nubes.
2.4 Programacin Modelo
Aunque el modelo de programacin en entornos de cuadrcula no difieren
fundamentalmente de forma paralela tradicional y distribuido ambientes,
obviamente complica por cuestiones como la mltiples dominios
administrativos; grandes variaciones en los recursos heterogeneidad, la estabilidad
y el rendimiento; manejo de excepciones en altamente dinmico (en que los
recursos pueden unirse y dejar bastante tanto en cualquier momento) ambientes,
etc. rejillas apuntar principalmente clculos cientficos a gran escala, por lo que
deben escalar para aprovechar gran nmero / cantidad de recursos, y nosotros
tambin lo hara naturalmente, quieren hacer que los programas se ejecutan rpido
y eficiente en la red ambientes y programas tambin deben terminar correctamente,
por lo fiabilidad y tolerancia a fallos deben ser considerados.
Nosotros discutimos brevemente aqu algunos modelos de programacin generales
Grids. MPI (Message Passing Interface) [36] es el ms modelo de programacin
de uso general en computacin paralela, en que un conjunto de tareas utilizan su
propia memoria local durante computacin y comunicacin mediante el envo y
recepcin mensajes. MPICH-G2 [32] es una implementacin de red habilitado de
MPI. Da la interfaz familiar de MPI mientras que proporciona integracin con el
Globus Toolkit. Lenguas de coordinacin tambin permitir que un nmero de
componentes posiblemente heterogneos a comunicarse e interactuar, ofreciendo
facilidades para la especificacin, la interaccin y la composicin dinmica de
distribuidos componentes (concurrentes). Por ejemplo, Linda [1] define un

conjunto de primitivas de coordinacin para poner y recuperar tuplas de un espacio


de datos compartida llamado el espacio de tuplas . Tiene ha demostrado que es
fcil de usar tales primitivas a implementar un programador paralelo maestrotrabajador. La Novena-G GridRPC [37] sistema integra una red de RPC (Remote
Procedure Call) capa en la parte superior de la caja de herramientas
Globus. Publica interfaces y libreras de funciones en MDS, y utiliza GRAM para
invocar ejecutables remotas. En Rejas, sin embargo, muchos aplicaciones estn
dbilmente acoplados en que la salida de uno puede ser pasado como entrada a uno
o ms otros, por ejemplo, como una presentar, oa travs de una invocacin de
servicios web. Mientras que tales "en trminos generales "clculos acoplados
pueden implicar grandes cantidades de computacin y comunicacin, las
preocupaciones de la programador tienden a ser diferentes de los de alta tradicional
computing rendimiento, siendo enfocada en temas de gestin en relacin con el
gran nmero de conjuntos de datos y tareas en lugar de la optimizacin de la
comunicacin interprocessor. De tal casos, los sistemas de flujo de trabajo [54] se
adapte mejor en la especificacin y la ejecucin de este tipo de aplicaciones. Ms
especficamente, una sistema de flujo de trabajo permite que la composicin del
individuo (single paso) componentes en un grafo de dependencias complejo, y
regula el flujo de datos y / o control a travs de estos componentes. Un ejemplo es
el sistema Swift [53], que puentes flujos de trabajo cientfico con la computacin
paralela. Es un herramienta de programacin paralela para la especificacin rpida
y fiable, ejecucin y gestin de la ciencia a gran escala y los flujos de trabajo de
ingeniera. El sistema de ejecucin Swift se basa en la CoG Karajan [33] motor de
flujo de trabajo para la planificacin eficiente y el equilibrio de carga, y se integra
el ligero Falkon servicio de ejecucin de la tarea para un rendimiento optimizado
y la tarea eficiencia de los recursos [40]. WSRF (Web Services Recursos Marco)
ha surgido de OGSA (Open Grid Service Arquitectura) [11] a medida que ms y
ms aplicaciones de rejilla estn desarrollado como servicios. WSRF Web Services
permite a convertirse estado, y proporciona un conjunto de operaciones para
establecer y recuperar los estados (recursos). La versin Globus Toolkit 4 contiene
Java y C implementaciones de WSRF, la mayora de la Globus servicios bsicos
se han rediseado para construir alrededor WSRF, stos por completo permitirn
orientada a servicios de programacin de cuadrcula modelo.
MapReduce [13] sin embargo, slo es otra programacin paralela modelo, que
proporciona un modelo de programacin y sistema de ejecucin para el
procesamiento de grandes conjuntos de datos, y se basa en una simple modelar con
slo dos funciones clave: "mapa" y "reducir" tomado de los lenguajes
funcionales. Se aplica la funcin de mapa una operacin especfica a cada uno de
un conjunto de elementos, produciendo un nuevo conjunto de elementos; una
funcin realiza reducir la agregacin de un conjunto de artculos. El sistema de
ejecucin automtica MapReduce Los horarios de las particiones de datos de

entrada y la ejecucin de los programas en un gran grupo de mquinas de productos


bsicos. El sistema est compuesto quejar tolerante comprobando peridicamente
nodos de trabajo y reasignacin de tareas fallidas a otros nodos de trabajo. Sawzall
es una lenguaje interpretado que se basa en MapReduce y separa las fases de
filtrado y agregacin para el programa ms conciso especificacin y mejor
paralelizacin. Hadoop [30] es el implementacin de cdigo abierto del modelo
MapReduce y cerdo es un lenguaje de programacin declarativa ofreci en la parte
superior de la Hadoop. Microsoft ha desarrollado el Cosmos distribuidos sistema
de almacenamiento y procesamiento marco Dryad y ofertas DryadLINQ [31] y
alcance como modelo de programacin declarativa en la parte superior de la
infraestructura de almacenamiento y computacin. DryadLINQ utiliza la sintaxis
orientada a objetos consulta LINQ donde mbito de aplicacin proporciona a los
operadores bsicos similares a los de SQL tales como Seleccionar, Ingreso,
agregacin, etc., tanto en traducir lo abstracto especificacin en el plan de
ejecucin detallado.
De scripting y Mesh-up (Java Script, PHP, Python, etc) tienen estado tomando el
lugar de un sistema de flujo de trabajo en el mundo de la nube, ya que no hay
manera fcil de integrar los servicios y aplicaciones de diferentes proveedores. Son
esencialmente los datos la integracin se acerca, porque toman las salidas de un
servicio / aplicacin, transformarlos y alimentar a otro. Google App Engine utiliza
un tiempo de ejecucin de Python modificado y elige Python lenguaje de scripting
para la aplicacin web el desarrollo, la interfaz para su almacenamiento BigTable
subyacente sistema es un lenguaje de consulta de propiedad (con nombre, como
usted pensara, GQL) es una reminiscencia de SQL, aunque todos stos
probablemente cambiarn. Nubes (como Amazon Web Servicios, Servicios Azure
Platform de Microsoft) tienen en general adoptadas API de servicios Web, donde
el acceso a los usuarios, configurar y los servicios del programa de la nube usando
APIs predefinidos expuestos como Servicios Web y HTTP y SOAP son los
protocolos comunes elegido para tales servicios. Aunque Nubes adoptaron algunos
protocolos de comunicacin comunes, tales como HTTP y SOAP, la integracin y
la interoperabilidad de todos los servicios y aplicaciones siguen siendo el mayor
desafo, ya que los usuarios necesitan para aprovechar en una federacin de nubes
en lugar de un nico proveedor de la nube.

2.5 Solicitud de Modelo


Rejillas generalmente apoyan muchos tipos diferentes de aplicaciones, que van
desde la informtica de alto rendimiento (HPC) de alta informtica rendimiento
(HTC). Aplicaciones HPC son eficientes en la ejecucin de trabajos paralelos

fuertemente acoplados dentro de un particular, mquina con interconexiones de


baja latencia y generalmente no son ejecutada a travs de una amplia red de red de
rea; estas aplicaciones suelen utilizar Message Passing Interface (MPI) para
lograr el comunicacin entre procesos necesarios. Por otro lado, las redes Tambin
han tenido gran xito en la ejecucin de manera ms flexible aplicaciones
acopladas que tienden a ser gestionados y ejecutados a travs de sistemas de flujo
de trabajo u otro complejo y sofisticado aplicaciones. En cuanto a las aplicaciones
de HTC dbilmente acoplados naturaleza, hay otras clases de la aplicacin, tales
mltiple Programa de mltiples datos (MPMD), MTC, capacidad de clculo, utility
computing, y vergonzosamente paralelas, cada una con su propios nichos
[42]. Estas aplicaciones dbilmente acoplados pueden ser compuesta de muchas
tareas (tanto independientes como dependientes tareas) que se pueden programar
individualmente en muchos diferentes los recursos informticos a travs de
mltiples fronteras administrativas para lograr alguna meta aplicacin ms
grande. Las tareas pueden ser pequeos o grande, monoprocesador o
multiprocesador, compute-intensivo o gran volumen de datos. El conjunto de
tareas puede ser esttica o dinmica, homogneo o heterogneo, sin apretar o
estrechamente acoplado.
El nmero total de tareas, cantidad de la informtica, y volmenes de datos podran
ser pequea, pero tambin extremadamente grande. Por otro lado, la computacin
en nube podra en principio abastezca a un conjunto similar de aplicaciones. La
nica excepcin que se har probablemente ser difcil de lograr en el Cloud
Computing (pero ha tenido mucho xito en Grids) son aplicaciones HPC que
requieren rpida e interconexiones de redes de latencia bajos de la escala eficiente
muchos procesadores. Como Cloud Computing es todava en su infancia, las
aplicaciones que se ejecutarn en las nubes no estn bien definidos, pero sin duda
podemos caracterizar a ser imprecisa, orientado transaccin (pequeas tareas en el
orden de milisegundos de segundos), y es probable que ser interactivo (en
oposicin a por lotes programados, ya que se encuentran actualmente en Grids).
Otra clase emergente de las aplicaciones en las rejillas es cientfico puertas de
enlace [51], que son frontales a una variedad de aplicaciones que puede ser
cualquier cosa, desde dbilmente acoplado fuertemente acoplado.
Una puerta de enlace de la Ciencia es un conjunto desarrollado por la comunidad
de herramientas, las aplicaciones y los datos de las colecciones que se integran a
travs de un portal o un conjunto de aplicaciones. Gateways proporcionan acceso
a una variedad de capacidades, incluyendo los flujos de trabajo, la visualizacin,
servicios de descubrimiento de recursos y la ejecucin del trabajo a travs de un
interfaz de usuario basada en navegador (que sin duda puede ocultar mucho de la

complejidad). Gateways cientficos estn empezando a adoptar una amplia


variedad de tecnologas web 2.0, pero hasta la fecha, gran parte de los desarrollos
en cuadrculas y la Web 2.0 han sido realizado en paralelo con poca interaccin
entre ellos. Estas las nuevas tecnologas son importantes mejoras a los caminos
gateways interactan con los servicios y proporcionan ricos usuario
interactividad. Aunque las puertas de enlace cientficos slo han surgido en Grids
hace poco, las nubes parecen haber adoptado el uso de puertas de acceso a los
recursos de la nube casi exclusivamente para el usuario final interaccin. El
navegador y tecnologas Web 2.0 lo har sin duda, juegan un papel central en cmo
los usuarios interactan con Grids y nubes en el futuro.
2.6 Modelo de Seguridad
Nubes comprenden principalmente los centros de datos dedicados perteneciente a
de la misma organizacin, y dentro de cada centro de datos, hardware y
configuraciones de software y plataformas de apoyo estn en en general ms
homognea en comparacin con los de cuadrcula ambientes. Interoperabilidad
puede convertirse en un problema grave para centro de datos cruz, dominio de las
interacciones cruzadas administracin, imaginar el funcionamiento de su servicio
de contabilidad en Amazon EC2 mientras que sus otras operaciones de negocios
en la infraestructura Google. Grids sin embargo se basan en la suposicin de que
los recursos son heterognea y dinmica, y cada sitio de la red puede tener su
dominio de administracin propia y autonoma operacin. Por lo tanto, la
seguridad ha sido diseado en la cuadrcula fundamental infraestructura. Las
cuestiones clave que se consideran son: inicio de sesin nico, por lo que los
usuarios pueden iniciar sesin en una sola vez y tener acceso a mltiples Sitios de
cuadrcula, esto tambin facilitarn contabilidad y auditora; delegacin, por lo que
un programa puede ser autorizado a acceder recursos en nombre de un usuario y
que puede delegar a otra programas; la privacidad, la integridad y la segregacin,
los recursos perteneciente a un usuario no se puede acceder por no autorizada
usuarios, y no puede ser manipulado durante la transferencia; coordinado la
asignacin de recursos, reservas, y el intercambio, teniendo en consideracin de
ambas polticas globales y locales de uso de recursos.
La clave pblica basado (Infraestructura Red de Seguridad) GSI protocolos se
utilizan para la autenticacin, la comunicacin proteccin, y la
autorizacin. Adems, CAS (Comunidad Authorization Service) est diseado
para el recurso avanzada autorizacin dentro ya travs de las comunidades. Gruber
(A Cuadrcula Uso de recursos de SLA Broker) [14] es un ejemplo que tiene puntos
de aplicacin de la poltica de distribucin para hacer cumplir tanto locales
polticas de uso y SLAs globales (Service Level Agreement), que permite que los
recursos en los sitios individuales para ser eficiente compartida en mltiples sitios,

entornos multi-VO. Actualmente, el modelo de seguridad para las nubes parece ser
relativamente ms simple y menos seguro que el modelo de seguridad adoptada
por Grids. Infraestructura de nube generalmente se basan en formularios web (ms
de SSL) para crear y gestionar la informacin de cuenta para los usuarios finales,
y permite a los usuarios restablecer sus contraseas y recibir nueva contraseas a
travs de correos electrnicos en un inseguro y sin cifrar la comunicacin. Tenga
en cuenta que los nuevos usuarios podran utilizar Nubes con relativa facilidad y
casi al instante, con una tarjeta de crdito y / o direccin de correo electrnico. Para
contrastar esto, Grids son ms estrictas sobre su seguridad. Por ejemplo, aunque
los formularios web se utilizan para gestionar cuentas de usuario, informacin
sensible acerca de nuevas cuentas y contraseas requiere tambin una persona a
otra conversacin verificar que la persona, tal vez la verificacin de un
patrocinador persona que ya tiene una cuenta y contraseas slo sern por fax o
por correo, pero en ningn caso van a ser enviado por correo electrnico. El
enfoque de la red a la seguridad podra ser ms tiempo consumir, pero aade un
nivel adicional de seguridad para ayudar a
evitar el acceso no autorizado.
La seguridad es una de las mayores preocupaciones para la adopcin de
Computacin En La Nube. Nos esbozar siete riesgos de un usuario de la nube debe
plantear a los proveedores antes de comprometerse [6]: 1) el usuario privilegiado
Acceso: datos confidenciales procesados fuera de las necesidades de la empresa la
seguridad de que slo son accesibles y propagado a usuarios
privilegiados; 2) Cumplimiento de normas: a las necesidades del cliente para
verificar si un proveedor de nube tiene auditoras y seguridad exterior
certificaciones y si su infraestructura cumple con alguna requisitos de seguridad
reglamentarios; 3) la ubicacin de los datos: desde un cliente no sabr donde se
almacenarn sus datos, es importante que el proveedor de la nube se comprometen
a almacenar y el procesamiento de datos en jurisdicciones especficas y para
obedecer locales requisitos de privacidad en nombre del cliente; 4) Datos la
segregacin: uno tiene que asegurarse de que los datos de un cliente es totalmente
separados de los datos de otro cliente; 5) Recuperacin: se Es importante que el
proveedor de la nube tiene una replicacin eficiente y el mecanismo de
recuperacin para restaurar los datos en caso de desastre; 6)
Apoyo a la Investigacin: Servicios en la nube son especialmente difciles de
investigar, si esto es importante para un cliente, entonces tal apoyo debe
garantizarse con un compromiso contractual; y 7) la viabilidad a largo plazo: los
datos deben ser viables incluso el Proveedor de la nube es adquirida por otra
empresa.
3 Conclusiones y luces para el futuro

En este trabajo, se muestra que las nubes y Rejillas comparten una gran cantidad
comunalidad en su visin, la arquitectura y la tecnologa, pero tambin difieren en
varios aspectos como la seguridad, modelo de programacin, modelo de negocio,
modelo de clculo, los datos modelo, las aplicaciones y las abstracciones. Tambin
identificamos retos y oportunidades en ambos campos. Creemos que una estrecha
esa comparacin ya que esto puede ayudar a las dos comunidades comprender,
compartir y desarrollar la infraestructura y la tecnologa dentro y fuera, y acelerar
Cloud Computing desde temprano prototipos a los sistemas de produccin.
Qu nos depara el futuro? Vamos a aventurar algunas predicciones, basado en
nuestras creencias de que la economa de la computacin buscarn ms y ms
como los de la energa. Ni la energa ni la computar redes del maana se ver como
el de ayer red de energa elctrica. Ambos avanzar hacia una mezcla de micro
produccin y grandes empresas de servicios pblicos, con un nmero creciente de
los pequeos productores (elica, solar, biomasa, etc., para la energa; para la
informtica, las agrupaciones locales e incrustado en procesadores zapatos y
paredes) coexistiendo con gran escala regional productores y carga que se
distribuyen entre ellos de forma dinmica.
S, la informtica no es realmente como la electricidad, pero s creo que, sin
embargo vamos a ver la evolucin paralela, impulsada por fuerzas similares.
En la construccin de esta distribuida "nube" o "Grid", tendremos que apoyo
aprovisionamiento y configuracin de on-demand "Sistemas virtuales" integrados
que proporcionan las capacidades precisas es necesario por un usuario
final. Tendremos que definir protocolos que permiten a los usuarios y proveedores
de servicios para descubrir y mano de exige a otros proveedores, para monitorear
y administrar su reservas, y organizar el pago. Necesitaremos herramientas para
gestionar tanto los recursos subyacentes y la resultante clculos
distribuidos. Vamos a necesitar la escala centralizada de los servicios pblicos de
la nube de hoy, y la distribucin y la interoperabilidad de las instalaciones de la
cuadrcula de hoy.
Desafortunadamente, al menos hasta la fecha, los mtodos utilizados para lograr
estos objetivos en las nubes comerciales de hoy no han sido abiertos y de propsito
general, pero en su lugar ha sido en su mayora de propiedad y especializado para
los usos internos especficos (por ejemplo, datos a gran escala anlisis) de las
empresas que los desarrollan. La idea de que lo que se quiere permitir la
interoperabilidad entre los proveedores (como en la red de energa elctrica) an
no ha salido a la superficie. Cuadrcula tecnologas y protocolos hablan
precisamente a estas cuestiones, y debera ser considerado.
Algunos de los protocolos y herramientas necesarios procedern del gente
inteligente de la industria en Amazon, Google, Yahoo, Microsoft e IBM. Otros

vendrn de las personas inteligentes del mundo acadmico y del gobierno


laboratorios. Otros vendrn de los que crean lo que llamamos estas cosas despus
de cuadrcula y Cloud. Ser interesante ver en qu medida estos diferentes
comunidades logran encontrar una causa comn, o en su lugar continuar por
caminos paralelos.

S-ar putea să vă placă și