Clase1 Introduccion

Computacin de Propsito General en Unidades de Procesamiento Grfico (GPGPU)
P. Ezzatti, M. Pedemonte y E. Dufrechou Ezzatti,
Clase 1 Introduccin
GPGPU
Clase 1 Introduccin
Clase 1 Introduccin
GPGPU
Contenido
Un poco de historia El pipeline grfico Tarjetas programables Por qu una arquitectura unificada? CUDA
Clase 1 Introduccin
GPGPU
Un poco de historia
Clase 1 Introduccin
GPGPU
Un poco de historia
1981 Monochrome Display Adapter (MDA):
No permita el despliegue de grficos. Solamente en modo texto: 80 columnas x 25 lneas, monocromo. 4 KB de memoria.
Clase 1 Introduccin
GPGPU
Un poco de historia
1982 Hercules Graphics Card:
En modo texto: 80 columnas x 25 lneas, monocromo. En modo grfico todos los pixeles eran direccionables: 720 x 348 (mono). 64 KB de memoria.
Clase 1 Introduccin
GPGPU
Un poco de historia
1981 Color Graphics Adapter (CGA):
En modo texto: 80 columnas x 25 lneas (16 colores) pero con ms baja resolucin y 40 columnas x 25 lneas (16 colores). En modo grfico: 640 x 200 (mono), 320 x 200 (4 colores) y 160 x 200 (16 colores). 16 KB de memoria.
Clase 1 Introduccin
GPGPU
Un poco de historia
1984 Enhanced Graphics Adapter (EGA):
Resolucin: 640 x 350 (16 colores de una paleta de 64 colores). 64 KB y 256 KB de memoria.
Clase 1 Introduccin
GPGPU
Un poco de historia
1987 Video Graphics Array (VGA):
ltimo estndar exitoso de IBM. Diseado como un single chip. Resoluciones: 640 x 480 (16 colores) y 320 x 200 (256 colores). 256 KB de memoria.
Clase 1 Introduccin
GPGPU
Un poco de historia
Durante la dcada del 90 se mejoran las resoluciones:
Super VGA: 800 x 600. XGA: 1024 x 768 (256 colores, 8 bits por pixel) y 800 x 600 (65536 colores, 16 bits por pixel).
Clase 1 Introduccin
GPGPU
Un poco de historia
Durante la dcada del 90 se presentan las primeras tarjetas con capacidad de reproducir efectos en 2D/3D:
3dfx Interactive (1996-2000): Lnea Voodoo ATI (1995-2004): Lnea Rage Nvidia (1998-2005): Lneas TNT y GeForce
Clase 1 Introduccin
GPGPU
El pipeline grfico
Clase 1 Introduccin
GPGPU
El pipeline grfico
Las operaciones para visualizar imgenes en pantalla se agrupan en un proceso generalmente conocido como pipeline grfico. Tpicamente se deben desplegar imgenes que son proyecciones de escenas tridimensionales en una pantalla bidimensional. Durante la dcada del 90 se disean tarjetas grficas que van incorporando etapas del pipeline grfico, con el fin de aliviar a la CPU.
Clase 1 Introduccin
GPGPU
El pipeline grfico
En 1999, Nvidia lanza al mercado la GeForce 256 que es considerada la primera GPU (Graphics Processing Unit). La GeForce 256 es la primera tarjeta de video consumer-level que implementa el pipeline grfico completo. El pipeline grfico ha sido definido con diferente nivel de detalle por diversos autores. A continuacin presentaremos el pipeline grfico basado en la descripcin de Kirk y Wu (Programming Massively Parallel Processors: A Hands-on Approach).
Clase 1 Introduccin
GPGPU
El pipeline grfico
La primera etapa del pipeline se encarga de recibir las imgenes de la CPU en algn formato manejable. Dicho formato es una coleccin de primitivas. Las primitivas suelen ser tringulos ya que son los polgonos ms simples y permiten un manejo eficiente.
Clase 1 Introduccin
GPGPU
El pipeline grfico
Vertex control:
Cada tringulo se transforma de acuerdo a su posicin y orientacin respecto al punto de vista. Cada uno de los vrtices del tringulo se transforma a otra posicin. Se eliminan los vrtices no visibles.
Clase 1 Introduccin
GPGPU
El pipeline grfico
VS/T & L:
Sombreado de vrtices, transformaciones e iluminacin. Se transforman los vrtices, asignando propiedades a los vrtices visibles como son: colores, normales, tangentes, texturas, etc. Esta etapa es realizada por los vertex shaders.
Clase 1 Introduccin
GPGPU
El pipeline grfico
Triangle setup:
Realiza clculos para las aristas, interpolando colores y otros valores de los vrtices.
Raster:
Determina para cada tringulo que pxeles lo integran. Por cada pxel se interpola, a partir de los vrtices, los valores necesarios para sombrear los pxeles, evaluar la inclusin de colores y determinar la posicin de la textura que ser pintada en el pixel.
Clase 1 Introduccin GPGPU
El pipeline grfico
Shader (sombreado):
En esta etapa se ejecutan los efectos que permiten renderizar imgenes en forma ms realista. Se determina el color final de cada pxel. Se utilizan tcnicas como la interpolacin de colores entre vrtices, el mapeo de textura, la iluminacin por pxel. Esta etapa es computada por los pixel shaders.
Clase 1 Introduccin
GPGPU
El pipeline grfico
ROP (Raster OPeration):
Se aplican restricciones finales sobre cada pxel. Por ejemplo: mezcla de colores de tringulos superpuestos para mejorar los efectos de transparencias y antialiasing. Se determinan los objetos visibles para un punto de vista dado y se descartan los pxeles ocultos.
FBI (Frame Buffer Interface):

Lee y escribe en el buffer de imagen.
El pipeline grfico
Ejemplo: la arquitectura de la GeForce 7800 (pre-CUDA)
Clase 1 Introduccin
GPGPU
Tarjetas programables
Clase 1 Introduccin
GPGPU
En los ltimos aos existe un auge de la utilizacin de GPUs para el cmputo de problemas de propsito general. Este crecimiento se basa fundamentalmente en:
La arquitectura es intrnsecamente paralela, en contraste con la arquitectura serial de las CPUs. La industria de los videojuegos ha presionado a los fabricantes de tarjetas grficas a aumentar las capacidades de procesamiento grfico para que los juegos sean ms realistas y ms rpidos. El surgimiento de lenguajes de programacin de propsito general para GPUs.
Clase 1 Introduccin
GPGPU
Las tarjetas de video viejas tenan un pipeline grfico fijo. Las operaciones ejecutadas y el orden en que se aplicaban sobre los datos estaba preconfigurado. Originalmente, las GPUs provean operaciones propias para la transformacin e iluminacin (vertex shaders) en los vrtices, y para determinar el color final de los pxeles (pixel shaders). En los ltimos diez aos, las GPUs han tenido cambios impresionantes.
Clase 1 Introduccin
GPGPU
1999-2006: se produce una mejora significativa en las capacidades de programacin de las GPUs. Algunos hitos son:
GeForce 3 (2001): primera GPU que ejecutaba vertex shaders programados en DirectX 8 (pudiendo programar la etapa de VS/T & L). ATI Radeon 9700 (2002): introdujo la aritmtica de punto flotante de 24 bits en los pixel shaders (DirectX 9 y OpenGL). GeForce FX (2002-2003): introdujo el trabajo con aritmtica de punto flotante de 32 bits. Xbox 360 (2005): primera arquitectura unificada de procesadores para el pipeline grfico. Una sola clase de procesadores computa las distintas secciones del pipeline.
Clase 1 Introduccin
GPGPU
En un principio, el avance en el hardware no fue acompaado por un avance en el software de manejo de las GPUs. Inicialmente la programacin de las GPUs se realizaba mediante llamados a servicios de interrupcin de la BIOS. Posteriormente, se comenzaron a desarrollar los shaders en el lenguaje ensamblador especfico de cada modelo. Esto implicaba la existencia de varios lenguajes y baja portabilidad de los programas. Otra alternativa era utilizar las APIs grficas como OpenGL y DirectX.
Clase 1 Introduccin
GPGPU
Evidentemente esto representaba una limitacin para el desarrollo de aplicaciones. Para solucionarlo se desarrollaron diferentes lenguajes de programacin de ms alto nivel que funcionaran sobre los modelos de GPU existentes, como: High-Level Shading Language (HLSL) y Cg. Posteriormente, otros lenguajes de alto nivel surgieron basados en considerar la GPU como un stream processor como: Brook, Sh, PyGPU, Accelerator Language, Close to the Metal (CTM) y ATI Stream. Sin embargo, cada herramienta segua siendo muy dependiente de la arquitectura de la GPU, el modelo, etc.
Por qu una arquitectura unificada?
Clase 1 Introduccin
GPGPU

La arquitectura de la GeForce 7800
Clase 1 Introduccin
GPGPU
Clase 1 Introduccin
GPGPU
10
Clase 1 Introduccin
GPGPU
Clase 1 Introduccin
GPGPU
Clase 1 Introduccin
GPGPU
11

La arquitectura del chip G80 (GeForce 8800)
Clase 1 Introduccin
GPGPU
CUDA
Clase 1 Introduccin
GPGPU
CUDA
En el ao 2007, Nvidia presenta CUDA (Compute Unified Device Architecture). Produjo un cambio radical en la arquitectura de las GPUs de Nvidia:
arquitectura unificada sin distincin entre procesadores de pxeles y vrtices.
La nueva arquitectura es completamente compatible con DirectX 10:

Microsoft DirectX es un conjunto de APIs de las plataformas Microsoft para el manejo de tareas vinculadas con multimedia, especialmente video y el desarrollo de juegos.
Clase 1 Introduccin
GPGPU
12
CUDA
Produjo un cambio radical en el software para desarrollo de aplicaciones en las GPUs de Nvidia. Es el mojn ms importante desde el nacimiento de la programacin de propsito general en GPUs (GPGPU). Masific la GPGPU, ya que dej de ser un juego para eruditos y se transform en una alternativa a la alcance de cualquier desarrollador.
Clase 1 Introduccin
GPGPU
CUDA
Pero, qu es CUDA? CUDA:
Es una arquitectura de computacin paralela para el cmputo de problemas de propsito general diseada por Nvidia. Est enfocada al clculo masivamente paralelo y las capacidades de procesamiento que brinda las tarjetas grficas de Nvidia. Permite programar el dispositivo a travs de extensiones de lenguajes de programacin estndar (C y Fortran) Est disponible para las tarjetas grficas GeForce de la serie 8 en adelante. Es compatible con Linux de 32/64 bits y Windows XP (y sucesores) de 32/64 bits.
Clase 1 Introduccin
GPGPU
CUDA
Se compone de una pila de capas de software que incluye bibliotecas, el CUDA Runtime y el CUDA Driver.
Clase 1 Introduccin
GPGPU
13
CUDA
Bibliotecas de CUDA:
Dos bibliotecas matemticas de alto nivel: CUFFT y CUBLAS. CUFFT para el clculo de Transformadas de Fourier. CUBLAS es una implementacin de BLAS (Basic Linear Algebra Subprograms) en GPU.
CUDA Driver:
Es un controlador de hardware. Est dedicado a la transferencia de datos entre la CPU y la GPU.
CUDA Runtime:
Provee una interfaz de programacin de aplicaciones (API). Provee un conjunto de instrucciones accesible a travs de lenguajes de alto nivel como son Fortran y C.
Clase 1 Introduccin
GPGPU
CUDA
Al programar en CUDA, la GPU se ve como un dispositivo de cmputo capaz de ejecutar un nmero muy elevado de hilos en paralelo. La GPU funciona como un coprocesador de la CPU (host). A la GPU se le suele llamar dispositivo (device).
Clase 1 Introduccin
GPGPU
CUDA
Si una parte de una aplicacin se ejecuta muchas veces pero en forma independiente sobre diferentes datos, puede ser aislada en una funcin que se ejecutar en el dispositivo mediante muchos hilos de ejecucin en forma concurrente. La funcin se compila usando el conjunto de instrucciones del dispositivo. El programa resultante, llamado ncleo (kernel), se descarga en el dispositivo para su ejecucin.
Clase 1 Introduccin
GPGPU
14
CUDA
El curso se centra en CUDA y las arquitecturas de Nvidia (G80, GT200 y Fermi). Se comentarn algunos aspectos de otros lenguajes que siguen una filosofa similar como OpenCL. No se entrar en detalles de las arquitecturas de AMD/ATI ya que presentan caractersticas distintas.
Clase 1 Introduccin
GPGPU
15

Clase1 Introduccion

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Clase1 Introduccion

Încărcat de

Drepturi de autor:

Formate disponibile

Computacin de Propsito General en Unidades de Procesamiento Grfico (GPGPU)

P. Ezzatti, M. Pedemonte y E. Dufrechou Ezzatti,

FBI (Frame Buffer Interface):

Por qu una arquitectura unificada?

Por qu una arquitectura unificada?

Por qu una arquitectura unificada?

Por qu una arquitectura unificada?

Por qu una arquitectura unificada?

Por qu una arquitectura unificada?

Por qu una arquitectura unificada?

La nueva arquitectura es completamente compatible con DirectX 10:

S-ar putea să vă placă și