Sunteți pe pagina 1din 97

Escuela Tcnica Superior de Ingeniera

Universidad de Sevilla






ANLISIS Y EVALUACIN DE
LAS TCNICAS UTILIZADAS
PARA LA TRANSMISIN DE
VDEO EN 3D








Proyecto Fin de Carrera
Autor: Vctor Jos Venegas Lumpi
Tutor: Jos Ramn Cerquides Bueno
Departamento: T Seal y Comunicaciones
Ingeniera de Telecomunicacin
Sevilla, Marzo de 2014



DEDICATORIA
A mi familia por confiar siempre en m.
Y en especial a mis padres y mi hermana
por su gran apoyo en todo momento.
ndice

ndice ............................................................................................................................................. 3
ndice de Figuras ........................................................................................................................... 5
ndice de Tablas ............................................................................................................................. 7
1 Introduccin .......................................................................................................................... 8
1.1 CONTEXTO ..................................................................................................................... 8
1.2 OBJETIVO ....................................................................................................................... 8
2 Conceptos bsicos ............................................................................................................... 10
2.1 VISIN 3D .................................................................................................................... 10
2.1.1 PRINCIPIOS FSICOS DE LA VISIN 3D ................................................................. 10
2.2 TECNOLOGAS PARA LA VISUALIZACIN DE IMGENES ESTEREOSCPICAS .............. 12
2.2.1 AIDED-VIEWING ................................................................................................... 12
2.2.2 FREE-VIEWING ..................................................................................................... 15
2.3 ADQUISICIN / GENERACIN DE CONTENIDOS 3D .................................................... 17
2.3.1 ADQUISICIN A TRAVS DE 2 LENTES (CMARA ESTEREOSCPICA) .................. 18
2.3.2 ADQUISICIN A TRAVS DE MLTIPLES CMARAS (SISTEMA MULTIVISTA) ...... 18
2.3.3 ADQUISICIN A TRAVS CMARA 2D + Z-CAM (TOF) ......................................... 19
2.3.4 ADQUISICIN A TRAVS CMARA 2D (Conversin 2D-3D) ................................. 19
2.4 FORMATOS DE VDEO PARA 3D .................................................................................. 19
2.4.1 FORMATO ANGLIFO CROMTICO OPTIMIZADO (OCA) .................................... 19
2.4.2 PROCESAMIENTO INDEPENDIENTE DE LAS SEALES DE VDEO (CSV) ................ 20
2.4.3 FORMATO COMPATIBLE CON EL CUADRO HD (CFC)........................................... 21
2.4.4 FORMATO VDEO + PROFUNDIDAD (V+D) .......................................................... 24
2.4.5 FORMATO MULTI-VIEW VIDEO CODING (MVC) .................................................. 26
2.4.6 FORMATO MVD (MVC+D) ................................................................................... 26
2.4.7 FORMATO LAYERED DEPTH VIDEO (LDV) ............................................................ 27
2.4.8 FORMATO DEPTH ENHANCED VIDEO (DES) ........................................................ 27
2.4.9 RESUMEN DE FORMATOS ................................................................................... 28
2.5 CODIFICACIN Y COMPRESIN DE LAS SEALES DE VDEO ESTEREOSCPICO.......... 28
2.5.1 CODIFICACIN ESTEREOSCPICA ........................................................................ 29
2.5.2 CODIFICACIN PARA EL FORMATO V+D ............................................................. 32
2.5.3 CODIFICACIN PARA EL FORMATO MVC ............................................................ 34
2.5.4 CODIFICACIN PARA EL FORMATO MVD ............................................................ 36
2.5.5 CODIFICACIN PARA EL FORMATO LDV .............................................................. 38
2.5.6 CODIFICACIN PARA EL FORMATO DES .............................................................. 38
2.5.7 CARACTERSTICAS GENERALES DEL ESTNDAR HEVC H.265 ........................... 38
3 Metodologa ........................................................................................................................ 42
3.1 ESTUDIO DE LAS TASAS DE BITS .................................................................................. 42
3.1.1 PARMETROS DEL ESTUDIO ................................................................................ 42
3.2 TASA DE BITS PARA OCA ............................................................................................. 53
3.3 TASA DE BITS PARA CSV .............................................................................................. 55
3.4 TASA DE BITS PARA CFC+............................................................................................. 55
3.5 TASA DE BITS PARA V+D .............................................................................................. 56
3.5.1 TASA DE BITS PARA MPEG-C PARTE 3 ................................................................. 56
3.5.2 TASA DE BITS PARA VDEO AUXILIAR - H.264 ...................................................... 57
3.6 TASA DE BITS PARA MVC ............................................................................................. 59
3.7 TASA DE BITS PARA MVD ............................................................................................ 61
3.8 TASA DE BITS PARA LDV .............................................................................................. 62
3.9 TASA DE BITS PARA DES .............................................................................................. 63
4 Anlisis de transmisin ........................................................................................................ 64
4.1 TRANSMISIN DE LAS SEALES DE 3DTV EN EL ESTNDAR DVB-T ............................ 64
4.1.1 CARACTERSTICAS TCNICAS DE LA RED TDT EN ESPAA ................................... 64
4.1.2 COMPARACIN DE LOS ESTNDARES DVB-T /DVB-T2 ....................................... 65
4.1.3 EL ESTNDAR DVB 3D TV .................................................................................... 66
4.1.4 GENERACIN DEL TRANSPORT STREAM Y MULTIPLEXACIN ............................ 69
4.1.5 CODIFICACIN MODULACIN Y TRANSMISIN DE LA SEAL DE TV-3D ............ 73
4.2 TRANSMISIN DE LAS SEALES 3DTV SOBRE IPTV ..................................................... 76
4.2.1 CONCEPTOS SOBRE IPTV ..................................................................................... 76
4.2.2 TCNICAS DE TRANSMISIN EN SISTEMAS IPTV ................................................. 78
4.3 RESULTADOS DE LAS PRUEBAS DE TRANSMISIN ...................................................... 81
4.3.1 TRANSMISIN DE 3DTV EN EL ESTNDAR DVB-T ............................................... 82
4.3.2 TRANSMISIN DE 3DTV SOBRE IPTV .................................................................. 86
5 Conclusiones y lneas de desarrollo .................................................................................... 90
5.1 CONCLUSIONES ........................................................................................................... 90
5.2 LNEAS DE DESARROLLO .............................................................................................. 92
Referencias Bibliogrficas ........................................................................................................... 93
Glosario de Trminos .................................................................................................................. 96


ndice de Figuras
Figura 2.1 Creacin de sensacin de profundidad ...................................................................... 10
Figura 2.2 Imagen estereoscpica ............................................................................................... 11
Figura 2.3 La imagen izquierda y derecha son filtradas con colores complementarios (rojo y
verde) y el usuario debe llevar incorporadas unas gafas con los respectivos filtros de colores
para obtener la visualizacin en 3D. ........................................................................................... 13
Figura 2.4 Lente con polarizacin horizontal solo permite el paso de las ondas con polarizacin
vertical ......................................................................................................................................... 14
Figura 2.5 Las lentes polarizadas permiten que solo una de las imgenes llegue a cada ojo .... 14
Figura 2.6 Funcionamiento de los lentes "shutter" .................................................................... 15
Figura 2.7 Tecnologa de barrera de parallax .............................................................................. 16
Figura 2.8 Funcionamiento monitor lenticular ........................................................................... 17
Figura 2.9 Cadena de transmisin del vdeo estreo .................................................................. 17
Figura 2.10 Adquisicin mediante 2 lentes con configuracin en paralelo ................................ 18
Figura 2.11 Empaquetamiento de cuadro para formato progresivo .......................................... 22
Figura 2.12 Side by Side (SbS) ..................................................................................................... 22
Figura 2.13 Top and Bottom (TaB) .............................................................................................. 23
Figura 2.14 Configuracin Tablero de ajedrez ............................................................................ 23
Figura 2.15 Configuracin de Campos alternados ...................................................................... 24
Figura 2.16 Imagen con su mapa de profundidad asociado ....................................................... 24
Figura 2.17 Formato MVC + Profundidad ................................................................................... 26
Figura 2.18 Formato LDV ............................................................................................................. 27
Figura 2.19 Estructura tpica de transmisin de H.264 ............................................................... 30
Figura 2.20 Codificacin para OCA .............................................................................................. 30
Figura 2.21 Aplicacin de H.264 en Dual-Streaming ................................................................... 31
Figura 2.22 Aplicacin de H.264 en Simulcast ............................................................................ 31
Figura 2.23 Aplicacin de H.264 en CFC+ .................................................................................... 32
Figura 2.24 Cadena de Transmisin para MPEG-C parte 3 ......................................................... 33
Figura 2.25 Aplicacin del codificador H.264 a las seales de imgenes auxiliares ................... 34
Figura 2.26 Prediccin Multivista para n=5 y GOP=8 (IPP) ......................................................... 35
Figura 2.27 Estructura de prediccin espacio temporal para MVC (HBP) .................................. 36
Figura 2.28 Cadena de transmisin en MVD ............................................................................... 37
Figura 2.29 Modo de prediccin de imgenes para MVD ........................................................... 37
Figura 2.30 Compresin de tasa de bits esperada en el momento de la estandarizacin ......... 39
Figura 2.31 Modos/macrobloque ............................................................................................... 40
Figura 3.1 Diagrama de bloques de la codificacin H.264 .......................................................... 45
Figura 3.2 Procesos de CABAC .................................................................................................... 48
Figura 3.3 Tasa de bits en SD ....................................................................................................... 49
Figura 3.4 Comparacin de resoluciones estndar de vdeo ...................................................... 51
Figura 3.5 Valores PSNR de la comparacin entre dos imgenes ............................................... 52
Figura 3.6 Fotogramas vdeo formato cromtico anaglfico ....................................................... 53
Figura 3.7 Tasa de bits para un vdeo OCA de resolucin SD ...................................................... 53
Figura 3.8 Tasa de bits para un vdeo OCA de resolucin HD-TDT .............................................. 54
Figura 3.9 Tasa de bits para un vdeo OCA de resolucin 720p .................................................. 54
Figura 3.10 Tasa de bits para un vdeo OCA de resolucin 1080i ............................................... 55
Figura 3.11 Fotograma de vdeo en configuracin SbS ............................................................... 55
Figura 3.12 Tasa de bits en 720p ................................................................................................. 56
Figura 3.13 Tasa de bits en 1080i ................................................................................................ 56
Figura 3.14 Tasa de bits al codificar el mapa de profundidad .................................................... 57
Figura 3.15 Vista izquierda y su correspondiente mapa de profundidad ................................... 58
Figura 3.16 Tasa de bits al codificar el mapa de profundidad .................................................... 58
Figura 3.17 Vista izquierda y derecha de una imagen estreo ................................................... 59
Figura 3.18 Tasa de bits al codificar con MVC y n=2 ................................................................... 59
Figura 3.19 Imagen grabada con 8 cmaras espaciadas 20cm entre ellas ................................. 60
Figura 3.20 Tasa de bits al codificar con MVC y n=8 ................................................................... 61
Figura 3.21 Fotograma de la vista izquierda con su correspondiente mapa de profundidad .... 62
Figura 3.22 Tasa de bis al codificar con MVD .............................................................................. 62
Figura 3.23 Vistas izquierda y derecha con sus mapas de profundidad asociados..................... 63
Figura 3.24 Tasa de bits al codificar con LDV .............................................................................. 63
Figura 4.1 Arquitectura de transmisin genrica para seales de vdeo 3D .............................. 64
Figura 4.2 Caractersticas tcnicas de la red TDT en varios pases europeos ............................. 65
Figura 4.3 Canal DVBT2 Con diversas modulaciones adaptadas al tipo de servicio ................. 66
Figura 4.4 Estndar DVB 3D TV. La parte gris muestra los aspectos tecnolgicos afectados ..... 67
Figura 4.5 La disparidad permite identificar la distancia a la que se encuentra cada regin sobre
la que se dibujan subttulos. ....................................................................................................... 68
Figura 4.6 Generacin del Transport-Stream .............................................................................. 69
Figura 4.7 Multiplexacin de vistas en dual Streaming .............................................................. 72
Figura 4.8 Multiplexacin de vistas izquierda + profundidad ..................................................... 72
Figura 4.9 Multiplexacin de canales 2D y 3D con un solo Multiplexor ..................................... 73
Figura 4.10 Multiplexacin de canales 2D y 3D con varios Multiplexores .................................. 73
Figura 4.11 Arquitectura general de la red IPTV ......................................................................... 78
Figura 4.12 Transmisin unicast .................................................................................................. 79
Figura 4.13 Transmisin multicast .............................................................................................. 80
Figura 4.14 Fotograma del vdeo en configuracin SbS .............................................................. 81
Figura 4.15 Fotograma del vdeo en configuracin TaB .............................................................. 81
Figura 4.16 Tipos de BER ............................................................................................................. 83
Figura 4.17 Ancho de banda en Unicast para configuracin TaB y resolucin 720p .................. 86
Figura 4.18 Ancho de banda en Unicast para configuracin TaB y resolucin 1080i ................. 87
Figura 4.19 Ancho de banda en Unicast para configuracin SbS y resolucin 720p .................. 87
Figura 4.20 Ancho de banda en Unicast para configuracin SbS y resolucin 1080i ................. 87
Figura 4.21 Ancho de banda en Multicast para configuracin TaB y resolucin 720p ............... 88
Figura 4.22 Ancho de banda en Multicast para configuracin TaB y resolucin 1080i .............. 88
Figura 4.23 Ancho de banda en Multicast para configuracin SbS y resolucin 720p ............... 88
Figura 4.24 Ancho de banda en Multicast para configuracin SbS y resolucin 1080i .............. 89

ndice de Tablas
Tabla 3.1 Factor Q ....................................................................................................................... 50
Tabla 4.1 Estndar DVB - Caractersticas Tcnicas ...................................................................... 66
Tabla 4.2 Nmero de portadoras ................................................................................................ 74
Tabla 4.3 Intervalos de guarda .................................................................................................... 74
Tabla 4.4 Tasas de transmisin en DVB-T (en Mbps) .................................................................. 74
Tabla 4.5 Tasas de transmisin en DVB-T para los formatos de 3DTV ....................................... 75
Tabla 4.6 Anchos de banda referenciales requeridos para IPTV ................................................ 77
Tabla 4.7 Parmetros DVB-T utilizados para las pruebas de transmisin ................................... 82
Tabla 4.8 Valores para la correcta recepcin .............................................................................. 83
Tabla 4.9 Resultados de las medidas de calidad de de la seal COFDM con la configuracin TaB
..................................................................................................................................................... 83
Tabla 4.10 Resultados de las medidas de calidad de de la seal COFDM con la configuracin
SbS ............................................................................................................................................... 84
Tabla 4.11 TS transmitidos y recibidos en la configuracin TaB ................................................. 85
Tabla 4.12 TS transmitidos y recibidos en la configuracin SbS con resolucin 720p ................ 85
Tabla 4.13 TS transmitidos y recibidos en la configuracin SbS con resolucin 1080i y 1080p . 86


8

1 Introduccin
El presente proyecto ha sido desarrollado en el Departamento de Teora de la Seal y
Comunicaciones de la Escuela Tcnica Superior de Ingeniera de la Universidad de Sevilla.
Este proyecto se enmarca dentro del estudio de tecnologas 3D para su aplicacin en diversos
mbitos.
1.1 CONTEXTO
Se ha producido recientemente un fuerte incremento en la produccin de contenidos
audiovisuales 3D para cine y televisin, en forma de pelculas y grabacin/retransmisin de
eventos en formato estreo (pares de imgenes).
Cabe sealar que las pelculas 3D y las pruebas de televisin en 3D (3DTV) tienen una larga
historia. Sin embargo, la tecnologa finalmente ha progresado lo suficiente en esta coyuntura,
por ejemplo, con el despliegue de la televisin digital (DTV) y la Televisin de Alta Definicin
(HDTV). Por ello las marcas comerciales ms importantes relacionadas con el sector
audiovisual, finalmente, se han introducido en el desarrollo de esta tecnologa.
Comenzaremos por sealar que hay dos tipos de tecnologa comercial para la visualizacin de
contenidos en 3D:
1) Las pantallas estereoscpicas
1
, que requieren gafas especiales para ver los
contenidos en 3D.
2) Las pantallas autoestereoscpicas, que muestran las imgenes en 3D de tal
manera que el usuario puede disfrutar de la experiencia de visualizacin sin
ningn tipo de accesorio especial.
1.2 OBJETIVO
El objeto de este documento es mostrar el proceso realizado para analizar y evaluar las
tcnicas que existen actualmente para la transmisin de vdeo en 3D para diferentes
dispositivos de visionado.
En primer lugar se explicarn una serie de conceptos necesarios para entender los
fundamentos de la tecnologa de vdeo en tres dimensiones. Tambin se comentar la
evolucin de los diferentes estndares de compresin de vdeo 3D, para posteriormente dar
una visin general del tratamiento digital de vdeo 3D y las partes en que se compone.
Profundizando en el objetivo del proyecto, se realizar un proceso de compresin del vdeo 3D
con diferentes cdecs y formatos para poder analizarlos individualmente y mediante unos
criterios de calidad de imagen realizar una comparacin entre ellos.
Posteriormente, se realizar la eleccin de los cdecs y formatos ms adecuados con respecto
a unos criterios de calidad de imagen definidos.

1
Estereoscopa: trmino asociado a la visualizacin de una imagen en tres dimensiones.

9

Para finalizar usaremos los cdecs y formatos escogidos para realizar la transmisin de vdeo
3D mediante radiodifusin (TDT) y mediante streaming, analizando la calidad de la imagen en
diferentes dispositivos de visionado de vdeo 3D.



10

2 Conceptos bsicos
En el siguiente captulo se realiza un estudio del arte de las diferentes tecnologas involucradas
en un sistema de vdeo 3D. Primeramente para entender el concepto de visin 3D se introduce
al lector en el concepto de visin estereoscpica y se explica brevemente la historia de la
visin estereoscpica hasta la actualidad.
Una vez definidos los conceptos bsicos, se mostrarn las diferentes tecnologas que existen
para la representacin de contenidos estereoscpicos tanto sistemas que actualmente estn
en fase de investigacin como sistemas comerciales. Seguidamente se explicarn las diferentes
formas que existen en la actualidad de generar contenidos 3D explicando la problemtica y
beneficios de cada uno.
Entre la generacin y la representacin, tpicamente, se utilizan codificadores que
proporcionan la informacin del transmisor al receptor con el nmero mnimo de bits y sin que
el espectador pueda observar que se ha realizado dicho proceso. En este caso se explicarn las
diferentes soluciones existentes para la codificacin de contenidos 3D.
2.1 VISIN 3D
Antes de profundizar en la explicacin del desarrollo de las tcnicas utilizadas para analizar los
diferentes formatos de codificacin 3D, se hace necesario explicar en qu principios fsicos se
basa la visin 3D.
2.1.1 PRINCIPIOS FSICOS DE LA VISIN 3D
El sistema visual humano es un sistema binocular, disponemos de dos ojos en los que, debido a
su separacin horizontal, se reciben dos imgenes, de una misma escena, con puntos de vista
diferentes. Mediante estas dos vistas el cerebro crea una sensacin espacial. A este tipo de
visin se le denomina visin estereoscpica y al proceso en si mismo estereopsis.

Figura 2.1 Creacin de sensacin de profundidad
En la estereopsis intervienen diversos mecanismos. Cuando observamos objetos muy lejanos,
los ejes pticos de nuestros ojos son paralelos. Cuando observamos un objeto cercano,
nuestros ojos giran para que los ejes pticos estn alineados sobre l, es decir, convergen. A su

11

vez se produce la acomodacin o enfoque para ver ntidamente el objeto. Este proceso
conjunto se denomina fusin. No todo el mundo tiene la misma capacidad de fusionar un par
de imgenes en una sola tridimensional. Alrededor de un 5% de la poblacin tiene problemas
de fusin
2
. La agudeza estereoscpica es la capacidad de discernir, mediante la estereopsis,
detalles situados en planos diferentes y a una distancia mnima. Hay una distancia lmite a
partir de la cual no somos capaces de apreciar la separacin de planos, y que vara de unas
personas a otras. As, la distancia lmite a la que dejamos de percibir la sensacin
estereoscpica puede variar desde unos 60 metros hasta cientos de metros
3
.
Un factor que interviene directamente en esta capacidad es la separacin interocular. A mayor
separacin entre los ojos, mayor es la distancia a la que apreciamos el efecto de relieve.
Las cmaras convencionales son monoculares (un solo objetivo) con lo que al realizar la
reproduccin de un contenido grabado con una de estas cmaras los ojos reciben la misma
imagen desde el mismo punto de vista a los dos ojos. En el caso de realizar la grabacin con
una cmara estereoscpica se observara como los objetos salen o se adentran sobre el marco
donde se representan, dotando a la reproduccin de un mayor realismo. En estas dos
imgenes (Figura 2.2) se puede apreciar la disparidad, es decir, las diferencias en la direccin
horizontal entre los elementos de la imagen.

Figura 2.2 Imagen estereoscpica
El mecanismo sobre el que se produce la estereopsis es extremadamente preciso. Pese a esto,
como se ha comentado anteriormente, no todo el mundo es capaz de realizar el proceso de
fusin. Desordenes visuales en la niez, aunque fueran temporales, pueden dar resultado a
estereoceguera, se calcula que afecta al 5% de la poblacin.
La causa ms comn es el estrabismo (desalineacin de los ojos), aunque en caso de ser
corregido a tiempo la visin estreo puede desarrollarse normalmente.
Tambin se hace necesario comentar que las capacidades de visualizacin estereoscpica
varan con la edad, siendo los jvenes son ms sensibles a esta, sobre todo cuando la
disparidad de la imagen es mayor.
A parte de los problemas fsicos que puedan impedir una correcta visualizacin, tambin se
hace necesario que la reproduccin se realice siguiendo una serie de requisitos, unos comunes

2
Howard, I.; Rogers, B. (1995). Binocular Vision and Stereopsis.
3
"Principles of Stereoscopy", Herbert McCay's

12

a contenidos 2D y otros exclusivos de contenidos estereoscpicos. Por la parte de 2D se hace
necesaria: una correcta definicin, resolucin y evitar el parpadeo de la imagen, esto ltimo se
consigue asegurando una frecuencia de refresco mnima de 50Hz. Por la parte de 3D se hacen
necesarios los siguientes requisitos:
La sensacin de mareo no debe existir.
El usuario no debe tener que realizar un esfuerzo para adaptarse a la sensacin 3D,
sino que esta sensacin sea natural.
La sensacin 3D debe ser ntida y constante a lo largo de todas las figuras y
especialmente en los bordes de los objetos.
El sistema debe ser lo ms independiente posible del ngulo de visin del usuario.
De cumplirse todos estos requisitos estaremos ante un sistema 3D que ser de gran aceptacin
por parte del pblico. Este tipo de visin debe ser algo natural y no ha de suponer ningn
esfuerzo o molestia adicional.
2.2 TECNOLOGAS PARA LA VISUALIZACIN DE IMGENES
ESTEREOSCPICAS
Los Displays 3D que se utilizan para realizar la representacin de los contenidos 3D pueden ser
divididos segn la tcnica usada para dirigir las vistas izquierda y derecha al ojo apropiado:
unos necesitan dispositivos pticos cerca de los ojos, y por el contrario, otros tienen este
proceso integrado en el display mismo. Estos ltimos, de visin libre (free-viewing), son
llamados autoestereoscpicos. El hecho de que el usuario no necesite incorporar ningn
elemento hace que este ltimo tipo sea de alto inters.
2.2.1 AIDED-VIEWING
En los monitores que s necesitan de elementos en el usuario (aided-viewing), dos perspectivas
diferentes son generadas (casi) simultneamente. Los rayos de luz son generados en un plano
fijo de visin mediante diversos mtodos de multiplexado que dirigen las imgenes al ojo
apropiado:
1) Multiplexado de colores (Anaglyph): Este sistema propone ubicar en un mismo cuadro las
dos imgenes de dos capas de color, superpuestas pero desplazadas ligeramente una
respecto a la otra para producir el efecto de profundidad. Cada imagen, para ser vista debe
ser filtrada por lentes especiales en cada ojo que separa y hace que los ojos tengan esa
diferencia de percepcin de la imagen, estos filtros son ptimos al usar colores
complementarios en la imagen y en las gafas, la imagen presentada por ejemplo en rojo no
es vista por el ojo que tiene un filtro del mismo color, pero s que ve la otra imagen en azul
o verde. Es muy comn utilizar el par rojo/cian ya que esta combinacin tiene
caractersticas simples de longitudes de onda paso bajo/paso alto.

13



Figura 2.3 La imagen izquierda y derecha son filtradas con colores complementarios (rojo y verde) y el
usuario debe llevar incorporadas unas gafas con los respectivos filtros de colores para obtener la
visualizacin en 3D.
2) Multiplexado mediante polarizacin: Este sistema propone algo similar al multiplexado de
colores, la diferencia se basa en usar la naturaleza de la luz polarizada para separar las
imgenes izquierda y derecha, dicha separacin de las imgenes se basa en la polarizacin
de la luz a +45 para el ojo derecho y a 45 para el ojo izquierdo, se desea al igual que en
el sistema anterior diferenciar cada imagen, pero si esta imagen se muestra como luz
polarizada tiene componentes determinadas de campo elctrico y magntico, las cuales
pueden ser filtradas en recepcin por gafas especiales. Este sistema posee varias ventajas
como el ser pasivo, y mantener todo el espectro de colores de una imagen, haciendo que
sea una tcnica muy sencilla.

14


Figura 2.4 Lente con polarizacin horizontal solo permite el paso de las ondas con polarizacin vertical
El funcionamiento bsico consiste en la utilizacin de dos proyectores con filtros (uno
vertical y el otro horizontal). La proyeccin se ha de realizar sobre una pantalla que refleje
los rayos sin modificar su polarizacin. El usuario deber incorporar unas gafas con filtros
polarizados para realizar la separacin de las imgenes.

Figura 2.5 Las lentes polarizadas permiten que solo una de las imgenes llegue a cada ojo
3) Multiplexado en tiempo: Este procedimiento propone que las imgenes correspondientes
a cada ojo se presenten en forma sucesiva una despus de otra, en este sistema la
informacin L+R
4
no est contenida en la misma imagen, hay un par de cuadros
independientes que se muestran en rpida sucesin. Es necesario separar estas imgenes
ante el espectador, y esto se logra con obturadores de alta velocidad alternados y
sincronizados, los cuales se montan en gafas especiales (shutter glasses), estos
obturadores son usualmente del tipo LCD (Liquid Crystal Display). El sistema visual humano
es capaz de mezclar imgenes estereoscpicas separadas por un retraso en el tiempo de
hasta 50ms. La velocidad a la cual se alternan las imgenes es conocida como velocidad de
renovacin, y por ello se pueden producir imgenes con parpadeo, sin embargo se ha
mejorado y se han determinado ciertos valores donde se tiene buena calidad de
visualizacin (12 imgenes/seg. para el cine tradicional y 12,5-15 imgenes/seg. para la
televisin con exploracin entrelazada). Este sistema funciona mucho mejor a velocidades
de renovacin ms elevadas con exploracin progresiva.

4
Informacin estereoscpica de los canales visuales Izquierdo + Derecho, llamado I+D L+R.

15


Figura 2.6 Funcionamiento de los lentes "shutter"
La ventaja de este sistema radica en que se pueden utilizar monitores 2D para la
reproduccin de los contenidos 3D siempre y cuando la frecuencia de refresco de pantalla
sea de al menos 100Hz y tengan un bajo tiempo de respuesta.

4) Multiplexado en espacio: En este sistema las dos vistas son creadas en lugares distintos y
redirigidas al ojo correcto mediante canales independientes. Este sistema es el utilizado
por los Head Mounted Displays (HMD)
5
. Con estos sistemas se puede llegar a tener una
percepcin de hasta 140 en horizontal y 90 en vertical.
2.2.2 FREE-VIEWING
En este sistema, las dos imgenes (L+R) se presentan simultneamente en tiras verticales
intercaladas. Un sistema lenticular de lentes cilndricas situado en la pantalla enfoca ambas
imgenes en forma separada aproximadamente a una distancia interocular cercana a los
65mm.
Este sistema exige que el espectador no mueva su cabeza bruscamente, y restringe el perfil
multivisin de una pantalla de televisin, es decir un cambio de posicin del espectador afecta
a la imagen que ste observa. Existe la sensacin de que la escena gira con el movimiento del
observador, este fenmeno se conoce como Free viewpoint (punto de vista libre), y hoy en da
la tecnologa ha desarrollado 8 de estos puntos. Cada Free Viewpoint requiere dos imgenes
(una por cada ojo) lo que hace que la pantalla tenga una resolucin mucho mayor que la HDTV
(High Definition Television). Con esto se desarrolla en algo la tcnica que permita que existan
mltiples espectadores, ya que no es necesario localizarlos en posiciones fijas. El principal
cambio es la utilizacin de micro-lentes que permiten controlar la difraccin de los haces de
luz. Como no se necesitan gafas especiales, se lo conoce como sistema autoestereoscpico.
Algunos de los mtodos ms destacados son:

5
HMD: es un dispositivo de visualizacin similar a un casco, que permite reproducir imgenes creadas
por ordenador sobre un "display" muy cercano a los ojos o directamente sobre la retina de los ojos.

16

Electrohologrficos: Estos displays, actualmente en fase de investigacin, pueden
grabar y reproducir las propiedades de las ondas de luz (amplitud, longitud de onda y
fase). Este proceso, en caso de realizarse de forma perfecta, sera el ideal para
sistemas de visin libre 3D.

Volumtricos: Estos displays crean la sensacin de inmersin proyectando la
informacin 3D dentro de un volumen. Estos sistemas tpicamente presentan
problemas de resolucin adems de necesitar mucho ancho de banda. Este tipo de
displays se encuentran actualmente en fase de investigacin.

Multiplexado por direccionamiento: Se aplican efectos pticos como la difraccin,
refraccin, reflexin y oclusin para redirigir la luz emitida por los pxeles de distintas
vistas al ojo apropiado. Existen diversos tipos, pero los ms destacados (debido a que
estn ms desarrollados tecnolgicamente) son los basados en la refraccin y en
oclusin:

1) Oclusin: Debido al efecto parallax (paralaje), partes de la imagen son ocultadas a
un ojo y visibles para el otro. Existen diversos tipos dependiendo del nmero de
hendiduras y de la posicin de colocacin de la barrera, que puede estar enfrente
o detrs de la pantalla. Las pantallas con barrera de parallax detrs del display ya
se pueden encontrar en el mercado en monitores tanto de PC como de porttiles.
Como se observa en la figura 2.7, la barrera de parallax es la encargada que
redirigir los haces de luz (y no la imagen en s), al ojo adecuado. El problema que
tiene este tipo de displays es que la posicin de visualizacin es muy estricta
siendo posible su uso slo para una persona.

Figura 2.7 Tecnologa de barrera de parallax
2) Refraccin: Como en el caso anterior existen diversos tipos de display, siendo
Integral Imaging el ms prometedor. En este tipo de displays la imagen se
compone de mltiples pequeas imgenes 2D capturas con un amplio nmero de
grupos de pequeas lentes convexas. Cada grupo de lentes captura la escena
desde un punto de vista distinto. De esta manera el usuario percibe diferentes
imgenes para diferentes puntos de vista. El problema radica en que los grupos

17

lentes deben de ser muy pequeos, debido a que cada pxel debe contener un
grupo de lentes. Por este motivo, el display debe de tener una resolucin muy alta.
Como solucin alternativa existen las pantallas lenticulares que usan lentes
cilndricas que pueden ser consideradas como una versin unidimensional de las
pantallas Integral Imaging. Debido a la orientacin vertical de las lentes, los rayos
de luz de cada imagen son emitidos en direcciones especficas en el plano
horizontal.

Figura 2.8 Funcionamiento monitor lenticular
En la figura anterior se muestra precisamente este funcionamiento. Se observa como el
usuario tendr la posibilidad de colocarse en distintos lugares donde podr percibir
correctamente la sensacin 3D, al contrario que con la barrera de parallax donde slo existe
un lugar donde es posible observar correctamente el contenido.
2.3 ADQUISICIN / GENERACIN DE CONTENIDOS 3D
Existen diferentes tecnologas de creacin de contenidos 3D y tambin existen diferentes
formas de visualizacin estereoscpica, esto hace que existan multitud de formatos con los
que codificar, almacenar y transmitir los contenidos. Cada formato de representacin depende
de un formato de codificacin concreto.
La adquisicin es la primera etapa en el proceso de crear y transmitir seales de 3D; la cadena
a la que el vdeo estereoscpico debe someterse se describe en la figura 2.9.

Figura 2.9 Cadena de transmisin del vdeo estreo
Los diferentes formatos para la codificacin, transmisin y visualizacin hacen que existan
muchas formas de adquirir vdeo 3D y de procesarlo. De los puntos anteriores del captulo se
desprende la conclusin de que para crear una imagen estereoscpica es necesario al menos
tener informacin de imgenes L+R, lo que supone que se necesitan dos lentes para captar
estas informaciones; sin embargo los nuevos mtodos proponen algunas otras soluciones.

18

2.3.1 ADQUISICIN A TRAVS DE 2 LENTES (CMARA ESTEREOSCPICA)
Este mtodo se presenta como la solucin elemental al problema de la adquisicin, debido a
que es la manera ms prxima de emular el sistema de visin humano.
La idea principal es asemejar las lentes a la visin humana, es por ello que la separacin
interlenticular debe ser de 65 mm. y tener un ngulo de convergencia igual al humano. Un
requerimiento elemental para el diseo de un sistema de adquisicin estereoscpico es la
comprensin total del espacio real (espacio donde se encuentra el objeto) para reproducir el
espacio del vdeo estereoscpico.
La tecnologa de cada lente para captar la imagen es igual a la tradicional de los sistemas de
vdeo monoscpico, es decir cmaras CCD. Cada lente trabaja bajo sus principios para capturar
la imagen independientemente.

Figura 2.10 Adquisicin mediante 2 lentes con configuracin en paralelo
2.3.2 ADQUISICIN A TRAVS DE MLTIPLES CMARAS (SISTEMA MULTIVISTA)
Para la implementacin de estos sistemas se utilizan lentes monoculares tradicionales
dispuestos de tal forma que permitan obtener los detalles que proporcionen informacin de
profundidad para una escena. Estos sistemas, al ser complicados, quedan reservados para
aplicaciones muy especficas y determinadas, tales como espectculos deportivos y culturales,
donde al espectador se le puede incluso brindar mayores posibilidades de interactividad. En
estos sistemas la produccin de imgenes es ms compleja y robusta que en otros casos, ya
que con muchas informaciones visuales los sistemas deben ser capaces de procesar gran flujo
de datos, tener altas tasas de compresin y obtener variables tiles para el desarrollo.
La etapa de captura se desarrolla mediante adquisicin sincronizada en el tiempo la cual se
logra para todas las cmaras dispuestas, esta sincronizacin utiliza Genlock
6
. Estas imgenes

6
Genlock: Tcnica comn en vdeo donde una referencia de vdeo especfica sirve para sincronizar todas
las fuentes de vdeo que se dispongan.

19

captadas por la cmara son almacenadas directamente sin compresin en el sistema de
almacenamiento, para un procesamiento offline (fuera del proceso).
El hecho de obtener mucha ms informacin de imagen permite tener algunos resultados
como vdeo estreo y vdeo con libre punto de vista, el cual se da cuando una escena puede
verse desde cualquier ngulo por la persona y esta percibir una visin volumtrica de la
respectiva vista elegida.
2.3.3 ADQUISICIN A TRAVS CMARA 2D + Z-CAM (TOF)
Este mtodo es muy til en algunos casos, dado que la informacin de profundidad permitira
generar el vdeo estereoscpico. Se propone un sistema en el cual se capte el plano 2D con un
lente normal y por otro lado se capte la informacin de profundidad de cada pxel
7
de este
plano, eso se hace a travs de las conocidas Z-Cam o tambin llamadas TOF (Time of Flight),
que permiten generar informacin para dar profundidad a cada pxel.
La Z-Cam genera pulsos de luz infrarroja con diodos lser que son reflejados por los objetos
que la cmara capta, al capturar esta reflexin el dispositivo calcula para cada pxel la distancia
exacta a la que se encuentra y genera un mapa de profundidad, el cual no es ms que el vdeo
original en escala de grises, en donde el blanco representa los pxeles ms cercanos y el negro
los pxeles con mayor componente de profundidad Z.
2.3.4 ADQUISICIN A TRAVS CMARA 2D (Conversin 2D-3D)
Esta tcnica aunque resulte la que ms se acopla a los sistemas que estn en vigencia, requiere
un procesamiento digital de la seal muy rigurosa y compleja.
Al no contar con la informacin real de profundidad, el emular o crear esta informacin
disminuye calidad y precisin. A pesar de todo ello, este es el mtodo ms usado en la
actualidad, dado que permite una compatibilidad total con los sistemas existentes, que lo
nico que deben incorporar es la etapa de conversin a 3D.
Esta conversin se puede hacer a dos niveles, en la produccin y en la recepcin; el ltimo
caso es lo que actualmente se tiene como 3DTV, la cual toma el cuadro en 2D, lo convierte a
3D y lo presenta en anglifo polarizado o multiplexado en el tiempo, sin embargo cuando este
proceso se realiza en la produccin se puede tener mayor calidad.
2.4 FORMATOS DE VDEO PARA 3D
Los formatos establecidos para el vdeo 3D han ido evolucionando desde los ms simples hasta
aquellos con procesos exclusivos y complejos. Un formato se puede definir como la descripcin
de la informacin que se adquiera y se procesa.
2.4.1 FORMATO ANGLIFO CROMTICO OPTIMIZADO (OCA)
Este formato de vdeo 3D est considerado como uno de los ms antiguos y con mayores
restricciones por su baja calidad; es notorio que este formato tiene completa compatibilidad

7
Pixel: La menor unidad homognea en parte de una imagen digital.

20

ya que este se reproduce en las pantallas convencionales y el procesamiento para generar 3D -
OCA es sencillo. El formato OCA (Anglifo Cromtico Optimizado) se le puede considerar como
un sistema admisible ya que ha sido optimizado para no perder calidad en el color ni sufrir
grandes alteraciones en el vdeo original, es de fcil manipulacin y de bajo costo.
2.4.2 PROCESAMIENTO INDEPENDIENTE DE LAS SEALES DE VDEO (CSV)
En este formato se tratan y procesan las seales para 3D que puedan existir de manera
independiente, es as que si se tienen seales izquierda y derecha, cada una de ellas se
someter a su estndar de compresin, a su codificacin y ser incluso transmitida
considerando que es una seal 2D, esto supone efectivamente el gasto del doble de recursos
para una informacin 3D, por lo tanto el sistema se limita a la existencia de dos imgenes.
Dentro de este formato podemos encontrar la tcnica de Dual-Stream y de Simulcast. En
ambas tcnicas las seales se adquieren independientemente, tienen su lnea de
procesamiento independiente dentro del sistema y son transmitidas bien sincronizadamente
multiplexadas o de manera simultnea, ocupando el doble de recursos tcnicos. En la
recepcin se utilizan dos plataformas independientes para cada seal.
Este formato representa la solucin natural a la produccin y transmisin de seales estreo
de vdeo, el formato es conveniente y aplicable para 2 vistas, izquierda y derecha. A cada una
de las vistas se le aplicarn codificadores que se usan actualmente. La desventaja principal de
este formato es que no se utiliza la relacin y la dependencia entre las vistas, que para otros
formatos representa un elemento vital para reducir los recursos tcnicos utilizados. Por otro
lado la ventaja existente es la fcil recuperacin de una de las vistas para la compatibilidad 2D.
Dado que no se utilizan tcnicas avanzadas para la codificacin de este vdeo se conoce a este
como CSV, o vdeo estreo convencional.
2.4.2.1 Concepto de Dual Stream
En este caso se generan dos flujos de las seales y posteriormente se someten a una etapa de
multiplexacin donde se estructura una secuencia de transmisin para que as se genere el par
de cuadros de vdeo de manera ordenada, este formato es compatible con 2D debido a que si
solo ese desea un cuadro, es fcil descartar el otro y diferenciar cul es el que se desea ver.
Inicialmente se contempla el Dual Streaming como el enviar los mismos flujos para dos fines
diferentes, pero si se trata de seales estereoscpicas, se aprovecha esta condicin para enviar
en dos flujos ligeramente distintos y que estos sean procesados de manera independiente.
Este formato es bastante aplicable con tcnicas de compresin y transmisin actuales, ya que
se maneja cada seal de manera independiente.
2.4.2.2 Transmisin Simultnea (Simulcast)
Aunque el procesar las seales independientemente es lo ms simple, es recomendable
simplificar el sistema, el esquema de transmisin simultnea plantea la existencia de dos
seales individuales L y R que sern transmitidas en diferentes canales, es decir como dos
seales diferentes; sin duda los recursos necesarios son elevados pero la infraestructura para
vdeo monoscpico no se altera, solo se aumenta.

21

2.4.3 FORMATO COMPATIBLE CON EL CUADRO HD (CFC)
El formato que se expone a continuacin, ha tenido una evolucin significativa, y comenz por
la idea ms sencilla, que fue enviar los cuadros izquierdo y derecho por separado de manera
alternada es decir como una transmisin doble de las escenas. Despus sigui evolucionando
hasta obtener mayor eficiencia ubicando a las dos imgenes en el mismo campo. Dado que la
base de este formato es el cuadro HD, el estndar HDMI propuso la idea de implementarlo y
defini formatos bases y formatos alternativos, dejando muchas opciones para realizar la
produccin de imgenes 3D. Adems se propone una efectiva solucin a la compatibilidad, el
fundamento bsico dice que estos formatos se basan en la existencia de 2 vistas (izquierda y
derecha) que aprovechando el nmero de lneas del cuadro, se ubican dentro del mismo
plano. El hecho de que se ubiquen dos imgenes en el lugar que ocupara una supone una
prdida de calidad, sin embargo la evolucin de las tcnicas de compresin ha permitido que
se mantenga la buena calidad y se comprima con estndares avanzados. Entre los formatos
avanzados HDMI, la versin 1.4a establece que se puede sustituir la informacin de uno de los
cuadros por informacin de profundidad, haciendo que la adquisicin de esta informacin
pueda ser aprovechada.
Este formato se presenta como una solucin sencilla a la compatibilidad, ya que se aprovecha
las cualidades del canal de alta definicin para ubicar en l, el mximo de informacin posible.
HDMI 1.4 establece las normas para la comunicacin de imgenes HD a travs de la interfaz
con el mismo nombre, y en su versin ampliada 1.4a establece los formatos para ubicar
imgenes L+R en el cuadro HD.
Para el estndar DVB-T se puede considerar que un canal HDTV ocupa la mitad del ancho de
banda de un mltiplex, y por lo tanto el canal de 3DTV ocupara los mismos recursos. El hecho
de introducir dos imgenes en un cuadro HD implica la prdida de resolucin, lo cual es una
desventaja; por otro lado la gran ventaja de este formato es la elevada compatibilidad que se
obtiene. De igual forma se definen los tipos de barrido de lnea para cada estructura 3D, ya sea
progresivo o entrelazado, manteniendo los principios de cada uno de estos mtodos. Las
estructuras 3D en HDMI 1.4a deberan procurar transmitir dos seales de vdeo en completa
resolucin 1080p, una para cada ojo, es as que se establecen nuevas dimensiones del cuadro
HD para 3D, todas ellas se basan en imgenes L+R, sin embargo tambin es vlido para las
estructuras actuales de 1920x1080p, claro que reduciendo su resolucin. Estas nuevas
dimensiones del cuadro HD establecen los siguientes conceptos:
Full HD 2D (FHD2D) / Half HD 3D (HHD3D): Es la de menor calidad para reproduccin
3D, mantiene las dimensiones convencionales del FHD2D es decir 1920x1080p.
Full HD 3D (FHD3D): Es la que conserva la calidad de cada cuadro, por lo tanto las
dimensiones del cuadro, aumentan de acuerdo a la configuracin.
A continuacin se presentan todas las configuraciones posibles y para cada dimensin del
cuadro HD:

22

2.4.3.1 Formato de Empaquetamiento de Cuadro
Para este formato se ubica el cuadro izquierdo en la parte superior, posteriormente un espacio
en blanco y luego el cuadro derecho, se establece una nueva dimensin del cuadro HD (ver
figura 2.11), este espacio en blanco viene dado por el pulso de borrado que el cuadro tiene
originalmente y que es de 45 lneas. Es muy similar, por la disposicin de los cuadros, al
formato Top and Bottom, pero se diferencia por la estructura detallada del cuadro.

Figura 2.11 Empaquetamiento de cuadro para formato progresivo
2.4.3.2 Configuracin Side by Side Half (SbS)
En esta configuracin se propone ubicar los cuadros izquierdo y derecho uno a continuacin de
otro horizontalmente (ver figura 2.12). En este caso el SbS del tipo Half (HHD3D) los cuadros
originales HD reducen su resolucin a la mitad en el eje horizontal, para al final obtener un
cuadro HD de dimensiones normales, en este caso el cuadro derecho se ubica a la derecha y el
izquierdo en la izquierda. La sealizacin para detectar este tipo de cuadros se realiza
mediante el estndar HDMI 1.4a.

Figura 2.12 Side by Side (SbS)
2.4.3.3 Configuracin Top and Bottom (TaB)
En este caso las imgenes izquierda y derecha son submuestreadas a la mitad de su resolucin
en el eje vertical y posteriormente ubicadas como muestra la figura 2.13.

23


Figura 2.13 Top and Bottom (TaB)
2.4.3.4 Configuracin quincunx matrix (Tablero de ajedrez)
Este formato forma parte del grupo de formatos extendidos de HDMI 1.4a, es decir no son
muy utilizados, pero tambin proponen una solucin para la disposicin de la informacin
estereoscpica, en este caso se propone dividir a la imagen en todos sus pxeles e ir alternando
en forma de tablero de ajedrez entre el pxel del cuadro derecho y el pxel del cuadro izquierdo
(ver figura 2.14), en este caso cada imagen tambin se submuestrea a la mitad de su
resolucin para poder ocupar un cuadro HD de dimensiones convencionales.

Figura 2.14 Configuracin Tablero de ajedrez
En este formato se mantiene el nmero de lneas originales, es poco usado para la
estructuracin de las imgenes antes de la transmisin. Por ello no se requiere un estudio
minucioso; existen dos posibilidades para estos cuadros, cualquiera de las vistas, izquierda o
derecha, puede ocupar el primer pxel del cuadro HD.
2.4.3.5 Configuracin campos alternados
Este es uno ms de los formatos extendidos de 3d_Structure para HDMI, es una configuracin
que se basa en el formato entrelazado, dado que intercala en la disposicin del cuadro HD (ver
Figura 2.15) los campos pares e impares para informacin estereoscpica izquierda y derecha.
Para este caso se mantiene el nmero de pxeles por lnea, el nmero de lneas efectivas se
duplica al igual que la frecuencia.

24


Figura 2.15 Configuracin de Campos alternados
2.4.4 FORMATO VDEO + PROFUNDIDAD (V+D)
La herramienta que representa la informacin de la profundidad es el mapa de profundidad. La
normativa ISO/IEC 23002-3 (MPEG-C Parte 3) define a este como un formato vlido para los
sistemas de 3D y establece los modos de produccin y compresin para estas imgenes. Para
obtener un mapa de profundidad existen varias tcnicas; a continuacin se describen los
procesos en el lado transmisor de este tipo de seales.
Existen 3 formas de obtener las seales necesarias para este formato, de todas estas se
desprende el mapa de profundidad que luego ser codificado independientemente y se
estructura junto con el vdeo en el conjunto de bits a ser transmitido.

Figura 2.16 Imagen con su mapa de profundidad asociado
2.4.4.1 El mapa de profundidad
El mapa de profundidad es una representacin visual de las escenas de vdeo, la cual contiene
valores discretos que representan la profundidad de cada pxel del cuadro original. Las
imgenes son representadas por cuadros en escalas de grises donde cada gris representa una
distancia Z, y se ha establecido que para los objetos cercanos se asigne el color blanco y para el

25

ms alejado el color negro. Para el vdeo, la profundidad se representa por una seal de vdeo
monocromtica de 8 bits, con estos 255 valores se obtienen buena calidad para la posterior
interpretacin de la profundidad de una escena. El mapa de profundidad consta simplemente
de una matriz que contienen N valores asociados a los pxeles individuales del flujo de vdeo
regular. Esta seal puede ser procesada con tcnicas especficas para seales de luminancia
8
, o
ms modernamente con las tcnicas de codificacin que el vdeo de la televisin digital utiliza.
Esta al ser una seal auxiliar de vdeo requiere ser sealizada, para lo cual se introduce un byte
que determina que la seal es de este tipo.
2.4.4.2 Generacin del mapa de profundidad a partir de 2D
La generacin de este tipo de informacin, forma parte del formato de conversin 2D a 3D, es
decir aqu se genera un mapa de profundidad utilizando algn algoritmo que estime el valor de
la componente Z de cada pxel. Algunas tcnicas crean un mapa de profundidad a travs de la
estimacin de la segunda vista, y posteriormente emplean la tcnica como si se hubiera
obtenido la imagen desde dos cmaras. Existen una gran variedad de propuestas para obtener
este mapa de profundidad, y todos estiman la componente Z de diferente manera, incluso
existen tcnicas para realizar transformacin en tiempo real.
Para la generacin de este mapa, algunas tcnicas parten del anlisis del vector del
movimiento el cual se obtiene fcilmente a travs del H.264 (MPEG-4), y con este vector
construyen el mapa de profundidad.
2.4.4.3 Generacin del mapa de profundidad a travs de Cmara infrarroja
Las Zcam funcionan a partir de la luz infrarroja que detecta la posicin de los objetos, por lo
que tambin se denominan cmaras infrarrojas. Estas cmaras obtienen dos seales de vdeo,
el plano 2D y el mapa de profundidad, este tipo de cmaras generan pulsos infrarrojos que se
reflejan por los objetos y dependiendo de dicha reflexin se obtiene el valor de profundidad de
cada objeto de la imagen. Estas cmaras constan de un CCD ultra rpido y una fuente de luz
infrarroja. Los sistemas de creacin de mapa de profundidad por rayos infrarrojos procuran
generar imgenes de alta calidad y no solo es la adquisicin sino el proceso para generar el
mapa en s. Despus de la adquisicin, es clave en el proceso corregir y poner a punto factores
como brillo, textura y segmentacin de la imagen. En primera instancia la cmara emite y
recibe pulsos de luz infrarroja, los cuales viajan junto con la luz que representa el plano, es por
ello que cada informacin debe ir a su correspondiente mdulo de procesamiento.
2.4.4.4 Generacin del mapa de profundidad a travs de Cmara Estreo
Si bien es cierto la tcnica ms adecuada para generar un mapa de profundidad es a travs de
un transductor diseado para ello; se han desarrollado diversos algoritmos que parten de que
la mayora de sistemas de 3D trabajan con cmaras estreo, por la facilidad y porque las
cmaras con dos lentes son ms populares que las cmaras infrarrojas para profundidad. Por
lo tanto la atencin ya no est en los lentes ni en el proceso de adquisicin, sino mas bien en la

8
La luminancia Y es la componente del vdeo que tiene la informacin de luminosidad (luz o brillo) de
la imagen.

26

lnea base del procesamiento de las seales izquierda y derecha para generar la informacin
V+D.
En esta tcnica se identifican dos etapas para la generacin del mapa, la primera consiste
bsicamente en preparar a la imagen para que se pueda extraer el mapa a partir de la
disparidad. Los 5 procesos que la primera etapa comprende, procuran corregir los errores de
los pxeles de la imagen para que posteriormente en la segunda etapa, la deteccin de la
disparidad sea correcta.
2.4.5 FORMATO MULTI-VIEW VIDEO CODING (MVC)
Este formato es robusto debido a que posee su propio estndar de compresin y codificacin,
el Multi-view Video Coding es una extensin que se hizo para H.264 (MPEG-4), y en este ya se
contempla la posibilidad de que desde la adquisicin se obtengan no slo dos, sino mltiples
vistas de una escena, y que estas sean comprimidas y transmitidas como un perfil multivista
Con la aparicin de esta extensin a la norma, no solo se fortalece el concepto del 3D basado
en la existencia de dos imgenes como en el sistema visual, sino tambin surge el concepto de
FVV (Free View-point Video), en el cual se adquieren n vistas, y se presentan al espectador n
vistas de las escenas. Para el caso particular en el que n=2 vistas es el que se usa en la
actualidad en los sistemas Blu-Ray 3D.
2.4.6 FORMATO MVD (MVC+D)
La bsqueda de cada vez ms calidad ha llevado a extender formatos ya existentes, es as que
al MVC, a pesar de que en su concepcin requiere n vistas lo que lo hara de gran calidad, se le
aade una informacin importante que ya ha sido estudiada, la profundidad. Este formato es
considerado dentro de la categora de los formatos avanzados para produccin de vdeo 3D y
se establece la existencia de n vistas, cada una de ellas con su respectivo mapa de
profundidad. Al igual que para MVC, la particularizacin de este formato en n=2 significa un
estreo de alta calidad.

Figura 2.17 Formato MVC + Profundidad
La gran ventaja de este formato es que al existir mltiples vistas y reforzadas con la
informacin de profundidad, la presentacin del vdeo al espectador tiene ms calidad; incluso

27

el espectador podr observar cada una de las n vistas de manera independiente en 3D. Debido
a que cada una tiene su mapa de profundidad. Adems el procesamiento digital de la seal se
simplifica al evitar el clculo de algunos parmetros de profundidad.
2.4.7 FORMATO LAYERED DEPTH VIDEO (LDV)
Este al igual que MVD, est dentro de los llamados formatos avanzados para vdeo 3D. Para
este formato se generan ms informaciones de profundidad para la imagen que se adquiera; al
igual que el anterior es un formato multivista por lo que puede existir n informaciones visuales
por seal de vdeo. Como es de imaginarse la cantidad de datos que se obtienen es bastante
grande por lo cual la compresin que se realice es fundamental y determinante.
El mtodo nace con LDI (Layered Depth Image) y se expande hasta aplicarlo no slo a
imgenes sino en vdeo tambin. La informacin que se asocia por cada vista de la imagen es:
la imagen de vdeo monoscpica, el mapa de profundidad asociado, una capa para representar
el fondo del vdeo (se obtiene de la oclusin del vdeo original), y una capa de fondo para la
profundidad.

Figura 2.18 Formato LDV
De todas las tcnicas de reconstruccin de imgenes 3D, LDV es una de las ms eficientes en el
momento de sintetizar las vistas en escenas 3D complejas.
2.4.8 FORMATO DEPTH ENHANCED VIDEO (DES)
En este formato se establece que se pueden generar 2 o ms vistas (n2) acompaadas de
informacin de profundidad y capas de oclusin; la informacin es similar a LDV sin embargo la
diferencia es que LDV transmite una vista completa y crea el resto, en este caso cada una de
las cmaras capta el vdeo de color con su respectiva extensin de la informacin.
En general todos los formatos, en los cuales se utilice a la profundidad como informacin para
crear el 3D dan flexibilidad para que se pueda manejar de mejor forma toda la informacin,
por lo tanto se vuelve un poco ms sencillo el manejar conceptos como movilidad, efectos de
profundidad, etc.

28

Este formato extiende al estreo convencional ya que genera una serie de datos extras a las
originales izquierda y derecha de un sistema estereoscpico tradicional, al extender el estreo
tiene como ventaja, dejar la posibilidad de que los formatos y esquemas anteriores puedan
adaptarse. Dentro de las informaciones adicionales se manejan seales de profundidad
adicionales y capas de oclusin, lo cual brinda una funcionalidad mayor por ejemplo se crean
facilidades para la post produccin, adems se puede sintetizar varias vistas as como adaptar
la lnea base con el fin de presentar en una pantalla de TV o ser proyectado en el cine. DES
(Depth Enhanced Video) establece que existan 2 flujos de vdeo, con un mapa de profundidad
y dos capas de oclusin cada uno. Se dice que este es un formato genrico porque el sistema
genrico de adquisicin brinda todas las seales necesarias de manera precisa y sencilla.
2.4.9 RESUMEN DE FORMATOS
MVD, LDV y DES fueron presentados como formatos avanzados para esquemas multivista y se
mencion como ventaja sobresaliente la viabilidad para que se usen en recepcin pantallas
autoestereoscpicas al usuario.
En definitiva no importa cul formato se utilice para transmitir la informacin 3D, el desarrollo
de la tecnologa de displays permite convertir esa informacin a dos o ms cuadros que se
pueden visualizar por cualquier mtodo que el fabricante elija. Lo ms importante es
encontrar un formato ptimo.
2.5 CODIFICACIN Y COMPRESIN DE LAS SEALES DE VDEO
ESTEREOSCPICO
Existen diversos organismos de estandarizacin que estn trabajando en un modelo estndar
de codificacin. Los tres ms importantes que han colaborado en el desarrollo de estndares
sobre tecnologas 3D son la Internacional Organization for Standardization (ISO), la
International Electrotechnical Commission (IEC) y la International Telecommunication Union
(ITU). ITU conjuntamente con MPEG (grupo de expertos en vdeo del ISO/IEC), trabajan en la
estandarizacin del H.264 (MPEG-4 parte 10 de ISO/IEC), este estndar conjunto trata aspectos
de codificacin multi-vista: MVC (Multi-View Coding). Mediante este tipo de codificacin se
pretende conseguir la compresin de diferentes vistas para poder realizar transmisiones de
Vdeo 3D con tasas de compresin adecuadas.
MVC al estar amparado por los tres grandes cuerpos de estandarizacin (ITU, ISO e IEC) se
puede estimar que ser el formato ms extendido en un futuro y evitar multiplicidad de
formatos de codificacin multi-vista.
Por su parte MPEG tambin trabaja en otros aspectos, por ejemplo, la parte 16 del MPEG-4,
denominada AFX (Animation Framework extensin), define una coleccin de herramientas
que permiten producir contenidos sintticos animados en tres dimensiones.
Tambin se est trabajando en el MPEG-C, que define los algoritmos avanzados de codificacin
de vdeos. Entre las partes del estndar, la parte 3 define la manera de aadir uno o ms flujos
de datos auxiliares (como por ejemplo mapas de profundidad) que estn asociados con los

29

pxeles del flujo de vdeo principal. De este modo, se puede utilizar este estndar para codificar
de forma universal la informacin estereoscpica para aplicaciones de 3D.
A continuacin se explicarn algunas de las formas ms habituales en las que se codifican este
tipo de contenidos.
2.5.1 CODIFICACIN ESTEREOSCPICA
La recomendacin ITU-T H.264, o ms conocida como MPEG-4, tiene grandes ventajas y buen
desempeo; si bien es cierto H.264 tiene varias extensiones aplicables a 3D, el MPEG-4
convencional tambin se puede aplicar a los formatos de vdeo 3D, porque el vdeo que se
transmite se le trata como vdeo 2D de caractersticas especiales.
MPEG-4 tiene una gran versatilidad y calidad de codificacin, si bien es cierto MPEG-2 lleg a
desarrollar una extensin para perfil multivisin, en el cual se contempla el caso de mltiples
vistas y de cmo explotar la relacin entre ellas para codificar y comprimir, no lleg a ser el
estndar de vanguardia y lleg a su mximo desarrollo en dicha extensin.
Las ventajas de MPEG-4 hacen que este sirva de base para desarrollar modelos ms eficientes
ante la gran cantidad de informacin que los formatos de 3DTV requieren.
A continuacin se realiza una descripcin de MPEG-4 y de cmo este se adapta a los diferentes
formatos, dependiendo la clase y cantidad de informacin necesarias.
2.5.1.1 Caractersticas generales del estndar H.264, MPEG-4 Parte 10
El procedimiento seguido se basa principalmente en aplicar JPEG sobre las imgenes de
referencia y a partir de esta, y mediante tcnicas de compensacin de movimiento (aplicadas
sobre macrobloques 8x8, 16x16 etc.), aprovechar la redundancia temporal entre imgenes
consecutivas pertenecientes a la misma escena. nicamente se codifican las diferencias. Estas
diferencias se describen mediante los vectores de movimiento, que especifican, si se ha
movido un macrobloque, cual es la nueva posicin dentro de la imagen del macrobloque y de
esta manera poder hacer una prediccin de la imagen. Sobre esta imagen diferencia tambin
se aplica JPEG.
El estndar define cinco tipos de imgenes en la codificacin:
Imgenes Intra (I): Slo contienen macrobloques intra. Son imgenes codificadas
teniendo en cuenta nicamente la propia imagen (son imgenes de referencia). Las
imgenes I suelen ser codificadas de manera similar a la codificacin JPEG. Las
imgenes I son las que ms ocupan y se utilizan como puntos de acceso aleatorio ya
que slo dependen de s mismas en la descodificacin.

Imgenes Predicted (P): Contienen macrobloques P y/o macrobloques I. Este tipo
corresponde a las imgenes predichas que hacen referencia a una imagen de tipo I o P
anteriores en tiempo. Ocupan entre un 30% y un 50% menos que una imagen I.


30

Imgenes Bi-Predicted (B): Contienen macrobloques B y/o macrobloques I. Son
imgenes predichas con referencia a la imagen I anterior y a la P posterior. Es
necesario que el descodificador tenga las dos referencias, anterior y posterior, para
poder descodificarlas correctamente. Suelen ser aproximadamente un 50% ms
pequeas que las imgenes P.

Imgenes Switching Predicted (SP): Contienen macrobloques P y/o I. Facilita el cambio
entre secuencias codificadas. Slo se utilizan en versiones extendidas del estndar.

Imgenes Switching Intra (SI): Son iguales que las SP pero contienen macrobloques SI,
que son un tipo especial de macrobloques intra. Slo se utilizan en versiones
extendidas del estndar. Cuando una imagen es codificada esta puede ser almacenada
en un contenedor de bytes o directamente transmitida. La transmisin seguir un
patrn fijo que consistir en el envo de una imagen I seguida de imgenes P y/o
imgenes B.
En la figura 2.19 podemos ver un posible patrn de transmisin.


Figura 2.19 Estructura tpica de transmisin de H.264
Es importante tener en cuenta que el descodificador necesitar una imagen de referencia
(imagen I) para empezar a descodificar, debido a que las dems imgenes (hasta la siguiente
imagen I) hacen referencia a ella.
2.5.1.2 H.264 AVC en OCA (Optimized Chromatic Anagliph)
En este caso la naturaleza de la seal de vdeo es similar a las seales convencionales de vdeo
2D, por lo tanto el estndar es fcilmente aplicable sin ninguna restriccin, tal como lo
muestra la figura 2.20.

Figura 2.20 Codificacin para OCA
Cabe mencionar que se debe procurar mantener la calidad, por lo que trabajar en HD sera una
idea conveniente en este formato. Para OCA, no existen seales auxiliares ni informacin extra
para el vdeo 3D.

31

2.5.1.3 H.264 AVC para CSV (Conventional Video Stereo)
Esta es la aplicacin natural a la parte estreo, considerando que aqu las seales de vdeo son
monoscpicas e independientes. Dentro de CSV, podemos considerar 2 casos como los
formatos antes estudiados, el caso del Dual-Streaming y del Simulcast; con esto H.264 trabaja
normalmente sobre cada uno bajo la estructura expuesta en las figuras 2.21 y 2.22
respectivamente:

Figura 2.21 Aplicacin de H.264 en Dual-Streaming


Figura 2.22 Aplicacin de H.264 en Simulcast
En los dos casos la codificacin es totalmente independiente, por lo que el codificador trabaja
con seales completamente convencionales. Las desventajas que se presentan son:
Dual-Streaming: se debe tener en consideracin que la estructura de transmisin
soporte el video-out proveniente de la codificacin de dos seales.

Simulcast: la estructura de transmisin si soporta la salida del codificador, se debe
considerar que el uso del canal de transmisin en este esquema de transmisin se
duplica.
Al ser informaciones completamente independientes estos esquemas se pueden ajustar a los
formatos V+D, utilizando en lugar del vdeo derecho a la informacin de profundidad.

32

2.5.1.4 H.264 AVC para CFC+ (Conventional HD Frame Compatible +)
CFC+ es el formato en el cual la informacin tiene una naturaleza propia para 3DTV, por lo cual
la cantidad de informacin ya crece; como se estudi en el formato, aqu se manejan al menos
las dimensiones del cuadro HD y para casos de mayor calidad, dimensiones superiores. Dado
que MPEG-4 si establece algunos niveles y perfiles en los cuales encajen estos vdeos, la
codificacin si sera aplicable.
Dado que en este formato se manejan los cuadros L+R bajo algn empaquetamiento, es
necesario utilizar la extensin de H.264 que define un SEI (Supplemental enhancement
information), es decir un sealizador de informacin adicional. En este SEI se indica bajo que
formato se empaqueta la informacin, y que tipo de informacin existe. Para mejorar la
calidad en la codificacin a esta informacin de vdeo 3D se le aplica el SVC (Scalable Video
Coding), el cual no es ms que un anexo del H.264 para seales de mayor calidad y por
supuesto compatible con los parmetros de codificacin antes estudiados.
En la figura 2.23 se ilustra como actuara el codificador para casos de empaquetamiento en un
cuadro HD. Cabe sealar que el tipo de empaquetamiento es totalmente independiente, ya
que mientras se ocupe las dimensiones normadas para los cuadros HD, el vdeo estereoscpico
se codifica como seales normales, an cuando estas lleven informacin estereoscpica.

Figura 2.23 Aplicacin de H.264 en CFC+
Debido al uso del cuadro HD, es necesario utilizar la sealizacin correspondiente, dicha
sealizacin se encuentra en la norma HDMI 1.4a en la seccin correspondiente a 3D.
2.5.2 CODIFICACIN PARA EL FORMATO V+D
La idea inicial de establecer el mapa de profundidad surge del proyecto ATTEST
9
, y se basa en
que una seal monocromtica ahorrara muchos recursos de transmisin y facilidad en
codificacin. Existen algunas tcnicas que resulta una solucin viable en este formato,

9
Advanced Three-dimensional Television System Technologies (ATTEST), proyecto para la investigacin
de un sistema de difusin eficiente de televisin 3D.

33

procurando siempre el uso eficiente de los recursos y evitar en lo posible que se demanden
tasas de bits excesivamente altas.
El desarrollo de estas tcnicas ha permitido que este formato sea eficiente e incluso sea
aplicable a la televisin mvil 3D. Es posible tambin aplicar la extensin MVC de H.264
tomando en cuenta que una de las vistas puede ser el mapa de profundidad.
2.5.2.1 MPEG-C parte 3
Este estndar conocido tambin como el ISO/IEC 23002-3, establece el procesamiento
separado e independiente de las seales de vdeo y de la seal de profundidad, tomando en
cuenta que codificar una seal de profundidad monocromtica requiere menos tasa de bits y
que en recepcin se debe contar con dos decodificadores para separar la reconstruccin de
ambas seales.
Cabe sealar que el estndar no establece tcnicas de compresin o transmisin, slo
establece la metodologa que puede ser aplicada para nuestro estudio con tcnicas
H.264/AVC.
Se considera que el codificador para la profundidad tendr como salida una tasa de bits de
entre el 5 y 10% de la tasa del vdeo 2D, siendo as la tasa total de bits un 110% en V+D usando
codificacin para cada seal, un valor que puede resultar cuestionable para servicios donde el
uso del canal sea realmente limitado.
La cadena de transmisin para este formato se representa en la figura 2.24.


Figura 2.24 Cadena de Transmisin para MPEG-C parte 3
El esquema de la figura 2.24 muestra la codificacin independiente de las 2 seales, de lo cual
resultarn dos flujos de bits; para la transmisin de dichos flujos, estos deben ser
multiplexados cuadro a cuadro generando un nico transport-stream, el cual puede

34

eventualmente contener parmetros adicionales del mapa de profundidad como informacin
auxiliar.
2.5.2.2 H.264 - Imgenes auxiliares
H.264 sostiene la posibilidad de codificar seales auxiliares de vdeo, teniendo las mismas
caractersticas de macro-bloques, de semntica y sintaxis en la codificacin.
Se pueden adicionar seales de vdeo redundantes o seales no especificadas en la norma
H.264, de esto se vale el 3D para poder transmitir sobre MPEG-4 la seal auxiliar del mapa de
profundidad (ver figura 2.25). Esta seal debe estar debidamente sealizada segn lo
establece el estndar, a este tipo de seales el estndar, las denominadas como Auxiliary
Coded Picture, y se definen como imgenes que suplementan a la seal primaria,
normalmente esta seal se usa como redundancia y el estndar restringe a que esta sea
monocromtica.

Figura 2.25 Aplicacin del codificador H.264 a las seales de imgenes auxiliares
Esta solucin permite aprovechar al mximo las ventajas de H.264 y adems se brinda un gran
nivel de compatibilidad con los sistemas anteriores, adems de un uso eficiente en la
transmisin.
2.5.3 CODIFICACIN PARA EL FORMATO MVC
Esta enmienda a H.264/AVC crea la posibilidad de explotar al mximo la dependencia entre las
vistas de una seal de vdeo estereoscpico, haciendo uso de una prediccin tomando en
cuenta los n cuadros presentes. Para este formato se pueden especificar dos casos, el primero
en el cual se generaliza la prediccin para n vistas, y el segundo que se ha mencionado como
estreo de alto desempeo si n=2.
Segn H.264 se aade un nuevo SEI para indicar el uso de la prediccin y codificacin
multivista. Un codificador MVC consiste bsicamente en N codificadores simples en paralelo,
cada uno de ellos utiliza estructuras de prediccin temporal, donde una secuencia de imgenes

35

sucesivas es codificada como Intra (I), Predictiva (P) o Bi-predictiva (B). Para mejorar an ms
la eficiencia de la codificacin, se tiende a utilizar Imgenes B jerrquicas, donde la jerarqua
de una imagen B es creada por la sucesin de imgenes B que resultan referencias para otras
imgenes B.
En MVC los conceptos de prediccin para una imagen se extienden a tal punto que una imagen
que est en el proceso de codificacin, puede tener tanto referencias temporales como
referencias intervista para la prediccin. En la figura 2.26 se explica esta prediccin MVC
considerando n=5 y un GOP de tamao 8.

Figura 2.26 Prediccin Multivista para n=5 y GOP=8 (IPP)
10

Para la cmara 1, el procedimiento de prediccin es idntico al caso de una sola vista,
manteniendo as una compatibilidad con sistemas anteriores, pero para el resto de vistas se
hace uso de la referencia intervista (flechas rojas) para la prediccin.
Con el fin de mejorar la eficiencia existen varias estructuras de prediccin desarrolladas, dos
de las ms importantes son IPP (inter-view prediction at key picture) y HBP (Hierarchical B
Pictures), IPP funciona bajo lo expuesto en la figura 2.26.
HBP explota an ms la relacin inter-vista, no solo utilizando las vistas n+1 para la prediccin
sino tambin las n+2. La figura 2.27 muestra el proceso de prediccin de las diferentes
imgenes para un GOP = 8 y n=8 vistas.


10
Fuente: 3D Video Formats and Coding Methods; Karsten Mller, Philipp Merkle, Gerhard Tech, and
Thomas Wiegand; HHI; 2006 Berln Alemania.

36


Figura 2.27 Estructura de prediccin espacio temporal para MVC (HBP)
11

En la figura anterior, la S indica la cmara, mientras que la T indica el tiempo. Como en
estndares anteriores, las tres maneras de codificar una imagen son: intracodificado (I cuadro),
predecible posterior (P cuadro) y predecible bi-direccional (B cuadro). La diferencia principal es
que en este nuevo estndar hay dos dimensiones: el tiempo y la vista, tal y como se puede ver
en la figura.
En la imagen se puede observar que slo en la cmara S0 se codifica una imagen como intra.
Esto se realiza cada 8 tramas. En las cmaras S2, S4, S6 y S7 se codifican las imgenes de
prediccin a partir de la vista S0, tambin cada 8 tramas. Finalmente, el resto de imgenes se
predicen bidireccionalmente a partir de las imgenes prximas en tiempo y espacio (entre
vistas).
En realidad, el esquema de prediccin puede llegar a ser mucho ms complejo que el que
muestra la figura y por eso se han propuesto nuevas herramientas de prediccin que se
puedan combinar con cualquier estructura de prediccin.
2.5.4 CODIFICACIN PARA EL FORMATO MVD
Para formatos avanzados como este, la codificacin se vuelve compleja debido a la cantidad de
informacin que se genera, MVD resulta una combinacin de V+D y MVC. La codificacin es en
principio basada en la tcnica MVC original, no obstante en trminos prcticos se puede hablar
de una codificacin MVD.
La codificacin en MVD funciona, dentro de un esquema global, de acuerdo a lo expuesto en la
figura 2.28.

11
Karsten Mller; Representation and Coding Formats for 3D Video; Conference Session 3DTV
Content; IEEE Broadcast Technology Society; 2009 Alemania.

37


Figura 2.28 Cadena de transmisin en MVD
12

Se observa que el codificador genera una nica seal para la transmisin, la cual contiene la
informacin de las n vistas y su respectiva profundidad. El modo de prediccin en este caso
vara ya que toma, adicionalmente, la informacin de profundidad. Este proceso de prediccin
se detalla en la Figura 2.29.

Figura 2.29 Modo de prediccin de imgenes para MVD
La codificacin y prediccin son basadas en MVC, tomando en cuenta que se van a generar
ms seales del vdeo, el diagrama de bloques del codificador es ms complejo.

12
Compression for 3DTV - with special focus on MPEG standards; Dr.-Ing. Aljoscha Smolid Fraunhofer
HHI Image Processing Department; Alemania 2007.

38

2.5.5 CODIFICACIN PARA EL FORMATO LDV
Este formato es sin duda ms preciso y de mayor calidad que los anteriores, y por ello su
codificacin tambin resulta ms compleja. Se puede aplicar el mismo MVC a estas seales,
haciendo un proceso similar al de MVD, donde las informaciones adicionales entran como
vistas extras al codificador MVC. Bajo esta premisa se puede aplicar el H.264 sin problema.
Es notorio que se puede recurrir en una complejidad mayor para los codificadores y en un flujo
de bits mucho mayor al que se pueda manejar para broadcasting. Por ello la compaa 3DTV
Solutions en pro de la calidad ha propuesto todo un esquema para este formato basndose
en su propio esquema de codificacin LDV, donde se explota al mximo la relacin entre todas
las capas y las vistas permitiendo posteriormente una efectiva reconstruccin a tasas de bits
ms accesibles. Sin embargo una desventaja de esta propuesta es que requiere una gran
exactitud en los mapas de profundidad, de no ser as se generarn resultados errneos.
2.5.6 CODIFICACIN PARA EL FORMATO DES
No cabe duda que para este formato se debe manejar el mismo criterio que para LDV y MVD; a
tal cantidad de informacin si bien es cierto MVC no se puede aplicar, ya que resultara de gran
complejidad su implementacin.
2.5.7 CARACTERSTICAS GENERALES DEL ESTNDAR HEVC H.265
Se espera que el ms reciente estndar de compresin, el cdec de vdeo de alta eficiencia
(HEVC, por sus siglas en ingls), tambin conocido como H.265, se convierta en el estndar de
vdeo preferido en la prxima dcada.
Igual que todas las generaciones anteriores de tecnologa de compresin de vdeo, el estndar
HEVC promete reducir el costo global de difusin y almacenamiento de activos de vdeo y al
mismo tiempo mantener o incrementar la calidad de la experiencia del espectador.
Sin sacrificar la calidad del vdeo, el HEVC puede reducir el tamao de un archivo de vdeo o
flujo de bits hasta en un 50%, en comparacin con el estndar AVC/H.264 o hasta en 75%, en
comparacin con los estndares MPEG-2. El resultado es una reduccin en los costos de
almacenamiento y transmisin de vdeo. De igual manera, el nuevo cdec prepara el camino
para difundir contenido de ms alta definicin a fin de ofrecer al consumidor una experiencia
de ms alta calidad.
El HEVC, diseado para el avance de la industria de compresin de vdeo, tiene el propsito de:
Proporcionar un promedio de reduccin de la tasa de bits de 50% para obtener una
calidad de vdeo fija, en comparacin con el H.264.
Proporcionar mayor calidad con la misma tasa de bits.
Definir una sintaxis estndar para simplificar la implementacin y maximizar la
interoperabilidad.
Seguir propiciando el trabajo en red, es decir, en flujos de transporte MPEG.

39


Figura 2.30 Compresin de tasa de bits esperada en el momento de la estandarizacin
Mientras que el H.264 tiene siete perfiles (conjuntos definidos de herramientas de codificacin
empleados para crear un flujo de bits que cumpla con los estndares), el HEVC define
actualmente tres: Main, Main 10 y Main Still Picture. Se espera que futuras extensiones del
cdec HEVC incluyan un aumento de la profundidad de bits, muestreos de color 4:2:2 y 4:4:4,
MVC (codificacin de vdeo multivista) y SVC (codificacin de vdeo escalable).
El perfil Main del HEVC permite una profundidad de bits de 8 bits por color, mientras que Main
10 permite 8 bits o 10 bits por color. Debido a la opcin adicional de profundidad de bits, el
perfil Main 10 tiene la capacidad de ofrecer una mejor calidad de vdeo que el Main.
Finalmente, el perfil Main Still Picture permite codificar una sola imagen fija con las mismas
exigencias del perfil Main.
La especificacin HEVC tambin define 13 niveles, que son conjuntos de restricciones que
indican el rendimiento requerido del decodificador para reproducir un flujo de bits del perfil
especificado. Los niveles estn, a su vez, divididos en dos niveles: el Main, que incluye los
niveles 1 - 3.1, y el High, que incluye los niveles 4 - 6.2 y est diseado para aplicaciones muy
exigentes. Los niveles del HEVC comparten ciertas similitudes con los del H.264, con la
diferencia fundamental de la adicin de los niveles 6, 6.1 y 6.2, que definen los requerimientos
para vdeo con resolucin 8K.
El principal objetivo del nuevo estndar HEVC es proporcionar las herramientas necesarias
para transmitir la cantidad ms pequea de informacin requerida para un determinado nivel
de calidad de vdeo.

40


Figura 2.31 Modos/macrobloque
Aunque hay varias diferencias entre los estndares H.264 y HEVC para codificar cada
macrobloque, vale la pena mencionar dos de ellas: el aumento de los modos de intra
prediccin y una particin refinada para la inter prediccin.
Intra prediccin y codificacin: En el estndar H.264 existen nueve modos de
prediccin en un bloque de 4 x 4 para la intra prediccin dentro de un determinado
cuadro y nueve modos de prediccin en el nivel de 8 x 8. Es menor en el nivel del
bloque de 16 x 16, donde se reduce a solo cuatro modos de prediccin. La intra
prediccin busca calcular el estado de los bloques adyacentes en una direccin que
minimiza el error del clculo.
En el HEVC existe una tcnica similar, pero el nmero de modos posibles es 35 (acorde
con la complejidad adicional del cdec). Esto implica la participacin de un nmero
enormemente alto de puntos de decisin en el anlisis, ya que hay casi dos veces el
nmero de tamaos de intra prediccin espacial en el HEVC, en comparacin con el
H.264, y casi cuatro veces el nmero de direcciones de intraprediccin espacial.

Inter prediccin y codificacin: El H.264 usa compensacin de movimiento a partir de
bloques, el tamao y la forma de los bloques es ajustable para buscar redundancia
temporal en los cuadros de un vdeo. La compensacin de movimiento suele ser
considerada la porcin ms exigente del proceso de codificacin. La habilidad para
implementarla de forma inteligente dentro del espacio de decisin tiene una gran
incidencia en la eficiencia del cdec. El HEVC lleva esta capacidad a otro nivel.
El HEVC reemplaza la estructura de macrobloque del H.264 por un conjunto de
bloques en estructura de rbol ms eficientes, pero tambin complejos. Cada bloque
puede ser ms grande (hasta 64 x 64) que el macrobloque estndar de 16 x 16, y
puede ser dividido de forma eficiente usando un quadtree. Este sistema permite al
codificador una gran flexibilidad para usar grandes particiones cuando predicen bien y
particiones pequeas cuando se necesitan predicciones ms detalladas.
Esto permite una mayor eficiencia en la codificacin, ya que se pueden codificar a bajo costo
grandes unidades de prediccin (incluido el tamao del bloque en estructura de rbol) cuando
se adaptan al contenido. Del mismo modo, cuando algunas partes del bloque necesitan
predicciones ms detalladas, estas tambin pueden describirse de forma eficiente.

41

Con respecto al impacto del HEVC en el mundo de la compresin de vdeo, hay varios casos en
los que la mejor calidad en la proporcin de la tasa de bits del HEVC tendr incidencia en las
aplicaciones de la industria. Teniendo en cuenta que la difusin de vdeo de alta calidad
demanda enorme capacidad de red, los siguientes son algunos de los beneficios proyectados:
Utilizacin de ms canales en redes satelitales, de cable y de televisin IPTV.
Menor costo de difusin de vdeo gestionado y no gestionado.
Mayor alcance para los operadores mviles y de televisin IPTV con restricciones de
ancho de banda.
Mejor calidad de la experiencia de los servicios de transmisin libre (OTT) de modo
que estn al mismo nivel de la difusin tradicional.
En el mercado de la transmisin mvil, la reduccin de la tasa de bits del HEVC de 30 50%,
para alcanzar una calidad comparable al H.264, se materializa en ahorros en los costos de la
difusin en las redes. Los operadores mviles no tendrn que distribuir tantos datos para un
determinado nivel de calidad, reduciendo los costos y haciendo la reproduccin ms confiable,
a condicin de que el hardware del dispositivo pueda decodificar sin problemas el HEVC.
El HEVC tambin se suma a la tendencia hacia vdeo de 4K y 8K Ultra HD de alta resolucin en
el mercado dominante. Gracias a que la resolucin 4K presenta cuatro veces el nmero de
pxeles que la 1080p, la eficiencia que brinda el HEVC hace mucho ms viable la difusin de 4K.
Se espera que antes de finalizar la dcada, el HEVC sea ampliamente adoptado en distintas
aplicaciones, como la transferencia y difusin de vdeo, vdeo satelital, vdeo por cable, IPTV,
vdeo vigilancia, vdeo corporativo y videojuegos.


42

3 Metodologa
A continuacin se expondr un estudio en el que se analizarn y se compararn las relaciones
de las tasas de bits con respecto a la calidad de la imagen en los diferentes formatos y
codificadores explicados en el captulo anterior.
3.1 ESTUDIO DE LAS TASAS DE BITS
Dependiendo del formato elegido y del esquema de codificacin, se pueden tener uno o ms
flujos de bits resultantes como seal de vdeo. En esta seccin se analizar la tasa de bits que
cada formato genera y una comparacin entre ellos.
3.1.1 PARMETROS DEL ESTUDIO
A continuacin se explicarn los parmetros tcnicos que se van a emplear para realizar el
estudio de las tasas de bits con respecto a las configuraciones empleadas para la codificacin.
3.1.1.1 Codificador H.264
La recomendacin ITU-T H.264-AVC (Advanced Video Coding) representa una evolucin a los
estndares existentes para la codificacin de vdeo como son H.261. H.262, H.263. Este
estndar surge ante la necesidad de procesar grandes cantidades de informacin digital de
vdeo y ms especficamente como una solucin eficiente al servicio de Televisin Digital, flujo
de vdeo por IP y las video comunicaciones.
Este estndar nace en 2003, presentando flexibilidad total ante la variedad de redes y
tecnologas existentes.
En una de las revisiones al estndar, la 2005-03, se incluyen las modificaciones al estndar de
codificacin para aadir cuatro nuevos perfiles referidos principalmente a las 4:2:2 y 4:4:4, con
ello se mejora la calidad del vdeo y se da la posibilidad de que el estndar se extienda hacia un
rango ms amplio de aplicaciones.
Para hacer ms fcil la estandarizacin, H.264 ha establecido desde el inicio, y en cada una de
sus enmiendas, niveles y perfiles, los cuales permiten dar una escala y una clasificacin de las
diferentes tasas de flujos de bits posibles. Se han desarrollado 7 diferentes perfiles para poder
cubrir varias aplicaciones existentes, desde redes inalmbricas hasta aplicaciones de cine
digital.
Cada perfil especifica un subconjunto de velocidades de transmisin, de la sintaxis
correspondiente y de los lmites a los que se deben acoplar los decodificadores existentes para
cada perfil. En la primera versin existen 3 perfiles: Perfil lnea base, perfil principal, y perfil
extendido.
El perfil lnea base es aplicable a servicios de vdeo-comunicaciones en tiempo real
tales como vdeo conferencias y el vdeo telfono.


43

El perfil principal est diseado para el almacenamiento de informacin digital y para
servicios de broadcasting de televisin.

El perfil extendido se aplica a los servicios multimedia sobre Internet.
Existen adems tres perfiles de alto nivel (High-Profile) definidos en las extensiones de los
rangos de fidelidad para aplicaciones tales como contenido-contribucin, contenido-
distribucin, y edicin de estudio y post-procesamiento, estos perfiles son: Alto (High), Alto 10
(High 10), Alto 4:2:2 (High 4:2:2) y Alto 4:4:4 (High 4:4:4).
El High Profile es capaz de soportar cuantizacin de 8 bits con esquema de muestreo
4:2:0 para aplicaciones de alta resolucin.

El perfil High 10 se basa en el mismo esquema 4:2:0, pero cuantiza las muestras con 10
o ms bits.

El perfil High 4:2:2 trabaja en su esquema de muestro para 10 o ms bits.

En el caso del perfil High 4:4:4 se asignan 12 bits por muestra, y se utiliza la
transformada de color residual integral para codificar la seal RGB.
Adems de los perfiles, se definen tambin los niveles para cada perfil existente. Los niveles
corresponden generalmente al poder de procesamiento y capacidad de memoria del cdec,
cada nivel soporta una determinada dimensin de la imagen (SDTV, HDTV). Como se observa,
los perfiles tienen puntos en comn y puntos divergentes, a continuacin se hace una
descripcin ms detallada de los mismos para cada perfil.
3.1.1.1.1 Elementos comunes en todos los perfiles
Como ya se ha comentado con anterioridad, para todos los perfiles se realiza la prediccin de
los cuadros de la misma forma, se establecen dos tipos de cuadros, los cuadros I (cuadro intra)
y los cuadros P (cuadros predicted), los cuales dependiendo si el formato requiere ms tipos de
cuadros, conforman el GOP (Group of Pictures).
Otro elemento comn en todos los perfiles es el CAVLC (Context-based Adaptive Variable
Length Coding), es decir una codificacin de longitud variable para mejorar la entropa del
cdigo.
3.1.1.1.2 Perfil de lnea Base
Los elementos exclusivos de este perfil son:
Orden flexible para los macrobloques: No necesariamente pueden estar estos en
orden, existe un mapa el cual asigna los macrobloques a los grupos de cuadros.

Orden arbitrario de los cuadros: Puede darse la alternancia en el orden entre bloques
precedentes y posteriores.


44

Redundancia de datos: Los datos son procesados en partes, y estas porciones de datos
pertenecen a los datos del cdigo redundante obtenido por las diferencias o
semejanzas de la tasa de codificacin, en comparacin con los datos comparados
previamente en la misma porcin de datos.
3.1.1.1.3 Perfil Principal
Para el perfil principal existe otro tipo de cuadros, los cuadros B (cuadros bi-predicted) y se
utiliza la prediccin ponderada, debido a que se aplica un factor de ponderacin a las muestras
de datos de prediccin de movimiento en el grupo de cuadros P B.
El cdigo para mejorar la entropa en este caso es CABAC (Context-adaptive binary arithmetic
coding), el cual consigue flujos de bits 10 % ms pequeos.
3.1.1.1.4 Perfil Extendido
Este perfil incluye todas las caractersticas del perfil de lnea base, y aade otros elementos
como:
Porciones SP.

Porciones SI.

Particiones de Datos: Los datos codificados son ubicados en particiones de datos
separados, cada particin puede ser ubicada en una capa diferente.

Maneja cuadros B.

Maneja prediccin ponderada.
3.1.1.1.5 Perfiles Altos (High-Profiles)
Este perfil incluye todas las caractersticas del perfil principal, es decir, cuadros B, prediccin
ponderada, CABAC; y adems tiene las siguientes caractersticas:
Tamao del bloque adaptativo: Puede ser 4x4 o 8x8, para muestreo de luminancia.

Matrices escaladas de cuantizacin: Diferentes escalas de acuerdo a frecuencias
especficas asociadas con los coeficientes de la transformada en el proceso de
cuantizacin para optimizar la calidad subjetiva.
3.1.1.1.6 Algoritmo de codificacin
El algoritmo de codificacin de H.264 consta de varios procesos, los cuales son descritos de
manera detallada en la figura 3.1.


45


Figura 3.1 Diagrama de bloques de la codificacin H.264
Como se observa en la figura 3.1 el codificador tiene la posibilidad de escoger entre modos de
prediccin Intra e Inter para determinada regin en las imgenes.
La prediccin se obtiene al eliminar los bloques y filtrar la seal proveniente de las imgenes
reconstruidas. El vector de movimiento y los modos de prediccin Intra pueden ser
especificados para una variedad de tamaos de bloque en la imagen, dentro del bloque de
codificacin de entropa H.264 se establecen dos mtodos dependiendo del perfil: CAVLC y
CABAC.
3.1.1.1.7 Prediccin Intra-Frame
H.264 usa el mtodo de prediccin Intra-cdigo en macrobloques de tipo I, para reducir la gran
cantidad de bits codificados que la seal de entrada genera por s misma. Este tipo de
prediccin es ms eficiente para el caso de secuencias de vdeo con poco movimiento. El
mtodo se basa en intentar predecir el bloque actual que se est procesando, extrapolando los
pxeles vecinos de bloques adyacentes en una serie de direcciones definidas. Para codificar un
bloque o un macro bloque bajo este Intra-codificacin, un bloque de prediccin se forma en el
bloque reconstruido previamente, la seal residual entre el bloque en procesamiento y el de la
prediccin es codificada. Para las muestras de luminancia el bloque de prediccin puede estar
formado por sub-bloques de 4x4, bloques de 8x8, o macrobloques de 16x16 en nueve
direcciones la prediccin; para la crominancia
13
puede darse en bloques de 8x8 para 4:2:0,
8x16 en 4:2:2, y 16x16 en 4:4:4 en cuatro direcciones de prediccin; para cada macro-bloque y
para cada una de sus componentes de color se determina el modo de prediccin a usarse y el
conjunto de direcciones de prediccin.

13
La crominancia es el componente de la seal de vdeo que contiene las informaciones del color
(R,G,B).

46

3.1.1.1.8 Prediccin Inter-Frame
La prediccin Inter-Frame est destinada a reducir la correlacin temporal con ayuda de las
herramientas de compensacin y estimacin del movimiento. Como es conocido en este
estndar, la imagen puede ser dividida en macrobloques o en bloques ms pequeos. Un
macrobloque de 16x16 muestras de luminancia se puede dividir en bloques ms pequeos de
a lo sumo 4x4. Para el modo 16x16 existen cuatro casos: 16x16, 16x8, 8x16 y 8x8. En el modo
8x8, los casos posibles son: 8x8, 8x4, 4x8 o 4x4. El bloque ms pequeo requiere una mayor
cantidad de bits para la seal, el vector de movimiento y los datos extra del tipo de particin;
de ah que la eleccin del tamao de la particin depende de las caractersticas de la seal de
vdeo de entrada. Por lo general las grandes particiones son apropiadas para reas
homogneas en un cuadro, y las particiones de tamao pequeo son apropiadas para reas
muy detalladas.
El proceso de prediccin Inter de un bloque en muestreo involucra eventualmente tambin la
seleccin de las imgenes a ser usadas como imgenes de referencia de un conjunto de
imgenes decodificadas previamente almacenadas. Las imgenes de referencia para la
compensacin del movimiento son almacenadas en el buffer de imgenes. En lo que se refiere
a la imagen en procesamiento, las imgenes que le preceden y le suceden a la misma se
almacenan en ese orden en el Buffer.
3.1.1.1.9 Transformacin y cuantificacin
Sin duda en este aspecto se ha avanzado mucho en relacin a los anteriores formatos, en este
caso se usa una Transformada entera a diferencia de las DCT que antes se usaban, con ello se
reduce, adems de con el filtro, el efecto visual de bloque. H.264 utiliza una transformacin
adaptativa con tamaos de bloque 4x4 y 8x8 (para los perfiles High).
Para mejorar la eficiencia en la compresin, el estndar emplea una estructura jerrquica para
la transformacin, en la cual los coeficientes DC (Direct Cosine), de las transformaciones 4x4
vecinas para las seales de luminancia, estn agrupadas en bloques de 4x4 y transformadas
nuevamente usando la transformada Hadamard
14
, el estndar especifica la transformada
Hadamard 4x4 para los coeficientes DC de la luminancia y slo para el modo Intra 16x16, y la
transformada Hadamard 2x2 para los coeficientes DC de la crominancia.
Por lo general este proceso de transformacin y cuantificacin requiere muchas
multiplicaciones hacindolo muy complejo en el momento de la implementacin. Para evitar
esto, se usa en H.264 la transformada Hadamard con valores enteros haciendo ms rpido y
eficiente el proceso.

14
Transformada de imgenes sumamente rpida, que consiste en un desarrollo en serie de funciones
bsicas cuyos valores son +1 o -1, en trminos matemticos la transformada H viene dada por:
=
1

(1)

1
=0
1
=0


47

3.1.1.1.10 Proceso de codificacin
Este proceso consta de una serie de pasos que establecen el orden de la codificacin, con ello
tambin es fcilmente identificable lo que se debe hacer en recepcin para decodificar las
seales.
Paso 1: Se aplica la transformada entera hacia adelante, para DCT de una entrada de
luminancia de 4x4 la formula resulta en :
=

=




; siendo las variables a, b, c:
=
1
2
; =

1
2
cos

8
; =

1
2
cos
3
8

Estos valores de a, b, c pueden ser simplificados por simplicidad obteniendo estos nuevos
valores:
=
1
2
; =

2
5
; =
1
2


La multiplicacin en el proceso de transformacin se evita al integrarla con la cuantizacin, de
esta forma se obtiene:
=

=
1 1 1 1
2 1 1 2
1 1 1 1
1 2 2 1
; =

2
4

2
4

2
4

2
4


La multiplicacin indicada en la expresin de X se la hace elemento a elemento en las matrices
sealadas.
Paso 2: Post-escalamiento y cuantizacin, la matriz SF (post-escalamiento) permite
obtener una seal Y transformada y cuantizada. El tamao del paso en la cuantizacin
se denomina Qstep.


H.264 define un total de 52 valores de paso para la cuantizacin.

48

3.1.1.1.11 Codificacin de entropa
Anteriormente a este estndar la forma de codificar era usando VLCs (Variable Length Codes),
en el cual la longitud de la palabra cdigo tena que ver con la probabilidad de ocurrencia; para
H.264 los VLCs funcionan de forma diferente.
Todos los elementos de sintaxis a excepcin de los datos residuales, son codificados con el
cdigo Golomb Exponencial
15
. Para los casos residuales en cambio se usa CAVLC, y para el
perfil principal y para los altos perfiles se utiliza el CABAC, el cual presenta mayor eficiencia
pero mayor complejidad comparndolo a CAVLC.
CAVLC: Cdigo adaptativo de longitud variable basado en el contexto, despus de la
transformacin y la cuantizacin, la probabilidad de que los coeficientes sean 0, +1 -1
es muy alta. CAVLC maneja los 0, +1 -1 de diferente modo con los niveles de los
coeficientes, el total de nmero de 0 y +1 -1 son codificados, y para otros
coeficientes se codifica con su nivel.

CABAC: Cdigo adaptativo aritmtico binario basado en el contexto, se alcanza un
buen nivel de compresin, el modelo de probabilidad para cada smbolo se basa en 3
procedimientos (ver figura 3.2), los cuales son: Binarizacin, modelo de contexto y
Cdigo aritmtico binario.

Figura 3.2 Procesos de CABAC
3.1.1.1.12 Tasa de transmisin.
Con todos los argumentos presentados para cada perfil, la tasa de transmisin original del
vdeo digital se reduce en cada etapa y proceso que el cdec efecta, por ejemplo el filtro de
suavizado de bloques ya disminuye en 5 a 10% la tasa binaria. Sin duda la eficiencia de este
cdigo es superior al de estndares anteriores; y para determinados PSNR
16
, se tienen mejores
tasas binarias que con tecnologas anteriores, por ejemplo se obtiene una tasa binaria 50%
menor a la que se obtiene con MPEG-2, llegando a tasas de compresin de 50:1.
Dependiendo del perfil, la tasa de bits es diferente, dado que para diferentes aplicaciones se
requiere mayor calidad. Lo que respecta a este trabajo, el mbito al que se aplica esta

15
Un cdigo exponencial Golomb de orden k es un tipo de cdigo universal, donde el parmetro k es un
entero no negativo, para H.264 se utiliza k=0.
16
La relacin a seal a ruido pico PSNR, define la relacin entre la energa mxima de la seal y la del
ruido, es muy usada para medir la calidad de una imagen reconstruida de la codificacin.

49

codificacin, es en los vdeos SD (Standar Definition) y HD (High Definition), por lo cual los
perfiles de inters son el perfil principal y los perfiles High en los niveles correspondientes. Con
estas consideraciones, las tasas binarias se encuentran entre los 64 Kbps y 150 Mbps, es
posible que existan tasas mayores para servicios como SHDTV, no aplicables a nuestro estudio.
Por otra parte, la tasa de transmisin tambin puede variar de acuerdo a la codificacin de
entropa realizada. Por ejemplo, para una definicin estndar SD las tasas de bits se enmarcan
dentro de lo expuesto en la figura 3.3.

Figura 3.3 Tasa de bits en SD
3.1.1.2 FACTOR Q
El factor de calidad o Factor Q relaciona el bitrate con el tamao del fotograma y el
"framerate" o velocidad de reproduccin de fotogramas (normalmente, 25 f.p.s. (fotogramas
por segundo)). Este factor permite saber si el flujo con que est comprimido un vdeo en
particular es acorde con el tamao del fotograma (en pxeles) y la velocidad de reproduccin
en f.p.s. No es lo mismo usar un bitrate de 900kbps para un vdeo de un iPod (con un tamao
de fotograma de 320x240 pxeles) que para un DVD, con un tamao de 720x576 pxeles. El
flujo es el mismo, pero se reparte entre ms o menos pxeles, lo que implica que toca ms o
menos calidad por pxel en cada caso.
La frmula para el clculo del Factor Q es la siguiente:
=

. . . ()

Bitrate en bits por segundo (bps)
Ancho del fotograma en pxeles (px)
Alto del fotograma en pxeles (px)
Segn diversas fuentes los valores que debe tener el Factor Q para el cdec H.264 tienen que
estar comprendidos en el rango de 0,2-0,35. Siendo el valor 0,25 el correspondiente a una
calidad de imagen ptima con el cdec H.264.

50

Para realizar el estudio de las tasas de bits se usarn 4 valores de Factor Q relacionados con la
calidad de imagen resultante:
Tabla 3.1 Factor Q
Calidad Baja Calidad Normal Calidad ptima Calidad Alta
Factor Q 0.17 0.2193 0.25 0.2741
3.1.1.3 SISTEMA DE CODIFICACIN PAL
PAL es la sigla de Phase Alternating Line (en espaol lnea alternada en fase). Es el nombre con
el que se designa al sistema de codificacin empleado en la transmisin de seales de
televisin analgica en color en la mayor parte del mundo. Es de origen alemn y se utiliza en
la mayora de los pases africanos, asiticos y europeos, adems de Australia y algunos pases
latinoamericanos.
El sistema PAL surgi en el ao 1963, de manos del Dr. Walter Bruch en los laboratorios de
Telefunken en su intento por mejorar la calidad y reducir los defectos en los tonos de color que
presentaba el sistema NTSC
17
. No obstante, los conceptos fundamentales de la transmisin de
seales han sido adoptados del sistema NTSC.
El sistema de color PAL se usa habitualmente con un formato de vdeo de 625 lneas por
cuadro (un cuadro es una imagen completa, compuesta de dos campos entrelazados) y una
tasa de refresco de pantalla de 25 cuadros por segundo, entrelazadas, como ocurre por
ejemplo en las variantes PAL-B, G, H, I y N. Algunos pases del Este de Europa que abandonaron
el sistema SECAM ahora emplean PAL D o K, adaptaciones para mantener algunos aspectos
tcnicos de SECAM en PAL.
El sistema PAL es ms robusto que el sistema NTSC. Este ltimo puede ser tcnicamente
superior en aquellos casos en los que la seal es transmitida sin variaciones de fase. Pero para
eso deberan darse unas condiciones de transmisin ideales (sin obstculos como montes,
estructuras metlicas...) entre el emisor y el receptor. En el caso en el que haya rebotes de
seal, el sistema PAL se ha demostrado netamente superior al NTSC (del que, en realidad, es
una mejora tcnica). Esa fue una razn por la cual la mayora de los pases europeos eligieron
el sistema PAL, ya que la orografa europea es mucho ms compleja que la norteamericana
(todo el medio oeste es prcticamente llano). Otro motivo es que en los EE.UU. son habituales
las emisiones de carcter local y en Europa lo son las estaciones nacionales, cuyas emisoras
suelen tener un rea de cobertura ms extensa. En el nico aspecto en el que el NTSC es
superior al PAL es en evitar la sensacin de parpadeo que se puede apreciar en la zona de
visin perifrica cuando se mira la TV en una pantalla grande (ms de 21 pulgadas), porque la
velocidad de refresco es superior (30Hz en NTSC frente a 25Hz en PAL). De todas formas este
es un argumento relativamente nuevo ya que en los aos 50 el tamao medio de la pantalla de
un receptor de televisin era de unas 15 pulgadas, siendo adems que esta frecuencia de

17
NTSC: National Television System Committee es un sistema de codificacin y transmisin de Televisin
en color analgico desarrollado en Estados Unidos.

51

refresco de imagen se adopt en su origen condicionada por la frecuencia de la corriente
alterna en los pases europeos, que es 50Hz frente a los 60Hz de los EE.UU.
Por todo esto hay que tener en cuenta que el formato de vdeo cambia segn el sistema que
uses. En el sistema PAL se utiliza 720 x 576 pxeles y 25 fotogramas por segundo, mientras que
en el sistema NTSC se utilizan 720 x 480 pxeles y 29,9 fotogramas por segundo.
Otras diferencias que podemos encontrar entre los dos sistemas pueden ser:
Los televisores y DVD europeos con el sistema PAL son capaz de reproducir DVD o
discos con el sistema NTSC, lo que no se puede hacer a la inversa.

En el sistema PAL la imagen de un vdeo cuenta con una resolucin mucho mejor.

El sistema NTSC puede producir menos fatiga en los ojos despus de exponer nuestra
vista durante mucho tiempo delante de una pelcula.
3.1.1.4 RESOLUCIONES
En la actualidad existen numerosas resoluciones o tamao del fotograma asociados al vdeo
digital que dependen entre otras cosas del sistema de reproduccin en el que se visualice el
vdeo.
En la figura 3.4 se puede observar la relacin de aspecto existente entre las distintas
resoluciones ms empleadas en la actualidad.

Figura 3.4 Comparacin de resoluciones estndar de vdeo
En este estudio nos centraremos en las siguientes cuatro resoluciones de vdeo digital
configuradas en el sistema de codificacin PAL:
Resolucin estndar SD: El tamao del fotograma es de 720x576 pxeles con una
velocidad de 25 f.p.s. para el formato PAL. Esta resolucin es la empleada en los DVDs
y los canales estndar de TDT (SDTV).


52

Resolucin HD -TDT: El tamao del fotograma es 1024x768 pxeles con una velocidad
de 25 f.p.s. para el formato PAL. Esta resolucin es la empleada en los canales HD de
las cadenas privadas de la TDT en Espaa (como son MEDIASET y A3MEDIA), aunque
esta resolucin no est considerada alta definicin.

Resolucin HD 720p: El tamao del fotograma es 1280x720 pxeles con una
velocidad de 25 f.p.s. para el formato PAL. Esta resolucin est considerada como alta
resolucin y se considera la frontera entre el HD y el SD.

Resolucin FULL HD 1080i: El tamao del fotograma es 1920x1080 pxeles con una
velocidad de 25 f.p.s. para el formato PAL. Esta resolucin es la empleada en los
canales de TDT de alta resolucin (HDTV), en los Blu-Ray y en los HD DVD.
3.1.1.5 PSNR
La relacin pico a pico de seal a ruido PSNR, define la relacin entre la energa mxima de la
seal y la del ruido, es muy usada para medir la calidad de una imagen reconstruida de la
codificacin; la PSNR de una imagen viene dada por:
= 10
10


donde MAXERR denota el mximo valor absoluto de la diferencia de la componente de color y
MSE es el error cuadrtico medio.
En esta medida, al comparar dos imgenes, el valor del PSNR vara segn la similitud que hay
entre las dos imgenes, por esto, si el valor del PSNR es alto, la diferencia entre las dos
imgenes es menor y viceversa.
En la figura 3.5 se observa el valor del PSNR al comparar dos imgenes. Los colores reflejan el
valor del PSNR en cada pxel de la imagen, valores de orden creciente: rojo, amarillo, verde,
azul, negro. Siendo el rojo el valor ms pequeo de PSNR, por tanto la diferencia ms grande
entra las dos imgenes y el negro el valor ms alto del PSNR, donde existe menor diferencia.

Figura 3.5 Valores PSNR de la comparacin entre dos imgenes

53

3.2 TASA DE BITS PARA OCA
En este formato se genera un solo flujo de vdeo proveniente del DSP, que fusiona dos
imgenes en una del tipo cromtico anaglfico, por lo tanto el flujo de bits resultantes estar
dentro de lo normal para vdeos de calidad SD o HD, es decir en un mximo de 4Mbps para
definicin estndar y 14 Mbps para alta definicin.
En la figura 3.6 se muestran cuatro fotogramas del vdeo en formato cromtico anaglfico
sobre el que se ha realizado el estudio de la tasa de bits.


Figura 3.6 Fotogramas vdeo formato cromtico anaglfico
A continuacin se muestra el resultado del estudio de las tasas de bits asociadas a las
diferentes resoluciones:
Resolucin 720x576:

Figura 3.7 Tasa de bits para un vdeo OCA de resolucin SD

48
48,5
49
49,5
50
50,5
51
51,5
52
1500 2000 2500 3000
P
S
N
R

(
Y
)

(
d
B
)
Bitrate (kbps)
720x576

54

Resolucin 1024x768:

Figura 3.8 Tasa de bits para un vdeo OCA de resolucin HD-TDT
Resolucin 1280x720:

Figura 3.9 Tasa de bits para un vdeo OCA de resolucin 720p







50,5
51
51,5
52
52,5
53
3000 3500 4000 4500 5000 5500
P
S
N
R

(
Y
)

(
d
B
)
Bitrate (kbps)
1024x768
50,5
51
51,5
52
52,5
53
53,5
3500 4000 4500 5000 5500 6000 6500
P
S
N
R

(
Y
)

(
d
B
)
Bitrate (kbps)
1280x720

55

Resolucin 1920x1080:


Figura 3.10 Tasa de bits para un vdeo OCA de resolucin 1080i
3.3 TASA DE BITS PARA CSV
Si bien es cierto que para este formato existen dos posibilidades, ambas generan 2 flujos de
datos que sern transportados y transmitidos de diferente manera, por ello en este sistema se
demandan muchos recursos respecto a la tasa de bits, es decir se genera un flujo doble al
convencional, lo cual significa que para definicin estndar se genera alrededor de 6 Mbps y
en alta definicin 28 Mbps.
3.4 TASA DE BITS PARA CFC+
Como se estudi en el estndar de compresin, existen varios perfiles y modos de codificacin
para imgenes de alta definicin. En el caso de este estudio, se realiza el anlisis de la tasa bits
tomando en cuenta una resolucin de vdeo 720p (1280x720) y 1080i (1920x1080), el perfil
High y una configuracin SbS (Side by Side). En la figura 3.11 se muestra un fotograma del
vdeo analizado.

Figura 3.11 Fotograma de vdeo en configuracin SbS
53
53,2
53,4
53,6
53,8
54
54,2
54,4
8000 9000 10000 11000 12000 13000 14000 15000
P
S
N
R

(
Y
)

(
d
B
)
Bitrate (kbps)
1920x1080

56

La tasa de bits resultante correspondientes a 720p y 1080i se exponen a continuacin en las
figuras 3.12 y 3.13 respectivamente.

Figura 3.12 Tasa de bits en 720p

Figura 3.13 Tasa de bits en 1080i
3.5 TASA DE BITS PARA V+D
El anlisis en este caso se realiza para las dos posibilidades expuestas en 2.5.2.1 y 2.5.2.2. Es
importante sealar que para este y todos los formatos que incluyan profundidad (MVD, LDV,
DES), la eficiencia de las tasas de transmisin ser mayor mientras los mapas de profundidad
sean mejor estimados y ms exactos.
3.5.1 TASA DE BITS PARA MPEG-C PARTE 3
En este caso, el codificador trabaja en dos partes la primera obedece a una imagen normal en
2D que puede tener relacin con los bitrate expuestos anteriormente dependiendo si esta
tiene alta definicin o definicin estndar. Y la segunda parte trabaja sobre el mapa de
profundidad asociado a la imagen normal.
45
45,5
46
46,5
47
47,5
48
48,5
49
3500 4000 4500 5000 5500 6000 6500
P
S
N
R

(
Y
)

(
d
B
)
Bitrate (kbps)
1280x720
49
49,5
50
50,5
51
51,5
52
52,5
8000 9000 10000 11000 12000 13000 14000 15000
P
S
N
R

(
Y
)

(
d
B
)
Bitrate (kbps)
1920x1080

57

Suponiendo una seal de vdeo de definicin estndar promedio de entre 3 y 4 Mbps para la
seal 2D, el codificar su mapa de profundidad requerira las tasas que detalla la figura 3.14.

Figura 3.14 Tasa de bits al codificar el mapa de profundidad
En la figura 3.14 se muestran tasas para diferentes codificaciones, incluyendo algunas
versiones del MPEG-4, si se toma en cuenta la versin ms reciente se observa que para un
valor de PSNR de 46.29 dB se requieren alrededor de 105 Kbps, apenas un 3.5% de la seal 2D.
En general se observa que esta informacin se codifica por debajo del 20% de la informacin
de color, vale recalcar que se puede aplicar a vdeos en HD, obviamente sabiendo que se
tendr mayor tasa de bits para el mapa de profundidad.
Estimando las tasas de bits para un vdeo SD, que en promedio puede tener 3.5 Mbps, y
considerando una PSNR de 42 dB (5% de la informacin de color), para una buena calidad:

+
=

= 3500 +125 = 3625


Estimando las tasas de bits para un vdeo HD, que en promedio puede tener 12 Mbps, y
considerando una PSNR de 40 dB (8% de la informacin de color), para una buena calidad:

+
=

= 12000 +960 = 12960


3.5.2 TASA DE BITS PARA VDEO AUXILIAR - H.264
En este caso se genera un solo flujo de datos, la relacin entre las tasas de bits del vdeo 2D y
de la profundidad tiene una proporcin similar al caso anterior, por debajo del 15%, no
obstante al usar un solo codificador, representa una optimizacin y un ahorro para los
sistemas de recepcin. Las pruebas realizadas para este esquema se han hecho bajo la LDTV
(Low Definition TV), usando el one-seg, es decir, vdeos de tasas que van desde 250 Kbps hasta
1500 Kbps aproximadamente, con una resolucin de 480x272 pxeles a 30 f.p.s., las pruebas se
han realizado variando algunos parmetros del codificador como el GOP (ver figura 3.16).

58


Figura 3.15 Vista izquierda y su correspondiente mapa de profundidad
En la figura 3.15 se representan la seal de vdeo de la vista izquierda (V_L) y el mapa de
profundidad de la vista izquierda (D_L), dependiendo del valor del parmetro GOP (Group of
Picture) asignado:


Figura 3.16 Tasa de bits al codificar el mapa de profundidad
En este caso se cuenta con un vdeo LDTV, que a 37 dB de PSNR, tiene una tasa de 1500 Kbps, y
cuyo mapa de profundidad se codifica alrededor de los 100 Kbps Con esto, se obtiene una
seal fcilmente manejable dentro de los rangos de vdeos convencionales, en general se
observa que la tasa de transmisin en este formato crecer entre un 5 y un 10%. Para una
seal SD estimando que la profundidad toma un 7% de la informacin de color, la tasa oscilara
entre los 3.21 Mbps y 4.28 Mbps.
Si bien es cierto no se presentan resultados en los casos de HD y SD, la relacin de las tasas de
bits es proporcional de acuerdo al incremento de la calidad.
Es necesario sealar que es posible utilizar la extensin MVC de H.264, para codificar
profundidad, es decir haciendo que MVC trabaje con dos vistas y una de ellas sea la
informacin de profundidad; y por otro lado codificar la profundidad basndose en Platelet
18
.
En todos los casos se genera un solo flujo de bits ya que la informacin de color y la de
profundidad se procesan en el mismo cdec H.264.

18
Algoritmo Platelet: se basa en el modelamiento de las superficies de los mapas de profundidad como
funciones matemticas definidas por intervalos.

59

3.6 TASA DE BITS PARA MVC
A continuacin se detallar el uso de MVC en multivista con al menos informacin L+R (ver
figura 3.17), donde las exigencias son mayores pero de igual forma la calidad es superior.
Como se coment anteriormente, el MVC es adaptable a n vistas (n>2). La mayor cantidad de
pruebas se han realizado para n=2. A continuacin en la figura 3.18 se presenta los resultados
para n=2. Para el caso de 2 vistas los parmetros de prueba han sido: 480x272 de resolucin,
se presentaron 235 frames a 30 f.p.s., CABAC y GOP =16.

Figura 3.17 Vista izquierda y derecha de una imagen estreo

Figura 3.18 Tasa de bits al codificar con MVC y n=2
La figura anterior muestra tanto el resultado para MVC como para AVC Simulcast y AVC Stereo
SEI, debido a que MVC surge como una mejora para codificar 2 vistas que anteriormente se
codificaron independientemente.
De la Figura 3.18 se puede observar que a 34 dB, MVC codifica dicha secuencia a 1500 Kbps,
entonces a partir de estos datos se obtiene el Factor Q:
480272 = 130560


130560

30

= 3916800



60

= 1500

1
3916800

= 0.357434


Con dicho Factor Q se estima la tasa de bits para una seal SD (720x576):
720576 = 414720


414720

30

= 12441600

= 12441600

0.357434

= 4.447
De igual forma, con el mismo Factor Q se estima la tasa de bits para una seal 1080i
(1920x1080):
19201080 = 2073600


2073600

30

= 62208000

1080
= 62208000

0.357434

= 22.23
Las tasas de bits obtenidas corresponden a un nivel muy alto de calidad de imagen debido a
que el valor del Factor Q obtenido est muy por encima del valor correspondiente a una
calidad de imagen ptima (Q=0,25). Por estas razones los valores de las tasas de bits resultan
muy elevados para las resoluciones 720p y 1080i.
Tomando en cuenta otros datos experimentales, la figura 3.20 muestra las tasas en las
siguientes condiciones: n=8 vistas, 640x480, 320 cuadros presentados a 30 f.p.s., GOP=16 y
CABAC.

Figura 3.19 Imagen grabada con 8 cmaras espaciadas 20cm entre ellas

61


Figura 3.20 Tasa de bits al codificar con MVC y n=8
Por lo tanto aplicando el mismo anlisis para n=8, la estimacin de la tasa de bits en SD y en
HD 1080i a 37dB es:
640480 = 307200


307200

30

= 9216000


= 1500

1
9216000

= 0.1628

= 12441600

0.1628

= 2.025

1080
= 62208000

0.1628

= 10.13
3.7 TASA DE BITS PARA MVD
El anlisis aqu se basa en que se obtendra una tasa superior a la del MVC en un 5% por vista
de profundidad existente, sin embargo al considerar a la profundidad como una vista ms en el
codificador y contando con algoritmos y mtodos de inter-correlacin ms eficientes la tasa de
bits requerida no es excesiva. La figura 3.22 muestra resultados experimentales considerando
un vdeo de 1024x768, un GOP=15, CABAC, 30 cuadros por segundo, con 100 cuadros
presentados.
31
32
33
34
35
36
37
38
400 600 800 1000 1200 1400 1600
P
S
N
R

(
Y
)

(
d
B
)
Bitrate (Kbps)
MVC n=8

62


Figura 3.21 Fotograma de la vista izquierda con su correspondiente mapa de profundidad

Figura 3.22 Tasa de bis al codificar con MVD
3.8 TASA DE BITS PARA LDV
LDV muestra un ahorro respecto a MVD debido a que la informacin adicional al vdeo de color
no requiere de grandes tasas de bits, y pueden no representar un exceso sobre las tasas hasta
ahora estudiadas; LDV resulta una mejora y las pruebas realizadas siempre hacen referencia a
la comparacin de los formatos MVD y LDV.

38,2
38,4
38,6
38,8
39
39,2
39,4
39,6
39,8
40
1500 1700 1900 2100 2300 2500
P
S
N
R

(
Y
)

(
d
B
)
Bitrate (Kbps)
MVD

63


Figura 3.23 Vistas izquierda y derecha con sus mapas de profundidad asociados
En la figura 3.24 se representan los resultados experimentales para LDV. Con los datos de la
figura 3.24, estimando la tasa de bits para un vdeo de 1024x768 a 16.67 f.p.s. a 38 dB con la
seal SD se tiene:

= + +. +

= 12441600

0.05 +0.039 +0.025 +0.02

= 1.67

Figura 3.24 Tasa de bits al codificar con LDV
3.9 TASA DE BITS PARA DES
Dado que este formato se codifica mayormente con Platelet, no se realiza un estudio de sus
tasas de bits, no obstante al codificarlo con MVC; el orden de sus tasas de bits es superior al de
V+D en un 5 10%.

64

4 Anlisis de transmisin
Con todo el anlisis anterior, corresponde ahora estudiar el mecanismo por el cual se
transmiten y se difunden las seales concernientes a una seal de vdeo 3D. Son ya conocidas
las posibilidades existentes para crear efecto 3D, por lo tanto es importante el anlisis del
proceso de transmisin para las seales involucradas. Dependiendo del formato y tcnica
elegida es necesario estudiar, cmo se ajustan las tcnicas del estndar con las seales que se
desean transmitir.

Figura 4.1 Arquitectura de transmisin genrica para seales de vdeo 3D
4.1 TRANSMISIN DE LAS SEALES DE 3DTV EN EL ESTNDAR DVB-T
4.1.1 CARACTERSTICAS TCNICAS DE LA RED TDT EN ESPAA
En todos los casos, la imagen, sonido y datos asociados a una emisin de TDT se codifican
digitalmente en formato MPEG-2 MPEG-4 (esta ltima para emisiones en HD), y el flujo
binario resultante de la codificacin se transmite mediante una modulacin de espectro digital
COFDM (Coded Orthogonal Frequency Division Multiplexing), que divide el flujo de
datos binarios en varios miles de sub-flujos.
La norma DVB-T permite canales de 6, 7 u 8 MHz de ancho de banda, define tres modos de
trabajo para el sistema de modulacin COFDM, uno basado en 2048 frecuencias ortogonales,
denominado 2k, otro con 4096 frecuencias, denominado 4k, y el tercero con 6817 frecuencias,
denominado 8k. Cada modo dispone de un nmero de portadoras, unas para pilotos y
sealizacin y otras para transportar informacin. Las portadoras pueden modularse en QPSK
19

(4-QAM
20
), en 16-QAM en 64-QAM. A su vez, cada smbolo tiene una duracin fija en tiempo,

19
QPSK (Quadrature Phase Shift Keying): modulacin por desplazamiento de fase, es una forma de
modulacin angular que consiste en hacer variar la fase de la portadora entre un nmero de valores
discretos.
20
QAM (Quadrature Amplitude Modulation): amplitud modulada en cuadratura, es una tcnica que
transporta datos, mediante la modulacin de la seal portadora, tanto en amplitud como en fase.

65

y se separa del siguiente smbolo por un intervalo de guarda, que puede ser 1/4, 1/8, 1/16
1/32 de la longitud de smbolo.
De acuerdo con el actual Plan Tcnico nacional de la TDT, en Espaa se utiliza la banda de
frecuencias de UHF (470 862 MHz) con 8 MHz de ancho de banda, y el modo de trabajo 8k
(con 6817 portadoras totales, de las cuales 6048 son portadoras de datos).

Figura 4.2 Caractersticas tcnicas de la red TDT en varios pases europeos
El resto de caractersticas tcnicas utilizadas por los operadores de las redes de difusin son las
siguientes:
Modulacin: 64-QAM.

Intervalo de guarda: 1/4 de la longitud del smbolo, lo que resulta en que cada
portadora est separada en 1116 Hz y la duracin del smbolo, ms el intervalo de
guarda, es de 1120 microsegundos (smbolo til de 896 microsegundos e intervalo de
guarda de 224 microsegundos).

FEC (Forward Error Correction): 2/3, es decir, 2 bits son tiles y 1 bit es de redundancia
para corregir, en recepcin, los errores que se producen durante la transmisin.
Con estos parmetros, el ancho de banda efectivo es de 19,91Mbps.
4.1.2 COMPARACIN DE LOS ESTNDARES DVB-T /DVB-T2
DVB-T [Digital Video Broadcasting Terrestrial] es el estndar para televisin digital terrestre
lanzado por DVB Project; en la actualidad cuenta con su segunda versin (DVB-T2), la que
forma parte de la familia de estndares del DVB, compuesta por DVB-T/T2 (para televisin
terrestre), DVB-S/S2 (para televisin satelital), DVB-C/C2 (para televisin satelital), DVB-H/SH
(para televisin en dispositivos mviles), DVB-IPTV (para televisin sobre redes IP), y otra larga
lista de estndares para distribucin y consumo de contenidos multimedia.
Por otra parte las mejoras introducidas en T2 permiten la transmisin transparente de
contenidos estereoscpicos, usando las modulaciones de ltima generacin (ver figura 4.3).

66


Figura 4.3 Canal DVBT2 Con diversas modulaciones adaptadas al tipo de servicio
Las principales caractersticas tcnicas del estndar DVB-T se puede apreciar en la Tabla 4.1.
Tabla 4.1 Estndar DVB - Caractersticas Tcnicas
DVB-T DVB-T2
FEC
Cdigos convolucionales
+ Red Solomon
LPDC + BCH
Tasa de codificacin 1/2, 2/3, 3/4, 5/6, 7/8 1/2, 3/5, 2/3, 3/4, 4/5, 5/6
Modulacin QPSK, 16QAM, 64QAM
QPSK, 16QAM, 64QAM,
256QAM
Canalizacin 5, 6, 7, 8 MHz 1.7, 5, 6, 7, 8, 10 MHz
Intervalos de guarda 1/4, 1/8, 1/16, 1/32
1/4, 19/256, 1/8, 19/128,
1/16, 1/32, 1/128
Tamao de FFT 2k, 8k 1k, 2k, 4k, 8k, 16k, 32k
Pilotos dispersos 8% del total 1%, 2%, 4%, 8% del total
Pilotos continuos 0.35% del total 2.6% del total
Mxima capacidad 31.66 Mbps 50.34 Mbps
4.1.3 EL ESTNDAR DVB 3D TV
En Julio de 2010 el proyecto DVB public una serie requerimientos comerciales para la
implementacin exitosa de una modelo de emisin de contenidos 3D sobre TDT. En este
documento se hace nfasis en la importancia de mantener la compatibilidad con los
decodificadores (STB
21
) en uso, as como tambin con la infraestructura existente desplegada
por los operadores, de tal manera que pudiesen utilizar sus canales HD existentes para
transmitir contenidos 3D, de manera exclusiva, sin afectar a los subscriptores que no quisieran
usar dicho servicio (DVB, 2010). Se esperaba que los consumidores necesitaran un periodo de
adaptacin, para tener un primer acercamiento a los nuevos contenidos y que posteriormente
demandaran mayor calidad y prestaciones.

21
STB (Set Top Box): Receptor de televisin o Decodificador, es el nombre con el que se conoce el
dispositivo encargado de la recepcin y opcionalmente decodificacin de seal de televisin analgica o
digital (DTV), para luego ser mostrada en un dispositivo de televisin.

67

Finalmente, en febrero de 2011 fue publicado el estndar oficial para la emisin de contenidos
en 3D (DVB 3DTV) (ETSI, 2011). Dicho estndar plantea la evolucin de los servicios de
distribucin de contenido 3D en dos fases:
Fase inicial: Est enfocada en satisfacer las necesidades actuales del mercado y
atender un nmero determinado de casos de uso (ver figura 4.4). Se debe contemplar
el uso, compatibilidad y no perturbacin entre decodificadores (STB) 3D y no 3D
(HDTV), televisores con capacidades 3D y sin ellas (HDTV), y conectores HDMI (1.4a y
anteriores). En algunos casos el usuario deber cambiar su televisor manualmente a
modo 3D, mientras en otros, el decodificador o el televisor debern intentar presentar
al usuario solo la vista del ojo izquierdo.

Figura 4.4 Estndar DVB 3D TV. La parte gris muestra los aspectos tecnolgicos afectados
De igual manera, los contenidos emitidos deben ser compatibles con los STB
capacitados para recibir vdeo 3D presentes en el mercado hoy o requerir a lo sumo
una actualizacin del software de mquina (firmware upgrade), y tener las siguientes
caractersticas: usar la codificacin H.264/AVC; tener una proporcin espacial (aspect
ratio) de 16:9; y usar los formatos 3D Side-by-Side (SbS) y Top-and-Bottom (TaB) de
acuerdo con las siguientes resoluciones y frecuencias:
720p ; 50 Hz TaB
720p ; 50 Hz SbS (Opcional)
1080i ; 25 Hz SbS
720p ; 59,94 / 60 Hz TaB
720p ; 59,94 / 60 Hz SbS (Opcional)
1080i ; 29,97 / 30 Hz SbS
1080p ; 23,98 / 24 Hz TaB
1080p ; 23,98 / 24 Hz SbS

68


Por otra parte, no se define ningn requerimiento especial para el sonido, pero s una
sealizacin especial para indicar la disposicin del cuadro de vdeo de acuerdo con las
resoluciones vistas anteriormente. Asimismo se especifica, en una adicin especial al
estndar DVB, la forma en que se deben gestionar los subttulos en una transmisin 3D
(DVB, 2011). El documento introduce el concepto de disparidad de subttulos
distancia entre una regin de subttulos y el segundo plano (background), que permite
determinar la ubicacin de los subttulos sobre el eje Z, algo que puede cambiar en
cada cuadro (ver figura 4.5).

Figura 4.5 La disparidad permite identificar la distancia a la que se encuentra cada regin sobre la que
se dibujan subttulos.
Segunda fase: Para las generaciones segunda y tercera de esta tecnologa, se espera
la introduccin de nuevos STB con la capacidad de decodificar vdeo H.264 MPEG-4
AVC (Advanced Video Coding) con la extensin MVC (Multiview Video Coding). El
nuevo formato no necesitar ser compatible con los STB actuales, pero s con los
dispositivos compatibles con el vdeo HD estndar. Se espera tambin que las
transmisiones DVB 3DTV incluyan por lo menos una vista HD con la calidad original, de
manera que los dispositivos que no posean la capacidad de procesar el contenido 3D,
an dispongan de un contenido apropiado para ensear al usuario. En esta nueva fase
de la evolucin de los servicios 3D, se abre la posibilidad de transmitir mltiples vistas
estereoscpicas a eleccin del usuario, aprovechando las mejoras en ancho de banda
ofrecidas por la evolucin de DVB, T2 y S2.

69

4.1.4 GENERACIN DEL TRANSPORT STREAM Y MULTIPLEXACIN
Con respecto al formato, est claro que se pueden originar uno o varios flujos de seales
digitales que deben configurar el Transport Stream
22
(TS), estos sern posteriormente
codificados, modulados y transmitidos. DVB-T establece un tipo de empaquetamiento basado
en la norma MPEG-2, es decir ajustndose a la sealizacin, cabeceras y secuencias para audio
y vdeo.
De lo ya estudiado, hay algunos formatos que originan una sola seal de vdeo, que dentro de
su concepcin ya viene sealizada e identificada de acuerdo a la informacin que corresponda,
en algunos formatos el codificador puede incluir un multiplexor, haciendo que si existen
mltiples seales estas se codifiquen y se genere un nico flujo de transporte TS. En otro caso
cada seal eventualmente puede ser introducida al multiplexor final, todo esto depender de
la disponibilidad de equipos en el mercado y del soporte para tal cantidad de entradas.
4.1.4.1 Empaquetamiento y generacin del TS con MPEG-2
MPEG-2 establece algunas normas para generar los elementos que van a ser multiplexados
posteriormente, tanto para audio como para vdeo, MPEG-2 establece que el flujo de
transporte TS va acompaado de su audio respectivo, por lo tanto en el caso de seales
mltiples de vdeo como es en la 3DTV se puede duplicar el audio o ahorrar ese espacio.
Parte importante de la cabecera del TS es el PID (Packet Identification), los paquetes de TS
pueden traer informacin de programas diferentes, adems de datos para la reconstruccin de
la informacin. Aparece este campo de 13 bits que permite la distincin de paquetes de
diferentes Elementary Streams (ES). De los 2
13
valores posibles, hay 17 reservados para
funciones especiales. Esto permite 8175 valores que son asignables a todos los otros ES que
forman el TS. El multiplexor tiene que garantizar que cada ES tenga un nico PID. La normativa
MPEG no especifica qu valores de PID se tienen que dar a los ES (a excepcin de los 17
mencionados). Con la cabecera incluida el Transport Stream se estructura como lo detalla la
figura 4.6.

Figura 4.6 Generacin del Transport-Stream

22
Transport Stream es un protocolo de comunicacin para audio, vdeo y datos especificado en los
estndares de MPEG-2. Los flujos binarios de vdeo y audio de cada programa se comprimen
independientemente formando cada uno de ellos una corriente elemental

70

El Mltiplex MPEG-2 Transport Stream puede contener varios programas audiovisuales, cada
uno de los cuales est compuesto por uno o varios flujos elementales PES
23
distribuidos en
paquetes de transporte. Estos paquetes a su vez estn marcados con un PID que identifica a
qu flujo elemental pertenecen.
Sin embargo, para que el decodificador pueda recuperar completamente un programa a travs
de los valores de los PID de los paquetes correspondientes, es necesario incluir informacin
adicional dentro del flujo de transporte que relacione estos PID con los programas a que
pertenecen. Tal informacin se denomina Informacin Especfica de los Programas o
Program Specific Information (PSI).
Esta Informacin Especfica de los Programas (PSI), definida por MPEG-2 para la Capa de
Sistema (ISO/IEC 13818-1), comprende la inclusin dentro del flujo de transporte, de 4 tipos de
tablas:
Program Association Table (PAT): Esta tabla, de inclusin obligatoria, es transportada
por los paquetes con PID=0x0000 y contiene una lista completa de todos los
programas disponibles en el Transport Stream.

Contitional Access Table (CAT): Esta tabla debe estar presente si al menos un
programa del mltiplex es de acceso condicional. Se transporta por los paquetes con
PID=0x0001, y proporciona detalles de los sistemas de cifrado empleados, as como los
valores de los PID de los paquetes de transporte que contienen la informacin del
control de acceso condicional.

Program Map Table (PMT): Cada programa audiovisual incluido en un Transport
Stream tiene una tabla PMT asociada con l. Dicha tabla proporciona detalles acerca
del programa y de los flujos elementales que comprende.
La Informacin del Servicio o Service Information (SI), en sistemas DVB (ETS 300 468)
incluye, adems, otros 4 tipos de tablas de insercin obligatoria dentro del Transport Stream y
3 tipos de tablas opcionales:
1) Obligatorias:

Network Information Table (NIT): Esta tabla proporciona informacin acerca de la red
fsica usada para transmitir el Transport Stream, como por ejemplo: frecuencias del
canal, detalles del transpondedor del satlite, caractersticas de modulacin, detalles
de redes alternativas disponibles, etc. Se transporta por los paquetes identificados con
PID=0x0010.

Service Description Table (SDT): Contiene datos que describen los servicios en el
sistema, como por ejemplo: nombres de los servicios, nombre del proveedor y otros

23
PES (Packed Elementary Streams): Los flujos comprimidos elementales de Vdeo y Audio se
empaquetan formando los flujos elementales empaquetados PES de vdeo y audio respectivamente. Los
paquetes de los flujos PES son de longitud variable.

71

parmetros asociados a cada servicio de un mismo mltiplex. Se transporta por
paquetes identificados con PID=0x0011.

Event Information Table (EIT): Se utiliza para transmitir informacin relativa a los
acontecimientos en curso o futuros en el mltiplex MPEG recibido en la actualidad, y
eventualmente sobre otros mltiplex MPEG, tal como: denominacin, hora de
comienzo, duracin, etc. Se transporta por los paquetes identificados con PID=0x0012.

Time & Date Table (TDT): Esta tabla proporciona informacin relativa a la hora y fecha
del momento, y se utiliza para poner en hora el reloj interno del receptor. La citada
informacin se incluye en una tabla especfica debido a las frecuentes actualizaciones
de la misma. Se transporta por paquetes identificados mediante PID=0x0014.

2) Opcionales:

Bouquet Association Table (BAT): El trmino bouquet se usa para referirse a una
Coleccin de servicios comercializados como entidad nica. Las tablas BAT
proporcionan informacin relativa a los bouquets. Adems de informar del nombre
del bouquet aportan la lista de los servicios disponibles en cada bouquet. Se
transportan por paquetes identificados con PID=0x011.

Running Status Table (RST): Las tablas RST actualizan de forma rpida la informacin
relativa a la situacin de un acontecimiento (que est o no sucediendo). Se transmiten
una sola vez y no de forma repetitiva por los paquetes identificados mediante
PID=0x0013.

Time Offset Table (TOT): Proporciona informacin relativa a la fecha y hora real as
como a la diferencia horaria local (local time offset). Se actualiza frecuentemente,
siendo transmitida por paquetes identificados con PID=0x0014 (como las TDT).

Stuffing Tables (ST): Estas tablas de relleno se emplean para invalidar tablas que ya
no sirven. Por ello usan paquetes que comparten valores de PID con otros tipos de
tablas: 0x0010; 0x0011; 0x0012 0x0013 y 0x0014.
Cada tabla est constituida, segn su importancia, por una o varias secciones (256 como
mximo, con una longitud mxima de 1.024 bytes excepto para tablas tipo Private y EIT
que pueden alcanzar los 4.096 bytes). Dichas secciones estn distribuidas a lo largo de una
serie de paquetes de transporte identificados con un PID comn.
4.1.4.2 Multiplexacin MPEG-2 para seales 3DTV que contienen mltiples
informaciones
De lo ya estudiado est claro que en ciertos formatos, al utilizar ms de un codificador se
genera ms de un flujo de de datos, y por ello estos deben ser obligatoriamente multiplexados
si se quiere que se transmitan bajo la misma plataforma.

72

Existen otros formatos tambin que, si bien es cierto generan mltiples seales, tambin
pueden contener la etapa de multiplexacin en el propio codificador, ya que agregan all su
sealizacin y sincrona correspondiente, lo cual sera recuperado sin problema por el
correspondiente decodificador. El formato que utiliza este tipo de multiplexacin es el de Dual
Streaming, considerando que los flujos pueden ser de seales L+R o de Vdeo y profundidad.
Con esto los formatos que despus del codificador generan mltiples flujos son:
Dual Streaming L+R.
MPEG-C parte 3.
MVC sin multiplexacin en el codificador (tpicamente para n=2).
En estos casos la multiplexacin se estructura como lo detalla la figura 4.7.

Figura 4.7 Multiplexacin de vistas en dual Streaming
Se observa que las vistas izquierda y derecha se alternan en el MUX y se los provee de sus PID
y PMT (Program Map Tables) para identificarlos y poder demultiplexarlos en recepcin; el
audio se multiplexa despus del vdeo izquierdo o si se requiere cada vdeo puede ir
acompaado del audio de forma idntica al TS de MPEG-2 para televisin 2D.
Para el caso de MPEG-C parte 3 el esquema es idntico y el Transport Stream se estructura de
forma similar (ver figura 4.8), la diferencia radica en que no se usa vdeo derecho sino
profundidad lo que hace que el codificador genere un cuadro de menos bitrate y el Mux
alterne, entre cuadros L de mayor tamao que los de profundidad, y los propios cuadros
depth.

Figura 4.8 Multiplexacin de vistas izquierda + profundidad
Para MVC el multiplexor generaliza su aplicacin a n vistas, aunque lo ms tpico sean 2,
obteniendo mejor compresin por la relacin intervista. Dado el panorama actual de la TDT, es
recomendable que para seales 3D se ofrezca al multiplexor de audio, vdeo y datos un solo
flujo para no alterar la arquitectura actual.

73

Actualmente la multiplexacin se usa estableciendo grupos de entrada por canal de TV (1
vdeo, 1 audio, datos). En nuestro caso, si la 3DTV requiere ms de una seal de vdeo para la
entrada se tienen dos opciones: un Multiplexor previo para entregar un solo flujo (ver figura
4.9), u ocupar un solo Multiplexor antes de la transmisin ocupando el espacio que ocuparan
varios programas de TV (ver figura 4.10).

Figura 4.9 Multiplexacin de canales 2D y 3D con un solo Multiplexor


Figura 4.10 Multiplexacin de canales 2D y 3D con varios Multiplexores
4.1.5 CODIFICACIN MODULACIN Y TRANSMISIN DE LA SEAL DE TV-3D
Una vez generado el TS final, el estndar DVB-T establece una serie de procedimientos hasta
llegar a la modulacin y difusin de la seal digital.
La secuencia de etapas despus del TS son: codificacin de canal, modulacin y etapa de
radiofrecuencia o difusin. La codificacin de canal (RS 204-188-8), y modulacin con su
respectivo FEC se realiza de forma idntica a las seales monoscpicas, as como la generacin
de tramas OFDM para su transmisin.
Est claro que el tipo de modulacin, tasa de FEC, relacin entre el tiempo til y tiempo de
guarda, al repercutir directamente con la tasa de bits que se soporta, deben ser analizados en
que combinacin se pueden cumplir los requerimientos que una seal 3DTV exige. A
continuacin se analiza las caractersticas del DVB-T que concuerdan con los requerimientos de
la seal 3D para sus distintos formatos.

74

4.1.5.1 Estructura de trama OFDM
La seal transmitida se organiza en tramas. Cada trama tiene una duracin T
F
y consiste de 68
smbolos OFDM. Cuatro tramas constituyen una sper-trama. Cada smbolo est constituido
por un conjunto de K=6817 portadoras en el modo 8K, o K=1705 portadoras en el modo 2K, y
es transmitido con una duracin T
S
. Se compone de dos partes: una parte til T
U
y un intervalo
de guarda de duracin D. El intervalo de guarda consiste en una continuacin cclica de la parte
til y se inserta previa a ella. Hay cuatro valores posibles para el intervalo de guarda que se
vern ms adelante.
A continuacin veremos una serie de tablas con parmetros de modulacin para canales de 8
MHz, segn la norma DVB-T:
Tabla 4.2 Nmero de portadoras

Duracin de la parte de smbolo para los intervalos de guarda permitidos en canales de 8MHz:
Tabla 4.3 Intervalos de guarda

En la tabla 4.4 se pueden observar las tasas de transmisin asociadas a una determinada
modulacin, intervalo de guarda y FEC:
Tabla 4.4 Tasas de transmisin en DVB-T (en Mbps)


75

Todo depende de la tasa que ocupen las seales de TV, es decir, de qu calidad se requiere,
para segn eso acomodar las tcnicas y obtener valores coherentes segn la tabla 4.4; y con
ello lograr utilizar los 8 MHz de forma eficiente.
4.1.5.2 Seales de TV-3D en las tramas OFDM
De acuerdo a las caractersticas antes expuestas compete ahora analizar la relacin entre las
mismas y las seales de 3DTV, evidentemente esta informacin no puede ser tratada
simplemente como una SDTV HDTV. Entonces corresponde analizar las tasas de bits que cada
formato requiere y as poder estimar el valor del ancho de banda que va a ser utilizado.
En la Tabla 4.5 se muestra un resumen de las tasas de transmisin de los diferentes formatos
de 3DTV.
Tabla 4.5 Tasas de transmisin en DVB-T para los formatos de 3DTV
FORMATO BIT-RATE 2D BIT-RATE 3D % PSNR
OCA
SD: 3.5 Mbps SD: 4 Mbps 14.28 36
HD: 7 Mbps HD:8 Mbps 14.28 42
CSV
SD: 4 Mbps SD: 4 Mbps x 2 = 8 Mbps 100 36
HD: 8 Mbps HD: 8 Mbps x 2 = 16 Mbps 100 42
CFC+
HD: 8 Mbps HD: 8 Mbps 0 42
V+D
MPEG-C PARTE 3
SD: 3.5 Mbps SD: 3.625 Mbps 10 42
HD: 12 Mbps HD: 12.960 Mbps 10 40
AUX VIDEO H.264
SD: 4 Mbps SD: 4.28 Mbps 7 40
HD: 8 Mbps HD: 8.56 Mbps 7 40
MVC
SD: 3 Mbps SD: 3.729 Mbps 8 40
MVD
SD: 4 Mbps SD: 4.635 Mbps 15 40
LDV
SD: 3 Mbps SD: 3.44 Mbps 8.7 42
DES
SD: 4 Mbps SD: 4.52 Mbps 8.8 42

Es decir, las seales 3D con formatos de calidad aumentan la tasa de un canal de TV-2D entre
un 10 y un 15%. Por otro lado, los formatos ms compatibles y ms fciles de implementar
pueden llegar a incrementar en un 100% los requerimientos.
Con todo esto, si queremos introducir en una trama OFDM una seal de 3DTV depender del
formato, de la calidad y del vdeo mismo. Por ejemplo usando 64 QAM con FEC de 2/3, que es
lo que tpicamente se utiliza en la TDT en Espaa, tendremos una trama capaz de soportar
19.91 Mbps. As se puede variar los parmetros y, dependiendo del formato, adecuar a la
trama a la seal de vdeo 3D.

76

4.2 TRANSMISIN DE LAS SEALES 3DTV SOBRE IPTV
4.2.1 CONCEPTOS SOBRE IPTV
El trmino IPTV (Internet Protocol Television) hace referencia a sistemas de distribucin de
seales de televisin o vdeo utilizando conexiones de banda ancha sobre el protocolo IP.
Desde el punto de vista del usuario, un sistema IPTV funciona de igual forma que los servicios
de pago por visin (satlite, cable); pero para el proveedor de servicio, IPTV incluye la
adquisicin, procesado y envo seguro de contenidos audiovisuales sobre una infraestructura
de red basada en IP. Las caractersticas principales de los sistemas IPTV son:
Soporte para la televisin interactiva. Los sistemas IPTV soportan el uso de
aplicaciones interactivas como la gua electrnica de programacin, juegos
interactivos, posibilidad de cambiar los ngulos de visin o navegar por Internet a alta
velocidad.

Personalizacin. Los sistemas IPTV permiten personalizar los hbitos televisivos, los
usuarios deciden qu es lo que quieren ver y cundo lo quieren ver.

Accesible en varios dispositivos. Los servicios IPTV no estn limitados a su uso en
televisores, los clientes pueden utilizar ordenadores personales y dispositivos mviles
para acceder a los distintos servicios.

Poco ancho de banda requerido. En lugar de realizar el envo de todos los canales
disponibles a cada usuario, las tecnologas IPTV permiten enviar slo el canal que el
usuario ha solicitado.

Posibilidad de integrar el servicio de televisin con otros servicios basados en IP.
Como los servicios de voz sobre IP o navegar por Internet a alta velocidad.
El trmino IPTV se suele confundir con el trmino Televisin por Internet o Internet TV.
Aunque ambos entornos utilizan la tecnologa IP para realizar el envo de contenidos, hay
varias diferencias entre ellos.
La principal diferencia es que la Televisin por Internet utiliza la red pblica Internet para la
transmisin de datos, mientras que IPTV utiliza redes privadas. Estas redes tienen una
extensin geogrfica limitada y suelen ser propiedad del proveedor de servicios, lo que
permite construir los sistemas de forma que den soporte a servicios de alta definicin. El
problema de la transmisin de servicios a travs de Internet es que, al tratarse de una red
pblica, no se tiene control sobre los elementos de la red y, por tanto, no se puede garantizar
la disponibilidad de los servicios ni una calidad mnima de los mismos.
Otra diferencia entre ambas es el mecanismo de acceso a los contenidos. En el caso de
Internet es necesario disponer de un PC, mientras que en los sistemas IPTV se suele utilizar un
decodificador (set-top box) para acceder a los distintos servicios.

77

4.2.1.1 Estructura general de un sistema IPTV
A lo largo de los ltimos aos se han desarrollado varias arquitecturas de red para
proporcionar servicios IPTV, siendo posible su implementacin en redes de fibra ptica, redes
ASDL, redes inalmbricas e incluso sobre Internet.
A menudo se suministra junto con el servicio de conexin a Internet, proporcionado por un
operador de banda ancha sobre la misma infraestructura, pero con un ancho de banda
reservado a tal propsito. Por ello, se requiere un mnimo de al menos unos 4 Mbps para
poder recibir la seal de TV comprimida segn el formato MPEG-2 o MPEG-4, algo que se
consigue fcilmente con los estndares de ADSL
24
, como son ADSL2 y ADSL2+, que pueden
llegar hasta 20 Mbps en bajada, sobre el bucle de abonado, si la distancia a la central
telefnica que provee el servicio no es muy elevada.
La capacidad estimada para servicios IPTV, utilizando tecnologa MPEG-4 para la
codificacin/compresin de la seal de vdeo, est entre 1 y 2 Mbps por cada canal de
definicin estndar (SDTV) y 7-8 Mbps por cada canal de alta definicin (HDTV). Para dos
canales simultneos el ancho de banda bruto resultante es de 2-4 Mbps para un servicio
bsico
25
8-10 Mbps si se incluye un canal HDTV. En la tabla 4.6 se observan los anchos de
banda promedio para los formatos MPEG-2 y MPEG-4.
Tabla 4.6 Anchos de banda referenciales requeridos para IPTV

MPEG-2 MPEG-4
Standard Definition (SD) 4 Mbps 1,5 Mbps
High Definition (HD) 15 Mbps 8 Mbps
La modalidad de oferta de IPTV puede ser de difusin en directo (streaming), igual que la
actual televisin digital TDT, de descarga bajo demanda (VoD
26
) o de Pay Per View
27
, y se
puede ver, bien en un PC o en un televisor convencional, al que se le ha colocado un
decodificador (set top-box) que descomprime y decodifica la seal de vdeo para presentrsela
al usuario.

24
ADSL (Asymmetric Digital Subscriber Line): Tecnologa de acceso a Internet de banda ancha que utiliza
la lnea telefnica convencional para realizar la transmisin de los datos.
25
Paquete Bsico (2 canales SDTV)
26
VoD (Video on Demand): El vdeo bajo demanda es el envo de programacin de vdeo a los usuarios
en el momento en que lo soliciten. Suele incluir funciones de pausa, avance y retroceso rpido de
contenidos.
27
Pay Per View (PPV): Canales de pago por visin

78


Figura 4.11 Arquitectura general de la red IPTV
4.2.2 TCNICAS DE TRANSMISIN EN SISTEMAS IPTV
El envo de streams de vdeo sobre redes IP se puede realizar utilizando tres tcnicas distintas
denominadas broadcast, unicast y multicast.
4.2.2.1 Unicast
La tcnica de transmisin unicast realiza el envo de contenidos creando conexiones
individuales entre el centro de datos y el decodificador de usuario. Por ejemplo, si cuatro
usuarios desean acceder al mismo canal, se deben crear cuatro conexiones punto a punto
desde el centro de datos hasta el decodificador de cada usuario a travs de la red IP. Desde el
punto de vista tcnico es el mecanismo ms sencillo de implementar, pero presenta el
inconveniente de que no realiza un uso efectivo del ancho de banda de la red.
Como se puede observar en la figura 4.12, cuando varios usuarios acceden al mismo canal a la
vez, se crean tantas conexiones dedicadas a travs de la red como usuarios desean acceder al
canal. En este ejemplo el servidor necesita enviar cuatro streams distintos para realizar el
envo del canal desde el centro de datos al decodificador de cada usuario. Las conexiones
creadas se extienden sobre dos oficinas regionales con dos conexiones dedicadas entre el
centro de datos y cada oficina. Tambin se establecen conexiones entre los routers de las
oficinas regionales y las puertas de enlace residenciales instaladas en los domicilios de los
abonados.
En los entornos de tipo unicast, donde se necesitan muchas conexiones IP, es necesario
disponer de enlaces de red de alta velocidad. Este mtodo de transporte IP se suele utilizar en
aplicaciones de vdeo bajo demanda donde cada usuario conectado recibe un stream nico.

79


Figura 4.12 Transmisin unicast
4.2.2.2 Broadcast
Las redes IP soportan la funcionalidad denominada broadcast donde se emite el mismo stream
de vdeo a todos los dispositivos de acceso conectados a la red, independientemente de si han
solicitado o no el canal. El inconveniente de este modo de envo es que los dispositivos
receptores pierden tiempo procesando paquetes de vdeo no solicitados. Otro inconveniente
que hace inadecuado el uso de broadcast en aplicaciones IPTV es que esta tcnica de
comunicacin no soporta el enrutado. Como las redes IPTV se pueden extender utilizando
routers el uso de broadcast es prohibitivo, la red y los dispositivos receptores se saturaran si
se envan todos los canales a todos los dispositivos receptores.
4.2.2.3 Multicast
El trmino multicast se refiere a la transmisin de una seal de vdeo nica a varios usuarios de
forma simultnea. Como ocurre con la tcnica broadcast, todos los usuarios reciben la misma
seal al mismo tiempo, pero en este caso no hay un stream distinto para cada receptor.
La ventaja ms significativa de su uso en redes IP es la reduccin del ancho de banda necesario
para transmitir contenidos de alta calidad a travs de la red. Esto es as porque slo se enva
un stream a cada router, que se encarga de realizar una copia para cada dispositivo receptor
conectado. Tambin se reduce la carga de procesado del servidor de contenidos ya que slo
transmite una copia del stream al router de distribucin.

80


Figura 4.13 Transmisin multicast
Como se puede observar en la figura 4.13, con el uso de la tcnica multicast slo se enva una
copia del canal sobre cada enlace de red, duplicando el stream cuando los enlaces de red se
dividen. Este mtodo de transmisin reduce considerablemente el nmero de conexiones
necesarias para el envo de contenidos. La tcnica multicast se suele utilizar para emitir
programaciones IPTV en vivo y es una tcnica eficiente para su uso en infraestructuras IPTV.
Sin embargo, la transmisin multicast presenta algunos inconvenientes:
No es posible realizar las acciones de rebobinar, pausa o avance rpido de los
contenidos.

Incrementa la carga de trabajo y procesado de los routers. Los routers deben realizar
copias de los streams para enviarlos a todos los clientes conectados.

Todos los componentes, desde la fuente de contenidos hasta el decodificador de
usuario, deben soportar la tecnologa multicast.




81

4.3 RESULTADOS DE LAS PRUEBAS DE TRANSMISIN
A continuacin se expondr los resultados obtenidos en las pruebas de transmisin de seales
3D tanto en el estndar DVB-T como en IPTV.
Las pruebas de transmisin se han realizado bajo el estndar DVB 3D, ms concretamente, con
las caractersticas de la fase inicial en los servicios de distribucin de contenidos 3D
comentados en el punto 4.1.3.
Se han utilizado dos vdeos 3D con formato CFC+ con la configuracin SbS y TaB, con una
proporcin espacial de 16:9 y usando la codificacin H.264/AVC. En las figuras 4.14 y 4.15 se
muestran los fotogramas de ambos vdeos.

Figura 4.14 Fotograma del vdeo en configuracin SbS

Figura 4.15 Fotograma del vdeo en configuracin TaB
Estos dos vdeos se han codificados con las siguientes resoluciones y frecuencias, tal como
viene detallado en el estndar DVB 3D:
720p @ 50 Hz TaB
720p @ 50 Hz SbS
1080i @ 25 Hz SbS
720p @ 59,94 / 60 Hz TaB
720p @ 59,94 / 60 Hz SbS

82

1080i @ 29,97 / 30 Hz SbS
1080p @ 23,98 / 24 Hz TaB
1080p @ 23,98 / 24 Hz SbS
La codificacin de los vdeos se ha realizado con una calidad alta, es decir, con un Factor Q =
0.2741, obteniendo una tasa de bits de 14209 Kbps para la resolucin 1080i y 6315 Kbps para
la resolucin 720p.
4.3.1 TRANSMISIN DE 3DTV EN EL ESTNDAR DVB-T
Los parmetros DVB-T que se han utilizado en la transmisin son los caractersticos de la
regin de Espaa, emitiendo en el canal 21, es decir:
Tabla 4.7 Parmetros DVB-T utilizados para las pruebas de transmisin
DVB-T
Nmero de canal 21
Frecuencia 474 MHz
Tasa de codificacin 2/3
Modulacin 64QAM
Ancho de banda 8 MHz
Intervalos de guarda 1/4
Modo de transmisin 8k
Ancho de banda efectivo 19.91 Mbps

El ancho de banda efectivo del TS es 19.91 Mbps y las tasas de bits de los vdeos es 14209 Kbps
y 6315 Kbps para 1080i y 720p respectivamente. Para crear la trama de transporte que se va a
emitir, en el multiplexor se pueden incluir los vdeos de la siguiente forma:
Un solo servicio con un vdeo de resolucin 1080i.
Dos servicios, cada uno con un vdeo de resolucin 720p.
Dos servicios: uno con un vdeo de resolucin 1080i y el otro con un vdeo de
resolucin 720p.
4.3.1.1 Medidas de nivel/calidad de la seal COFDM
Antes de mostrar los resultados obtenidos hay definir una serie de parmetros utilizados para
realizar las medidas:
BER: Tasa de bits errneos. Es la relacin que existe entre en n de bits errneos y el
nmero de bits transmitidos. Hay dos tipos de BER, el CBER (antes de FEC) y el VBER
(despus de FEC).

83


Figura 4.16 Tipos de BER
MER: Tasa de errores de modulacin. Es la representacin numrica del vector de
error, que es la diferencia entre la seal patrn que debera recibirse y la seal con
errores que realmente recibe.

C/N: Relacin portadora a ruido. Es una expresin del ruido agregado por el
modulador en los amplificadores y otros componentes activos de los sistemas de
distribucin.
A continuacin se muestran los valores mnimos requeridos para la correcta recepcin de
servicios de difusin de TV en Alta Definicin:
Tabla 4.8 Valores para la correcta recepcin
28

DVB-T
POTENCIA 45 70 dBV
C/N 25 dB
MER > 20 dB
CBER < 1x10
-2
VBER < 2x10
-4

Una vez explicados los parmetros utilizados para medir la calidad de la seal OFDM, se
procede a mostrar los resultados obtenidos al hacer la medicin en la toma de antena:
1) Con la configuracin TaB:
Tabla 4.9 Resultados de las medidas de calidad de de la seal COFDM con la configuracin TaB
TaB
RESOLUCIN/
FRECUENCIA
720p
50Hz
720p
59.94Hz
1080p
23.98Hz
POTENCIA (dBV) 51.2 51.4 50.2
C/N (dB) 31.4 31.3 33.5
MER (dB) 27 27.1 26.8
CBER 1.2x10
-4
1.5x10
-4
1.9x10
-4
VBER < 10
-7
< 10
-7
< 10
-7

28
Fuente: Manual de Buenas Prcticas Cadena de Recepcin. Grupo de Calidad del Servicio de
Televisin Digital Terrestre. Subdireccin General de Infraestructuras y Normativa Tcnica.

84

2) Con la configuracin SbS:
Tabla 4.10 Resultados de las medidas de calidad de de la seal COFDM con la configuracin SbS

SbS
RESOLUCIN/
FRECUENCIA
720p
50Hz
720p
59.94Hz
1080i
25Hz
1080p
23.98Hz
1080i
29.97Hz
POTENCIA (dBV) 51.5 51.4 49.8 51.4 51.3
C/N (dB) 31.2 31 25.3 31 30.8
MER (dB) 27 27.3 20.9 26.9 27.1
CBER 1.7x10
-4
1.4x10
-4
1.2x10
-4
2.2x10
-4
1.2x10
-4

VBER < 10
-7
< 10
-7
< 10
-7
< 10
-7
< 10
-7


Como se puede comprobar en las tablas 4.9 y 4.10, los valores obtenidos para los vdeos en las
dos configuraciones y en todas las resoluciones/frecuencias, estn dentro de los valores
admitidos para una correcta recepcin.
Tambin se comprueba a nivel visual que todas las configuraciones medidas tienen una
perfecta recepcin y se pueden visualizar correctamente en un televisor 3D.
4.3.1.2 ANLISIS DE LOS TRANSPORT STREAMS (TS)
En esta seccin se mostrar el contenido de los Transport Streams generados tras la
multiplexacin y antes de ser transmitidos, los cules, sern comparados con los Transport
Streams obtenidos en el receptor.
En la tabla 4.11 se muestran las tasas de bits de los Transport Streams transmitidos y recibidos
para la configuracin TaB. Tambin se muestra el nmero de paquetes errneos seguidos en el
caso de los TS recibidos. Por ltimo se detalla el porcentaje de la tasa de bits asociado a cada
tabla, vdeo, audio y paquetes de relleno:









85

Tabla 4.11 TS transmitidos y recibidos en la configuracin TaB
Transmitidos Recibidos
720p
50Hz
720p
59.94Hz
1080p
23.98Hz
720p
50Hz
720p
59.94Hz
1080p
23.98Hz
Bitrate multiplex (bps) 19905882 19905882 19905882 19905814 19905814 19905826
Continuity errors 0 0 0 6 5 7
TEI errors 0 0 0 0 0 0
PAT (PID: 0x0000) 0.02% 0.02% 0.02% 0.02% 0.02% 0.02%
CAT (PID: 0x0001) 0.02% 0.02% 0.02% 0.02% 0.02% 0.02%
PMT (PID: 0x0064) 0.02% 0.02% 0.02% 0.02% 0.02% 0.02%
NIT (PID: 0x0010) 0.00% 0.00% 0.00% 0.00% 0.00% 0.00%
SDT (PID: 0x0011) 0.00% 0.00% 0.00% 0.00% 0.00% 0.00%
VIDEO (PID: 0x0000) 18.63% 30.20% 46.68% 18.54% 29.09% 40.64%
AUDIO (PID: 0x0000) 0.97% 0.95% 1.40% 0.97% 0.95% 1.42%
NULL (PID: 0x1FFF) 80.35% 68.80% 51.86% 80.43% 69.91% 57.89%

En la tabla 4.12 se exponen las tasas de bits de los Transport Streams transmitidos y recibidos
para la configuracin SbS y una resolucin de 720p.
Tabla 4.12 TS transmitidos y recibidos en la configuracin SbS con resolucin 720p
Transmitidos Recibidos
720p
50Hz
720p
59.94Hz
720p
50Hz
720p
59.94Hz
Bitrate multiplex (bps) 19905882 19905882 19905815 19905823
Continuity errors 0 0 15 7
TEI errors 0 0 0 0
PAT (PID: 0x0000) 0.02% 0.02% 0.02% 0.02%
CAT (PID: 0x0001) 0.02% 0.02% 0.02% 0.02%
PMT (PID: 0x0064) 0.02% 0.02% 0.02% 0.02%
NIT (PID: 0x0010) 0.00% 0.00% 0.00% 0.00%
SDT (PID: 0x0011) 0.00% 0.00% 0.00% 0.00%
VIDEO (PID: 0x0000) 29.20% 67.23% 30.17% 67.63%
AUDIO (PID: 0x0000) 0.95% 0.95% 0.95% 0.95%
NULL (PID: 0x1FFF) 69.80% 31.77% 68.82% 31.37%

En la tabla 4.13 se exponen las tasas de bits de los Transport Streams transmitidos y recibidos
para la configuracin SbS con una resolucin de 1080i y 1080p.






86

Tabla 4.13 TS transmitidos y recibidos en la configuracin SbS con resolucin 1080i y 1080p
Transmitidos Recibidos
1080i
25Hz
1080p
23.98Hz
1080i
29.97Hz
1080i
25Hz
1080p
23.98Hz
1080i
29.97Hz
Bitrate multiplex (bps) 19905882 19905882 19905882 19905834 19905816 19905822
Continuity errors 0 0 0 7 8 7
TEI errors 0 0 0 0 0 0
PAT (PID: 0x0000) 0.02% 0.02% 0.02% 0.02% 0.02% 0.02%
CAT (PID: 0x0001) 0.02% 0.02% 0.02% 0.02% 0.02% 0.02%
PMT (PID: 0x0064) 0.02% 0.02% 0.02% 0.02% 0.02% 0.02%
NIT (PID: 0x0010) 0.00% 0.00% 0.00% 0.00% 0.00% 0.00%
SDT (PID: 0x0011) 0.00% 0.00% 0.00% 0.00% 0.00% 0.00%
VIDEO (PID: 0x0000) 54.76% 67.72% 69.47% 67.61% 67.15% 56.10%
AUDIO (PID: 0x0000) 0.95% 0.95% 0.95% 0.95% 0.95% 0.94%
NULL (PID: 0x1FFF) 44.24% 31.28% 29.52% 31.39% 31.84% 42.91%

4.3.2 TRANSMISIN DE 3DTV SOBRE IPTV
Las pruebas de transmisin de 3DTV sobre IPTV se han realizado mediantes las tcnicas
Unicast y Multicast.
4.3.2.1 Pruebas de transmisin mediante la tcnica Unicast
A continuacin se expondrn las grficas correspondientes a los anchos de banda de los
paquetes de datos recibidos mediante IP. Se ha transmitido los vdeos 3D indicados en el
comienzo del apartado 4.3 con las configuraciones TaB y SbS, ambas con resoluciones 720p y
1080i. El flujo de paquetes ha sido analizado desde el cliente (receptor). Hay que indicar que
las unidades indicadas en el eje de ordenadas es bps.
1) Transmisin con configuracin TaB y resolucin 720p:

Figura 4.17 Ancho de banda en Unicast para configuracin TaB y resolucin 720p
En la figura 4.17 se observa que el valor medio del ancho de banda con estas caractersticas es
de aproximadamente 5Mbps.




87

2) Transmisin con configuracin TaB y resolucin 1080i:

Figura 4.18 Ancho de banda en Unicast para configuracin TaB y resolucin 1080i
En la figura 4.18 se puede observar que el valor medio del ancho de banda con estas
caractersticas es de aproximadamente 10Mbps, el doble que con resolucin 720p.
3) Transmisin con configuracin SbS y resolucin 720p:

Figura 4.19 Ancho de banda en Unicast para configuracin SbS y resolucin 720p
En la figura 4.19 se observa que el valor medio del ancho de banda con estas caractersticas es
de aproximadamente 5Mbps. Los valores obtenidos son muy similares a la configuracin TaB.
4) Transmisin con configuracin SbS y resolucin 1080i:

Figura 4.20 Ancho de banda en Unicast para configuracin SbS y resolucin 1080i
En la figura 4.20 se puede observar que el valor medio del ancho de banda con estas
caractersticas es de aproximadamente 10Mbps, el doble que con resolucin 720p.
4.3.2.2 Pruebas de transmisin mediante la tcnica Multicast
Las pruebas de transmisin realizadas bajo esta tcnica, se han llevado a cabo con las mismas
configuraciones que en el apartado anterior. Los resultados de las pruebas se reflejan a
continuacin:



88

1) Transmisin con configuracin TaB y resolucin 720p:

Figura 4.21 Ancho de banda en Multicast para configuracin TaB y resolucin 720p
Como se puede comprobar en la figura 4.21 el ancho de banda es un poco menor con relacin
al resultado con la tcnica Unicast; pero el valor medio del ancho de banda resultante sigue
siendo aproximadamente 5Mbps.
2) Transmisin con configuracin TaB y resolucin 1080i:

Figura 4.22 Ancho de banda en Multicast para configuracin TaB y resolucin 1080i
En la figura 4.22 se da la misma situacin que para el caso anterior, el ancho de banda es algo
inferior al de la tcnica Unicast; pero el valor medio del ancho de banda vuelve a ser
aproximadamente 10Mbps.
3) Transmisin con configuracin SbS y resolucin 720p:

Figura 4.23 Ancho de banda en Multicast para configuracin SbS y resolucin 720p
En la figura 4.23 se ve que estamos en la misma situacin que en la configuracin TaB, el ancho
de banda disminuye un poco con esta tcnica; pero su valor medio sigue estando en torno a
los 5Mbps.





89

4) Transmisin con configuracin SbS y resolucin 1080i:

Figura 4.24 Ancho de banda en Multicast para configuracin SbS y resolucin 1080i
En este caso vuelve a suceder lo mismo que en los casos anteriores, el ancho de banda esta en
torno a los 10Mbps, un poco ms bajo que con la tcnica Unicast, tal como se observa en la
figura 4.24.
En conclusin, para enviar contenidos 3D de alta definicin a travs de IPTV, es necesario un
ancho de banda muy elevado que puede oscilar entre 5 y 20 Mbps.
Desde el punto de vista visual, el resultado obtenido en los receptores de visualizacin 3D,
tanto en un televisor 3D como en un telfono mvil con pantalla autoesteroscpica ha sido
bueno. Puesto que tanto en la tcnica Unicast como en la tcnica Multicast se han visualizado
los vdeos 3D transmitidos con buena calidad.



90

5 Conclusiones y lneas de desarrollo
5.1 CONCLUSIONES
La estereoscopa ha tenido un desarrollo sostenido y extenso a lo largo de la historia, por
lo cual es muy necesario que se aplique acorde a la tecnologa existente en todos los
campos, especialmente en el servicio de Televisin.

La Televisin Digital es un gran avance tecnolgico, sin embargo este servicio debe
competir con tecnologas como IP-TV e Internet; por lo cual el brindar nuevas
prestaciones (3DTV) al usuario, harn que la TV sea atractiva y marque la lnea de
desarrollo para otras tecnologas.

Todas las tcnicas de codificacin actuales para imgenes estereoscpicas se
fundamentan en la norma H.264 / MPEG-4, dado que este esquema de codificacin est
vigente para DVB-T y DVB-T2 se tiene un gran punto a favor para poder implementar el
servicio.

Las tcnicas de adquisicin proponen variadas soluciones para mltiples vistas, en la
actualidad lo ms aplicable son los mtodos basados en 2 vistas (L+R), por lo tanto estos
mtodos son los ms apropiados para iniciar pruebas en etapas de adquisicin y de
transmisin.

Las tcnicas que usan el mapa de profundidad como informacin importante, presentan
un ahorro en tasas de bits; sin embargo merecen una infraestructura de adquisicin de
imgenes exclusiva y propia de los formatos V+D, que son ms adaptables a los
estndares de codificacin menos sofisticados, por lo tanto representan una opcin
conveniente en la etapa de transmisin.

La calidad en la adquisicin depende proporcionalmente del nmero de vistas adquiridas,
es por ello que para un sistema multivista, la calidad en reproduccin ser mxima; no
obstante las dificultades en los requerimientos del canal y el costo de los equipos
aumenta significativamente. La demanda de recursos tcnicos en estos casos hace que lo
ms recomendable sea utilizar interpolacin o creacin de vistas no adquiridas y para
evitar el uso excesivo del canal, esta creacin se debera hacer en recepcin, lo cual por
ahora supone receptores bastante complejos.

El estndar H.264 es muy robusto en cuanto al tipo de informacin que puede procesar,
los anexos AVC y MVC presentan una gran herramienta para el desarrollo de sistemas con
gran cantidad de informacin; la 3DTV para DVB-T resulta completamente aplicable desde
este parmetro tcnico y verstil al poder utilizar diferentes anexos de la norma
dependiendo del formato de produccin 3D elegido.


91

La interfaz HDMI 1.4a establece la mejor solucin para la comunicacin de las seales 3D
en recepcin, ya que se encuentra estandarizado y muestra grandes prestaciones, adems
de contar con la aceptacin del mercado.

Es necesario reglamentar el uso del ancho de banda de los mltiplex, para que as se
establezca un proceso de aplicacin de seales estereoscpicas a uno o ms canales y que
estos convivan tanto con seales HD y SD.

Con el ahorro de espectro radio elctrico que implica la TDT, no es crtico que servicios
como el 3D puedan aplicarse con tcnicas como Simulcast o Dual Streaming, ya que a
pesar de duplicar los recursos que se utilizaran normalmente, la capacidad disponible es
suficiente.

El desarrollo de la HDTV va ntimamente ligado al desarrollo de la 3DTV, ya que la primera
generacin del servicio se fundamenta en la utilizacin del cuadro de alta definicin.

La decisin sobre qu contenidos deben transmitirse en canales 3D, debe estar ligada a la
aceptacin de los consumidores, por lo tanto es necesario tomar en cuenta los estudio
previos que determinan la clase de eventos que los espectadores desean y esperan ver
por televisin 3D.

El problema de la incomodidad visual debe ser abordado en todas las etapas: en la
adquisicin, calibrando mejor las cmaras y utilizando mejores mtodos de captacin; en
la etapa de pre-procesamiento ajustando el paralaje y la disparidad horizontal, en la
codificacin evitando prdida de informacin de profundidad; en recepcin efectuando
una correcta reconstruccin de la seal visual y por ltimo al utilizar pantallas de alta
calidad con mtodos polarizados o multiplexados en tiempo que generen la menor fatiga
visual posible.

Dentro de la reproduccin sobre pantallas estereoscpicas y autoestereoscpicas, se
requieren amplios estudios y experimentos de evaluacin subjetiva para determinar la
tcnica de mayor aceptacin.

Desde el punto de vista de transmisin sobre IPTV, uno de los inconvenientes es que el
sistema debe soportar tasas de transferencia muy elevadas para garantizar la calidad de
servicio contratada por los clientes.

Los clientes que deseen acceder a los servicios 3D deben tener televisores y
decodificadores 3D de alta definicin.

Por el momento la solucin econmicamente ms conveniente en la reproduccin de la
seal, es utilizar gafas polarizadas o LCS. Las gafas 3D activas (LCS) tienen mejores
resultados en la resolucin, ya que muestran imgenes de alta resolucin en calidad Full-
HD y menor distorsin de la imagen; por otro lado las polarizadas permiten obtener

92

mayor luminosidad al no existir un parpadeo de la imagen a cada ojo; sin embargo en
ambos casos la solucin mucho ms barata implica utilizar gafas polarizadas (pasivas).

El presente estudio ha abordado en mayor o menor escala todos los aspectos que
comprenden un sistema de 3DTV, concluyendo que el sistema es viable tcnicamente, y
que en pocos aos algn operador de TDT en Espaa debe incluir este servicio como parte
de las innovaciones de la digitalizacin.
5.2 LNEAS DE DESARROLLO
Del estudio realizado se desprenden campos donde es necesario desarrollar investigacin
y generar aplicaciones propias del estndar.

Se recomienda efectuar ms pruebas de campo y de calidad subjetiva para determinar el
formato ptimo para la norma DVB 3DTV y establecer una lnea base de la evolucin del
servicio, tomando en cuenta las generaciones estudiadas.

Con la aparicin del nuevo cdec HEVC o H.265 se abrirn nuevas lneas de desarrollo de
la 3DTV debido al mayor nivel de compresin de este cdec con su antecesor.

La nueva Ultra HD ser un nuevo desafo para el desarrollo de la tecnologa de vdeo 3D.

Dado que la TV satelital ha profundizado en mayor medida el desarrollo de la 3DTV, se
recomienda estudiar los proyectos que se han lanzado, y recoger las tcnicas y resultados
favorables para adaptarlos a las normas de televisin digital terrestre.

Se debe analizar e investigar mtodos para actualizar los receptores STB tanto para los
formatos 3D actuales como los formatos que se estn desarrollando.

Se recomienda desarrollar aplicaciones, con el objetivo de que el usuario interacte con la
seal de vdeo 3D, pueda manipularla y elegir el formato de acuerdo a la pantalla o a su
conveniencia.

Es necesario establecer el grado de aceptacin del servicio por parte de los consumidores
en la sociedad, por lo tanto se recomienda realizar estudios de mercado considerando
aspectos sociales y econmicos.





93

Referencias Bibliogrficas

Minoli, Daniel; 3DTV Content Capture, Encoding and Transmission. John Wiley &
Sons; New Jersey; 2010.
Richardson, Iain; H.264 and MPEG-4 Video compression. Wiley, Inglaterra, 2003.
ITU-T Recommendation H.264, Advanced video coding for generic audiovisual
Services 2010.
BALAKO Hrvoje, Comparison of Compression Algorithms for High Definition and
Super High Definition Video Signals; Audio Video Consulting Ltd., Karlovaka 36b,
10020 Zagreb, Croatia; 2010.
BOISSON Guillaume, KERBIRIOU Paul y LOPEZ Patrick; THOMSON Research Digest;
Encoding contents for 3DTV: binocular stereo, 2D+Z and LDV; IEEE International
Conference on Image Processing (ICIP); 2009.
BONANSEA Lucas; 3D Hand gesture recognition using a ZCam and an SVM-SMO
classifier; Tesis Iowa State University Ames; Iowa; 2009.
BOURGE Arnaud, GOBERT Jean y BRULS Fons, MPEG-C Part 3: Enabling the
introduction of video plus depth contents, Philips Applied Technologie (Suresnes,
France), Philips Research (Eindhoven, The Netherlands), 2006.
CHUANG Tzu-Der, TSUNG Pei-Kuei, LIN Pin-Chih, CHANG Lo-Mei, MA Tsung-Chuan,
CHEN Yi-Hau, CHEN Yu-Han, TSAI Chuan-Yung, y CHEN Liang-Gee; A 59.5mW
Scalable/Multi-view Video Decoder Chip for Quad/3D Full HDTV and Video Streaming
Applications ;DSP/IC Design Lab, Graduate Institute of Electronics Engineering,
National Taiwan University, Taipei, Taiwan; 2010.
Digital Video Broadcasting (DVB); Frame Compatible Plano-Stereoscopic 3DTV (DVB-
3DTV); DVB Document A154; Febrero 2011.
FEHN Christoph; Depth-Image-Based Rendering (DIBR), Compression and
Transmission for a New Approach on 3D-TV Fraunhofer-Institut fr
Nachrichtentechnik, Heinrich-Hertz-Institut (HHI); Einsteinufer 37, 10587 Berlin,
Germany; 2004.
FEHN Cristopher; A 3D-TV System Based On Video Plus Depth Information;
Fraunhofer-Institut fur Nachrichtentechnik, Heinrich-Hertz Institut; 2009.
GARATE Jose Luis, HD y 3D Situacion y Tendencias, Grupo ASTRA, Madrid, Octubre
2010.

94

HITACHI, Ltd., PANASONIC Corporation., PHILIPS Consumer Electronics,
INTERNATIONAL B.V., SILICON Image, Inc., SONY Corporation, TECHNICOLOR, S.A.,
TOSHIBA Corporation; High-Definition Multimedia Interface Specification Version 1.4a
Extraction of 3D Signaling Portion; 4 Marzo; 2010.
KERBIRIOU Paul, BOISSON Guillaume, SIDIB Korian, HUYNH-THU Quan, Depth-based
representations: which coding format for 3D Video broadcast applications?;
Technicolor, 3D4YOU Project, 17 Marzo 2011.
LAKIS Christodoulou, LIAM M. Mayron, HARI Kalva, OGE Marques, y BORKO Furht; 3D
TV Using MPEG-2 and H.264 View Coding and Autostereoscopic Displays; Dept. of
Computer Science and Engineering, Florida Atlantic University, Boca Raton, FL 33431,
Octubre 2006.
LEE Jin Young, WEY Hochen, y PARK Du-Sik; A Fast and Efficient Multi-View Depth
Image Coding Method Based on Temporal and Inter-View Correlations of Texture
Images; IEEE; 2011.
MULLER Karsten, 3D Video Formats and Coding Methods; 3DTV Conference IEEE,
IHH; Alemania; 2010.
NAMHO Hur, HYUN Lee, GWANG Soon Lee, SANG Jin Lee, ATANAS Gotchev, y SANG-Il
Park; 3DTV Broadcasting and Distribution Systems; IEEE transactions on
broadcasting, VOL. 57, NO. 2, Junio 2011.
OHM Jens-Rainer; MPEG Developments in Multi-view Video Coding and 3D Video;
RWTH Aachen University Lehrstuhl und Institut fur Nachrichtentechnik; Alemania
2009.
PEI-KUEI Tsung, LI-FU Ding, WEI-YIN Chen, TZU-DER Chuang, YU-HAN Chen, PAI-HENG
Hsiao, SHAO-YI Chien, y LIANG-GEE Chen; Video Encoder Design for High-Definition
3D Video Communication Systems; IEEE Communications Magazine ; Abril 2010.
ROHDE & SCHWARZ; 3D TV test signals in line with the HDMI 1.4a interface
standard; Broadcasting/Test & Measurement Application Brochure; Mnchen
Alemania; 2011.
TAM Wa James, SPERANZA Filippo, YANO Sumio, SHIMONO Koichi, ONO y Hiroshi;
Stereoscopic 3D-TV: Visual Comfort; IEEE Transactions on broadcasting, VOL. 57, NO.
2, Junio 2011.
VETRO Anthony, TOURAPIS Alexis M., MLLER Karsten, y CHEN Tao; 3D-TV Content
Storage and Transmission, IEEE Transactions on Broadcasting -- Special Issue on 3D-TV
Horizon: Contents, Systems and Visual Perception, Octubre 2010.

95

MERKLE, P., BRUST, H., DIX,K., MLLER, K. and WIEGAND, T.; Stereo Video
Compression for Mobile 3D Services, IEEE Transactions on Broadcasting -- 3DTV
Conference: The True Vision - Capture, Transmission and Display of 3D Video, 2009.
Vetro, A. ; Tourapis, A.M. ; Muller, K. ; Tao Chen; 3D-TV Content Storage and
Transmission, IEEE Transactions on Broadcasting 2011.
Jonte, J.I., Prieto, I., Fernndez, A., Costales, R.; Estudio Sobre las Necesidades
Tecnolgicas en la IPTV y en la TV Mvil, Ministerio de Comercio, Industria y Turismo.
IPTV and Internet Video Wes Simpson, Howard Greenfield (2007).
Manual de Buenas Prcticas Cadena de Recepcin. Grupo de Calidad del Servicio de
Televisin Digital Terrestre. Subdireccin General de Infraestructuras y Normativa
Tcnica. Marzo 2009.
http://tdtdvb-t.blogspot.com.es/.
The Digital Video Broadcasting Project (DVB) - www.dvb.org.


96

Glosario de Trminos
3DTV Three dimensional Television
ADSL Asymmetric Digital Subscriber Line
AVC Advanced Video Coding
CABAC Context-adaptive binary arithmetic coding
CAVLC Context-Adaptive Variable Length
CCD Charged Couple Display
CFC Conventional HD Frame Compatible
COFDM Coded Orthogonal Frequency Division Multiplexing
CSV Conventional Stereo Video
DES Depth Enhanced Video
DVB-T Digital Video Broadcasting- Terrestrial
FEC Forward Error Correction
FHD3D Full HD 3D
FVV Free View-point Video
GOP Group of Picture
HDTV High Definition Television
HHD3D Half HD 3D
L+R Left + Right
LCD Liquid Crystal Display
LDV Layered Depth Video
MVC Multiview Video Coding
MVD Multiview Video Coding + Depth
OCA Optimized Chromatic Anaglyph
PAL Phase Alternating Line
PSNR Peak Signal Noise Ratio
QAM Quadrature Amplitude Modulation

97

QPSK Quadrature Phase Shift Keying
SbS Side by Side
SDTV Standard Definition Television
STB Set Top Box
SVC Scalable Video Coding
TaB Top and Bottom
TDT Televisin Digital Terrestre
TOF Time of Flight
TS Transport Stream
V+D Video + Depth
VCL Video Coding Layer
VoD Video on Demand

S-ar putea să vă placă și