Tema 3. Gestión de proyectos de desarrollo multimedia...

65
Dra. Sandra Baldassarri Tema 3. Gestión de proyectos de desarrollo multimedia y sistemas web. Elementos de diseño. Contenido dinámico 30258- Diseño Centrado en el Usuario. Diseño para la Multimedia Objetivos Desarrollo de proyectos multimedia y sistemas web utilizando técnicas de diseño centrado en el usuario. Características de las aplicaciones multimedia y web Definición de elementos multimedia: – Texto – Imagen / Gráficos – Audio – Video / Animaciones Algunas consideraciones prácticas: – Diseño para web. Guías de estilo.

Transcript of Tema 3. Gestión de proyectos de desarrollo multimedia...

Dra. Sandra Baldassarri

Tema 3. Gestión de proyectos de desarrollo multimedia y sistemas web.

Elementos de diseño.Contenido dinámico

30258- Diseño Centrado en el Usuario.Diseño para la Multimedia

Objetivos

Desarrollo de proyectos multimedia y sistemas web utilizando técnicas de diseño centrado en el usuario.

• Características de las aplicaciones multimedia y web

• Definición de elementos multimedia:– Texto

– Imagen / Gráficos

– Audio

– Video / Animaciones

• Algunas consideraciones prácticas:– Diseño para web. Guías de estilo.

30258 – Diseño Centrado en el Usuario –Diseño para la Multimedia

Aplicaciones Multimedia

Multimedia o hipermedia (no sólo texto):

• Sistemas hipertexto + medios adicionales– Ilustraciones, fotografías, videos, sonidos, etc…

• Enlaces y “hotspots” pueden formar parte de los medios– Áreas de imágenes– Tiempos y ubicaciones en los videos

• El contenido puede ser:– Estático– Dinámico (basado en tiempo)

Contenido Dinámico: Audio

Existen dos tipos fundamentales de sonido:- Habla- Otros sonidos

El tratamiento digital del habla cubre tres aspectos: Codificación del habla: para la comunicación entre

personas, relacionado con la conversión A/D y la compresión de la señal digital.

Síntesis del habla: para la comunicación entre máquina y persona

Reconocimiento y comprensión del habla: para la comunicación entre persona y máquina

Audio

Otros sonidos:

El sonido audible consiste en ondas sonoras que se producen cuando las oscilaciones de la presión del aire se convierten en vibraciones detectadas por el oído humano. Estas vibraciones se convierten en impulsos nerviosos que son percibidos por el cerebro.

El oído humano detecta frecuencias de sonido entre 20Hz y 20kHz.

Audio: digitalización

Conversión

Analógico/Digital

A sound wave, in red, represented digitally, in blue (aftersampling and 4-bit quantization).

Audio: digitalización

• A partir de micrófono, sintetizador, grabaciones en cinta, emisiones en vivo de radio y TV, CDs y discos.

• Los sonidos digitalizados son muestras de sonido. Cada enésima fracción de segundo se toma una muestra y se guarda como información en bits o bytes.

Audio: digitalización

• Velocidad de muestreo: frecuencia con que se toman las muestras. Las velocidades de muestreo más usadas son: Calidad CD 44.1 kHz, 22.05 kHz y 11.025 kHz.

• Tamaño de la muestra: cantidad de información almacenada de cada muestra. Los tamaños de muestras más usados son: 8 y 16 bits.

Audio: digitalización

El valor de cada muestra se redondea al entero más próximo (cuantización) y si la amplitud es más grande que el intervalo disponible se hace un recorte (clipping) de la parte alta o baja de la onda .

Audio: digitalización

El ruido en la cuantización se puede suavizar mediante el dithering agregando ruido al azar para suavizar transiciones.

Audio digital

• Representación real de un sonido, almacenado enforma de miles de números individuales llamadosmuestras.

• Los datos digitales representan la amplitudinstantánea (volumen) de un sonido en períodospequeños de tiempo.

• Ocupan mucho espacio, pero no son dependientesdel dispositivo.

MIDI

• Estándar de comunicaciones para instrumentosmusicales electrónicos y computadoras (1980).

• Permite la comunicación entre la música y lossintetizadores de sonido de diferentes fabricantesenviando mensajes.

• Protocolo para pasar descripciones detalladas deuna partitura musical como notas, secuencias denotas e instrumentos.

• Lista de órdenes de grabaciones de accionesmusicales que, cuando se envían a un dispositivo dereproducción MIDI, produce sonido. No es sonidodigitalizado.

Compresión de audio

El sonido es más difícil de comprimir que las imágenes, especialmente utilizando métodos de compresión sin pérdidas.

A grandes rasgos, la compresión de audio puede hacerse:– Dominio del tiempo: más fáciles de implementar pero requieren

más de 10 bits de muestra

– Dominio de frecuencias: utilizan 3 bits por muestra y se basan en la percepción auditiva y en el enmascaramiento psicoacústico.

Existen numerosas técnicas de compresión, con y sin pérdidas, las más comunes son las que se basan en la codificación diferencial.

Compresión de audio

Hay tres esquemas de codificación diferencial:

• DPCM

• Modulación delta

• ADPCM

Compresión de audio

DPCM = Simple Differential Pulse Code Modulation

Se toma como valor siguiente la diferencia con el valor de la señal en el instante anterior.

señal inicial señal codificada mediante DPCM

T

tiempo tiempo

se necesitan menos bitspara codificar la diferencia

amplitud amplitud

Modulación Delta

Modulación delta

Es una forma particular de codificación DPCM en la cual la diferencia entre el valor actual y el valor siguiente se codifica con un solo bit. Este bit indica si el valor de la señal se incrementa o se decrementa en un “quantum”. Esta técnica es adecuada para señales cuyos valores no cambian muy rápidamente para una frecuencia de muestreo dada.

señal inicial señal codificada mediantedelta modulation

T

tiempo tiempo

amplitud amplitud

ADPCM

ADPCM = Adaptive Differential Pulse Code Modulation

Es una versión sofisticada del método DPCM. En lugar de usar una función de predicción constante, la estimación varía adaptándose a las características de la señal. El valor siguiente se obtiene extrapolando los valores anteriores de la señal.

Compresión de audio

LPCM (Linear PCM):• Variante de PCM que realiza compresión lineal. Se

utiliza en el formato WAV.Mnidisc:• Variante de ADPCM que elimina ciertos componentes

que no son audibles porque quedan enmascaradosmu-law/A-law: • Sistema de compresión no lineal que permite utilizar

resolución a 8 bits pero ofrece una calidad sonora próxima a 14 bits. Más rápido que ADPCM. Se utiliza en telefonía.

MPEG1 Layer 3 (mp3)

• En 1997 el Instituto Fraunhofer ideó un codec capaz de comprimir audio sin pérdida de calidad apreciable. En 1992 MPEG aprobó la tecnología y nació el MP3 (MPEG-1 Audio Layer 3).

• Permite compresiones de 12:1 y superiores.

• No pierde calidad de sonido de forma apreciable (por un oído no entrenado).

• mp3 utiliza unos cuantos trucos para comprimir el sonido, aprovechando la manera en la que el oído humano percibe el sonido.

MPEG1 Layer 3 (mp3)

• Se basa en las limitaciones del oído humano, que sólo es capaz de captar las frecuencias entre 20Hz y 20 kHz y es más sensible entre 2 y 4 kHz. De esta forma elimina las frecuencias inaudibles conservando la esencia del sonido.

• Al obtener un MP3 se puede seleccionar la codificación y compresión que se desea (nivel de calidad). A 128kbits/44kHz estéreo se consigue un buen equilibrio entre calidad y compresión. Es el nivel por defecto en los compresores disponibles en la red.

• Se han realizado estudios de percepción para verificar la calidad obtenida.

MPEG1 Layer 3 (mp3)

• Umbral mínimo de audición–No es lineal, el margen de percepción real es menor que el teórico Cualquier sonido fuera no es necesario codificarlo

• Efecto máscara–Los sonidos fuertes no dejan oír los débiles éstos se filtran–Existe máscara temporal cuando no se percibe un sonido antes o

después de un sonido más fuerte

• Reserva de bytes–Partes más comprimidas dejan espacio a las menos comprimibles

para mantener el flujo constante (VBR)

• Fusión de estéreo–En determinadas frecuencias el oído no percibe el punto de

emisión del sonido

MPEG1 Layer 3 (mp3)

• Su utilidad:– En un CD de 80 minutos caben 80 minutos de música en formato

CD-Audio y 700 minutos de música en formato MP3 (unos 11 CD’s de audio) - estéreo con calidad 16 bits a 44hHz codificada en MP3 a 128kb/seg.

• Programas reproductores: – WinAmp, RealOne Player, Music Match Jukebox, Windows

Media Player, Quicktime, Flash,…

• Para generar MP3 a partir de CD-Audio: – Musicmatch Jukebox, Real Jukebox, EasyMP3,...

• Un CD con MP3 sólo se podrá escuchar en equipos reproductores compatibles.

Formatos de audio

Dolby Digital

• AC-3: es la versión más común, con 6 canales: 5.1– 5 canales de ancho de banda completa (20 Hz a 20 kHz) +1

canal exclusivo para los sonidos de baja frecuencia (subwoofer)

– Compresión perceptual

• Dolby Digital EX / DD Sorround EX: 6.1

• Dolby Digital Live (DDL): 5.1, tiempo real, videojuegos, …

• Dolby Digital Plus (E-AC-3): 13.1

• Dolby TrueHD: hasta 14 canales para HD DVD y Blu-ray

Formatos de audio

AAC (MPEG-4 Advanced Audio Coding)• Este códec está orientado a usos de banda ancha y se

basa en la eliminación de redundancias de la señal acústica, así como en compresión mediante la transformada de coseno discreta modificada (MDCT), y en utilizar VRB, muy parecido a MP3.– Produce una mejor calidad que MP3 en archivos pequeños y

requiere menos recursos del sistema para codificar y descodificar.

• Formato elegido por Apple para iPods y para iTunes. También es utilizado por Ahead Nero, Winamp y Nintendo DSi.

Formatos de audio

AAC (MPEG-4 Advanced Audio Coding)

Formatos de audio

AAC (MPEG-4 Advanced Audio Coding)• Ventajas con respecto a MP3

– El formato AAC soporta sonido multicanal lo cual resulta un códec de audio apropiado para el sonido envolvente de 6 o más altavoces. MP3 sólo permite, en su formato base, sonido estéreo.

– Puede alcanzar una frecuencia de muestreo de 96khz, utilizado en estudios de grabación. MP3 está diseñado sólo para la reproducción y para alcanzar hasta 48khz.

– La calidad de sonido es considerablemente superior al mismo bitrate. Un archivo de audio en AAC-HC codificado a 64kbps puede ofrecer una calidad similar a un MP3 codificado a 128kbps.

– Incluso a bitrates muy bajos (<32kbps) el sonido sufre poca pérdida en comparación con el MP3 (útil para codificar ficheros de audio de tamaño muy pequeño o para codificar diálogos)

Formatos de audio

WAV: Formato Waveform• Es el más usado y soportado por plataformas Windows. • Almacena información sobre el número de pistas (mono o

estéreo), frecuencia de muestreo, profundidad de bits, igualmente que datos raw de audio no comprimidos.

• La codificación más usual utiliza el formato “Linear Pulse Code Modulation” (LPCM)

• La calidad depende de la combinación de parámetros seleccionada: – resolución o tamaño de la muestra (8, 16, 20, 24 bit, etc), frecuencia de

muestreo (e.g. 8000, 11025, 16000, 22050, 24000, 32000, 44100, 48000 Hz / “muestras por segundo", etc), signo (con o sin), número de canales (monaural, estéreo, cuadrafónico, etc), orden de los bits (little endian, big endian).

Formatos de audio

Otros formatos

• AU: Formato NeXT/Sun. Multiplataforma

• VOX: Útil para grabaciones de voz. Alto grado de compresión (50:1) pero con baja calidad.

• AIFF: Formato Audio Interchange Format, de Apple. Sin compresión.

• TSP: Formato TrueSpeech de DSP. Muy buena calidad, compresión 15:1

Formatos de audio

Otros formatos• GSM: Esquema de compresión para voz,

originalmente para teléfonos celulares, que ha ganado uso en aplicaciones de telefonía en Internet.

• RA: Formato Progressive Networks Real Audio. Muy popular. Compresión 20:1.

• OGG Vorbis (GNU). Basado en streaming. Muybuena calidad (mejor que mp3). Las películas conaudio OGG llevan extensión OGM.

• WMA (Windows Media Audio). Sonido Sorround.También basado en streaming.

Audio: Herramientas de Autor

Son numerosas las herramientas que permiten trabajar con sonido digital:

• Plataformas Windows: Cool Edit, Goldware, WaveEdit, Stereo Studio FX

• Plataformas Mac: Sound Edit Pro, Alchemy y Audio Track

• Profesionales: Sonic Foundry’s Sound Fong (PC), Digidesign’s Pro Tools (Mac)

• Y otros como: FreeAmp, WinAmp, PhatNoise, FreeRIP MP3

Audio: Herramientas de Autor

Las operaciones básicas de edición de sonidos que senecesitan en las producciones multimedia son:

–Recortes–Uniones–Ajustes de volumen–Conversión de Formatos–Remuestreo y muestreo a baja velocidad–Desvanecimiento–Ecualización–Ajustes de tiempos–Procesamiento digital de señales–Sonido a la inversa

Contenido Dinámico: Vídeo

Secuencia de frames representados por imágenes en formato de mapa de bits.

La tecnología de soporte, edición y almacenamiento de vídeo ha evolucionado mucho en los últimos años.

Actualmente la mayor parte de los dispositivos portátiles como móviles, ordenadores, etc. llevan incorporadas cámaras de vídeo.

Vídeo: Estándares

Las cámaras de vídeo digital actuales deben mantener la compatibilidad con los estándares que rigen la TV.

Aunque el alcance y adopción de la HDTV sigue en aumento, los estándares de vídeo digital heredan algunas características esenciales de los sistemas broadcast de TV analógicos como: tamaño de los frames, frame rate, etc…

Por lo tanto, es necesario conocer las bases fundamentales de los sistemas analógicos.

Vídeo: Estándares

Fundamentos del vídeo analógico. Parámetros:

Número de imágenes por segundo que se utilizan para representar el movimiento.

Relación de aspecto: número de líneas horizontales en relación con el número de líneas verticales.

Método de Codificación del Color o Formatos de Señal

Métodos de codificación del color sobre la señal: ancho de banda, modulación en amplitud, modulación en frecuencia, modulación en fase.

Vídeo: Estándares

Los formatos de difusión estándares son: PAL, NTSC, SECAM y HDTV.

PAL: 25 fps, 625 líneas, 4:3 ,YUV, Subp: AM.

NTSC: 30 fps, 525 líneas, 4:3, YIQ, Subp: AM.

SECAM: 25 fps, 625 líneas, 4:3, YUV, Subp: FM.

HDTV: 30 fps,1125 líneas, 16:9.

Vídeo: Estándares

Relación de aspecto:Número de líneas horizontales en relación con el número deverticales.

- El formato estándar de televisión analógica es 4:3- Los televisores panorámicos y de alta definición tienen relación 16:9- En cine las relaciones de aspecto más usadas son 1.85:1 y 2.39:1.- En fotografía las proporciones más usadas son 4:3 y 3:2- Los ordenadores suelen usar relación 4:3 o 5:4 (16:10 en portátiles)

Vídeo: Estándares

PAL: 25 fps, 625 líneas, 4:3 ,YUV, Subp: AM.

Cada frame tiene 625 líneas, de las cuales 576 forman la imagen, que se muestra en 25 frames por segundo.

NTSC: 30 fps, 525 líneas, 4:3, YIQ, Subp: AM.

Cada frame tiene 525 líneas, de las cuales 480 formanla imagen y se muestran en 29.97 frames porsegundo.

Vídeo: Estándares

HDTV: 30 fps,1125 líneas, 16:9

Transmisión de la señal de color: YCrCbY = 0,299R + 0,587G + 0,114B

R-Y = 0,701 R - 0,587 G - 0,114 B

B-Y = 0,886 B - 0,299 R - 0,587 G

Resolución: 1280x720 píxeles en barrido progresivo (720p) o 1920x1080 píxeles en barrido entrelazado (1080i)

Recepción e interactividad: Teletexto digital basado en XHTML y CSS. Para servicio interactivo se requiere un canal de retorno a través de conexión a Internet.

Vídeo: Estándares

En los sistemas analógicos la codificación del color se realiza siempre por componentes, en codificaciones derivadas de Y/R-Y/B-Y.

Codificación YUV

Vídeo: Estándares

Los métodos de codificación del color o formado de la señal pueden ser:

– Señal por componentes: mantiene la información del color separada en sus tres valores (codificación RGB o Y/R-Y/B-Y)

– Señal Super-Vídeo o YC: los dos canales que llevan la información del color se combinan en uno llamado crominancia.

– Señal de vídeo compuesto: los dos canales Y/C se combinan en una sola señal, con lo que el ancho de banda de una de ellas debe reducirse. Puesto que el ojo es más sensible a los cambios en luminancia que en crominancia, se deteriora esta última.

Vídeo: Estándares

En vídeo digital el número de colores distintos que se pueden representar en un pixel depende del número de bits por pixel (bpp).

Vídeo: Estándares

CCIR 601 define el estándar de muestreo de vídeo digital, con 720 muestras de color y 2 x 360 muestras de diferencia de color por línea: Y CBCR con muestreo 4:2:2

Los frames de PAL son 720x576 y NTSC 720x480.

Los pixels no son cuadrados.

Vídeo digital: Estándares

DV (DVCAM, DVPRO)

• Aplica muestreo de color 4:1:1

• Comprime a un ratio constante de 25 Mbits por segundo

• Obteniendo una proporción de compresión de 5:1.

Vídeo digital: Estándares

• MPEG define una serie de estándares y se estudiarán en detalle en el apartado de Compresión.

• MPEG-2 se usa en DVDs, MPEG-4 soporta un rango de datos multimedia en bitrates desde 10kbps a 300Mbps o más.

• MPEG-4 define el formato de fichero.

• MPEG-4 es un estándar Multiparte. – La parte 2 define el codec de video,

– La parte 10 (H264/AVC) es una versión mejorada.

Vídeo digital: Estándares

• Todos los estándares MPEG definen un conjunto de perfiles (características) y niveles (parámetros).

• En multimedia se utilizan los siguientes perfiles: – Baseline (BP): para videoconferencia y móviles

– Extended (XP): streaming de vídeo

– Main (MP): el más utilizado, H.264 y AVC

– High (HP): para HDTV y Blu-ray

Vídeo: Compresión

Tipos de compresión:

- Sin pérdida

- Con pérdida

Compresión de vídeo:

• Evitar redundancia de datos

• Representar con menos precisión las partes de la imagen a las que el ojo es menos sensible

• Despreciar partes de la animación menos apreciables

Vídeo: Compresión

Compresión de una imagen:JPEG: 10:1-40:1 0.2 seg de descompresión…Esto no es problema en imagen estática

Compresión de vídeo:–Usar jpeg es inviable a 15-25 fps–Un codec no es una serie de compresiones estáticas de

imágenes individuales: permite controles como el ancho de banda constante, obtiene ventajas del movimiento.

En consecuencia, hay dos tipos de compresión:- Espacial: Intra-cuadro- Temporal: Inter-cuadro

Vídeo: Compresión

Compresión espacial: intra-cuadroSuele ser similar a la que se utiliza en imagen estática

Compresión temporal: inter-cuadro

Vídeo: Compresión

Parámetros a tener en cuenta:- Tipo de compresor inter e intra-cuadro (codec)

- Resolución de Color

- Calidad de compresión

- Sincronización en cuadros por segundo

- Frecuencia de key-frames

- Limitación global del ancho de banda

- Parámetros adicionales: • Compensación de movimiento• Seguimiento de bloques

Vídeo: Compresión

El conjunto de técnicas para codificar (comprimir) y decodificar (descomprimir) puede variar según el método empleado, y pueden ser procesos asimétricos.

A la definición de un método para codificar y decodificar una secuencia de vídeo se le denomina CODEC.

Vídeo: Compresión

Un entorno de vídeo digital suele estar asociado a unos codecs determinados.

Los entornos de vídeo digital más extendidos son: QuickTime, Video for Windows, Real Video, Windows Media…y cada uno de estos puede trabajar con varios codecs.

Vídeo: Compresión

Cada codec determina el tipo de compresión inter e intra-cuadro. No se puede elegir un método de cada fabricante.

CODECs: RLE (RLE), Video1, Indeo 3.2 (VQ), Cinepak(VQ), MPEG (JPEG), Fractal (IFS-VQ)

Vídeo: Compresión

• Métodos de codificación espacial (intra-cuadro): RLE, JPEG, VQ, Wavelets, Fractal

• Métodos de compresión temporal (inter-cuadro): Por diferencia de frames, compensación de movimiento, seguimiento de bloques

Vídeo: Compresión

• La compresión espacial de un frame individual de vídeo se suele realizar utilizando métodos basados en transformadas.

• La compresión DV es puramente espacial. Extiende la técnica JPEG permitiendo la elección del tamaño de los bloques de las transformadas, y por “mezcla”, para nivelar los cambios en un frame.

Vídeo: Compresión

Codificación del color

• Generalmente se aplica sub-muestreo de color antes de cualquier método de compresión.

Vídeo: Compresión

VQ = Cuantización VectorialSe utiliza en compresión de la señal, codificación de imágenes y del habla

Método:

-Divide la imagen en grupos de 8x8 pixeles

- Es de tipo recursivo / multipaso / autocorrector- Se agrupan los bloques similares en categorías

- Se construye un bloque de referencia para cada categoría

- Se eliminan los bloques iniciales y se guarda únicamente el de referencia de cada categoría para la descompresión

Vídeo: Compresión

VQ = Cuantización Vectorial

- Recursividad- Una vez seleccionado un primer grupo de bloques de referencia la

imagen se descomprime y se compara con el original.

- Si hay mucha diferencia se crea un conjunto de grupos de referencia adicionales que compensen los fallos producidos por el primer conjunto.

- Compresión- Los bloques de referencia se guardan en una serie de tablas que son

usadas en la descompresión

- Normalmente se utiliza RLE para comprimir más la información

Vídeo: Compresión

Wavelets

- Filtrado de la imagen con filtros paso-bajo y paso-alto, con lo que se crean distintas vistas

- Así se localizan las zonas de información de alta frecuencia/pequeña amplitud y las de baja frecuencia/gran amplitud

- Organiza las vistas en forma de árbol desde la de menor frecuencia a la de mayor

Vídeo: Compresión

Wavelets

- Autocorrector: una vez comprimida la primera vista la descomprime y compara: si hay diferencias las codifica, sino pasa al siguiente nivel

- Cuantización: una vez codificada utiliza un método de cuantización semejante a JPEG y luego un método de compresión sin pérdidas (Huffman)

- Es simétrico: comprime y descomprime rápidamente

Vídeo: Compresión

MPEG (Motion Pictures Expert Group)

- Estándar ISO

- Intra-cuadro (JPEG)

- Inter-cuadro: compresión temporal, diferencias entre cuadros consecutivos

- Asimétrico

- Reducciones de 50:1 en adelante

Vídeo: Compresión

MJPEG = Motion JPEG- Comprime cada fotograma de forma independiente- Sucesión de cuadros JPEG (simétrico)- 20:1 con JPEG y MJPEG sin pérdida de calidad- Ventajas:

Acceso en tiempo real a cada frame, facilidad de edición, imágenes individuales claras, recuperación rápida en caso de pérdida de paquetes.

- Desventajas: Mayor consumo de ancho de banda y de almacenamiento con más de 5 fps, sin soporte para audio sincronizado

Vídeo: Compresión

Compresión MPEG:Compresión espacial: JPEG

Vídeo: Compresión

¿Cómo comprime MPEG?Hay tres tipos de cuadros en MPEG:

Intra-coded (I), son los de referencia completos, keyframes, con compresión espacial

Predictive-coded (P), se codifican con respecto al frame anterior (I o P a su vez), con predicción compensada de movimiento

Bidirectional predictive-coded (B), codificados con respecto al frame anterior y al posterior (I o P)

Vídeo: Compresión

Compresión MPEG:Se forman grupos de cuadros consecutivos

– Siempre empezados en I– Contienen I, P y B entremezclados

– Los P o B dependen del codificador (el estándar no obliga ni indica cuándo se pone uno u otro)

Vídeo: Compresión

Compresión MPEG:

La compensación de movimiento guarda la diferencia relativa en el desplazamiento de los objetos como un vector de movimiento.

En los codecs existentes la compensación de movimiento se aplica a macrobloques, ya que no suele ser posible identificar objetos concretos.

Vídeo: Compresión

Compresión MPEG:

La compensación de movimiento

Vídeo: Compresión

Compresión MPEG:Las imágenes B utilizan imágenes posteriores y anteriores como base de la compensación del movimiento y la diferencia entre frames

Vídeo: Compresión

• Una secuencia de video se codifica como un Grupo de Imágenes (GOP: Group of Pictures). Si se usan B-frames, hay que reordenar un GOP para mostrarlo en el orden de decodificación correcto.

Vídeo: Compresión

MPEG-1 (1992)

- Soporte CD

- Calidad VHS, 30 fps

- Audio CD

- 10 Mb por minuto

- Compresión vídeo: H.261 y JPEG

- Compresión de audio: MUSICAM (MPEG-1, Layer II)

Vídeo: Compresión

MPEG-2

- Soporte DVD

- Calidad vídeo-difusión (S-VHS)

- 4 a 9 Mb/seg y 15 a 20 Mb/seg para HDTV

- Permite:– Baja resolución: vídeo consumo (352x240)

– Media: estudios de TV (720x480)

– Alta 1440: HDTV (1440x1152)

– Alta: producción (1920 x1080)

Vídeo: Compresión

MPEG-4: Estándar

Dividido en más de 20 sub-estándares diferentes:

─ System: Animación/Interactividad

─ Vídeo: Advanced Simple Profile (ASP): DivX, XviD, …

─ Audio: Advanced Audio Coding (AAC)

─ Vídeo: Advanced Video Coding (AVC): H.264

─ Contenedor: MP4 container format (.mp4)

─ Subtítulos: Time Text Subtitle Format

Vídeo: Compresión

H.264 / MPEG-4 AVC (Advanced Video Codec)─Buena calidad de imagen

─Orientado a vídeo de baja calidad para videoconferencia y aplicaciones por Internet.

─Inicialmente basado en 8 bits/muestra y con muestreo 4:2:0.

─Surgen extensiones:─ Soporte para tamaño de transformada adaptativo

─ Soporte para representación sin pérdida en regiones específicas

─ Soporte: 10 bits/muestra con 4:2:2 // 12 bits/muestra con 4:4:4

─Tipos de imágenes: I, P, B + SP (Switching P) y SI (Switching I) que sirven para codificar la transición entre dos flujos de vídeo.

─Estructura DCT (modificada) + Compensación del Movimiento (propone gran variedad de formas y particiones de bloques)

Vídeo: Compresión

H.264 MPEG-4 AVC

Vídeo: Compresión

• MPEG-4 Parte 2 divide la escena en objetos que se pueden comprimir de forma separada. Para la escena completa utiliza compensación del movimiento global y compensación del movimiento para mejorar la calidad de MPEG-1 y MPEG-2.

• H.264/AVC es una versión optimizada de MPEG-4 Parte 2 y agrega varias técnicas extras que incluyen tamaño variable de los bloques y macrobloques, y un “filtro de de-blocking” para suavizar las zonas discontinuas entre bloques.

Vídeo: Otros codecs

OGG Theora─ Parte del codec VP3, de On2 Technologies─ Libre de patentes─ Vídeo de alta definición─ Especificaciones

– Componentes cromáticos: 4:2:0, 4:2:2 y 4:4:4 (similar mpeg)– Frames I y P. Elimina B para simplificar la descompresión– Bloques 8x8– Composición de un frame:

• Tres planos de color (Y, Cr, Cb)

– Codecs como plugins

Vídeo: Otros codecs

DivX─Calidad de Imagen: buena (próximo a MPEG 2)

─Suavidad de movimiento: buena (sin hardware específico)

─Tamaño del fichero: muy pequeño

─Posibilidad de edición: mal

─Comentario: Películas bajadas por Internet. Bueno como resultado final de una edición, para reproducir en ordenador y reproductores de DVD.

Periódicamente aparecen nuevas versiones. Se puede descargar el codec de http://www.divx.com/

Actualmente se usa menos:

─ la versión profesional es de pago

─mayor uso de XviD

Vídeo: Otros codecs

XviD (similar a DivX)─Calidad de Imagen: buena

─Suavidad de movimiento: buena

─Tamaño del fichero: muy pequeño

─Posibilidad de edición: mal

─Comentarios:

─Ha aumentado la popularidad en el último tiempo

─Presenta muchas posibilidades de configuración

─Software de libre distribución en http://www.xvid.com/

Vídeo: Otros codecs

• On2 VP6 se hizo popular por su incorporación a Flash Video. Se supone que está basado en DCT, con compensación de movimiento (propietario).

• Windows Media 9 (estandarizado por la SMPTE como VC-1) incorpora características similares a H.264/AVC. Es el que se utiliza en los players Blu-Ray.

• On2 VP6 y OGG Theora son menos potentes que H264/AVC o Windows media 9 pero no son de pago y están muy extendidos.

Vídeo: Otros codecs

• 3IVX: conjunto de herramientas para crear y reproducir formatos basados en MPEG-4

• Huffyuv: codec de vídeo de compresión sin pérdida que consume pocos recursos de procesador. Bueno para captura de vídeo analógico en tiempo real.

• Intel I263 & I420: codecs de Intel que se suelen usar en tarjetas capturadoras y webcams.

• TSCC: TechSmith Screen Capture Codec, de Camtasia. Se utiliza habitualmente para la realización de video-tutoriales.

• X264 VfW: codec gratuito y libre para comprimir pistas de vídeo usando el estándar H.264 AVC. Necesita un descompresor x264 o h264

Vídeo: Calidad

La calidad de cada codec se mide por la capacidad para reproducir una secuencia de vídeo original.

No es lo mismo evaluar la calidad para secuencias de bajo movimiento y alto movimiento.

Sin embargo, todos los codecs modernos producen una excelente calidad a 2Mbps o más.

Vídeo: Calidad

A la hora de seleccionar un codec hay que tener en cuenta los siguientes criterios:

• Calidad de la imagen individual• Suavidad del movimiento• Manejo de la paleta de colores (flash)• Independencia de la resolución• Equilibrio compresión/descompresión

Vídeo: Calidad

Mediciones de la calidad de vídeo:• Objetivas: uso de métricas

– Relación señal ruido (PSNR), Similaridad estructural (Ssim), Medidas de artefactos en bloques, Medidas en emborronamiento (blur)

• Subjetivas: percepción por parte de los usuarios– MSU Continuous Quality Evaluation (MSUCQE), …

• Comparaciones: – velocidad, perfiles soportados, estrategias de control de bit

rate

Vídeo: Calidad

Vídeo: Software de tratamiento y edición

• La edición de vídeo consiste en el proceso de construir una película completa a partir de un conjunto de vídeo clips o de escenas, combinándolos con sonido cuando sea necesario.

• La postproducción consiste en la realización de cambios o en la composición del material, utilizando operaciones similares a las que se utilizan en la manipulación de imágenes estáticas.

Vídeo: Software de tratamiento y edición

El software de edición permite la captura, digitalización, edición y postproducción de vídeo: añadir efectos, transiciones, rotulación, inclusión de animaciones, incrustaciones, chroma, sonorización,…

Ejemplos: Avid Cinema, Adobe Premiere, After Effects, VirtualDub, Final Cut, Video Fusion, Ulead Media Shop, …

Vídeo: Software de tratamiento y edición

Las herramientas para TDV presentan un aspecto común de cara al usuario:

- Se basan en una representación gráfica de lo que es una edición A/B: dos mesas de originales, pista de secuencia final y generador de efectos de vídeo.

- Cada mesa presenta una serie de pistas de vídeo y audio en las que se pueden cargar secuencias de vídeo digital. Se representan como líneas de tiempo con especificación SMPTE.

Vídeo: Software de tratamiento y edición

Herramientas:

• Cortar, copiar, pegar

• Situación de marcas

• Croma-keying (no sólo en azul), mezcla

Titulación:

• Utilización de tipos TrueType o Adobe Type1

• Antialiasing

Vídeo: Software de tratamiento y edición

Efectos especiales, transiciones, filtros:• Dissolve, wipe, explosiones• Definibles por el usuario• Enchufables (terceras partes)

Sonido: • No son editores completos de sonido, sólo ofrecen posibilidades simples de edición: cortar, pegar, fades, etc.

• Los más avanzados: eco, reverberación, amplificación…

Vídeo: Software de tratamiento y edición

Ejemplo: Superposición de clips para una transición

Vídeo: Software de tratamiento y edición

Ejemplo: Filtro de color aplicado en el tiempo (postpro)

Vídeo: Software de tratamiento y edición

Salida:

• Grabación por campos para paso a VTR

• Grabación como vídeo digital (selección de codec)

• Posibilidad de salida EDL (lista de edición) para trabajar sobre edición analógica o mezclas posteriores.

Vídeo: Distribución

• El vídeo se puede distribuir sobre las redes como un fichero de descarga, y puede ser por streaming o por descarga progresiva.

• La descarga progresiva significa que la película comienza a mostrarse cuando el tiempo necesario para descargar los frames siguientes es menor que el tiempo que tomaría visualizar la película completa.

Vídeo: Distribución

• En streaming, cada frame se visualiza a medida que va llegando.

• El streaming permite transmisión de video en vivo y no requiere guardar un fichero en el disco del usuario, pero requiere tener un ancho de banda suficiente para entregar los frames a la velocidad suficiente para que sean visualizados.

Vídeo: Distribución

• ComparativaConcepto Descarga Streaming

Pérdida de información

Imposible Probable

Servidor Servidor web estándar Servidor específico para streaming

Protocolo de red

TCP/IP UDP/IP

Protocolo de ejecución

HTTP RTP

Calidad de la señal

No hay pérdida de información. Alta calidad.

Puede sufrir pérdidas en la señal.Calidad variable.

Inicio de la reproducción

Comienza cuando el archivo ha sido descargado por completo

Casi inmediata

Vídeo: Distribución

• El emisor envía la señal de vídeo a un servidor de streaming, mediante un software que recoge la señal de audio y vídeo entrante al PC (p.ej. desde una tarjeta de sonido o desde una mesa de mezclas), codificarla al bitrate al que quiera emitir la señal y enviar esa señal codificada a los servidores de streaming.

• La audiencia se conecta al servidor de streaming para ver la emisión, para lo que necesitan tener instalado un reproductor multimedia en el ordenador: Windows Media Player, Real Video, Flash o Quicktime

Vídeo: Distribución

Streaming: Tipos• Bajo demanda: es el método más habitual. El contenido multimedia está

almacenado en un archivo en un servidor de streaming y a él los usuarios pueden acceder en cualquier momento. Al acceder al fichero comienza la reproducción, pero el usuario puede controlarla (ir hacia delante, hacia atrás, parar...). Múltiples usuarios pueden acceder simultáneamente al mismo contenido.

• Emisión programada: el contenido está almacenado en un servidor streaming y su reproducción comienza en un instante determinado. Todos los usuarios visualizan a la vez el contenido y no pueden controlar la reproducción.

• “En vivo”: el contenido se visualiza al mismo tiempo que se genera (no está almacenado).

Vídeo: Distribución

Servidores “streaming”: características• Control de flujo: se intenta mantener una velocidad de

trasferencias estable, sin picos.

• Protección frente a “pérdidas” (“skip protection”): aprovecha el exceso de banda para ir almacenando en el buffer; si algún paquete se pierde echará mano del buffer para volver a trasmitir sólo lo perdido.

• Adaptación al ancho de banda: optimiza la calidad del archivo multimedia en función del ancho de banda disponible

• Protección de datos: el contenido se reproduce pero no se almacena con lo que se protegen los derechos de autor.

Vídeo: Distribución

Reproductores de “streaming”• Existen tres arquitecturas principales

- Real Media

- Windows Media

- Quicktime

• Los reproductores correspondientes se integran como pluginsen los navegadores Web.

• Es necesario que el archivo de vídeo o de audio esté codificado en el formato adecuado

– Audio: ra (g2), wma, vorbis,…

– Vídeo: asf, rm, mov, vdo,…

Vídeo: Distribución

• Una arquitectura multimedia provee de un API para la captura, ejecución y compresión; un formato contenedor; un servidor de streaming; y herramientas software.

• Flash Video se utiliza ampliamente para video Web. Los ficheros FLV se deben ejecutar con un Flash Player con un SWF que controle la visualización del video (o con un componente extra)

Vídeo: Distribución

• QuickTime y DirectShow son las arquitecturas multimedia que se incluyen en Mac OS X y en Windows, respectivamente. Sus formatos de ficheros son MOV y WMV.

• Ambos permiten el uso de diferentes codecs, incluyendo H.264/AVC y WMV9, y permiten leer y escribir con varios formatos adicionales de ficheros, como MP4 y AVI.

Vídeo: Distribución

• OGG es un formato abierto, que puedes usarse con el codec Theora para producir películas no sujetas a restricciones o licencias.

• Web video puede necesitar que se reduzca su tamaño de frame o frame rate antes de comprimirlo y exportarlo en un formato adecuado (MP4 o FLV), que puede visualizarse en la mayor parte de sistemas.

Animación tradicional

La animación tradicional se realiza a partir de dibujos o pinturas en un papel donde cada aspecto de la imagen tiene que redibujarse en cada frame (shot). Hay diferentes técnicas: cel animation, stop-motion, claymation…

Las animaciones que se realizan utilizando estas técnicas capturan un frame por vez por medio de cámaras conectadas a un ordenador (en lugar de grabar la filmación).

Animación tradicional

• Cel animation: los elementos o caracteres de una escena que se van a mover se dibujan en material transparente (celuloide). El fondo se realiza de forma separada.

Animación tradicional

• Stop-motion: esta técnica permite crear animaciones tridimensionales a partir de formas bidimensionales. Hay diversas formas de hacerlo, pero todas utilizan miniaturas tridimensionales en las que los objetos se mueven con muchísimo cuidado entre cada shot.

• Ejemplo

Animación tradicional

• Claymation: Animación con plastilina. Normalmente incluye técnica de stop-motion.

http://www.youtube.com/watch?v=fA71niaKnQQ

Animación tradicional

• Combinación de animación con personajes reales: se realiza trabajando con técnicas tradicionales de animación.

Animación digital

• Todas las técnicas de animación tradicional tienen su contraparte digital.

• Además, existen técnicas puramente digitales en las cuales no hay limitaciones como ratio de aspecto, tamaño de los frames, etc.

• Algunos formatos de animación digital soportan transparencia y canal chroma.

Animación digital

• En animación digital hay que resaltar la animación tridimensional generada por ordenador (CG3G)

• Esta técnica incluye generación de shaders, simulación del cuerpo humano, ropas, cabello, agua, montañas, efectos especiales, etc.

Animación: secuencia de imágenes

Las animaciones se pueden crear digitalmente.

• Cada frame individual puede corresponder a imágenes bitmap o imágenes vectoriales.– Las imágenes bitmap son conceptualmente más simples,

pero la animación suele ser más laboriosa.

– Las imágenes vectoriales ofrecen más posibilidades para la creación y manipulación.

• Una secuencia de imágenes se puede guardar como ficheros de imágenes consecutivas numeradas, que luego se trabajan en programas de edición de vídeo o en Flash.

Animación: secuencia de imágenes

Composición por capas:

• Los contenidos de cada frame se trabajan utilizando composición de capas (layer comps), que se mantienen como una secuencia de frames en el mismo documento.

Animación: secuencia de imágenes

• Rotoscopia: esta técnica recibe el nombre por el dispositivo patentado por Max Fleischer en 1915 (Betty Boop)

Animación: secuencia de imágenes

• GIF Animados: consisten en múltiples imágenes bitmaps en un solo fichero. Las imágenes individuales se visualizan como una secuencia en los browser web o por otros programas sin necesidad de plug-in.

Animación: secuencia de imágenes

• Los GIF Animados son adecuados para animaciones cortas y simples.

• Características:– Color indexado

– Compresión intraframe sin pérdidas (¿eficiencia?)

– No poseen pista de sonido ni controles de reproducción

Arriba: Original

Abajo: Gif

Animación: secuencia de imágenes

• GIF Animados:

Material adecuado

Arriba: Original

Abajo: Gif

Animación: secuencia de imágenes

• GIF Animados:

Material no adecuado

Arriba: Original

Abajo: Gif

Animación: Interpolación

• La técnica de interpolación (o in-betweening) se utiliza tanto para animación tradicional como para animación digital.

• En animación tradicional, los animadores principales dibujan los cuadros claves de la animación y los dibujantes secundarios crean frames intermedios.

Animación: Interpolación

• Los programas de animación generan cuadros intermedios interpolando los valores de propiedades como la posición entre los cuadros claves, etc.

• La interpolación se puede aplicar a imágenes bitmap o a propiedades de los objetos vectoriales.

Animación vectorial

• Las imágenes vectoriales son más fáciles de tratar con la técnica de interpolación.

• La interpolación se puede aplicar:– a la forma de los objetos (traslación, rotación, escalado,

deformaciones etc)

– a otras propiedades (cambio de color, iluminación, etc)

• Los frames intermedios sólo contienen instrucciones de las modificaciones en los parámetros que definen las propiedades de los objetos.

• La animación vectorial produce ficheros compactos.

Animación vectorial

• Las películas Flash (ficheros SWF) son el formato de animación web más popular.

• La animación en Flash se organiza con una línea de tiempo.

• Los objetos vectoriales se crean como un escenario, con herramientas convencionales de dibujo vectorial.

Animación vectorial en Flash

• Los diferentes objetos gráficos se guardan en una librería de símbolos.

• Se crean instancias de los objetos para reutilizarlos, transformándolos de forma independiente y aplicando diferentes efectos visuales.

• Se aplica interpolación sobre cada instancia.

Animación vectorial en Flash

Hay tres tipos de símbolos en Flash:

• Símbolos gráficos: son objetos vectoriales reutilizables.

• Movie clips: son animaciones auto-contenidas con sus propias líneas de tiempo, que se ejecutan dentro de una animación principal y se controlan por scripts.

• Símbolos botones: actualmente reemplazados por compontes de la IU.

Se pueden animar símbolos gráficos y movie clips.

Animación: Motion Graphics

• Se denomina Motion Graphics al diseño gráfico animado (generalmente incluye texto).

• After Effects es la aplicación líder en ordenadores personales para crear gráficos en movimiento, y ofrece los controles más sofisticados.

• Los efectos más simples se logran reposicionando o alterando propiedades de las capas de las imágenes bitmap de forma independiente.

• Las capas se pueden mover siguiendo caminos de movimiento (motion paths).

Animación: Motion Graphics

• Ejemplo simple

Animación: Motion Graphics

• Se puede utilizar interpolación para modificar diferentes propiedades y sus valores.

Animación: Motion Graphics

• Se pueden aplicar efectos basados en el tiempo, como desintegración, desaparición, etc…

Animación: Resumen

• La animación consiste en una secuencia de imágenes en movimiento.

• Entre las técnicas de animación tradicional hallamos:– Cel animation, Stop-motion, Claymation

• La animación digital puede realizarse sobre imágenes bitmap o vectoriales.

• Las técnicas más utilizadas son:– Composición por capas, rotoscopia

– Interpolación (in-betweening en animación tradicional)

Referencias - Multimedia

Lecturas recomendadas sobre codificación de audio– http://en.wikipedia.org/wiki/Category:Audio_codecs

• Digital Multimedia, N. Chapman & J. Chapman, Wiley 2013. – Capítulos 8 (Audio)

• http://www.digitalmultimedia.org/slide_sets/8

Referencias - Multimedia

Lecturas recomendadas sobre codecs de vídeo:– Comparativa:

http://en.wikipedia.org/wiki/Comparison_of_video_codecs– Revisión anual, MSU Video Group:

http://www.compression.ru/video/index.htm– Otros: http://www.doom9.org/index.html?/codecs-203-1.htm

• Digital Multimedia, N. Chapman & J. Chapman, Wiley 2013. – Capítulos 6 (Vídeo)

• http://www.digitalmultimedia.org/slide_sets/6

Referencias - Multimedia

• Lecturas recomendadas:– Animación tradicional:

http://en.wikipedia.org/wiki/Traditional_animation

• Digital Multimedia, N. Chapman & J. Chapman, Wiley 2013. – Capítulos 7 (Animación)

• http://www.digitalmultimedia.org/slide_sets/7