bandaancha [Sólo lectura] - URBE · Algoritmo de Codificaci ón Huffman El algoritmo desarrollado...

38
Banda Ancha Compresión, Almacenamiento y Transmisión Eficiente de Señales de Voz, Video y Datos MSc. Luis Rojas

Transcript of bandaancha [Sólo lectura] - URBE · Algoritmo de Codificaci ón Huffman El algoritmo desarrollado...

Banda AnchaCompresión, Almacenamiento y Transmisión Eficiente de Señales de Voz, Video y Datos

MSc. Luis Rojas

INTRODUCCIÓN

Para el almacenamiento y transmisión eficiente

de señales de voz, video y texto se utilizan técnicas de

codificación fuente y de canal. La codificación fuente

comprime eficientemente las señales mediante la

eliminación de sus partes redundantes e irrelevantes.

CONTENIDO

Modelo de un sistema de telecomunicaciones.Teoría de señales aleatorias.Probabilidad.Variables aleatorias.Procesos Estadísticos.Teoría de la Información.Modelos fuentes.Codificación fuente.Modelos de Canal.Codificación de Canal.

Modelo de un Sistema de Comunicación

Haciendo uso de modelos matemáticos se pueden analizar, diseñar o comparar sistemas de comunicación tal como lo muestra el diagrama de bloques siguientes:

Fuente CodificaciónFuente

Codificaciónde

Canal

Destino DecodificaciónFuente

Decodificaciónde

Canal

Canal

Perturbación

Modelos Fuente y Codificación Fuente

La Teoría de la Información modela la señal fuente mediante procesos aleatorio o estocástico.Una información se puede dividir en cuatro partes :

Una línea horizontal divide la parte relevante (significativa) de la parte irrelevante (no significativa).Cada línea vertical divide la parte redundante (conocida) de la parte no redundante (desconocida).Solamente la parte interesante debe transmitirse al receptor.La tarea de la codificación fuente es eliminar tanto la parte redundante así de la parte irrelevante de la información por transmitir.

Modelos Fuente y Codificación Fuente

Redundante (conocida)

R

Irrelevante (no significativa)

No redundante (desconocida)

H

Relevante

(significativa)Interesante

Planos de información según Schouten

Modelos Fuente y Codificación Fuente

Las ecuaciones asociadas son:El valor del contenido de decisión Ho referido a un solo símbolo ak del conjunto de k símbolos es:

Ho = Log 2 K (bit/símbolo) 1.1

El contenido de decisión está constituido por la redundancia R y el contenido de información H:

Ho = R+H 1.2

El contenido de información I(ak) del símbolo ak se define de la siguiente manera:

I (ak) = log 2 P(ak) (bit) 1.3

El contenido de información medio del conjunto de símbolos a1, ..... ak ...... ak se calcula de la siguiente manera:

K

H = - ? p(ak) . Log 2 p(ak) (bit/símbolo) 1.4 K=1

Modelo de Canal

Canal discreto utilizando un canal no discreto

FuenteCodificador

deFuente

Codificadorde

CanalModulador

DestinoDecodificador

deFuente

Decodificadorde

CanalDemodulador

CanalSímbolos binarios

Símbolos binarios

Perturbación

Canal Discreto

Código Reversible

Un código reversible debe satisfacer ciertas condiciones:

Símbolos fuente u

Probabilidad

p(u)

CódigoI

CódigoII

CódigoIII

CódigoIV

A1A2A3A4

0.50.250.1250.125

00110

010011

010110111

001011

0111

Codificación Fuente Para Facsímil

Para reducir el tiempo de transmisión a través de una codificación que elimina la redundancia se dividen los puntos en grupos con la misma amplitud y cada grupo se codifica y transmite su longitud. Dicha codificación se denomina “run length coding”. Para codificar las longitudes blancas y las longitudes negras se utilizan códigos diferentes

I 6 I 3 I 7 I 2 I

Algoritmo de Codificación Huffman

El algoritmo desarrollado por Huffman en 1962 para el cálculo de códigos de prefijos con redundancia mínima, consiste en: 1.- Ordenar los símbolos fuente de mayor a menor probabilidad.2.- Unir a los dos símbolos fuentes menos probables en un símbolo

de ayuda y calcular su probabilidad.3.- Ordenar los símbolos de ayuda y los resultantes símbolos fuente

nuevamente de menor a mayor probabilidad y unir los dos símbolos de menor probabilidad en un nuevo símbolo de ayuda y calcular su probabilidad.

4.- Repetir el paso 3 hasta que aparezca un símbolo con la probabilidad 1.

5.- Si se representa la unión de símbolos a través de líneas se obtiene el árbol de codificación de un código de prefijo con k nodos de terminación. Cada nodo posee dos ramas. A cada rama de un nodo se le asigna uno de los dos símbolos de código: 0,1.

Algoritmo de Codificación Huffman

De la asignación de ceros y unos, resulta la palabra de código de cada símbolo fuente.

CODIFICACIÓN FUENTE PARA FAXIMIL

Para la transmisión de señales de fax en blanco y negro cada línea de la señal de video se muestra y cada muestra se cuantiza utilizando un valor de amplitud blanco y negro. Cada muestra presenta un punto blanco y negro. Cada punto tiene un contenido de decisión Ho = 1 bit.Para reducir el tiempo de transmisión a través de una codificación que elimina la redundancia se dividen los puntos en grupos con la misma amplitud y cada grupo se codifica y transmite su longitud. Dicha codificación se denomina “run length coding”. Para codificar las longitudes blancas y las longitudes negras se utilizan códigos diferentes.

CODIFICACIÓN FUENTE PARA FAXIMIL

Si se modelan las longitudes mediante una fuerte discreta sin memoria y además se asume que las longitudes son estadísticamente independientes, entonces el contenido medio de información de las longitudes blancas y negras se pueden expresar de la siguiente manera:

6 3 7 2

CONDICIÓN DE FAXIMIL

Si se modelan las longitudes mediante una fuente discreta sin memoria y además se asume que las longitudes son estadísticamente independientes, entonces el contenido medio de información de las longitudes blancas y negras se pueden expresar de la siguiente manera.

r maxHb = - ? pb ( r ) . log2 pb ( r )

r=1

r maxHn = - ? pn ( r ) . log2 pn ( r )

r=1

CONDICIÓN DE FAXIMIL

Para reducir la complejidad del equipo se codifican solamente las primeras 63 longitudes según Huffman. Las longitudes más grandes son representadas utilizando dos palabras de códigos, donde la primera parte representa la longitud r.64 y la segunda parte el resto de la longitud la cual puede ser cero.

º º º º º º º º º º º ºº º º º º º º º º º º ºº º º º º º º º º º º ºº º º º º º º º º º º ºº º º º º º º º ºº º º º º º º º ºº º º º º º º º º

CODIFICACIÓN FUENTE PARA FAXIMIL

Para la transmisión de señales de fax en blanco y negro cada línea de la señal de video se muestra y cada muestra se cuantiza utilizando un valor de amplitud blanco y negro. Cada muestra presenta un punto blanco y negro. Cada punto tiene un contenido de decisión Ho = 1 bit.

Para reducir el tiempo de transmisión a través de una codificación que elimina la redundancia se dividen los puntos en grupos con la misma amplitud y cada grupo se codifica y transmite su longitud. Dicha codificación se denomina “run length coding”. Para codificar las longitudes blancas y las longitudes negras se utilizan códigos diferentes.

CODIFICACIÓN FUENTE PARA FAXIMIL

26

1

9

2

8

4

60 Blancas

Negras

A26 A9 A8

Codificación:

L = 67 Blancas

11 o 1164

10003

64 11o11+3 100000

CODIFICACIÓN FUENTE PARA FACSIMIL

Otros modelos de fuente para la modificación de señales de f1x se muestran en la figura 12 junto con las entropías correspondiente por cada punto de imagen. Debido a que la entropía representa el limite inferior del índice de transmisión la figura permite una comparación entre los diferentes modelos fuentes. Puntos de líneaLongitudesPalabras de código

3 2 121000 11 001000

CODIFICACIÓN FUENTE PARA FACSIMIL

Palabras de código

Longitudes Longitudes blancas Longitudes negras

0 001010101 00001101111 000111 0102 0111 113 1000 10;::63 00110100 00000110011164 11011 0000001111128 10010 000011001000192 010111 000011001001;:1728 010011011 0000001100101

TABLA DEL CÓDIGO DE HUFFMAN MODIFICADO

MODELOS DE CANAL

Un modelo de canal describe las perturbaciones mediante procesos estocásticos. Con la ayuda de un modelo de canal se puede determinar la capacidad de canal. La capacidad de canal indica el máximo contenido de información trasferible por un canal.

Modelo de canal también se puede utilizar para reducir la probabilidad de error de transmisión de valores cercanos a cero.

MODELOS DE CANAL

1.- Patrones de error en canales reales:

En la figura Nº 1 muestran ejemplos de secuencia con errores de transmisión producidos por canales discretos binarios reales.

Los errores se clasifican en :

a.- Errores de un bit.

b.- Errores de ráfaga.

c.- Mezcla de errores de un bit y de Ráfaga.

MODELOS DE CANAL

Figura 14 a.- secuencia de símbolos binarios con errores de un bit.

Error

Figura 15 b.- Secuencia de símbolos binarios con errores de un bit y de ráfaga.

MODELOS DE CANAL

La operación + corresponde a la adicción modulo dos con la siguiente tabla:

0+0 = 00+1 = 11+0 = 11+1 = 0

Ejemplos:X = 000101101Y = 010101001E = 010000100

MODELOS DE CANAL

El patrón de error contiene unos en las posiciones de los

símbolos binarias donde ocurrieron errores de transmisión y

cero en las otras posiciones.

Error de ráfaga : Secuencia de elementos de códigos para

la cual entran dos elementos de códigos erróneos consecutivos

siempre existen menos de Y elementos de códigos correctos.

En un error de ráfaga el ultimo elemento del código de la

ráfaga y el primer elemento de código de la siguiente ráfaga se

encuentran separados por al menos r elementos de código

correcto.

MODELOS DE CANAL

Longitud de error de ráfagas es el número de elementos

de código contenidos en un error de ráfaga.

Ejemplo de un patrón de error:

00000110011000100000

El patrón de error anterior contiene con r = 2 dos errores

de ráfaga de longitud 2 y un error de un bit.

Si r = 4, dicha secuencia contiene solamente un error de

ráfaga de longitud r = 10. La definición anterior permite

mediante la selección adecuada del valor de r.

CANAL DISCRETO SIN MEMORIA

El modelo de canal discreto sin memoria permite describir

la manera sencilla canales que generan errores de un bit

estadísticamente independiente.

Suponga que la entrada de un canal discreto sin memoria

se excita con la secuencia de símbolos del alfabeto :

A1,A2,...AK..AK.

Sea b1,b2,...b3,...bJ el alfabeto de la secuencia de símbolos

correspondiente a la salida del canal. Un canal discreto sin

memoria se define mediante las probabilidades condicionales

p(bJ / AK ), que dan la probabilidad de que un símbolo Ak se

transforme en un símbolo bj.

CANAL DISCRETO SIN MEMORIA

Sea X = X1,... Xn,...XN una secuencia de entrada, donde Xnrepresenta un símbolo arbitrario del alfabeto A1,...AK,...AK.

Sea Y = Y1,...Yn,...YN la secuencia correspondiente a la salida, del canal, donde Yn representa un símbolo arbitrario del alfabeto b1,...b2,...bJ ,..bJ.

En el caso de un canal discreto sin memoria cada símbolo a la salida del canal, es estadísticamente dependiente del símbolo correspondiente a la entrada del canal. Para una secuencia de N símbolos se cumple :

N

Pn ( y / x ) = P(yn / Xn)

N=1

CANAL SIMÉTRICO Y BINARIO ( C.S.B)

P ( Y/X) = P(y1,...YN / X1,...XN) = P (E1,...EN)

Ejemplo :

P(001 / 011) = p(E1 = 0 ,E2 = 1, E3 = 0)

= (1- p) . p.(1-p)

= (1-p)2 p.

ANTECEDENTESUn aspecto fundamental en los desarrollos de los sistemas multimedia, es el eficiente almacenamiento y la transmision de secuencias de imagenes.

Adicionalmente, el funcionamiento basado en objetos está adquiriendo mayor importancia a medida que son requeridos con la aparición del mpeg – 4.

•En un futuro, el promedio de datos entre 8 y 64 kbps facilitará la transmision a trave’s de canales de telefonía móvil y fija como también sobre la internet.

•Objetivo:los algoritmos estandarizados como elitu-r rec., H261 y h263, se aplcan basados en el procedimiento de las imagenes de entrada.

•Solución: cada imagen es subdividida en objetos bidimensionales de forma fisica aleatoria de diferente movimiento y localizacion. Esto fisica aleatoria de diferentes movimiento y localizacion. Esto permite en primer lugar una mayor presicion de la descripción del mundo real y en segundo lugar el direccionmiento por separado de contenidode imagenes especificas.

CODIFICACION DE VIDEOS A VELOCIDADES MUY BAJAS (8.....64 Kbps)

USANDO MODELOS DE OBJETOS EN 2D

Para cada objeto ,son estimados los parámetros de forma, textura y movimiento bidimencional con respecto a la imagen previa.

Muchos de los cambios entre imágenes sucesivas son descritas

solamente por parámetros de forma y movimiento que pueden ser

transmitidos de manera eficiente, solamente para áreas de imágenes donde esta descripción falla, los parámetros de textura son

transmitidos.

En el lado receptor, la imagen es sintetizada usando los parámetros

transmitidos. Esta solución fue considerada durante el desarrollo del estándar MPEG-4 y fue incluida dentro del modelo de verificación de

vídeo que adoptó el mismo principio de codificación.

ANALISIS / SINTESISCodificación de Audio ( MPEG-4 HILN )

La cuantización y codificación de modelos paramétricos es controlada por un modelo físico que amplía la señal de entrada la cual depende de la sensibilidad del oído humano para la reconstrucción de errores.

En el decodificador para cada objeto de audio, una señal es sintetizada desde el modelo paramétrico del decodificador.

La salida del decodificador es la suma de todas las señales objetos.

La cuantización y codificación de modelos paramétricos es controlada por un modelo físico que amplía la señal de entrada la cual depende de la sensibilidad del oído humano para la reconstrucción de errores.

En el decodificador para cada objeto de audio, una señal es sintetizada desde el modelo paramétrico del decodificador.

La salida del decodificador es la suma de todas las señales objetos.

CODIFICACION DE VIDEO A BAJAS VELOCIDADES(8....64 Kbps) utilizando objetos trimensionales incluyendo modelos tridimensionales predefinidos (Modelos Faciales)

Antecedentes: El estándar MPEG-4 hará posible la codificación de

imágenes basados en contenidos, acceso a la imagen así como también la animación de modelos tridimensionales.

Las velocidades propuestas de 8 hasta 64 Kbps, permiten la

transmisión a través de canales de telefonía fija y móvil así como la red

de INTERNET.

Objetivo : El objetivo de este proyecto es incrementar la eficiencia de codificación utilizando la información del contenido de la escena y

describiendo la geometría tridimensional del mundo real con modelos

de objetos tridimensionales incluyendo modelos predefinidos.

Un modelo tridimensional puede incluir modelos predefinidos comopor ejemplo modelos faciales para cabeza humana. Los modelos tridimensionales adecuados son seleccionados analizando el contenido de la imagen.Los parámetros para la textura, forma y movimiento del objeto y la iluminación de la escenas son estimados automáticamente.

Muchos de los cambios entre dos imágenes sucesivas son descritas solamente por parámetros de forma, movimiento e iluminación que son codificados muy eficientemente.Solamente para áreas de la imagen donde esta descripción falla, los parámetros son de textura son transmitidos.En el lado receptor la imagen es sintetizada utilizando los parámetros transmitidos. Esta investigación es patrocinada por el gobierno Alemán

CODIFICACION DE VIDEOPara aplicaciones de muy baja velocidad ( de 8.........64 kbps ) basados

en modelos de objetos tridimensionales.

Antecedentes : un punto fundamental en los sistemas multimedia actualmente desarrollados es el eficiente almacenamiento, transmisión y manipulación de secuencia de imágenes y escenas tridimensionales. Objetivo : Por cuanto los algoritmos de codificación como el ITU recH261 – H263 asi como el MPEG-4 para vídeo describe los cambios en la secuencias de imagen a través de movimientos bidimensionales paralelos al plano de la imagen , el objetivo de este proyecto es hacer uso de la geometría tridimensional del mundo real con movimientos bidimensionales paralelos al plano de la imagen.

Solución : Para una codificación de imagen eficiente , los cambios que se producen desde una imagen a la siguiente, son descritas por modelos de objetos tridimensionales texturizados y por la rotación y traslación tridimensional.

Los objetos pueden ser articulados y la iluminación de escenas puede

consistir en luz difusa y directa.

Para cada objeto son estimados la textura, el movimiento

tridimensional, forma tridimensional y parámetros específicos ( por

ejemplo, parámetros de mímica para modelos faciales ).

Para cada objeto son estimados la textura, el movimiento

tridimensional, forma tridimensional y parámetros específicos ( por

ejemplo, parámetros de mímica para modelos faciales ).

GRACIAS POR SU ATENCIÓN