Redes Neuronales Recurrentes -...

Inteligencia Computacional II

Redes Recurrentes

Dra. Ma. del Pilar Gómez Gil Ciencias Computacionales,

INAOE pgomez@inaoep.mx Versión: 8-Junio-2015

Presentan retro-alimentación, esto es, la salida de un neurón se usa como entrada a sí mismo, o a otro que eventualmente se conecta a sí mismo.

La salida de la neurona tiene que calcularse usando valores de entrada y salida obtenidos en tiempos anteriores

Presentan características similares a la memoria humana

La operación de estas redes y de los algoritmos que se usan para entrenarlas se caracterizan a través de ecuaciones diferenciales o en diferencia

Redes Neuronales Recurrentes

(C) P. Gómez Gil. INAOE 2015

Neurodinámica

Se refiere al estudio de RNA vistas como sistemas dinámicos

no lineales, dando énfasis en el problema de estabilidad.

La presencia de estabilidad siempre implica alguna forma de

coordinación entre las partes individuales de un sistema.

La estabilidad en redes con retroalimentación global (redes

recurrentes) es difícil de alcanzar.

Fundamentalmente, las redes recurrentes pueden usarse

como memorias asociativas, o como sistemas de entrada-

salida.

[Haykin 2009]

(C) P. Gómez Gil. INAOE 2015 3

Sistemas dinámicos

Un sistema dinámico es aquel que cambia con

el tiempo

Un sistema dinámico se puede definir con un

modelo en el espacio de estados a través de un

sistema de ecuaciones diferenciales del tipo:

))(()( ttdt

dj xFx

Redes recurrentes inspiradas en

Física Estadística

Unidades de cómputo (neurones) no lineales.

Conexiones sinápticas (pesos) simétricas.

Uso abundante de retro-alimentación.

Las Redes de Hopfield

Hopfield conceptualizó las redes neuronales como sistemas dinámicos con energía y mostró su semejanza con ciertos modelos físicos.

Hopfield propuso varios modelos de redes recurrentes. En este tipo de redes, la salida de cada neurón se calcula y se retro-alimenta como entrada, calculándose otra vez, hasta que se llega a un punto de estabilidad.

Supuestamente los cambios en las salidas van siendo cada vez mas pequeños, hasta llegar a cero.

Puede ser que una red recurrente nunca llegue a un punto estable.

Dr. John Hopfield

Dinámica de las Redes

Recurrentes de Hopfield (1/2) Dada una red recurrente de N neurones con

acoplamiento simétrico, esto es wij = wji, donde wij es la

conexión de i a j, la salida del neurón j está dada por la

ecuación:

donde es la no-linealidad de tipo sigmoide del neurón

son funciones en el tiempo.

Dinámica de las Redes Recurrentes de

Hopfield (2/2)

Está dada por el conjunto de ecuaciones diferenciales no lineales acopladas del tipo:

Para j = 1,2, ... N

Controla el cambio del potencial (efecto capacitivo).

Pérdidas debido a resistencia en la entrada al elemento j.

umbralj

jC tv j

Configuración de la Red

Se utiliza principalmente con entradas binarias.

Se puede utilizar como una memoria asociativa, o para resolver problemas de optimización.

Una memoria asociativa o dirigida por contenido es aquella que se puede accesar teniendo una parte de un patrón de entrada, y obteniendo como resultado el patrón completo.

Hopfield también utilizó sus redes para resolver un problema de optimización: El agente viajero. Además construyó una red con circuitos integrados que convierte señales analógicas en digitales.

Modelo Básico de Hopfield

n es el número de nodos en la red.

Las entradas Xo, X1 ... Xn-1 se aplican a la red en el tiempo

t = 0. Pueden tomar valores de +1 ó -1.

Las salidas Uo, U1... Un-1 se van calculando y recalculando, hasta que sus valores ya no cambian. Cuando esto sucede, se tiene la salida de la red, y X’i = Ui para i= 1.. n-1

Algoritmo de Entrenamiento de la red Hopfield

Paso único: Calcule los valores de los pesos que conectan a los nodos,

utilizando la siguiente fórmula:

donde es el peso que va del neurón i al neurón j, y es el valor del i-ésimo elemento de la s-ésima clase; m es el número de clases que se desean aprender. En notación matricial:

Lo que se conoce como el producto externo (outer product) de un vector renglón consigo mismo.

jisixxt

jsisij

ijtisx

0 t, ii i

Algoritmo de evaluación de la red Hopfield

Paso 1. Inicialice la red con un patrón de entrada:

donde n es el número de nodos en la red

1ni0XU ii )0(

Algoritmo de evaluación de la red

Hopfield (2/2)

Paso 3. Itere hasta converger siguiendo la siguiente fórmula:

donde F es una función escalón definida como:

Cuando la red converge, su salida representa al patrón que más se parece al

patrón de entrada dado.

cambio)(sin 0 si )(

0 si 1

1nj0tUtFtUn

))(()1(1

Ejemplo

Almacenar en una Red Hopfield los siguientes patrones:

)1 ,1,1,1(

)1 ,1 ,1 ,1(

Ejemplo (cont.)

diagonalhaciendo

xxxxTTT

Ejemplo (cont.) Supongamos que deseamos recuperar el patrón mas cercano a:

En este punto U(1), es igual al U(0), por lo que el sistema ya está estable y el proceso termina.

El patrón mas parecido a A es (1 1 1 -1)

1111 A

1111)0(1

1111)0(

Ejemplo (cont.)

!12 11112

!01 111101

FINUUU

UUTUFU

2) Ahora hallaremos el patrón mas parecido a 1111 A

Representación del sistema

dinámico de Hopfield

[Zurada 92]

EJEMPLO DE APRENDIZAJE CON HOPFIELD

La siguiente figura, publicada en (Lippman 87), muestra el

resultado obtenido al construir una memoria asociativa utilizando

una red de Hopfield con 120 nodos.

La red fue entrenada con los patrones mostrados en la parte

superior de la figura. Después de entrenada, se le mostró a la

red el número "3", distorsionado de manera aleatoria,

Cambiando cada bit con una probabilidad de 0.25. Este patrón

se aplicó en el tiempo t = 0. Las salidas obtenidas en t = 0 y en

las primeras 7 iteraciones se muestran en la parte posterior de la

figura.

Ejemplo del comportamiento de la

red Hopfield [Lippman 87]

VENTAJAS Y DESVENTAJAS DE LAS REDES DE

HOPFIELD

- Prácticamente no existe tiempo de entrenamiento, ya que este no

es un proceso adaptativo, sino simplemente el cálculo de una matriz

- Las redes de Hopfield son bastante tolerantes al ruido, cuando

funcionan como memorias asociativas.

- El número de patrones a almacenar (o aprender) es bastante

limitado comparado con el número de nodos en la red. Según

Hopfield, el número de clases a aprender no puede ser mayor de

0.15 veces el número de nodos en la red.

- La red se vuelve inestable si los patrones se parecen entre sí.

A Hopfield net at hardware

(C) P. Gómez Gil. INAOE 2015

[Zurada 1992]

Redes con retrasos

Incluyen memoria introduciendo retrasos de tiempo en

la estructura sináptica de la red y ajustando sus valores

durante el entrenamiento. (Se sabe que en el cerebro

se manejan señales retrasadas).

Un ejemplo de esta metodología es la red "Time Delay

Neural Network" (TDNN) descrita por Lang y Hinton en

1988 y por Waibel en 1989.

Es una red hacia delante de varios niveles cuyos

neurones escondidos y de salida se repiten a través

del tiempo.

Una red totalmente Recurrente

(c) INAOE 2015

I2 w02

w01 w00

Características de un modelo de

red recurrente

El cálculo de la salida yi, de cada neurón i, esta dado por:

donde: Xi representa la entrada total al i-ésimo neurón que viene de otros

neurones,

Ii es la entrada externa al neurón i,

Wji es la conexión del neurón i al neurón j y

es un función diferenciable cualquiera, normalmente una sigmoide:

iiii Ixyt

jjii ywx

Dinámica del neurón La dinámica del neurón puede expresarse usando

ecuaciones de recurrencia:

Hay varias soluciones a la minimización de E, (por ejemplo, ver

Pearlmutter B.A. "Learning State Space Trayectories in Recurrent

Neural Networks" Neural Computation, Vol. 1 pp. 263-269, 1989).

iiiii Ixty

])()([)()( iiiii Ixtyttytty

))()(()()( iiiii Ixtyttytty

Entrenamiento de Redes

Recurrentes Hay dos metodologías básicas de entrenamiento de

redes recurrentes:

Retropropagación a través del tiempo. Creada originalmente en

la tesis de P. Werbos (1974), (1990). Redescubierta

independientemente por Rumelhart et al. (1986) y una variación

propuesta por Williams y Peng (1990).

Aprendizaje Recurrente al Tiempo Real (Real Time Recurrent

Learning). Descrito por Williams y Zipsen (1989), los orígenes

del algoritmo fueron dados por McBride y Nardendra (1965)

(C) P. Gómez Gil.

INAOE 2015

Backpropagation through time (BPTT) is

an algorithm that attempts to minimize the

error obtained over a period of time

between the output of a neuron and the

desired value of such output.

It was originally proposed by Werbos

(1990).

(C) P. Gómez Gil.

INAOE 2015

The total error in an output neuron is

represented by:

OUTPUT NUERONS

(C) P. Gómez Gil.

INAOE 2015

In a discrete form:

LEARNING

(C) P. Gómez Gil.

INAOE 2015

Pearlmutter (1989) found that the

modification to the weights (learning) can

be described by the equation:

LEARNING (2)

(C) P. Gómez Gil.

INAOE 2015

Using a discrete notation:

(c) INAOE 2015 33

PEARLMUTTER’S ALGORITHM (1/5)

(C) P. Gómez Gil.

INAOE 2015

Gómez-Gil, 1989

(C) P. Gómez Gil.

INAOE 2015 35

(C) P. Gómez Gil.

INAOE 2015 36

(C) P. Gómez Gil.

INAOE 2015 37

(C) P. Gómez Gil.

INAOE 2015 38

ALGORITHM TO PREDICT A

TRAJECTORY

(C) P. Gómez Gil.

INAOE 2015 39

Redes NARX

REFERENCES

(C) P. Gómez Gil.

INAOE 2015

Gómez-Gil, P. “The effect of non-linear Dynamic Invariant in the Recurrent Neural Networks for Prediction of Electrocardiograms.” María del Pilar Gómez Gil. PhD dissertation in Computer Science, Texas Tech University. December 1998.

Gómez-Gil P, Ramírez-Cortés JM, Pomares Hernández SE, Alarcón-Aquino V. “A Neural Network Scheme for Long-term Forecasting of Chaotic Time Series” Neural Proceesing Letters. Vol.33, No. 3, June 2011. pp 215-233. Published online: March 8, 2011. DOI: 10.1007/s11063-011-9174-0 (cited at JCR Science Edition—2009). (preliminary PDF)

Pearlmutter, B. (1990). Dynamic Recurrent Neural Networks. Technical Report CMU-CS-90-196. School of Computer Science, Carnegie Mellon University, Pittsburgh MA.

Werbos, P. (1990). Backpropagation Through Time: What it Does and How to Do it”. P IEEE , 74 (10), 1550-1560.

Redes Neuronales Recurrentes -...

Documents

Transcript of Redes Neuronales Recurrentes -...

2.6 REDES RECURRENTES - medicinaycomplejidad.org · cuadrática, puesto que la red de Hopfield minimizará a V Una red de Hopfield puede diseñarse como una memoria asociativa, en

Procesamiento digital de señales - ccc.inaoep.mxccc.inaoep.mx/~pgomez/cursos/pds/slides/S2-ADC.pdf · Puntos importantes O Recordatorio de definiciones básicas de: frecuencia, periodo,

Aplicaciones - infofich.unl.edu.arinfofich.unl.edu.ar/upload/caf406e31ecdbad16744c1c8dac323fb2f88a…Memorias y recuperación de información •Redes neuronales –Red de Hopfield

Procesamiento digital de señales - ccc.inaoep.mxccc.inaoep.mx/~pgomez/cursos/pds/slides/S9-Filtros.pdf · O Los filtros que se implementan con convolución realizan sumas de ...

Introducción a la Robótica - ccc.inaoep.mxccc.inaoep.mx/~esucar/Clases-irob/ir2-locomocion.pdf · el robot – Directa: dada lo posición inicial y los movimientos realizados, cuál

Tópicos Avanzados: Inteligencia Computacional Iccc.inaoep.mx/~pgomez/cursos/IC-I/acetatos/introduccion.pdf · Inteligencia Artificial e inteligencia computacional (cont.) La representación

UNIVERSIDAD DE MÁLAGA - biblioteca.uma.es · supervisado (Red de Elman) realiza la predicción de la demanda de manera ... optimización utilizando redes recurrentes de Hopfield,

Red Neuronal Modelo de Hopfield - PROGRAMACION Ipedrobeltrancanessa-biblioteca.weebly.com/uploads/1/2/4/0/12405072/... · Red Neuronal Modelo de Hopfield Introducción Dentro de este

Redes Neuronales Artificiales - disi.unal.edu.codisi.unal.edu.co/~lctorress/RedNeu/RNA007c.pdf · 2 Redes Neuronales Artificiales Red de Hopfield Problema de memoria asociativa Almacenar

Tópicos Avanzados: Redes Neuronales Artificiales Dra. Ma ...ccc.inaoep.mx/~pgomez/cursos/redes neuronales artificiales... · proceso llamados neuronas, Contiene cerca de 100 trillones

ESCUELA POLITÉCNICA NACIONAL - Repositorio …bibdigital.epn.edu.ec/bitstream/15000/4566/1/CD-4187.pdf · 3.3.2.1 Arquitectura de la red de Hopfield..... 85 3.3.2.2 Funcionamiento

DISEÑO, DESARROLLO E IMPLEMENTACIÓN, DE UN ENTRENADOR DE ... · tipos de redes de acuerdo a la topologÍa ... caracteristicas de hopfield..... 54 . 2.2.3.5.3.1.2. funcionamiento

'1148.206.53.84/tesiuami/Complemento primer lote/UAM0116.pdf · neuronales tales como la red de Hopfield la cual se diseña específicamente como memoria direccionable de contenido.

El oído Timbre - ccc.inaoep.mxccc.inaoep.mx/~a.morales/DSP/pdf/DSP_16_procesamientoAudio.pdf · El conducto auditivo externo es un conducto que se ubica entre el pabellón auricular

Redes de Hopfield

Propedéutico de Programación Coordinación de Ciencias ...ccc.inaoep.mx/~pgomez/cursos/programacion/presentaciones/sema… · Constructores tipo “copy class” • Cuando se pasan

Redes Neuronales Artificiales Conceptos básicosccc.inaoep.mx/~pgomez/cursos/IC-I/acetatos/fundamentos.pdf · 2019-03-20 · Redes Neuronales Artificiales Conceptos básicos (c) P.

HISTORIA DE LA EDUCACIÓN - ccc.inaoep.mxccc.inaoep.mx/Tesis-Web/Pdfs/HISTORIA%20DE%20LA%20EDUCACI%D3N.pdf · manejo de los personajes de la historia de México durante el periodo

BIOGRAFÍA - ccc.inaoep.mxccc.inaoep.mx/Tesis-Web/Pdfs/BIOGRAF%CDA.pdfbiografía política de José Mariano Salas", UNAM, Facultad de Filosofía y ... de la figura histórica de Ricardo

Aprendizaje profundo: el poder del aprendizaje automático ...ccc.inaoep.mx/~pgomez/conferences/PggTSys16.pdf · APRENDIZAJE PROFUNDO El poder del aprendizaje automático unido al