CACP02

7/24/2019 CACP02

1/52

Sobre los Modelos DifusosSobre los Modelos DifusosAdaptativos DinAdaptativos Dinmicosmicos

Mariela CERRADAMariela CERRADA--LOZADALOZADADirectores de tesis: J. AGUILARDirectores de tesis: J. AGUILAR--CASTRO y A. TITLICASTRO y A. TITLI

Institut National des Sciences Appliques Universidad de Los Andescole Doctorale Systmes Automatiques Doctorado en Ciencias AplicadasComplexe Scientifique de Rangueil Complejo La Hechicera

Toulouse - FRANCE Mrida -VENEZUELA.

Laboratoire dAnalyse et dArchitecture des Systmes (LAAS -CNRS)Groupe DISCO7, avenue du Colonel Roche31077 Toulouse -FRANCE

IV Congreso de Automatizacin y ControlMrida, 12-14 noviembre 2003

7/24/2019 CACP02

2/52

08/11/200308/11/2003 22

ContenidoContenidoMarco TericoMarco Terico Contexto: Modelado e IdentificacinContexto: Modelado e Identificacin

El modelo difuso adaptativoEl modelo difuso adaptativo

Modelado Difuso Adaptativo DinmicoModelado Difuso Adaptativo Dinmico Motivacin y ObjetivosMotivacin y Objetivos

Proposicin:Proposicin:El modelo difuso adaptativo dinmico.El modelo difuso adaptativo dinmico.

El algoritmo de aprendizaje en lnea.El algoritmo de aprendizaje en lnea.

Ejemplo IlustrativoEjemplo Ilustrativo Algunas consideraciones sobre el algoritmo de aprendizaje en lnAlgunas consideraciones sobre el algoritmo de aprendizaje en lneaea

AplicacionesAplicaciones Control PredictivoControl Predictivo

Motivacin y objetivosMotivacin y objetivos

PropuestaPropuesta

Caso de estudio: control de un proceso de fermentacinCaso de estudio: control de un proceso de fermentacin

Perspectivas en la aplicacin a la supervisin y diagnsticoPerspectivas en la aplicacin a la supervisin y diagnstico

Conclusin GeneralConclusin General

7/24/2019 CACP02

3/52

08/11/200308/11/2003 33

ContextoContexto

Trabajo centrado en el reaTrabajo centrado en el reade modelado ede modelado eidentificacin.identificacin.

Desarrollo de un modeloDesarrollo de un modelodifuso por identificacindifuso por identificacin

Modelos difusos eModelos difusos eidentificacin:identificacin: Estructura del modeloEstructura del modelo

Tipo de modeloTipo de modelo

Funciones de pertenenciaFunciones de pertenencia

Operadores lgicosOperadores lgicos

Ajuste del modeloAjuste del modeloParmetros de las funcionesParmetros de las funcionesde pertenenciade pertenencia

Ajuste del nmero de reglasAjuste del nmero de reglas

Modelado

Identificacin

Modelos

difusos

7/24/2019 CACP02

4/5208/11/200308/11/2003 44

El modelo difuso adaptativoEl modelo difuso adaptativo

Sea una regla de una base de reglas difusa (modelo difusSea una regla de una base de reglas difusa (modelo difuso):o):

dondedonde XXii es una variable lingstica de entrada definida sobre un universes una variable lingstica de entrada definida sobre un universo de discursoo de discurso UUii yyyy es la variable lingstica de salida definida sobre un universes la variable lingstica de salida definida sobre un universo de discursoo de discurso VV.. FFiill yy GGll sonson

conjuntos difusosconjuntos difusos sobresobre UUii yy VV, respectivamente, l =1,,M; i=1,,n., respectivamente, l =1,,M; i=1,,n.

Lema 1Lema 1(Wang, 1994)(Wang, 1994):: El modelo lgicoEl modelo lgico--difuso (1), con un mecanismo de inferencia utilizandodifuso (1), con un mecanismo de inferencia utilizandoel mtodo de fusificacin por singleton difusos, el mtodo de deel mtodo de fusificacin por singleton difusos, el mtodo de defusificacin del promedio defusificacin del promedio de

centros y funciones pertenencia de Gauss para los conjuntos difucentros y funciones pertenencia de Gauss para los conjuntos difusos de la variables desos de la variables deentrada, tiene la forma funcional siguiente:entrada, tiene la forma funcional siguiente:

ll

nn

ll GyFxFxR ESENTONCESESYY...ESSI: 11

l

( )

( )

= =

= =

=M

l

n

il

i

l

ii

M

l

n

i

l

i

l

iil

x

x

Xy

1 1

2

1 1

2

exp

exp

)(

li

li

l

Parmetros ajustables

(1)

(2) es el centro del conjunto difusoes el centro del conjunto difuso GGll

es el valor medio de la funcin dees el valor medio de la funcin de

pertenenciapertenencia FFiill

es la pendiente de la funcin dees la pendiente de la funcin de

pertenenciapertenencia FFiill

es el vector de variables de entradaes el vector de variables de entrada xx ii

7/24/2019 CACP02

5/52

08/11/200308/11/2003 55

ModeladoModelado DifusoDifusoAdaptativoAdaptativo

DinmicoDinmico

7/24/2019 CACP02

6/52

08/11/200308/11/2003 66

Motivacin y objetivosMotivacin y objetivos

Proposicin de nuevos mtodos de modelado difuso

Incorporacin de los

datos cuantitativosdisponibles.

Conjuntos difusosdependientes del tiempo

Modelos Difusos

Adaptativos (MDA)

Funciones de Pertenencia

Dinmicas (FAD)

Utilizar y evaluar un algoritmo deaprendizaje fuera de lnea basado en elmtodo del descenso del gradiente.

Proponer un algoritmo de aprendizajeen lnea basado en AprendizajeReforzado

Nuestros Objetivos

Proponer un modelo difusocon funciones de pertenenciadinmicas a parmetros ajustables

Modelo Difuso Adaptativo Dinmico (MDAD)

Mtodos de Aprendizaje para

el ajuste de parmetros

7/24/2019 CACP02

7/52

08/11/200308/11/2003 77

El modelo difuso adaptativo dinmicoEl modelo difuso adaptativo dinmico

{ }))(,( xxF F= )),(,()( )( txxtF tF=

Funciones de pertenencia dinmicas (Virant y Zimic, 1996)

Fig. 1 Funciones de Pertenencia Dinmicas

Conjunto difuso F Conjunto difuso dinmico F

Definicin 1: Una funcin de pertenencia es dinmica si su estructura o sus

parmetros cambian con el tiempo

7/24/2019 CACP02

8/52

08/11/200308/11/2003 88

Nuestra proposicin: El modelo difusoNuestra proposicin: El modelo difuso

adaptativo dinmicoadaptativo dinmico

( )

( )

= =

= =

=M

l

n

il

i

l

ii

M

l

n

il

i

l

iil

wt

vtx

wtvtxut

Xy

1 1

2

1 1

2

),(

),(exp

),(),(exp),(

)(

),( utll

),( wtl

i

l

i

( )

( )

= =

= =

=M

l

n

il

i

l

ii

M

l

n

il

i

l

iil

x

x

Xy

1 1

2

1 1

2

exp

exp

)(

xi

t

Funciones de pertenenciadinmicas

Dinmica de las variables

del sistema

u ,v ,w son parmetros

ajustables

Lema 2

),( vtl

i

l

i ?

(3)

Definicin 2 (Sobre las funciones de pertenencia dinmicas de gauss)Definicin 3 (Sobre los centros de las funciones de pertenencia dinmicas)

Definicin 4 (Sobre los modelos difusos adaptativos dinmicos)

7/24/2019 CACP02

9/52

08/11/200308/11/2003 99

La funcinLa funcin

Definicin 5.Definicin 5. SeaSea xxii(t(tjj)),(i =1,... ,n;j=1,2,... ) el valor de la variable de entrada,(i =1,... ,n;j=1,2,... ) el valor de la variable de entrada xxii deldelMFAD en el tiempoMFAD en el tiempo t = tt = tjj . La estructura dinmica para la funcin. La estructura dinmica para la funcin ii

ll(t,v)(t,v) es dadaes dadapor la ecuacin siguiente:por la ecuacin siguiente:

N

txj

jkki

jt

ix

+

== 11 1

)(1)(

),( vtl

i

liv

donde

)(*))(,(jt

ixl

iv

jt

ixl

ivfl

i ==

es un parmetro ajustable

(4)

(5)

7/24/2019 CACP02

10/52

08/11/200308/11/2003 1010

La funcinLa funcin

+

== ,2*2 )())(,( jtli

wjtl

iwf

iil

i

Nkiki

i

j

jk txtxjt

+

= = 1,1

2

2

1

1))()((

)(

Definicin 6.Definicin 6. SeaSea xxii(t(tjj)),(i =1,... ,n; j =1,2,...) el valor de la variable de entrada,(i =1,... ,n; j =1,2,...) el valor de la variable de entrada xxii deldel

MFAD en el tiempoMFAD en el tiempo t = tt = tjj . La estructura dinmica para la funcin. La estructura dinmica para la funcin iill(t,w)(t,w) es dadaes dada

por la ecuacin siguiente:por la ecuacin siguiente:

(6)

(7)

donde

l

iw )0( >l

iw, es un parmetro ajustable y )( ki tx es dada por la ec. (5)

),( wtl

i

0> Es un bias constante para prevenir una indeterminacin numricacuando 0)(2

jt

i

7/24/2019 CACP02

11/52

08/11/200308/11/2003 1111

La funcinLa funcin ),( utl

)(__

))(__,( * jtyu

ljtyu

lfl ==

Definicin 7.Definicin 7. Sea y(tSea y(tjj) (j =1,2,...) el valor de la variable de salida del sistema obt) (j =1,2,...) el valor de la variable de salida del sistema obtenidaenida

en el tiempo t = ten el tiempo t = tjj . La estructura dinmica para la funcin. La estructura dinmica para la funcin ll (t,u)(t,u) es dada por laes dada por la

ecuacin siguiente:ecuacin siguiente:

Njty

j

jkkty

=

=2

2

1

,)(__

2

)(

(8)

(9)

lu

donde

es un parmetro ajustable

S

7/24/2019 CACP02

12/52

08/11/200308/11/2003 1212

Sobre la estructura propuesta para lasSobre la estructura propuesta para las

funciones de pertenenciafunciones de pertenencia

La incorporacin de (5), (7) y (9) en la funciones de pertenencia del modelo difuso

surge de manera natural, de acuerdo con el significado fsico deil, l y l , en los

conjuntos difusos Fi l y Gl.

La estructura propuesta en (4), (6) y (8), permite que las funciones de

pertenencia se desplacen sobre el universo de discurso de los conjuntos

difusos asociados, con un sentido fsico.

Sobre la incorporacin de la dinmica histrica de la variables:

Sobre la seleccin de los valores iniciales de los parmetros:

La seleccin de los valores iniciales de los parmetros en el MDLa seleccin de los valores iniciales de los parmetros en el MDA dado en (2),A dado en (2),esta guiado por el conocimiento acerca del dominio sobre el cualesta guiado por el conocimiento acerca del dominio sobre el cual estn definidasestn definidas

los valores de las variables de entrada y salida al modelo.los valores de las variables de entrada y salida al modelo.

SS b l t t t l

7/24/2019 CACP02

13/52

08/11/200308/11/2003 1313

Sobre la estructura propuesta para lasSobre la estructura propuesta para las

funciones de pertenenciafunciones de pertenencia

La estructura propuesta permite minimizar el problema de activacin de

reglas asociado al modelo difuso adaptativo tipo (2), durante y despus

de aplicar algoritmos de aprendizaje basados en el descenso del gradiente.

Con nuestra proposicin, se percibe, de manera natural, que losCon nuestra proposicin, se percibe, de manera natural, que los valores inicialesvalores iniciales

de los parmetros deber seleccionarse alrededor de 1, independiede los parmetros deber seleccionarse alrededor de 1, independientemente delntemente del

dominio sobre el cual se definen las variables del modelo.dominio sobre el cual se definen las variables del modelo.

Esto representa un aporte importante de la estructura propuesta para las

funciones de pertenencia dinmicas, por cuanto la seleccin de losvalores iniciales en un problema que incide en el desempeo de los

algoritmos de aprendizaje.

7/24/2019 CACP02

14/52

08/11/200308/11/2003 1414

Algoritmo de aprendizaje: enfoque fuera de lneaAlgoritmo de aprendizaje: enfoque fuera de lnea

Los parLos parmetrosmetros vviill wwiill y uy u ll son ajustados en lnea o fuera de lnea, segn unson ajustados en lnea o fuera de lnea, segn unesquema genrico de aprendizaje:esquema genrico de aprendizaje:

Enfoque fuera de lEnfoque fuera de lnea usando el mnea usando el mtodo del descenso del gradientetodo del descenso del gradienterespecto de una funcirespecto de una funcin de error cuadrn de error cuadrtico medio E, definido sobre unatico medio E, definido sobre unacoleccicoleccin de patronesn de patrones {(X(t{(X(tjj), y(t), y(tjj)); j=1,...,N})); j=1,...,N}

+=+ )()1( kk

K

EKK

=+ )()1(

( )2

1

)()(2

11

=

=N

j

jje tytyN

E (11)

)( je ty es salida del MDAD en t=tjdonde

(10)

De esta manera, (10) queda definido como:

representa, genricamente, un parmetro.

es la tasa de aprendizaje.

(12)

7/24/2019 CACP02

15/52

08/11/200308/11/2003 1515

Algoritmo de aprendizaje: enfoque en lneaAlgoritmo de aprendizaje: enfoque en lnea

= ++=

0k1kt

kt

rR

Diferencias temporales (Sutton, 1988)

[ ]

++=+

),(),(),

1(1

ttxP

ttxPtt

xPtt

Ley de ajuste: Algoritmo TD

(13)

),(),1

( ttxPtt

xP +

es una diferencia temporal

Mtodo para resolver problemas de prediccin.

Objetivo: Ajustar una funcin de prediccinP(x,), siendo x un vector de datos disponibles

y un vector de parmetros ajustables.

Aprendizaje reforzado (Sutton, 1998)

Aprendizaje basado en ensayo y error.

ObjetivoObjetivo: Aprender una poltica de accin que: Aprender una poltica de accin quepermite maximizar la ganancia ponderadapermite maximizar la ganancia ponderada RRtt

Fig. 2 Relacin Agente-Ambiente

(15)

0

7/24/2019 CACP02

16/52

08/11/200308/11/2003 1616

Ley de ajuste: Agente Crtico HeursticoLey de ajuste: Agente Crtico Heurstico

AdaptativoAdaptativo

donde:t es el vector de parmetros disponibles en t.Xt es el vector de datos disponibles en t.rt+1 es la seal de reforzamiento.P(xt, t) es la funcin de prediccin.0

7/24/2019 CACP02

17/52

08/11/200308/11/2003 1717

Nuestra proposicin: La funcin deNuestra proposicin: La funcin de

prediccinprediccin P(xP(xtt,, ))

Incorporar el comportamiento del MDAD proponiendo una funcin deprediccin dependiente del error de identificacin:

donde

0

7/24/2019 CACP02

18/52

08/11/200308/11/2003 1818

La ley de ajuste de parLa ley de ajuste de parmetrosmetros

Tomando la derivada parcial de P respecto al vectorTomando la derivada parcial de P respecto al vector ,, se tiene:se tiene:

(19)(19)

Sustituyendo (19) en (16) se tiene la ley de ajuste de parmetroSustituyendo (19) en (16) se tiene la ley de ajuste de parmetros siguiente:s siguiente:

(20)(20)

dondedonde

y, a partir de (17):y, a partir de (17):

=

=

t

Kk

kt

ttktt kxe

xP),(),()(

),(

=

=

),(),(

),( tet

t

kyxe

k k

[ ]=+ +++=+t

k

1 ),(),((),(),1(1 )

K

t tt kkxekttt

xPttxPrtt

),(),(2

1),(

11

2

tttttt xPxexP +=++

(21)

(22)

Nuestra proposicin: La seal deNuestra proposicin: La seal de

7/24/2019 CACP02

19/52

08/11/200308/11/2003 1919


reforzamientoreforzamiento rrt+1t+1

En la prediccin de la ganancia ponderada REn la prediccin de la ganancia ponderada Rtt, se espera que:, se espera que:

o, de manera equivalente:o, de manera equivalente:

Por otro lado, tomando en cuenta la funcin de prediccin P propPor otro lado, tomando en cuenta la funcin de prediccin P propuesta, se esperauesta, se esperaque:que:

Y si el MDAD se est ajustando correctamente, se espera tambinY si el MDAD se est ajustando correctamente, se espera tambin

que:que:

tt RP

),1

(),( 1 ttxPrtt

xP t ++ +

),(),1

(0 1 ttxPtt

xPrt

7/24/2019 CACP02

20/52

08/11/200308/11/2003 2020


reforzamientoreforzamiento rrt+1t+1

Tomando en cuenta las condiciones dadas en (24) y (25) y dado quTomando en cuenta las condiciones dadas en (24) y (25) y dado que:e:

(26)(26)

La seal de reforzamiento rLa seal de reforzamiento rt+1t+1 se define de la siguiente manera:se define de la siguiente manera:

),(),1(2

1),

1( 2211 tt

xPtterttxPr tt +++=+

+ ++

),P(x),P(xr

),P(x),P(xtxer

ttttt

tttttt

7/24/2019 CACP02

21/52

08/11/200308/11/2003 2121

Ejemplo ilustrativoEjemplo ilustrativo

Identificacin de una funcin no lineal variante en el tiempo deIdentificacin de una funcin no lineal variante en el tiempo descrita por lascrita por lasiguiente ecuacin en diferencias:siguiente ecuacin en diferencias:

donde:donde:

La funcin g[y(k),y(kLa funcin g[y(k),y(k--1)] es estimada usando el MDAD1)] es estimada usando el MDAD..

Condiciones generales en la fase de entrenamiento (Aprendizaje fCondiciones generales en la fase de entrenamiento (Aprendizaje fuera deuera delnea):lnea):

Los valores iniciales de los parmetros han sido escogidosLos valores iniciales de los parmetros han sido escogidosaleatoriamente sobre intervalos adecuados.aleatoriamente sobre intervalos adecuados.

Generacin de 250 patrones de entrenamiento usando comoGeneracin de 250 patrones de entrenamiento usando comoentradaentrada u(k)u(k) una secuencia binaria pseudouna secuencia binaria pseudo--aleatoria.aleatoria.

Realizacin de diferentes ciclos de aprendizaje con diferentesRealizacin de diferentes ciclos de aprendizaje con diferentes

valores de la tasa de aprendizajevalores de la tasa de aprendizaje (ecuacin (12)) y nmero de(ecuacin (12)) y nmero dereglas M, hasta conseguir la convergencia del error.reglas M, hasta conseguir la convergencia del error.

)()]1(),([)1( kukykygky +=+

)k/sen(..a(k)

kykykakykykykykyg

25025252

)1()(1)]()()[1()()]1(),([ 22

+=

++ +=

7/24/2019 CACP02

22/52

08/11/200308/11/2003 2222


0 100 200 300 400 500 600 700 8000

0.2

0.4

0.6

0.8

1

time (sec)

relativeerror

0 100 200 300 400 500 600 700 8005

0

5

10

15

time (sec)

realoutput(

),estimatedoutput(

)

7/24/2019 CACP02

23/52

08/11/200308/11/2003 2323


0 100 200 300 400 500 600 700 8000

0.2

0.4

0.6

0.8

1

time (sec)

relat

iveerror

0 100 200 300 400 500 600 700 8005

0

5

10

15

time (sec)

realou

tput(

),estimatedoutput(

)

7/24/2019 CACP02

24/52

08/11/200308/11/2003 2424


MM N_parN_par RMSERMSE

FAFA

RMSERMSE

FVFV

88 4040 0.21300.2130 0.14760.1476

1010 5050 0.20510.2051 0.16180.1618

2020 100100 0.23250.2325 0.15900.1590

4040 200200 0.25450.2545 0.24140.2414

Fig.6- Desempeo del MDAD (M =8) usando unalgoritmo de ajuste fuera de lnea (40 parmetros

ajustables)

Caso 2.Aprendizaje fuera de lnea usando el MDAD

MM RMSE FARMSE FA

caso 1caso 1

RMSE FVRMSE FV

caso 1caso 1

RMSE FARMSE FA

caso 2caso 2

RMSE FVRMSE FV

caso 2caso 21010 0.15330.1533 0.20510.2051 0.60360.6036

0.56300.5630

0.16180.1618

2020 0.14440.1444 0.23250.2325 0.15900.1590

RMSE =0.1476

Tabla 1- Resumen de los errores obtenidos usando elMDAD

Tabla 2- Comparacin entre los errores obtenidosusando el MDA y el MDAD

1=4 (ec. (5),(7)); 2=1 (ec. (9))

0 100 200 300 400 500 600 700 8000

0.05

0.1

0.15

time (sec)

relativeerror

0 100 200 300 400 500 600 700 8005

0

5

10

15

time (sec)

realoutpu

t(

),estimatedoutput(

)

7/24/2019 CACP02

25/52

08/11/200308/11/2003 2525


7/24/2019 CACP02

26/52

08/11/200308/11/2003 2626


Caso 3.Aprendizaje en lnea usando AR y el MDAD

Fig.8- Desempeo del MDAD (M =6) usando un algoritmo deajuste en lnea (36 parmetros ajustables)

= = 0.9)1(9.0

)1()(

+

=k

kk

K =5 (ec. (19))

0 100 200 300 400 500 600 7000

0.05

0.1

0.15

time index

relativeer

ror

0 100 200 300 400 500 600 7005

0

5

10

15

time index

realoutp

ut(

),estimatedoutput(

)

RMSE =0.1110

7/24/2019 CACP02

27/52

08/11/200308/11/2003 2727


0 100 200 300 400 500 600 7000

0.05

0.1

0.15

time index

relativeerror

0 100 200 300 400 500 600 7005

0

5

10

15

time index

realoutput(),estimatedoutput(

)

7/24/2019 CACP02

28/52

08/11/200308/11/2003 2828

Consideraciones sobre el algoritmo deConsideraciones sobre el algoritmo de

aprendizaje en lneaaprendizaje en lnea

Sensibilidad respecto a la variacin de los parmetros , ,

Pequeos cambios en la tasa de variacin respecto al RMSE, fijando el

valor de la tasa de aprendizaje . Cambios mas significativos en tasa de variacin, fijando y .

Sensibilidad respecto al nmero de reglas

La tasa de variacin es poco significativa despus de un cierto nmero de

reglas (M =15 en el ejemplo estudiado)

Sensibilidad respecto a las condiciones iniciales de los parmetros

El valor global del RMSE es mejorado para condiciones iniciales

alrededor de 1.

Consideraciones sobre el algoritmo deConsideraciones sobre el algoritmo de

7/24/2019 CACP02

29/52

08/11/200308/11/2003 2929

Consideraciones sobre el algoritmo deCo s de ac o es sob e e a go t o de

aprendizaje en lneaaprendizaje en lnea

Sensibilidad respecto a las condiciones iniciales de los parmetros

0 100 200 300 400 500 600 700 8000

0.05

0.1

0.15

0.2

time index

relativeerror

0 100 200 300 400 500 600 700 8002

1

0

1

2

time index

real

output(

),estimatedoutput()

0 100 200 300 400 500 600 700 8000

0.05

0.1

0.15

0.2

time index

relativeerror

0 100 200 300 400 500 600 700 8002

1

0

1

2

time index

realoutput(

),estimatedoutput()

Fig.10- Desempeo del MDAD usando un algoritmode ajuste en lnea con valores iniciales de los

parmetros sobre el intervalo [0.5 1.5]

Fig.11- Desempeo del MDAD usando un algoritmode ajuste en lnea con valores iniciales de los

parmetros sobre el intervalo [0 1]

7/24/2019 CACP02

30/52

08/11/200308/11/2003 3030

AplicacionesAplicaciones

C l di iC t l di ti

7/24/2019 CACP02

31/52

08/11/200308/11/2003 3131

Control predictivoControl predictivo

Un modelo de prediccin del procesoUn modelo de prediccin del proceso

Una secuencia de acciones de control futuros que minimizan una fUna secuencia de acciones de control futuros que minimizan una funcinuncin

objetivoobjetivo

Una estrategia de horizonte movibleUna estrategia de horizonte movible

Referencia w

Tiempo t

KTiempoactual

pasado futuro

Horizontede control Horizonte de

prediccinK+Hc

K+Hp

Control u

Prediccinde la salida

==

++++=Hc

iQ

Hp

i P

ei

i

ikuikyikwJ1

2

1

2)1()()(

El control predictivo abarca un conjunto de mtodos de control han sido desarrolladosalrededor de ciertas ideas fundamentales:

Fig.14- Estrategia general del control predictivo

(28)

7/24/2019 CACP02

32/52

08/11/200308/11/2003 3232

MotivacinMotivacin

Necesidad de un modelo de prediccin de la salida delNecesidad de un modelo de prediccin de la salida del

proceso.proceso.

Necesidad de mtodos de optimizacin para laNecesidad de mtodos de optimizacin para laminimizacin de la funcin objetivo.minimizacin de la funcin objetivo.

Entrada dereferencia

Entradas et salidaspasadas

Entradas

futuras u

Salida estimada(prediccin)

Errores

futuros

RestriccionesFuncinObjetivo

Modelo

Optimizador

Fig.15- Estructura base del control predictivo

ObjetivosObjetivos

7/24/2019 CACP02

33/52

08/11/200308/11/2003 3333

ObjetivosObjetivos

Utilizar un modelo difuso adaptativo dinmico comoUtilizar un modelo difuso adaptativo dinmico comomodelo de prediccin a un paso.modelo de prediccin a un paso.

Utilizar un algoritmo de optimizacin basado enUtilizar un algoritmo de optimizacin basado en

funciones de penalidad y aprendizaje reforzado.funciones de penalidad y aprendizaje reforzado.

Optimizador Proceso

Modelo Difuso

(MFAD)

Filtro

z -1

r (t+1)

ye(t+1)

y(t+1)

e

u(t)

Fig.16- Esquema de control predictivo utilizado

MDAD como modelo de prediccin a unMDAD como modelo de prediccin a un

7/24/2019 CACP02

34/52

08/11/200308/11/2003 3434

p

pasopaso

0

1

)()(

+

==j

txj

kki

jt

ix

0

2

2

1

))()(()( +

=

= j

kiki

i

j

k

txtxjt

),( wtl

iLas funciones y , en (4) y (6) respectivamente, han sido

redefinidas usando:

(29)

(30)

Esta definicin ha reportado resultados satisfactorios en la identificacin desistemas invariantes en el tiempo (Cerrada et al., 2002)

),( vtl

i

Algoritmo de optimizacinAlgoritmo de optimizacin

7/24/2019 CACP02

35/52

08/11/200308/11/2003 3535

Algoritmo de optimizacinAlgoritmo de optimizacin

mig

Exxxxh)h(x); h(x

i

nnx

,...,1;0

),,...,,(max 21

=

=

))(()()1( kxdkxkx +=+ )()())(( 1 xgxhkxdi

m

i

i= =

El problema del control predictivo se ha planteado como un problEl problema del control predictivo se ha planteado como un problema de programacin no linealema de programacin no lineal(PNL), usando para su resolucin, un algoritmo de optimizacin u(PNL), usando para su resolucin, un algoritmo de optimizacin usando funciones de penalidadsando funciones de penalidad

(J. Tang y D. Wang, 1997) pero incorporando una tasa adaptativa(J. Tang y D. Wang, 1997) pero incorporando una tasa adaptativa segn un algoritmo basado ensegn un algoritmo basado en

aprendizaje reforzado (G. Tesauro,1995)aprendizaje reforzado (G. Tesauro,1995)

>

= 0)(

0)(0

xgsi

xgsi

ii

i

i

+=

)(

1

max xgg ii },...,1),(max{max mixgg i ==

>+

=

0)(

0)(

)(max

max

max

gsigM

xh

gsixh

xh

Algoritmo de optimizacin usando funciones de penalidad

Algoritmo de aprendizaje TD-Gammon

(31)

(32) (33) (34)

(35) (36) (37)

[ ]

+=+ +

),(

),(1 1tt

xP

ttxPrtt t (38)

K denota el ndice de iteracin y son valores muy pequeos

t denota el ndice de iteracin

M es un valor muy grande

Algoritmo de control predictivo a un paso usando elAlgoritmo de control predictivo a un paso usando el

7/24/2019 CACP02

36/52

08/11/200308/11/2003 3636

algoritmo de optimizacin con funciones de penalidadalgoritmo de optimizacin con funciones de penalidad

)()1()(1 udtutu kkk +=+

maxmin

maxmin

2

)(

)(

))1()1((2

1)(min

utuu

utuu

tytwuJ eu

++=

)1()()( = tututu

0)(

0)(

0)(

0)(

))1()1((

2

1);(-h(u)max

min

max

min

max

2

++==

tuu

utu

tuu

utu

tytwJuJ eu

Sea el problema de control predictivo sujeto a restricciones:

(39) donde

ye(t+1)=f(u(t),y(t) es la salida estimada por el MDAD

)(

)1())1()1(()(

tu

tytytwuh ee

+++=

El problema (39) es redefinido como el problema de PNL siguiente:

Inspirados en la ley de actualizacin (32), se propone el siguiente algoritmo de control:

(40)

donde es una tasa adaptativa y dk(u) es calculadosegn (33) con:

(41)

(42)

(43)

Ley de ajuste para la tasa adaptativaLey de ajuste para la tasa adaptativa

7/24/2019 CACP02

37/52

08/11/200308/11/2003 3737

Ley de ajuste para la tasa adaptativaLey de ajuste para la tasa adaptativa

))(()()1( jdjj +=+

0)(

)(2

1)(min 2

=

ig

Jrh

El problema de ajuste de la tasa se plantea como el siguiente problema de PNL:

(44) donde J es definido en (41) y res una seal de

reforzamiento

ye(t+1)=f(u(t),y(t) es la salida estimada por el MDAD.

)(

)(

)(

)1())1()1()(()(

j

tu

tu

tytytwJrh

k

k

ee

+

++=

Haciendo uso de la ley de ajuste (32), se tiene:

d() es calculado segn (33) con:(45)

(46)

La seal de reforzamiento res definida segn el problema bajo estudio.

AlgoritmoAlgoritmo

7/24/2019 CACP02

38/52

08/11/200308/11/2003 3838

AlgoritmoAlgoritmo

no0)( ugi

))(()()1( jdjj +=+

0)( jgno

))(( jd

)(udk

)()1()(1 udtutu kkk +=+

Ejemplo de AplicacinEjemplo de Aplicacin

7/24/2019 CACP02

39/52

08/11/200308/11/2003 3939

Ejemplo de AplicacinEjemplo de Aplicacin

Control de la presin interna de un tanque fermentadorControl de la presin interna de un tanque fermentador

Objetivo de control: regular la apertura de la vlvula de salidaObjetivo de control: regular la apertura de la vlvula de salida de aire del tanquede aire del tanque

Relacin altamente no lineal entre la apertura de la vlvula y lRelacin altamente no lineal entre la apertura de la vlvula y la presin internaa presin interna

Tasa de muestreo de 5 seg.Tasa de muestreo de 5 seg.

agua

Presin

Internay

u

aire

controlador

vlvula

Fig.17- Proceso de fermentacin

u representa el % de cierre de la vlvula, luego

100)(0 tu

10)(10 tu

Adems:

Modelo de identificacinModelo de identificacin

7/24/2019 CACP02

40/52

08/11/200308/11/2003 4040

Modelo de identificacinModelo de identificacin

Modelo de identificacin a un paso usando un MDAD: yModelo de identificacin a un paso usando un MDAD: yee(t+1(t+1))=f(y(t),u(t))=f(y(t),u(t))

Ajuste fuera de lnea, usando las ecuaciones (11),(12) y (13) yAjuste fuera de lnea, usando las ecuaciones (11),(12) y (13) y 323 pares de datos de323 pares de datos de

entrenamiento.entrenamiento.

Se seleccion el modelo difuso obtenido con M=30 (Se seleccion el modelo difuso obtenido con M=30 (RMSE =776.7 en fase de validacin)

0 200 400 600 800 1000 1200 1400 16000

0.005

0.01

0.015

0.02

time (sec)

relativeerror

0 200 400 600 800 1000 1200 1400 16001

1.2

1.4

1.6

1.8x 10

5

time (sec)

realoutput(),estimatedoutput(

)

Fig.19- Desempeo del MDAD en la identificacin delproceso de fermentacin

0 200 400 600 800 1000 1200 1400 16000

20

40

60

80

100

time(sec)

valvepositionu(%)

0 200 400 600 800 1000 1200 1400 16001

1.2

1.4

1.6

1.8

2x 10

5

time(sec)

pre

ssure(Pa)

Fig.18- Patrones de entrenamiento


7/24/2019 CACP02

41/52

08/11/200308/11/2003 4141


Restricciones sobre el valor del control:

0)(10)(

010)()(

0)()(

0100)()(

4

3

2

1

=

=

=

=

tuug

tuug

tuug

tuug

0)(

01)(

0)()1()(

0100)()1()(

010)()(

010)()(

6

5

4

3

2

1

=

=

=

=

=

=

g

g

udtug

udtug

udg

udg

>=

63

6

10*10100

JsiJJsir

Restricciones sobre el valor de la tasa:

Definicin de la seal de reforzamiento:

Parmetros del algoritmo de optimizacin:

02.0)0(

10

10

10

5

2

4

=

=

=

=

M

(47)(48)

(49)

Filtro:

z

z

zE

zF 9.01.0

)(

)( += (50)

ResultadosResultados

7/24/2019 CACP02

42/52

08/11/200308/11/2003 4242

ResultadosResultados

0 500 1000 1500 2000 25001

1.1

1.2

1.3

1.4

1.5

1.6

1.7

1.8

1.9x 10

5

time(sec)

pression(Pa)

Fig.20 Desempeo del algoritmo de control contasas constantes ( =0.02,0.03,0.04)

0 500 1000 1500 2000 25001

1.1

1.2

1.3

1.4

1.5

1.6

1.7

1.8

1.9x 10

5

time(sec)

pression(Pa)

Fig.21 Desempeo del algoritmo de control contasas adaptativa usando AR.

Aplicacin a la supervisin yAplicacin a la supervisin y

di tidi ti

7/24/2019 CACP02

43/52

08/11/200308/11/2003 4343

diagnsticodiagnstico

Caractersticas del MDAD

No es necesario escalar las amplitudes originales de las variablesdel modelo, permitiendo preservar el sentido fsico del modelo.

En un modelo difuso, la nocin de causalidad esta presente desde su

concepcin. En el MDAD esta nocin se incorpora tambin en la definicin de las

funciones , y : las variaciones de la media y la varianza de las variables de

entrada, visualizadas en , , inciden en las variaciones sobre . An cuando no se tiene una representacin explcita del tiempo, la nocintemporal es incorporada en la definicin de las funciones , y , permitiendotener una memoria temporal tomando en cuenta una cantidad de informacin

histrica.

Supervisin y diagnsticoSupervisin y diagnstico

7/24/2019 CACP02

44/52

08/11/200308/11/2003 4444

Supervisin y diagnsticoSupervisin y diagnstico

Proceso

MDA

D

de

diagn

stico

u y

Indicador de fallas

Controlador Proceso

MDADSupervisor

w u y

Fig.27 Esquema de diagnstico

Fig.28 Esquema de supervisin


7/24/2019 CACP02

45/52

08/11/200308/11/2003 4545

Ejemplo ilustrativoj p

0 100 200 300 400 500 600 7001

0

1

2

3

4

5

time index

a(k)

Proceso

MDAD de

identificacin

u y

ye

v wHacia un modelo

de supervisin

Hacia un modelo

de diagnstico

Fig.29 Informacin contenida en unMDAD como identificador

Se retoma nuevamente el ejemplopresentado en la parte de modelado y se

observa la evolucin de las funciones de

membresa y sus parmetros, en las variables

de entrada al modelo en condiciones normales

de operacin y en condicin de falla.

Fig.23 Falla sobre el trmino a(k)

7/24/2019 CACP02

46/52

08/11/200308/11/2003 4646

j pj p

0 100 200 300 400 500 600 70010

10.5

11

11.5

12

12.5

13

time index

norm(v)

0 100 200 300 400 500 600 70012.4

12.5

12.6

12.7

12.8

12.9

13

time index

norm(w)

0 100 200 300 400 500 600 7000

500

1000

1500

2000

time index

norm(alfa)

0 100 200 300 400 500 600 7000

100

200

300

400

500

600

time index

norm(beta)

0 100 200 300 400 500 600 7000

500

1000

1500

2000

time index

norm(alfa)

0 100 200 300 400 500 600 7000

100

200

300

400

500

600

time index

norm

(beta)

0 100 200 300 400 500 600 70010

10.5

11

11.5

12

12.5

13

time index

norm(v)

0 100 200 300 400 500 600 70012.4

12.5

12.6

12.7

12.8

12.9

13

time index

norm(w)

Fig.24 Condicinnormal

Fig.25 Falla abrupta


7/24/2019 CACP02

47/52

08/11/200308/11/2003 4747

j pj p

0 100 200 300 400 500 600 70010

10.5

11

11.5

12

12.5

13

time index

norm(v)

0 100 200 300 400 500 600 70012.4

12.5

12.6

12.7

12.8

12.9

13

time index

norm(w)

0 100 200 300 400 500 600 7000

500

1000

1500

2000

time index

norm(alfa)

0 100 200 300 400 500 600 7000

100

200

300

400

500

600

time index

norm(beta)

Fig.26 Condicinnormal

Fig.27 Fallacontinua

0 100 200 300 400 500 600 7000

500

1000

1500

2000

time index

norm(alfa)

0 100 200 300 400 500 600 7000

100

200

300

400

500

600

time index

norm(beta)

0 100 200 300 400 500 600 70010

10.5

11

11.5

12

12.5

13

time index

norm(v)

0 100 200 300 400 500 600 70012.4

12.5

12.6

12.7

12.8

12.9

13

time index

norm(w)

Conclusin generalConclusin general

7/24/2019 CACP02

48/52

08/11/200308/11/2003 4848

gg

Sobre la propuesta de modelado difuso dinSobre la propuesta de modelado difuso dinmicomico

La originalidad del modelo propuesto reside en el uso de funcionLa originalidad del modelo propuesto reside en el uso de funciones dees depertenencia dinpertenencia dinmicas con significado fmicas con significado fsico.sico.

Sobre el algoritmo de aprendizaje en lSobre el algoritmo de aprendizaje en lneanea

La contribuciLa contribucin reposa en la proposicin reposa en la proposicin de una funcin de una funcin de prediccin de prediccin quen queincorpora el desempeincorpora el desempeo del modelo difuso, lo que permite resaltar loso del modelo difuso, lo que permite resaltar loselementos del aprendizaje reforzado en telementos del aprendizaje reforzado en trminos del problema derminos del problema deidentificaciidentificacin: definir una accin: definir una accin (ajuste de los parn (ajuste de los parmetros del MDAD),metros del MDAD),determinar el valor de dicha accideterminar el valor de dicha accin (prediccin (prediccin del error) y dar unan del error) y dar una

recompensa en trecompensa en t

rminos del error de prediccirminos del error de predicci

n.n.

El valor de la seEl valor de la seal de reforzamiento queda claramente definida,al de reforzamiento queda claramente definida,satisfaciendo condiciones tanto del problema de AR como del probsatisfaciendo condiciones tanto del problema de AR como del problema delema deidentificaciidentificacin del modelo difuso.n del modelo difuso.


7/24/2019 CACP02

49/52

08/11/200308/11/2003 4949

gg

Sobre los resultados experimentales aplicados a la identificaciSobre los resultados experimentales aplicados a la identificacin de sistemas non de sistemas nolineales variantes en el tiempolineales variantes en el tiempo

Los ejemplos desarrollados ilustran resultados satisfactorios alLos ejemplos desarrollados ilustran resultados satisfactorios alcomportamiento del error de identificacicomportamiento del error de identificacin.n.

El uso del MDAD ha mostrado un mejor desempeEl uso del MDAD ha mostrado un mejor desempeo que el MDA tantoo que el MDA tantousando algoritmo de aprendizaje en lusando algoritmo de aprendizaje en lnea como fuera de lnea como fuera de lnea.nea.

Sobre la aplicaciSobre la aplicacin al control predictivon al control predictivo

La capacidad de predicciLa capacidad de prediccin del MDAD ha sido validado en el problema den del MDAD ha sido validado en el problema decontrol predictivo desarrollado, mostrando un desempecontrol predictivo desarrollado, mostrando un desempeo adecuado en lao adecuado en laidentificaciidentificacin del proceso de fermentacin del proceso de fermentacin.n.

Dos problemas de optimizaciDos problemas de optimizacin usando aprendizaje reforzado y funciones den usando aprendizaje reforzado y funciones depenalizacipenalizacin, fueron propuestos para resolver el problema de controln, fueron propuestos para resolver el problema de controlpredictivo a un paso: uno orientado al cpredictivo a un paso: uno orientado al clculo de control, y el otro orientado allculo de control, y el otro orientado alcclculo de la tasa de aprendizaje del algoritmo de control. El deslculo de la tasa de aprendizaje del algoritmo de control. El desempeempeo delo delsistema controlado fue mejoradosistema controlado fue mejorado usando aprendizaje reforzado para elusando aprendizaje reforzado para el

clculo de la tasa de aprendizaje.clculo de la tasa de aprendizaje.


7/24/2019 CACP02

50/52

08/11/200308/11/2003 5050

gg

Sobre las perspectivas del uso del MDAD en la supervisiSobre las perspectivas del uso del MDAD en la supervisin y diagnosticon y diagnostico

El MDAD propuesto tiene caracterEl MDAD propuesto tiene caractersticas importantes para tratar las tareas desticas importantes para tratar las tareas desupervisisupervisin y diagnn y diagnstico.stico.

El MDAD usado como modelo de identificaciEl MDAD usado como modelo de identificacin de entradan de entrada--salida, guarda ensalida, guarda enla evolucila evolucin de las funcionesn de las funciones yy , y en los par, y en los parmetrosmetros vv yy ww ajustados enajustados enllnea, informacinea, informacin interesante acerca del comportamiento del proceso. Dichan interesante acerca del comportamiento del proceso. Dichainformaciinformacin puede ser utilizada con propn puede ser utilizada con propsitos de supervisisitos de supervisin y diagnn y diagnstico.stico.

Perspectivas respecto al desarrollo de modelos difusos dinPerspectivas respecto al desarrollo de modelos difusos dinmicosmicos En relaciEn relacin a nuestra propuestan a nuestra propuesta

DefiniciDefinicin de funciones de membresn de funciones de membresa dina dinmicas de tipo triangular.micas de tipo triangular.IncorporaciIncorporacin de funciones de membresn de funciones de membresa dina dinmicas en modelos de tipo TSK.micas en modelos de tipo TSK.

ValidaciValidacin del uso del MDAD en un caso de estudio orientado al diagnn del uso del MDAD en un caso de estudio orientado al diagnstico y a lastico y a lasupervisisupervisin.n. Otras propuestasOtras propuestas

Ecuaciones diferenciales difusasEcuaciones diferenciales difusas

Publicaciones

7/24/2019 CACP02

51/52

08/11/200308/11/2003 5151

PublicacionesPublicaciones en extenso:en extenso:

M.M. CerradaCerrada, J., J.AguilarAguilar, E., E. ColinaColina, A., A. TitliTitli..An approach for dynamical adaptiveAn approach for dynamical adaptivefuzzy modelling.fuzzy modelling. Proceedings of FUZZProceedings of FUZZ--IEEE 2002 International Conference onIEEE 2002 International Conference onFuzzy LogicFuzzy Logic, pp. 156, pp. 156--161.161. HawaiHawai, USA. May 2002., USA. May 2002.

Computer and Control AbstractComputer and Control Abstract,,August 2002, Abstract No. 66418

M.M. CerradaCerrada, J., J.AguilarAguilar, E., E. ColinaColina, A., A. TitliTitli.. Dynamical Adaptive Fuzzy Systems:Dynamical Adaptive Fuzzy Systems:

An Application on System Identification,An Application on System Identification, Proceedings of 15th Triennal IFACProceedings of 15th Triennal IFACWorld CongressWorld Congress, p.p 1006, p.p 1006--1011. Barcelona, Espaa. Julio 20021011. Barcelona, Espaa. Julio 2002..

M.M. CerradaCerrada, J., J.AguilarAguilar, E., E. ColinaColina, A., A. TitliTitli.. TimeTime--varying non linear systemvarying non linear systemidentification using dynamical adaptive fuzzy systems,identification using dynamical adaptive fuzzy systems, Revista Tcnica de laRevista Tcnica de laFacultad de Ingeniera,Facultad de Ingeniera, Universidad del ZuliaUniversidad del Zulia, vol. 25(3) p.p 171, vol. 25(3) p.p 171--180. Diciembre180. Diciembre20022002..

SometidosSometidos aa revisinrevisin::

M.M. CerradaCerrada, J., J.AguilarAguilar, E., E. ColinaColina, A., A. TitliTitli.. Dynamical membership functions: aDynamical membership functions: annapproach for adaptive fuzzy modellingapproach for adaptive fuzzy modelling,, FuzzyFuzzy SetsSets andand SystemsSystems, 2da. revisin, 2da. revisin

AgradecimientosAgradecimientos

7/24/2019 CACP02

52/52

08/11/200308/11/2003 5252

g

Esta tesis ha sido desarrollada en el marco de:

Convenio franco-venezolano PCP Optimizacin e Integracin de Procesos.

Convenio de co-tutela ULA-INSA.

CACP02

Documents

Transcript of CACP02