CACP02
-
Upload
eliojoseortiz -
Category
Documents
-
view
217 -
download
0
Transcript of CACP02
-
7/24/2019 CACP02
1/52
Sobre los Modelos DifusosSobre los Modelos DifusosAdaptativos DinAdaptativos Dinmicosmicos
Mariela CERRADAMariela CERRADA--LOZADALOZADADirectores de tesis: J. AGUILARDirectores de tesis: J. AGUILAR--CASTRO y A. TITLICASTRO y A. TITLI
Institut National des Sciences Appliques Universidad de Los Andescole Doctorale Systmes Automatiques Doctorado en Ciencias AplicadasComplexe Scientifique de Rangueil Complejo La Hechicera
Toulouse - FRANCE Mrida -VENEZUELA.
Laboratoire dAnalyse et dArchitecture des Systmes (LAAS -CNRS)Groupe DISCO7, avenue du Colonel Roche31077 Toulouse -FRANCE
IV Congreso de Automatizacin y ControlMrida, 12-14 noviembre 2003
-
7/24/2019 CACP02
2/52
08/11/200308/11/2003 22
ContenidoContenidoMarco TericoMarco Terico Contexto: Modelado e IdentificacinContexto: Modelado e Identificacin
El modelo difuso adaptativoEl modelo difuso adaptativo
Modelado Difuso Adaptativo DinmicoModelado Difuso Adaptativo Dinmico Motivacin y ObjetivosMotivacin y Objetivos
Proposicin:Proposicin:El modelo difuso adaptativo dinmico.El modelo difuso adaptativo dinmico.
El algoritmo de aprendizaje en lnea.El algoritmo de aprendizaje en lnea.
Ejemplo IlustrativoEjemplo Ilustrativo Algunas consideraciones sobre el algoritmo de aprendizaje en lnAlgunas consideraciones sobre el algoritmo de aprendizaje en lneaea
AplicacionesAplicaciones Control PredictivoControl Predictivo
Motivacin y objetivosMotivacin y objetivos
PropuestaPropuesta
Caso de estudio: control de un proceso de fermentacinCaso de estudio: control de un proceso de fermentacin
Perspectivas en la aplicacin a la supervisin y diagnsticoPerspectivas en la aplicacin a la supervisin y diagnstico
Conclusin GeneralConclusin General
-
7/24/2019 CACP02
3/52
08/11/200308/11/2003 33
ContextoContexto
Trabajo centrado en el reaTrabajo centrado en el reade modelado ede modelado eidentificacin.identificacin.
Desarrollo de un modeloDesarrollo de un modelodifuso por identificacindifuso por identificacin
Modelos difusos eModelos difusos eidentificacin:identificacin: Estructura del modeloEstructura del modelo
Tipo de modeloTipo de modelo
Funciones de pertenenciaFunciones de pertenencia
Operadores lgicosOperadores lgicos
Ajuste del modeloAjuste del modeloParmetros de las funcionesParmetros de las funcionesde pertenenciade pertenencia
Ajuste del nmero de reglasAjuste del nmero de reglas
Modelado
Identificacin
Modelos
difusos
-
7/24/2019 CACP02
4/5208/11/200308/11/2003 44
El modelo difuso adaptativoEl modelo difuso adaptativo
Sea una regla de una base de reglas difusa (modelo difusSea una regla de una base de reglas difusa (modelo difuso):o):
dondedonde XXii es una variable lingstica de entrada definida sobre un universes una variable lingstica de entrada definida sobre un universo de discursoo de discurso UUii yyyy es la variable lingstica de salida definida sobre un universes la variable lingstica de salida definida sobre un universo de discursoo de discurso VV.. FFiill yy GGll sonson
conjuntos difusosconjuntos difusos sobresobre UUii yy VV, respectivamente, l =1,,M; i=1,,n., respectivamente, l =1,,M; i=1,,n.
Lema 1Lema 1(Wang, 1994)(Wang, 1994):: El modelo lgicoEl modelo lgico--difuso (1), con un mecanismo de inferencia utilizandodifuso (1), con un mecanismo de inferencia utilizandoel mtodo de fusificacin por singleton difusos, el mtodo de deel mtodo de fusificacin por singleton difusos, el mtodo de defusificacin del promedio defusificacin del promedio de
centros y funciones pertenencia de Gauss para los conjuntos difucentros y funciones pertenencia de Gauss para los conjuntos difusos de la variables desos de la variables deentrada, tiene la forma funcional siguiente:entrada, tiene la forma funcional siguiente:
ll
nn
ll GyFxFxR ESENTONCESESYY...ESSI: 11
l
( )
( )
= =
= =
=M
l
n
il
i
l
ii
M
l
n
i
l
i
l
iil
x
x
Xy
1 1
2
1 1
2
exp
exp
)(
li
li
l
Parmetros ajustables
(1)
(2) es el centro del conjunto difusoes el centro del conjunto difuso GGll
es el valor medio de la funcin dees el valor medio de la funcin de
pertenenciapertenencia FFiill
es la pendiente de la funcin dees la pendiente de la funcin de
pertenenciapertenencia FFiill
es el vector de variables de entradaes el vector de variables de entrada xx ii
-
7/24/2019 CACP02
5/52
08/11/200308/11/2003 55
ModeladoModelado DifusoDifusoAdaptativoAdaptativo
DinmicoDinmico
-
7/24/2019 CACP02
6/52
08/11/200308/11/2003 66
Motivacin y objetivosMotivacin y objetivos
Proposicin de nuevos mtodos de modelado difuso
Incorporacin de los
datos cuantitativosdisponibles.
Conjuntos difusosdependientes del tiempo
Modelos Difusos
Adaptativos (MDA)
Funciones de Pertenencia
Dinmicas (FAD)
Utilizar y evaluar un algoritmo deaprendizaje fuera de lnea basado en elmtodo del descenso del gradiente.
Proponer un algoritmo de aprendizajeen lnea basado en AprendizajeReforzado
Nuestros Objetivos
Proponer un modelo difusocon funciones de pertenenciadinmicas a parmetros ajustables
Modelo Difuso Adaptativo Dinmico (MDAD)
Mtodos de Aprendizaje para
el ajuste de parmetros
-
7/24/2019 CACP02
7/52
08/11/200308/11/2003 77
El modelo difuso adaptativo dinmicoEl modelo difuso adaptativo dinmico
{ }))(,( xxF F= )),(,()( )( txxtF tF=
Funciones de pertenencia dinmicas (Virant y Zimic, 1996)
Fig. 1 Funciones de Pertenencia Dinmicas
Conjunto difuso F Conjunto difuso dinmico F
Definicin 1: Una funcin de pertenencia es dinmica si su estructura o sus
parmetros cambian con el tiempo
-
7/24/2019 CACP02
8/52
08/11/200308/11/2003 88
Nuestra proposicin: El modelo difusoNuestra proposicin: El modelo difuso
adaptativo dinmicoadaptativo dinmico
( )
( )
= =
= =
=M
l
n
il
i
l
ii
M
l
n
il
i
l
iil
wt
vtx
wtvtxut
Xy
1 1
2
1 1
2
),(
),(exp
),(),(exp),(
)(
),( utll
),( wtl
i
l
i
( )
( )
= =
= =
=M
l
n
il
i
l
ii
M
l
n
il
i
l
iil
x
x
Xy
1 1
2
1 1
2
exp
exp
)(
xi
t
Funciones de pertenenciadinmicas
Dinmica de las variables
del sistema
u ,v ,w son parmetros
ajustables
Lema 2
),( vtl
i
l
i ?
(3)
Definicin 2 (Sobre las funciones de pertenencia dinmicas de gauss)Definicin 3 (Sobre los centros de las funciones de pertenencia dinmicas)
Definicin 4 (Sobre los modelos difusos adaptativos dinmicos)
-
7/24/2019 CACP02
9/52
08/11/200308/11/2003 99
La funcinLa funcin
Definicin 5.Definicin 5. SeaSea xxii(t(tjj)),(i =1,... ,n;j=1,2,... ) el valor de la variable de entrada,(i =1,... ,n;j=1,2,... ) el valor de la variable de entrada xxii deldelMFAD en el tiempoMFAD en el tiempo t = tt = tjj . La estructura dinmica para la funcin. La estructura dinmica para la funcin ii
ll(t,v)(t,v) es dadaes dadapor la ecuacin siguiente:por la ecuacin siguiente:
N
txj
jkki
jt
ix
+
== 11 1
)(1)(
),( vtl
i
liv
donde
)(*))(,(jt
ixl
iv
jt
ixl
ivfl
i ==
es un parmetro ajustable
(4)
(5)
-
7/24/2019 CACP02
10/52
08/11/200308/11/2003 1010
La funcinLa funcin
+
== ,2*2 )())(,( jtli
wjtl
iwf
iil
i
Nkiki
i
j
jk txtxjt
+
= = 1,1
2
2
1
1))()((
)(
Definicin 6.Definicin 6. SeaSea xxii(t(tjj)),(i =1,... ,n; j =1,2,...) el valor de la variable de entrada,(i =1,... ,n; j =1,2,...) el valor de la variable de entrada xxii deldel
MFAD en el tiempoMFAD en el tiempo t = tt = tjj . La estructura dinmica para la funcin. La estructura dinmica para la funcin iill(t,w)(t,w) es dadaes dada
por la ecuacin siguiente:por la ecuacin siguiente:
(6)
(7)
donde
l
iw )0( >l
iw, es un parmetro ajustable y )( ki tx es dada por la ec. (5)
),( wtl
i
0> Es un bias constante para prevenir una indeterminacin numricacuando 0)(2
jt
i
-
7/24/2019 CACP02
11/52
08/11/200308/11/2003 1111
La funcinLa funcin ),( utl
)(__
))(__,( * jtyu
ljtyu
lfl ==
Definicin 7.Definicin 7. Sea y(tSea y(tjj) (j =1,2,...) el valor de la variable de salida del sistema obt) (j =1,2,...) el valor de la variable de salida del sistema obtenidaenida
en el tiempo t = ten el tiempo t = tjj . La estructura dinmica para la funcin. La estructura dinmica para la funcin ll (t,u)(t,u) es dada por laes dada por la
ecuacin siguiente:ecuacin siguiente:
Njty
j
jkkty
=
=2
2
1
,)(__
2
)(
(8)
(9)
lu
donde
es un parmetro ajustable
S
-
7/24/2019 CACP02
12/52
08/11/200308/11/2003 1212
Sobre la estructura propuesta para lasSobre la estructura propuesta para las
funciones de pertenenciafunciones de pertenencia
La incorporacin de (5), (7) y (9) en la funciones de pertenencia del modelo difuso
surge de manera natural, de acuerdo con el significado fsico deil, l y l , en los
conjuntos difusos Fi l y Gl.
La estructura propuesta en (4), (6) y (8), permite que las funciones de
pertenencia se desplacen sobre el universo de discurso de los conjuntos
difusos asociados, con un sentido fsico.
Sobre la incorporacin de la dinmica histrica de la variables:
Sobre la seleccin de los valores iniciales de los parmetros:
La seleccin de los valores iniciales de los parmetros en el MDLa seleccin de los valores iniciales de los parmetros en el MDA dado en (2),A dado en (2),esta guiado por el conocimiento acerca del dominio sobre el cualesta guiado por el conocimiento acerca del dominio sobre el cual estn definidasestn definidas
los valores de las variables de entrada y salida al modelo.los valores de las variables de entrada y salida al modelo.
SS b l t t t l
-
7/24/2019 CACP02
13/52
08/11/200308/11/2003 1313
Sobre la estructura propuesta para lasSobre la estructura propuesta para las
funciones de pertenenciafunciones de pertenencia
La estructura propuesta permite minimizar el problema de activacin de
reglas asociado al modelo difuso adaptativo tipo (2), durante y despus
de aplicar algoritmos de aprendizaje basados en el descenso del gradiente.
Con nuestra proposicin, se percibe, de manera natural, que losCon nuestra proposicin, se percibe, de manera natural, que los valores inicialesvalores iniciales
de los parmetros deber seleccionarse alrededor de 1, independiede los parmetros deber seleccionarse alrededor de 1, independientemente delntemente del
dominio sobre el cual se definen las variables del modelo.dominio sobre el cual se definen las variables del modelo.
Esto representa un aporte importante de la estructura propuesta para las
funciones de pertenencia dinmicas, por cuanto la seleccin de losvalores iniciales en un problema que incide en el desempeo de los
algoritmos de aprendizaje.
-
7/24/2019 CACP02
14/52
08/11/200308/11/2003 1414
Algoritmo de aprendizaje: enfoque fuera de lneaAlgoritmo de aprendizaje: enfoque fuera de lnea
Los parLos parmetrosmetros vviill wwiill y uy u ll son ajustados en lnea o fuera de lnea, segn unson ajustados en lnea o fuera de lnea, segn unesquema genrico de aprendizaje:esquema genrico de aprendizaje:
Enfoque fuera de lEnfoque fuera de lnea usando el mnea usando el mtodo del descenso del gradientetodo del descenso del gradienterespecto de una funcirespecto de una funcin de error cuadrn de error cuadrtico medio E, definido sobre unatico medio E, definido sobre unacoleccicoleccin de patronesn de patrones {(X(t{(X(tjj), y(t), y(tjj)); j=1,...,N})); j=1,...,N}
+=+ )()1( kk
K
EKK
=+ )()1(
( )2
1
)()(2
11
=
=N
j
jje tytyN
E (11)
)( je ty es salida del MDAD en t=tjdonde
(10)
De esta manera, (10) queda definido como:
representa, genricamente, un parmetro.
es la tasa de aprendizaje.
(12)
-
7/24/2019 CACP02
15/52
08/11/200308/11/2003 1515
Algoritmo de aprendizaje: enfoque en lneaAlgoritmo de aprendizaje: enfoque en lnea
= ++=
0k1kt
kt
rR
Diferencias temporales (Sutton, 1988)
[ ]
++=+
),(),(),
1(1
ttxP
ttxPtt
xPtt
Ley de ajuste: Algoritmo TD
(13)
),(),1
( ttxPtt
xP +
es una diferencia temporal
Mtodo para resolver problemas de prediccin.
Objetivo: Ajustar una funcin de prediccinP(x,), siendo x un vector de datos disponibles
y un vector de parmetros ajustables.
Aprendizaje reforzado (Sutton, 1998)
Aprendizaje basado en ensayo y error.
ObjetivoObjetivo: Aprender una poltica de accin que: Aprender una poltica de accin quepermite maximizar la ganancia ponderadapermite maximizar la ganancia ponderada RRtt
Fig. 2 Relacin Agente-Ambiente
(15)
0
-
7/24/2019 CACP02
16/52
08/11/200308/11/2003 1616
Ley de ajuste: Agente Crtico HeursticoLey de ajuste: Agente Crtico Heurstico
AdaptativoAdaptativo
donde:t es el vector de parmetros disponibles en t.Xt es el vector de datos disponibles en t.rt+1 es la seal de reforzamiento.P(xt, t) es la funcin de prediccin.0
-
7/24/2019 CACP02
17/52
08/11/200308/11/2003 1717
Nuestra proposicin: La funcin deNuestra proposicin: La funcin de
prediccinprediccin P(xP(xtt,, ))
Incorporar el comportamiento del MDAD proponiendo una funcin deprediccin dependiente del error de identificacin:
donde
0
-
7/24/2019 CACP02
18/52
08/11/200308/11/2003 1818
La ley de ajuste de parLa ley de ajuste de parmetrosmetros
Tomando la derivada parcial de P respecto al vectorTomando la derivada parcial de P respecto al vector ,, se tiene:se tiene:
(19)(19)
Sustituyendo (19) en (16) se tiene la ley de ajuste de parmetroSustituyendo (19) en (16) se tiene la ley de ajuste de parmetros siguiente:s siguiente:
(20)(20)
dondedonde
y, a partir de (17):y, a partir de (17):
=
=
t
Kk
kt
ttktt kxe
xP),(),()(
),(
=
=
),(),(
),( tet
t
kyxe
k k
[ ]=+ +++=+t
k
1 ),(),((),(),1(1 )
K
t tt kkxekttt
xPttxPrtt
),(),(2
1),(
11
2
tttttt xPxexP +=++
(21)
(22)
Nuestra proposicin: La seal deNuestra proposicin: La seal de
-
7/24/2019 CACP02
19/52
08/11/200308/11/2003 1919
Nuestra proposicin: La seal deNuestra proposicin: La seal de
reforzamientoreforzamiento rrt+1t+1
En la prediccin de la ganancia ponderada REn la prediccin de la ganancia ponderada Rtt, se espera que:, se espera que:
o, de manera equivalente:o, de manera equivalente:
Por otro lado, tomando en cuenta la funcin de prediccin P propPor otro lado, tomando en cuenta la funcin de prediccin P propuesta, se esperauesta, se esperaque:que:
Y si el MDAD se est ajustando correctamente, se espera tambinY si el MDAD se est ajustando correctamente, se espera tambin
que:que:
tt RP
),1
(),( 1 ttxPrtt
xP t ++ +
),(),1
(0 1 ttxPtt
xPrt
-
7/24/2019 CACP02
20/52
08/11/200308/11/2003 2020
Nuestra proposicin: La seal deNuestra proposicin: La seal de
reforzamientoreforzamiento rrt+1t+1
Tomando en cuenta las condiciones dadas en (24) y (25) y dado quTomando en cuenta las condiciones dadas en (24) y (25) y dado que:e:
(26)(26)
La seal de reforzamiento rLa seal de reforzamiento rt+1t+1 se define de la siguiente manera:se define de la siguiente manera:
),(),1(2
1),
1( 2211 tt
xPtterttxPr tt +++=+
+ ++
),P(x),P(xr
),P(x),P(xtxer
ttttt
tttttt
-
7/24/2019 CACP02
21/52
08/11/200308/11/2003 2121
Ejemplo ilustrativoEjemplo ilustrativo
Identificacin de una funcin no lineal variante en el tiempo deIdentificacin de una funcin no lineal variante en el tiempo descrita por lascrita por lasiguiente ecuacin en diferencias:siguiente ecuacin en diferencias:
donde:donde:
La funcin g[y(k),y(kLa funcin g[y(k),y(k--1)] es estimada usando el MDAD1)] es estimada usando el MDAD..
Condiciones generales en la fase de entrenamiento (Aprendizaje fCondiciones generales en la fase de entrenamiento (Aprendizaje fuera deuera delnea):lnea):
Los valores iniciales de los parmetros han sido escogidosLos valores iniciales de los parmetros han sido escogidosaleatoriamente sobre intervalos adecuados.aleatoriamente sobre intervalos adecuados.
Generacin de 250 patrones de entrenamiento usando comoGeneracin de 250 patrones de entrenamiento usando comoentradaentrada u(k)u(k) una secuencia binaria pseudouna secuencia binaria pseudo--aleatoria.aleatoria.
Realizacin de diferentes ciclos de aprendizaje con diferentesRealizacin de diferentes ciclos de aprendizaje con diferentes
valores de la tasa de aprendizajevalores de la tasa de aprendizaje (ecuacin (12)) y nmero de(ecuacin (12)) y nmero dereglas M, hasta conseguir la convergencia del error.reglas M, hasta conseguir la convergencia del error.
)()]1(),([)1( kukykygky +=+
)k/sen(..a(k)
kykykakykykykykyg
25025252
)1()(1)]()()[1()()]1(),([ 22
+=
++ +=
-
7/24/2019 CACP02
22/52
08/11/200308/11/2003 2222
Ejemplo ilustrativoEjemplo ilustrativo
0 100 200 300 400 500 600 700 8000
0.2
0.4
0.6
0.8
1
time (sec)
relativeerror
0 100 200 300 400 500 600 700 8005
0
5
10
15
time (sec)
realoutput(
),estimatedoutput(
)
-
7/24/2019 CACP02
23/52
08/11/200308/11/2003 2323
Ejemplo ilustrativoEjemplo ilustrativo
0 100 200 300 400 500 600 700 8000
0.2
0.4
0.6
0.8
1
time (sec)
relat
iveerror
0 100 200 300 400 500 600 700 8005
0
5
10
15
time (sec)
realou
tput(
),estimatedoutput(
)
-
7/24/2019 CACP02
24/52
08/11/200308/11/2003 2424
Ejemplo ilustrativoEjemplo ilustrativo
MM N_parN_par RMSERMSE
FAFA
RMSERMSE
FVFV
88 4040 0.21300.2130 0.14760.1476
1010 5050 0.20510.2051 0.16180.1618
2020 100100 0.23250.2325 0.15900.1590
4040 200200 0.25450.2545 0.24140.2414
Fig.6- Desempeo del MDAD (M =8) usando unalgoritmo de ajuste fuera de lnea (40 parmetros
ajustables)
Caso 2.Aprendizaje fuera de lnea usando el MDAD
MM RMSE FARMSE FA
caso 1caso 1
RMSE FVRMSE FV
caso 1caso 1
RMSE FARMSE FA
caso 2caso 2
RMSE FVRMSE FV
caso 2caso 21010 0.15330.1533 0.20510.2051 0.60360.6036
0.56300.5630
0.16180.1618
2020 0.14440.1444 0.23250.2325 0.15900.1590
RMSE =0.1476
Tabla 1- Resumen de los errores obtenidos usando elMDAD
Tabla 2- Comparacin entre los errores obtenidosusando el MDA y el MDAD
1=4 (ec. (5),(7)); 2=1 (ec. (9))
0 100 200 300 400 500 600 700 8000
0.05
0.1
0.15
time (sec)
relativeerror
0 100 200 300 400 500 600 700 8005
0
5
10
15
time (sec)
realoutpu
t(
),estimatedoutput(
)
-
7/24/2019 CACP02
25/52
08/11/200308/11/2003 2525
Ejemplo ilustrativoEjemplo ilustrativo
-
7/24/2019 CACP02
26/52
08/11/200308/11/2003 2626
Ejemplo ilustrativoEjemplo ilustrativo
Caso 3.Aprendizaje en lnea usando AR y el MDAD
Fig.8- Desempeo del MDAD (M =6) usando un algoritmo deajuste en lnea (36 parmetros ajustables)
= = 0.9)1(9.0
)1()(
+
=k
kk
K =5 (ec. (19))
0 100 200 300 400 500 600 7000
0.05
0.1
0.15
time index
relativeer
ror
0 100 200 300 400 500 600 7005
0
5
10
15
time index
realoutp
ut(
),estimatedoutput(
)
RMSE =0.1110
-
7/24/2019 CACP02
27/52
08/11/200308/11/2003 2727
Ejemplo ilustrativoEjemplo ilustrativo
0 100 200 300 400 500 600 7000
0.05
0.1
0.15
time index
relativeerror
0 100 200 300 400 500 600 7005
0
5
10
15
time index
realoutput(),estimatedoutput(
)
-
7/24/2019 CACP02
28/52
08/11/200308/11/2003 2828
Consideraciones sobre el algoritmo deConsideraciones sobre el algoritmo de
aprendizaje en lneaaprendizaje en lnea
Sensibilidad respecto a la variacin de los parmetros , ,
Pequeos cambios en la tasa de variacin respecto al RMSE, fijando el
valor de la tasa de aprendizaje . Cambios mas significativos en tasa de variacin, fijando y .
Sensibilidad respecto al nmero de reglas
La tasa de variacin es poco significativa despus de un cierto nmero de
reglas (M =15 en el ejemplo estudiado)
Sensibilidad respecto a las condiciones iniciales de los parmetros
El valor global del RMSE es mejorado para condiciones iniciales
alrededor de 1.
Consideraciones sobre el algoritmo deConsideraciones sobre el algoritmo de
-
7/24/2019 CACP02
29/52
08/11/200308/11/2003 2929
Consideraciones sobre el algoritmo deCo s de ac o es sob e e a go t o de
aprendizaje en lneaaprendizaje en lnea
Sensibilidad respecto a las condiciones iniciales de los parmetros
0 100 200 300 400 500 600 700 8000
0.05
0.1
0.15
0.2
time index
relativeerror
0 100 200 300 400 500 600 700 8002
1
0
1
2
time index
real
output(
),estimatedoutput()
0 100 200 300 400 500 600 700 8000
0.05
0.1
0.15
0.2
time index
relativeerror
0 100 200 300 400 500 600 700 8002
1
0
1
2
time index
realoutput(
),estimatedoutput()
Fig.10- Desempeo del MDAD usando un algoritmode ajuste en lnea con valores iniciales de los
parmetros sobre el intervalo [0.5 1.5]
Fig.11- Desempeo del MDAD usando un algoritmode ajuste en lnea con valores iniciales de los
parmetros sobre el intervalo [0 1]
-
7/24/2019 CACP02
30/52
08/11/200308/11/2003 3030
AplicacionesAplicaciones
C l di iC t l di ti
-
7/24/2019 CACP02
31/52
08/11/200308/11/2003 3131
Control predictivoControl predictivo
Un modelo de prediccin del procesoUn modelo de prediccin del proceso
Una secuencia de acciones de control futuros que minimizan una fUna secuencia de acciones de control futuros que minimizan una funcinuncin
objetivoobjetivo
Una estrategia de horizonte movibleUna estrategia de horizonte movible
Referencia w
Tiempo t
KTiempoactual
pasado futuro
Horizontede control Horizonte de
prediccinK+Hc
K+Hp
Control u
Prediccinde la salida
==
++++=Hc
iQ
Hp
i P
ei
i
ikuikyikwJ1
2
1
2)1()()(
El control predictivo abarca un conjunto de mtodos de control han sido desarrolladosalrededor de ciertas ideas fundamentales:
Fig.14- Estrategia general del control predictivo
(28)
-
7/24/2019 CACP02
32/52
08/11/200308/11/2003 3232
MotivacinMotivacin
Necesidad de un modelo de prediccin de la salida delNecesidad de un modelo de prediccin de la salida del
proceso.proceso.
Necesidad de mtodos de optimizacin para laNecesidad de mtodos de optimizacin para laminimizacin de la funcin objetivo.minimizacin de la funcin objetivo.
Entrada dereferencia
Entradas et salidaspasadas
Entradas
futuras u
Salida estimada(prediccin)
Errores
futuros
RestriccionesFuncinObjetivo
Modelo
Optimizador
Fig.15- Estructura base del control predictivo
ObjetivosObjetivos
-
7/24/2019 CACP02
33/52
08/11/200308/11/2003 3333
ObjetivosObjetivos
Utilizar un modelo difuso adaptativo dinmico comoUtilizar un modelo difuso adaptativo dinmico comomodelo de prediccin a un paso.modelo de prediccin a un paso.
Utilizar un algoritmo de optimizacin basado enUtilizar un algoritmo de optimizacin basado en
funciones de penalidad y aprendizaje reforzado.funciones de penalidad y aprendizaje reforzado.
Optimizador Proceso
Modelo Difuso
(MFAD)
Filtro
z -1
r (t+1)
ye(t+1)
y(t+1)
e
u(t)
Fig.16- Esquema de control predictivo utilizado
MDAD como modelo de prediccin a unMDAD como modelo de prediccin a un
-
7/24/2019 CACP02
34/52
08/11/200308/11/2003 3434
p
pasopaso
0
1
)()(
+
==j
txj
kki
jt
ix
0
2
2
1
))()(()( +
=
= j
kiki
i
j
k
txtxjt
),( wtl
iLas funciones y , en (4) y (6) respectivamente, han sido
redefinidas usando:
(29)
(30)
Esta definicin ha reportado resultados satisfactorios en la identificacin desistemas invariantes en el tiempo (Cerrada et al., 2002)
),( vtl
i
Algoritmo de optimizacinAlgoritmo de optimizacin
-
7/24/2019 CACP02
35/52
08/11/200308/11/2003 3535
Algoritmo de optimizacinAlgoritmo de optimizacin
mig
Exxxxh)h(x); h(x
i
nnx
,...,1;0
),,...,,(max 21
=
=
))(()()1( kxdkxkx +=+ )()())(( 1 xgxhkxdi
m
i
i= =
El problema del control predictivo se ha planteado como un problEl problema del control predictivo se ha planteado como un problema de programacin no linealema de programacin no lineal(PNL), usando para su resolucin, un algoritmo de optimizacin u(PNL), usando para su resolucin, un algoritmo de optimizacin usando funciones de penalidadsando funciones de penalidad
(J. Tang y D. Wang, 1997) pero incorporando una tasa adaptativa(J. Tang y D. Wang, 1997) pero incorporando una tasa adaptativa segn un algoritmo basado ensegn un algoritmo basado en
aprendizaje reforzado (G. Tesauro,1995)aprendizaje reforzado (G. Tesauro,1995)
>
= 0)(
0)(0
xgsi
xgsi
ii
i
i
+=
)(
1
max xgg ii },...,1),(max{max mixgg i ==
>+
=
0)(
0)(
)(max
max
max
gsigM
xh
gsixh
xh
Algoritmo de optimizacin usando funciones de penalidad
Algoritmo de aprendizaje TD-Gammon
(31)
(32) (33) (34)
(35) (36) (37)
[ ]
+=+ +
),(
),(1 1tt
xP
ttxPrtt t (38)
K denota el ndice de iteracin y son valores muy pequeos
t denota el ndice de iteracin
M es un valor muy grande
Algoritmo de control predictivo a un paso usando elAlgoritmo de control predictivo a un paso usando el
-
7/24/2019 CACP02
36/52
08/11/200308/11/2003 3636
algoritmo de optimizacin con funciones de penalidadalgoritmo de optimizacin con funciones de penalidad
)()1()(1 udtutu kkk +=+
maxmin
maxmin
2
)(
)(
))1()1((2
1)(min
utuu
utuu
tytwuJ eu
++=
)1()()( = tututu
0)(
0)(
0)(
0)(
))1()1((
2
1);(-h(u)max
min
max
min
max
2
++==
tuu
utu
tuu
utu
tytwJuJ eu
Sea el problema de control predictivo sujeto a restricciones:
(39) donde
ye(t+1)=f(u(t),y(t) es la salida estimada por el MDAD
)(
)1())1()1(()(
tu
tytytwuh ee
+++=
El problema (39) es redefinido como el problema de PNL siguiente:
Inspirados en la ley de actualizacin (32), se propone el siguiente algoritmo de control:
(40)
donde es una tasa adaptativa y dk(u) es calculadosegn (33) con:
(41)
(42)
(43)
Ley de ajuste para la tasa adaptativaLey de ajuste para la tasa adaptativa
-
7/24/2019 CACP02
37/52
08/11/200308/11/2003 3737
Ley de ajuste para la tasa adaptativaLey de ajuste para la tasa adaptativa
))(()()1( jdjj +=+
0)(
)(2
1)(min 2
=
ig
Jrh
El problema de ajuste de la tasa se plantea como el siguiente problema de PNL:
(44) donde J es definido en (41) y res una seal de
reforzamiento
ye(t+1)=f(u(t),y(t) es la salida estimada por el MDAD.
)(
)(
)(
)1())1()1()(()(
j
tu
tu
tytytwJrh
k
k
ee
+
++=
Haciendo uso de la ley de ajuste (32), se tiene:
d() es calculado segn (33) con:(45)
(46)
La seal de reforzamiento res definida segn el problema bajo estudio.
AlgoritmoAlgoritmo
-
7/24/2019 CACP02
38/52
08/11/200308/11/2003 3838
AlgoritmoAlgoritmo
no0)( ugi
))(()()1( jdjj +=+
0)( jgno
))(( jd
)(udk
)()1()(1 udtutu kkk +=+
Ejemplo de AplicacinEjemplo de Aplicacin
-
7/24/2019 CACP02
39/52
08/11/200308/11/2003 3939
Ejemplo de AplicacinEjemplo de Aplicacin
Control de la presin interna de un tanque fermentadorControl de la presin interna de un tanque fermentador
Objetivo de control: regular la apertura de la vlvula de salidaObjetivo de control: regular la apertura de la vlvula de salida de aire del tanquede aire del tanque
Relacin altamente no lineal entre la apertura de la vlvula y lRelacin altamente no lineal entre la apertura de la vlvula y la presin internaa presin interna
Tasa de muestreo de 5 seg.Tasa de muestreo de 5 seg.
agua
Presin
Internay
u
aire
controlador
vlvula
Fig.17- Proceso de fermentacin
u representa el % de cierre de la vlvula, luego
100)(0 tu
10)(10 tu
Adems:
Modelo de identificacinModelo de identificacin
-
7/24/2019 CACP02
40/52
08/11/200308/11/2003 4040
Modelo de identificacinModelo de identificacin
Modelo de identificacin a un paso usando un MDAD: yModelo de identificacin a un paso usando un MDAD: yee(t+1(t+1))=f(y(t),u(t))=f(y(t),u(t))
Ajuste fuera de lnea, usando las ecuaciones (11),(12) y (13) yAjuste fuera de lnea, usando las ecuaciones (11),(12) y (13) y 323 pares de datos de323 pares de datos de
entrenamiento.entrenamiento.
Se seleccion el modelo difuso obtenido con M=30 (Se seleccion el modelo difuso obtenido con M=30 (RMSE =776.7 en fase de validacin)
0 200 400 600 800 1000 1200 1400 16000
0.005
0.01
0.015
0.02
time (sec)
relativeerror
0 200 400 600 800 1000 1200 1400 16001
1.2
1.4
1.6
1.8x 10
5
time (sec)
realoutput(),estimatedoutput(
)
Fig.19- Desempeo del MDAD en la identificacin delproceso de fermentacin
0 200 400 600 800 1000 1200 1400 16000
20
40
60
80
100
time(sec)
valvepositionu(%)
0 200 400 600 800 1000 1200 1400 16001
1.2
1.4
1.6
1.8
2x 10
5
time(sec)
pre
ssure(Pa)
Fig.18- Patrones de entrenamiento
Control predictivoControl predictivo
-
7/24/2019 CACP02
41/52
08/11/200308/11/2003 4141
Control predictivoControl predictivo
Restricciones sobre el valor del control:
0)(10)(
010)()(
0)()(
0100)()(
4
3
2
1
=
=
=
=
tuug
tuug
tuug
tuug
0)(
01)(
0)()1()(
0100)()1()(
010)()(
010)()(
6
5
4
3
2
1
=
=
=
=
=
=
g
g
udtug
udtug
udg
udg
>=
63
6
10*10100
JsiJJsir
Restricciones sobre el valor de la tasa:
Definicin de la seal de reforzamiento:
Parmetros del algoritmo de optimizacin:
02.0)0(
10
10
10
5
2
4
=
=
=
=
M
(47)(48)
(49)
Filtro:
z
z
zE
zF 9.01.0
)(
)( += (50)
ResultadosResultados
-
7/24/2019 CACP02
42/52
08/11/200308/11/2003 4242
ResultadosResultados
0 500 1000 1500 2000 25001
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9x 10
5
time(sec)
pression(Pa)
Fig.20 Desempeo del algoritmo de control contasas constantes ( =0.02,0.03,0.04)
0 500 1000 1500 2000 25001
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9x 10
5
time(sec)
pression(Pa)
Fig.21 Desempeo del algoritmo de control contasas adaptativa usando AR.
Aplicacin a la supervisin yAplicacin a la supervisin y
di tidi ti
-
7/24/2019 CACP02
43/52
08/11/200308/11/2003 4343
diagnsticodiagnstico
Caractersticas del MDAD
No es necesario escalar las amplitudes originales de las variablesdel modelo, permitiendo preservar el sentido fsico del modelo.
En un modelo difuso, la nocin de causalidad esta presente desde su
concepcin. En el MDAD esta nocin se incorpora tambin en la definicin de las
funciones , y : las variaciones de la media y la varianza de las variables de
entrada, visualizadas en , , inciden en las variaciones sobre . An cuando no se tiene una representacin explcita del tiempo, la nocintemporal es incorporada en la definicin de las funciones , y , permitiendotener una memoria temporal tomando en cuenta una cantidad de informacin
histrica.
Supervisin y diagnsticoSupervisin y diagnstico
-
7/24/2019 CACP02
44/52
08/11/200308/11/2003 4444
Supervisin y diagnsticoSupervisin y diagnstico
Proceso
MDA
D
de
diagn
stico
u y
Indicador de fallas
Controlador Proceso
MDADSupervisor
w u y
Fig.27 Esquema de diagnstico
Fig.28 Esquema de supervisin
Ejemplo ilustrativoEjemplo ilustrativo
-
7/24/2019 CACP02
45/52
08/11/200308/11/2003 4545
Ejemplo ilustrativoj p
0 100 200 300 400 500 600 7001
0
1
2
3
4
5
time index
a(k)
Proceso
MDAD de
identificacin
u y
ye
v wHacia un modelo
de supervisin
Hacia un modelo
de diagnstico
Fig.29 Informacin contenida en unMDAD como identificador
Se retoma nuevamente el ejemplopresentado en la parte de modelado y se
observa la evolucin de las funciones de
membresa y sus parmetros, en las variables
de entrada al modelo en condiciones normales
de operacin y en condicin de falla.
Fig.23 Falla sobre el trmino a(k)
-
7/24/2019 CACP02
46/52
08/11/200308/11/2003 4646
j pj p
0 100 200 300 400 500 600 70010
10.5
11
11.5
12
12.5
13
time index
norm(v)
0 100 200 300 400 500 600 70012.4
12.5
12.6
12.7
12.8
12.9
13
time index
norm(w)
0 100 200 300 400 500 600 7000
500
1000
1500
2000
time index
norm(alfa)
0 100 200 300 400 500 600 7000
100
200
300
400
500
600
time index
norm(beta)
0 100 200 300 400 500 600 7000
500
1000
1500
2000
time index
norm(alfa)
0 100 200 300 400 500 600 7000
100
200
300
400
500
600
time index
norm
(beta)
0 100 200 300 400 500 600 70010
10.5
11
11.5
12
12.5
13
time index
norm(v)
0 100 200 300 400 500 600 70012.4
12.5
12.6
12.7
12.8
12.9
13
time index
norm(w)
Fig.24 Condicinnormal
Fig.25 Falla abrupta
Ejemplo ilustrativoEjemplo ilustrativo
-
7/24/2019 CACP02
47/52
08/11/200308/11/2003 4747
j pj p
0 100 200 300 400 500 600 70010
10.5
11
11.5
12
12.5
13
time index
norm(v)
0 100 200 300 400 500 600 70012.4
12.5
12.6
12.7
12.8
12.9
13
time index
norm(w)
0 100 200 300 400 500 600 7000
500
1000
1500
2000
time index
norm(alfa)
0 100 200 300 400 500 600 7000
100
200
300
400
500
600
time index
norm(beta)
Fig.26 Condicinnormal
Fig.27 Fallacontinua
0 100 200 300 400 500 600 7000
500
1000
1500
2000
time index
norm(alfa)
0 100 200 300 400 500 600 7000
100
200
300
400
500
600
time index
norm(beta)
0 100 200 300 400 500 600 70010
10.5
11
11.5
12
12.5
13
time index
norm(v)
0 100 200 300 400 500 600 70012.4
12.5
12.6
12.7
12.8
12.9
13
time index
norm(w)
Conclusin generalConclusin general
-
7/24/2019 CACP02
48/52
08/11/200308/11/2003 4848
gg
Sobre la propuesta de modelado difuso dinSobre la propuesta de modelado difuso dinmicomico
La originalidad del modelo propuesto reside en el uso de funcionLa originalidad del modelo propuesto reside en el uso de funciones dees depertenencia dinpertenencia dinmicas con significado fmicas con significado fsico.sico.
Sobre el algoritmo de aprendizaje en lSobre el algoritmo de aprendizaje en lneanea
La contribuciLa contribucin reposa en la proposicin reposa en la proposicin de una funcin de una funcin de prediccin de prediccin quen queincorpora el desempeincorpora el desempeo del modelo difuso, lo que permite resaltar loso del modelo difuso, lo que permite resaltar loselementos del aprendizaje reforzado en telementos del aprendizaje reforzado en trminos del problema derminos del problema deidentificaciidentificacin: definir una accin: definir una accin (ajuste de los parn (ajuste de los parmetros del MDAD),metros del MDAD),determinar el valor de dicha accideterminar el valor de dicha accin (prediccin (prediccin del error) y dar unan del error) y dar una
recompensa en trecompensa en t
rminos del error de prediccirminos del error de predicci
n.n.
El valor de la seEl valor de la seal de reforzamiento queda claramente definida,al de reforzamiento queda claramente definida,satisfaciendo condiciones tanto del problema de AR como del probsatisfaciendo condiciones tanto del problema de AR como del problema delema deidentificaciidentificacin del modelo difuso.n del modelo difuso.
Conclusin generalConclusin general
-
7/24/2019 CACP02
49/52
08/11/200308/11/2003 4949
gg
Sobre los resultados experimentales aplicados a la identificaciSobre los resultados experimentales aplicados a la identificacin de sistemas non de sistemas nolineales variantes en el tiempolineales variantes en el tiempo
Los ejemplos desarrollados ilustran resultados satisfactorios alLos ejemplos desarrollados ilustran resultados satisfactorios alcomportamiento del error de identificacicomportamiento del error de identificacin.n.
El uso del MDAD ha mostrado un mejor desempeEl uso del MDAD ha mostrado un mejor desempeo que el MDA tantoo que el MDA tantousando algoritmo de aprendizaje en lusando algoritmo de aprendizaje en lnea como fuera de lnea como fuera de lnea.nea.
Sobre la aplicaciSobre la aplicacin al control predictivon al control predictivo
La capacidad de predicciLa capacidad de prediccin del MDAD ha sido validado en el problema den del MDAD ha sido validado en el problema decontrol predictivo desarrollado, mostrando un desempecontrol predictivo desarrollado, mostrando un desempeo adecuado en lao adecuado en laidentificaciidentificacin del proceso de fermentacin del proceso de fermentacin.n.
Dos problemas de optimizaciDos problemas de optimizacin usando aprendizaje reforzado y funciones den usando aprendizaje reforzado y funciones depenalizacipenalizacin, fueron propuestos para resolver el problema de controln, fueron propuestos para resolver el problema de controlpredictivo a un paso: uno orientado al cpredictivo a un paso: uno orientado al clculo de control, y el otro orientado allculo de control, y el otro orientado alcclculo de la tasa de aprendizaje del algoritmo de control. El deslculo de la tasa de aprendizaje del algoritmo de control. El desempeempeo delo delsistema controlado fue mejoradosistema controlado fue mejorado usando aprendizaje reforzado para elusando aprendizaje reforzado para el
clculo de la tasa de aprendizaje.clculo de la tasa de aprendizaje.
Conclusin generalConclusin general
-
7/24/2019 CACP02
50/52
08/11/200308/11/2003 5050
gg
Sobre las perspectivas del uso del MDAD en la supervisiSobre las perspectivas del uso del MDAD en la supervisin y diagnosticon y diagnostico
El MDAD propuesto tiene caracterEl MDAD propuesto tiene caractersticas importantes para tratar las tareas desticas importantes para tratar las tareas desupervisisupervisin y diagnn y diagnstico.stico.
El MDAD usado como modelo de identificaciEl MDAD usado como modelo de identificacin de entradan de entrada--salida, guarda ensalida, guarda enla evolucila evolucin de las funcionesn de las funciones yy , y en los par, y en los parmetrosmetros vv yy ww ajustados enajustados enllnea, informacinea, informacin interesante acerca del comportamiento del proceso. Dichan interesante acerca del comportamiento del proceso. Dichainformaciinformacin puede ser utilizada con propn puede ser utilizada con propsitos de supervisisitos de supervisin y diagnn y diagnstico.stico.
Perspectivas respecto al desarrollo de modelos difusos dinPerspectivas respecto al desarrollo de modelos difusos dinmicosmicos En relaciEn relacin a nuestra propuestan a nuestra propuesta
DefiniciDefinicin de funciones de membresn de funciones de membresa dina dinmicas de tipo triangular.micas de tipo triangular.IncorporaciIncorporacin de funciones de membresn de funciones de membresa dina dinmicas en modelos de tipo TSK.micas en modelos de tipo TSK.
ValidaciValidacin del uso del MDAD en un caso de estudio orientado al diagnn del uso del MDAD en un caso de estudio orientado al diagnstico y a lastico y a lasupervisisupervisin.n. Otras propuestasOtras propuestas
Ecuaciones diferenciales difusasEcuaciones diferenciales difusas
Publicaciones
-
7/24/2019 CACP02
51/52
08/11/200308/11/2003 5151
PublicacionesPublicaciones en extenso:en extenso:
M.M. CerradaCerrada, J., J.AguilarAguilar, E., E. ColinaColina, A., A. TitliTitli..An approach for dynamical adaptiveAn approach for dynamical adaptivefuzzy modelling.fuzzy modelling. Proceedings of FUZZProceedings of FUZZ--IEEE 2002 International Conference onIEEE 2002 International Conference onFuzzy LogicFuzzy Logic, pp. 156, pp. 156--161.161. HawaiHawai, USA. May 2002., USA. May 2002.
Computer and Control AbstractComputer and Control Abstract,,August 2002, Abstract No. 66418
M.M. CerradaCerrada, J., J.AguilarAguilar, E., E. ColinaColina, A., A. TitliTitli.. Dynamical Adaptive Fuzzy Systems:Dynamical Adaptive Fuzzy Systems:
An Application on System Identification,An Application on System Identification, Proceedings of 15th Triennal IFACProceedings of 15th Triennal IFACWorld CongressWorld Congress, p.p 1006, p.p 1006--1011. Barcelona, Espaa. Julio 20021011. Barcelona, Espaa. Julio 2002..
M.M. CerradaCerrada, J., J.AguilarAguilar, E., E. ColinaColina, A., A. TitliTitli.. TimeTime--varying non linear systemvarying non linear systemidentification using dynamical adaptive fuzzy systems,identification using dynamical adaptive fuzzy systems, Revista Tcnica de laRevista Tcnica de laFacultad de Ingeniera,Facultad de Ingeniera, Universidad del ZuliaUniversidad del Zulia, vol. 25(3) p.p 171, vol. 25(3) p.p 171--180. Diciembre180. Diciembre20022002..
SometidosSometidos aa revisinrevisin::
M.M. CerradaCerrada, J., J.AguilarAguilar, E., E. ColinaColina, A., A. TitliTitli.. Dynamical membership functions: aDynamical membership functions: annapproach for adaptive fuzzy modellingapproach for adaptive fuzzy modelling,, FuzzyFuzzy SetsSets andand SystemsSystems, 2da. revisin, 2da. revisin
AgradecimientosAgradecimientos
-
7/24/2019 CACP02
52/52
08/11/200308/11/2003 5252
g
Esta tesis ha sido desarrollada en el marco de:
Convenio franco-venezolano PCP Optimizacin e Integracin de Procesos.
Convenio de co-tutela ULA-INSA.