V A "Mr,,. \ r3
ESCUELA TÉCNICA SUPERIOR DE INGENIEROS AERONÁUTICOS
Manue l Abe jón Adamez
- SISTEMAS ADAPTIVOS DE DECISIÓN EN CONTROL AUTOMÁTICO -
UNM-ilÜDAD POLITÉCNICA DE MADRID £ T. S. S. AERONÁUTICOS
8 ' 8 L ¡ O T E C A ÍÍCJ - 1* Cí,r,"»AfVí>
•;' :>(-c-'H^\u )fr5.52.5 f-í- í.kitvi.t̂ '.Aa *.552'.'í
h:tt.\AR)H* .ÍO&J) . .ABÉ, >JlS>. j fc
I i
ÍONSÜLTA EN BIBLIOTECA
Tesis doctoral dirigida por el Dr. Ings D. Julio González Bernaldo de Quirós, catedráti-co de la E.T.S.I. Aeronáuticos
ESCt DE
B 1
ELA TEGN'iO.A S!;f'tR!0R lfJGtNlíl.GS i-WiYYY'o
Qr$qy?>\ E3 L 1 O Y Y C A
-1971 -
INSTITUTO POLITÉCNICO DE MADRID
-1 -
Antes de entrar en el tema ob;^to d§ este traba-
jo queremos cumplir el gratísimo deber ce manifestar nues-
tro agradecimiento a las personas sin cu3-a colaboración, -
más o menos directa, no nos hubiera side posible llevarlo
a cabo.
En primer lugar al Profesor Gcn.zález Berna]do de
Quirós -maestro, compañero y amigo- al cue el autor debe no
sólo la inestimable dirección de esta tenis, sino su propia
iniciación en la Automática9 durante sus estudios de Inge-
niería Aeronáutica, y su posterior formealón en dicho cam-
po.
También a todos aquellos profesores de nuestra -
Escuela y de la Facultad de Ciencias de Madrid -demasiados
para que les podamos citar sin incurrir en lamentables rmi
siones- que contribuyeron a nuestra formación matemática y,
sobre todo, a nuestra capacidad de aplicarla.
Igualmente hemos de reconocer la deuda de grati-
tud que tenemos contraída con todas las personas que estu-
dian y trabajan en la Escuela Técnica Superior de Ingenie-
ros Aeronáuticos por cosas tan intangibles, pero tan impor
tantea, come el "ambiente de trabajo" y el "clima humano" -
que nos han rodeado. Es ésta especialmente importante con
el limo. Sr. Director, D. Manuel Avello Ugalde 0 cuyo alien
to para la realización de esta tesis ha sido constante; con
- I I -
nuestros compañeros y amigos más próximos, cuyo empeño en
verla concluida ha sido quizás mayor que el propio; y, en
di tino pero principal lugar, con nuestros alumnos, sin -
los que nuestra labor carecería de sentido.
Queremos finalmente agradecer a los Sres. Sánchez
Vállez y Sánchez Gómez -competentísimos funcionarios y bue
nos amigos nuestros- su meritoria labor de mecanografía y
su pulcra delineación respectivamente.
Madrid, Enero de 1971
Manuel Abejón
Í N D I C E
INTRODUCCIÓN 1
P r i m e r a P a r t e
-ELEMENTOS DE TEORÍA DE LA DECISIÓN
Y APLICACIONES AL CONTROL ADAPTIVO
INTRODUCCIÓN A LA TEORÍA DE LA DECISIÓN 9
PROCESOS DE DECISIÓN NO SECUENCIALES
EN CONTROL ADAPTIVO 23
PROGESOS DE DECISIÓN SECUENCIALES EN
CONTROL ADAPTIVO . .. . 34
Segunda Parte
-CONTROL ADAPTIVO CON DISPOSITIVOS DE DECISIÓN
SISTEMAS DE CONTROL ADAPTIVO CON
DISPOSITIVOS DECISORIOS 59
UN CASO DE SISTEMA ADAPTIVO DE DECISIÓN ..... 93
CONCLUSIONES 134
Apéndices
RESUMEN DE DEFINICIONES Y TEOREMAS
DE TEORÍA DE LA DECISIÓN 140
UNAS NOTAS SOBRE LA ECUACIÓN DE FOKKER-PLANCK 144
UN COMENTARIO CRITICO 155
=ooOoo=
0. INTRODUCCI ON
Suaario
0 . 1 . OBJETO
0 . 2 . BREVE DESCRIPCIÓN
0 . 3 . OBSERVACIONES SOBRE FINES Y MÉTODOS
- 2~
O. I N T R O P Ü C C I ON
0 . 1 . OBJETO.
En el presente trabajo se trata de estudiar -sin
ninguna pretensión de exhaustividad- algunas cuestiones re
lativas a la aplicación de la Teoría de la Decisión Esta—
dística al Control Adaptivo. En especial se llega a la ola
boración de una regla de decisión original válida para sis
temas no lineales de control adaptivo y se hace aplicación
de la misma a un supuesto práctico.
Como es sabido el control automático -utilizando
las técnicas de análisis lineal y la idea clave de realimen
tación- se desarrolló sobremanera9 tanto en el aspecto toó*
rico como en el tecnológico 9 durante la década de los 40 y
primeros años 50. Al filo del medio siglo la complejidad -
de los procesos a controlar y la progresiva sofisticación
de la propia teoría -sin contar con la creciente importan-
cia de las técnicas digitales, la influencia de la investí
gación aeroespacial, etc.- condujeron al estudio de siste-
mas no lineales crecientemente complejos, sistemas de mués
treo, etc., hasta llegar a los sistemas adaptivos que han
ocupado destacadamente el estudio de los especialistas du-
rante estos últimos años.
El control adaptivo consiste simplemente en dis-
poner de controladores cuyas características sean suscepti
- 3 -
bles de variar automáticamente, adaptándose a los cambios
de configuración del sistema a controlar, de las entradas
al mismo, de las perturbaciones, etc. . El "quid" de la —
cuestión está en la consecución de dispositivos que sean -
capaces de medir u observar dichos cambios, calcular a par
tir de los mismos, y de los criterios de optimización pre-
establecidos, los valores ideales de las características -
instantáneas del controlador y ajustar las reales a ellas.
Por lo tanto un punto esencial es el de la observación de
los parámetros del sistema a controlar, cosa que resulta -
imposible de hacer en plan determinista, en la mayoría de
las situaciones reales, por la presencia de ruidoa
Por la razón apuntada es necesario utilizar cri-
terios que permitan -a falta de determinaciones exactas- la
consecución de estimaciones, lo más realistas posibles, de
los parámetros del sistema. Aquí es donde aparece la Teoría
de la Decisión.
La Teoría de la Decisión, como veremos más adelan
te, permite con una base estadística apropiada hacer tales
estimaciones con -un riesgo mínimo. Nuestro trabajo consis-
tirá en mostrar cómo se consiguen tales resultados, en es-
pecial para los sistemas de tipo no lineal no suficientemen
te estudiados aún en este aspecto.
La Teoría de la Decisión que adquiere un "status"
de prestigio con la obra de Wald "Statistical Decisión Pune
-4-
tions,! (1950) ha sido aplicado durante la década de los 50
a numerosos problemas de teoría y práctica de las comunica
ciones; en los años 60 tales aplicaciones alcanzaron a los
problemas de control9 en cuya tarea se sigue actualmente .
La presente es9 pues9 una aportación más a tal línea de in
vestigación*
0.2. BREVE DESCRIPCIÓN.
Aparte de esta introducción y de unos apéndices
finales9 la tesis está dividida en dos partes; en una pri-
mera se hace una exposición de ideas elementales con el fin
de aclarar y dotar de una base al contenido más original -
de la segunda parte. Cada una de ellas está formada por —
tres capítulos.
En el primero se dan los conceptos fundamentales
de teoría de la decisión y sus aplicaciones a los proble—
mas de comunicación y control.
En el segundo se tratan los métodos no secuencia
les.
En el tercero -y fundament dí> la primera párte-
se trata de los métodos secuenciales9 que se aplicarán en
los que siguen a los sistemas adaptivos? algunos resulta—
dos, aunque básicamente conocidos9 han sido modificados9 -
ampliados y adaptados con al fin de aplicarlos al control
adaptivo de sistemas no linéales9 alternativa no binaria y
- 5 -
ruido no gaussiano0
El capítulo cuarto (ya en la segunda parte) es -
el fundamental del trabajo por su amplitud y por contener
resultados inéditos. En particular se obtiene en él una re
gla de decisión aplicable a sistemas no lineales con ruido,
basándose en una sustitución de la ley de probabilidad real
por una aproximación multinomialo
El capítulo quinto so dedica íntegramente a apla-
car dicha regla a un supuesto práctico.
El último capítulo -el sexto- contiene un breve
resumen y una lista do conclusiones.
Se han añadido tres apéndices al final, cuyos —
respectivos finos son los siguientess el A, dar una lista
de definiciones y teoremas de Teoría de la Decisión? el B,
resumir unas ideas sobre la ecuación de Fokker-Planck de -
los procosos markovianos y la solución de Caughey para el
caso estacionario 5 y el C9 dar unas notas críticas sobre -
la monografía de Y. Sawaragi, YG Sunahara y T„ Nakamizo, -
advirtiendo do algunos errores que contiene.
0.3. OBSERVACIONES SOBRE EINES Y MÉTODOS.
Antes de terminar la introducción del presente -
trabajo es preciso hacer algunos comentarios y observacio-
nes sobre los finos perseguidos en el mismo y los métodos
utilizados.
- 6 -
En primer lugar hay que señalar que no hemos pro
tendido escribir una monografía completa sobre el toma, si
no exclusivamente comunicar algunas contribuciones al mis-
mo. Por lo tanto os inútil buscar muchos resultados ya co-
nocidos o cuestiones que son objeto actualmente de invosti
gacióna El lector que esto interosado on los mismos deberá
acudir a las referencias que damos o, mejor? a los números
recientes de las revistas do la especialidad.
Esa misma falta intencional do oxhaustividad lie
va consigo aparejada, on algunos pasajes do la primera par
te, un cierto asistematismo por omisión de resultados, --
pruebas o datos no absolutamente imprescindibles para com-
prender nuestra contribución concreta. No creemos que sea
ello un inconveniente, ya que debe quedar bien claro que -
los tres primeros capítulos no tienen mayor interés por sí
mismos y sólo cumplen los dos finos siguientes % 12. Dar al
gunos resultados y fórmulas de -un modo directamente utili-
zable para nuestras investigaciones°9 y 22. Hacer relativa-
mente legible el trabajo sin un exceso de prerrequisitos.
En cuanto al método seguido hemos de puntiializar
que está mucho más cerca del utilizado por los ingenieros
de control y los estadísticos -un tanto heurístico y prag
mático- que del riguroso y teórico de los matemáticos —
(aunque ello haya violentado a veces los escrúpulos, más -
matemáticos que ingenieriles, del autor). El motivo es '-
dobles por -una par te , t r a t a r se de cuestiones de aplicación
tdcnica (objeto de una t e s i s doctoral en ingenier ía ) ; por
otra refer i rse a problemas en los que un exceso de formali
zación y r igor no añade nuchas ventajas, ya que son sucia—
nente concretos y susceptibles de conprobación enpír ica. -
Nos parecen a este respecto nuy oportunas unas palabras —
(que oitárenos con c ie r ta l iber tad) del Profesor Sixto Ríos
señalancTo que de las t r e s etapas por l as que atraviesa t o -
da natenatización de un fenóneno reals conceptualización ,
razonaniento lógico-deductivo y desconceptualización se —
presta , indebidáñente, nás atención a la nenos inportante
y ñas sencil la que es la in temedia . Siguiendo tan au to r i -
zado consejo hemos procurado huir de ese extremo sin caer,
naturalmente, en el opuesto.
PRIMERA PARTE
ELEMENTOS DE TEORÍA DE LA DECISIÓN
Y APLICACIONES AL CONTROL ADAPTIVO
1. INTRODUCCIÓN A LA TEORÍA DE LA DECISIÓN
S u rna r i o
1 . 1 . GENERALIDADES.
1.2. DESCRIPCIÓN DE UN PROCESO DE DECISIÓN.
1.3. FORMULACIÓN GENERAL.
1.4. SOLUCIÓN BAYESIANA.
1.5. CASO BINARIO.
NOTAS Y REFERENCIAS.
- 1 0 -
1. INTRODUCCIÓN A LA TEORÍA DE LA DECISIÓN
1,1. GENERALIDADESo
Vamos9 en este primer capítulo, a dar un breve -
resumen de las ideas básicas de la Teoría de la Decisión y
de sus aplicaciones a los problemas de comunicación y con-
trol. Estos últimos se reducirán al de la detección bina—
ria.
En un proceso de decisión se trata (si se nos per
mite una definición aproximativa) da estimar una situación
imperfectamente conocida por su aleatoriedad intrínseca o
por falta de información? valorar las posibles consecuen—
cias de las decisiones que se adopten en función de tal ejs
timación y adoptar la política o estrategia óptima. Natu—
raímente se considerará una política óptima cuando para ca
da caso nos dé la decisión óptima, es decir la que maximi-
za o minimiza una cierta función criterio9 preestablecida
de acuerdo con el plantel de objetivos que se tengan.
Los primeros estudios de procesos de decisión -
aparecieron en el campo do la Teoría de la Estimación esta
dística por obra de Neyman y Pearson. Posteriormente Wald
creó toda una Teoría de la Decisión con amplias aplicacio-
nes en diversas ramas de .".a Estadística y la Investigación
Operativa.
Las aplicaciones de dicha Teoría se han prolonga
-11 -
do después a los problemas de comunicación y en el decenio
último a los de control.
1.2. DESCRIPCIÓN DE ÜN PROCESO DE DECISIÓN.
Tenemos una situación definida por un parámetro
© . Suponemos que éste puede tomar la gama discreta de va
lores ©*.,...., © n con las probabilidades "a priori" -
Pi==p(©*)# En un caso concreto © puede ser el valor de
un parámetro de una distribución estadística, la posición
de un blanco buscado por un radar, el contenido de un men-
saje, el valor de una característica dinámica de un siste-
ma de control, etc.5 la ?(©.?) representa, en tal caso,
las probabilidades estimadas "a priori" de que el valor de
© sea precisamente © . .
Si © estuviera dado determinísticamente bastaría
una observación empírica para conocer su valor real (con -
el nivel de precisión permitido por el sistema de medida)-
pero si, como sucede en los casos aludidos, su valor real
es alterado por la presencia de perturbaciones o "ruido" -
aleatorios, es necesario estimar el valor del mismo a par-
(1) La descripción se hace para el caso de © discreto por comodidad, pero no hay problema en considerar el caso continuo (así lo haremos en la sección siguiente al dar una formulación general).
- 1 2 -
tir del valor observado.
Imaginemos que los valores muéstrales posibles -
son 91 9. . . . $©m . Para cada valor real © . existe, una proba
bilidad condicional p. . =p(9- (9*.) de que se obtenga el -i J j i
valor observado 9̂ (estas probabilidades podrían calcular-
le 9 naturalmente, si se conoce la ley de probabilidad con-
junta o$ lo que es lo mismo, si se conoce el tipo de ruido).
En el supuesto discreto las P-ĵ formarán una matriz de di-
mensiones n xm .
A la vista del valor observado y de las correspon
dientes probabilidades Pj_ y P• . pueden tomarse las distin
tas decisiones de aceptar la hipótesis de que el valor real * i' =fe c e
de ©"" es 9 , ? ( , , , ,©~ que designaremos & - . , . . . a ,
-13-
1.3. FORMULACIÓN GENERALa
Vamos ahora a formalizar matemáticamente lo di—
cho en la sección anterior, cuando describimos de un modo
somero un proceso de decisión.
Vamos a suponer que tratamos de estimar la fun—
ción de t, 9*(t). Como es natural sus verdaderos valores -
no nos son accesibles porque son perturbados por un cierto
ruido n(t), de forma que los valores observados correspon-
den a ©(t). En principio puede suponerse que la superposi-
( 1 ) ción del ruido a l a seña l es ad i t i va v J
©(t) = ©*(t) + n ( t )
lo que nos pe rmi t i rá e s t a b l e c e r r e l ac iones en t re l a s l eyes
de probabi l idad respect ivasc
Tomaremos -una muestra de © de n v a l o r e s , ©.* ,
©2?.. • • * 9 n , en l o s i n s t a n t e s t - , . * . v , t , y formaremos -
con e l l o s e l vec tor de l a s observaciones 8= ( 9 1 , . . i # 1 6 r l ) •
Este se corresponde con e l formado por l o s va lores r e a l e s
©*(t.j) =©* , . . . . . , ©*(tn) =©* , es dec i r con O* = ( .©*, . . . . .
©* )
(1) Dicha h i p ó t e s i s no es gene ra l , n i s iqu ie ra r e a l i s t a en muchos casos o Esto no obsta a l a va l idez del razonamien to que s igue .
- 1 4 -
En nuestra primitiva descripción, tomar una deci
sión era simplemente dar como valor real un determinado ©*!
y se la designaba por
P C Í , " ? * ) = P d ( ¿ ( "©) P ( © , © * ) =
= p a ( 5 | ©) p ( 9 | © * ) s(9*) (1.2)
siendo s ^ / ^ . «*,
p (9 , 9 ) Densidad de probabi l idad conjunta de 9 a5
p¿( S j 9) Densidad de probabi l idad condicionada
de tonar £ cuando se ha observado 9 #
p(©|© ) Densidad de probabi l idad condicionada
de observar 9 cuando e l va lo r r e a l es
9 ~ .
/"^¿\ s(9 ) Probabi l idad ,fa pr ior i 1 1 de que e l va lo r
r e a l sea 9 .
Como es lógico, el conocimiento de las anteriores
funciones de densidad presupone el conocimiento de las ca-
racterísticas estadísticas de la señal y el ruido, salvo -
pn(£|9) que 9 naturalmente, es la que queremos determinar.
Por otra parte conviene señalar que, en algunos casos, di-
chas densidades se convertirán en distribuciones tipo "del
ta de Dirae" o, lo que es lo mismo, se tratará de probabi-
lidades discretas.
Con la ayuda de (1.2) la expresión (1.1) se oon-
vierte en la siguientes
- 1 6 -
R ( s , p a ) =
= / / J L ( 9 * , S) p d ( ? / 0 ) p(©("©*) s(9**)d9* cl91 ..M. dcTj — d¿n E v E o E d ( 1 . 3 )
(E , E 0 y E¿ son l o s e s p a c i o s do l a s e ñ a l , de l a s o b s e r v a -
c i o n e s y de l a s d e c i s i o n e s ) .
A ' E [L(9 , Ǥ ) J l o hemos des ignado por R(s 9 p d )
y l e l l amaremos , s i g u i e n d o l a t e r m i n o l o g í a de Wald, r i e s g o
medio. Depende, supues t a dada de antemano L(9 ? c> ) * ¿le l a s
p r o b a b i l i d a d e s ,!a p r i o r i M s ( 9 ) y de p d (o>)9 ) .
Si se de f ine un f ? r iesgo c o n d i c i o n a l " 1 (9 , P-J
c orno
1(3* , Pd) =
L("9*9
- 1 7 -
R(s9pd)= Z L±3 p i k p d ( f j K ) s i
i , j , k
K©i* ,P d ) = 2 Li j P i k P d ^ o l ^ k ) ^ -8 )
Se t r a t a 9 pues, de monimizar e l r iesgo e l ig iendo —*» « •
l a P¿(
-18-
1.5. CASO BINARIO.
El problema de la detección binaria es suficien-
temente conocido, pero vamos a dar una ligera ojeada al -—
mismo que nos servirá de introducción.
Suponemos que en el espacio de las señales hay -
dos subconjuntos posibless el correspondiente al mensaje -
nulo y el del mensaje no nulo con las probabilidades respec)
tivas Q y P (naturalmente P + Q=1) y que la función do
densidad del mensaje no nulo es S- (O ) . Por lo tanto la -
(1)
densidad s e r á v ' } i
S(9**) = P S ^ ? * ) +Q S (&*-o) (1.10)
Supondremos que sólo hay dos hipótesis H y H-,
correspondientes a admitir que no hay mensaje o que sí lo
kay* y Por 1° tanto sólo son posibles las decisiones £Q y
o-. . Entonces?
P d ( l |e) = Pd(J0l ©) S (S-¿0) +Pd(á,l©5 § (é-3,) (1.11)
Como es n a t u r a l se t i ene que s
P d ^ o l ® > + P d ^ l ' ^ = 1
La función de pérdida puede darse cornos
(1) Las £ (•) son d i s t r i b u c i o n e s "de l ta de Dirac'1 .
-19-
"* -* L(9* = o, §Q) = L ^ *] ,-fi± L(9 S = o, ^) = L12 i
L(*©* ¿ o, $Q) = L21 L("0* ¿ o, ¿.f) = L 2 2 J
(1.12)
Llevando (1.10), (1.11) y (1.12) a la expresión
del riesgo se tiene (llamando E v y Ev- a los subconjun-
tos de E v correspondientes a señal nula y no nula)%
R(s ,pd) = / Cp s1 &*) + Q ̂ (®* " o)] a©*..... de¿* x
x /" P(T|i**) [Ll 1 Pd( í 0 | ©5 + L21 P d ( JQ | £j
+ L 1 2 p d ( < 5 1 | ©) •Í-L22pd(1 / S1 (©*) p(9*"( "?*) d © * , . . . . d9n*J d©1 . . . . „d9n
'E0
+ PL,
v
*• / P a ^ i l " ^ rQL12p(©*Jo) +
/ S.,(©*) p(©'|'©*)d©*. d©^J d © r . . . . d©n 4-PL22 1 (1.14)
Si introducimos l a s probabi l idades de los e r r o r e s
- 2 0 -
de p r imera y segunda c l a s e
£, = / p ( 9 | o ) Pd(
- 2 1 -
Es decir
R(s ,p d ) =QL 1 2 4-PL 2 2 4- / Vd(S0¡
JB0
T) P(Lo, -Loo) I -
- Q Í L ^ - L ^ ) p(0 | O )
siendo I =
UVJ r e © o a ~ C l f e v
,7 * *x ^ *
(1.17)
*
'EV
p ( © | 0 * ) ' s 1 (9*) d©', d©^ (1.18)
1
A la v i s t a de (1.17) e l r i esgo será minino cuan-
do se n in in ice l a i n t e g r a l del segundo miembro. Habrá dos
casos?
12) P(L2 1 - L 2 2 ) I - Q d ^ - L ^ ) p ( 9 | o ) > 0
entonces debe se r P¿L^ol ®) = 0
22) En caso c o n t r a r i o debe se r P^ít^oj ©) = 1
Si fornanos l a l l anada "razón de ve ros imi l i tud
genera l izada"
A =
y nácenoss
p f .s.,(©*) p(G*|^*) d©*, d©n*
Q p(© |o )
y= _- l£J l - l l . L21 ~L22
tendremos que l a reg la bayesiana será
A )f escoger £^
NOTAS Y REFERENCIAS AL CAPITULO 1
-La Teoría de la Decisión es principalmente crea
ción de Wald^ las referencias básicas sons
Wald, A.: "Basic ideas of a General Theory of
Statistical Decisión Rules", Proc. Int. Cong. Math, , 1950
(visión general e introductoria sobre la materia).
Wald, A.s "Statistical Decisión Functions", Wi~
loy, New York, 1950 (texto fundamental que recoge la labor
del autor y otros matemáticos sobre la materia en los años
anteriores).
-La formulación de la Teoría de juegos se debe al
genial Von Neunann (a partir de 1928)5 la primera obra de
conjunto esz
Von Neumann, J. y Morgenstern, 0.: "Theory of -
Games and Economic Behavior", Princeton University Press,
1941 (2S ed. , 1947).
-Una obra didáctica sobre la materia es:
McKinsey, J.: "Introduction to the Theory of Ga-
nes% McGraw-Hill, New York, 1952. (ed. esp. en Aguilar).
-Obras tratando conjuntamente Teoría de la Deci-
sión y Teoría de juegos sons
Blackwell, D.. y Girshick, M.A. t "Theory of Games
and Statistical Decisions", Wiley, New York, 1954.
Luce, R.D, y Raiffa, H. 1 "Ganes and decisions",
Wiley, New York, 19 57.
- 2 3 -
2. PROCESOS DE DECISIÓN NO SECUENCIALES EN CONTROL ADAPTIVO
S un a r i o
2.1. INTRODUCCIÓN.
2.2. DETECCIÓN PARA UN CASO NO BINARIO. CALCULO
DEL RIESGO.
2.3. DETERMINACIÓN DE UNA REGLA BAYESIANA.
2.4. APLICACIÓN A UN SISTEMA ADAPTIVO.
NOTAS Y REFERENCIAS.
- 2 4 -
2- PBCCESOS DE DECISIÓN NO SECUENCIALES EN CONTROL ADAPTIVO
2.1. INTRODUCCIÓN.
Hemos adelantado en la exposición hecha anterior
mente que la Teoría de la Decisión permite resolver proble
mas de Comunicación y Control sumamente interesantes. Sin
embargo nos hemos limitado al caso de detección "binaria -
con un sentido elemental y poco realista.
En efectos en situaciones normales es frecuente
que nos veamos en la necesidad de estimar el valor de para
metros (características de sistemas dinámicos, factores am
tiéntales, etc.) con un campo de variabilidad amplio. En -
tales casos supondría una simplificación drástica el redu-
cir dicha gama de valores a una opción binaria y es, por -
lo tanto, lógico extender ésta a una serie de valores dis-
cretos, suponiendo que durante intervalos de tiempo prees-
tablecidos dicho parámetro permanece constante y cambia al
pasar de uno a otro. Esta hipótesis será tanto más apropia
da cuanto menor sea la máxima de las amplitudes de los in-
tervalos y monos rápida la variación del parámetro conside
rado.
En una primera fase nos ocuparemos de procesos -
de decisión no secuenciales, es decir de procesos tales que
se toma una muestra de tamaño pre de te armiñado y se decide -
- 2 5 -
en consecuencxa e
2 . 2 . DETECCIÓN PARA UN CASO NO BINARIO, CALCULO DEL RIESGO,
Supongamos que se t r a t a , de e s t i m a r e l v a l o r 9 * ( t )
d e l parámet ro observado O(t ) = Q ^ ( t ) + n(fc) como hemos h e -
cho anter iormentOo Dividamos e l campo de v a r i a b i l i d a d do l
c i t a d o parámet ro en N i n t e r v a l o s Cj , Cp? * . . . * %«i?°N como
se i n d i c a en l a f i g u r a 2,1
e(t)
o*(t)
f °N
e( t )
¿^©4(t)
^ - ^ < /
\~^^7%?Q^ i ©V | 1
r^\ *?T 1 c 2
¡ c1 i J ! l
e n
I mm
t1 t2 n
Figura 2 * 1
Se trata9 pues, de sustituir el problema de deter
minar exactamente 0*(t) por el de saber en qué intervalo -
se encuentra.
Tomemos n observaciones en los instantes t-j ,. .
. o 9 tn y sean sus valores 9̂ ,. . .. 99 n . Formemos el vector
1 '̂ n-
- 2 6 -
siendo E0 e l espacio de l a s observaciones y n e l tamaño
es tab lec ido "a p r i o r i " de l a muestra no secuenc ia l .
Imaginemos que e l espacio n~dimensional E0 e s t á
dividido en N subcon juntos L-, • .... ,L¡j cada uno en cor res—
pondencia con los i n t e r v a l o s C J , . . , . , C J J del campo de va r i a
b i l i dad de 9 * ( t ) . La h i p ó t e s i s % de que e l ©*(t) verdade-
ro e s t á en C¿ so acepta cuando 9 6L^ . La decisión de acej3
t a r HJL se designa por ¿¡. ( i = 19 2 , . . . , N) * Llamaremos
Lj_.j =L(C¿, £•) a l a función no negat iva de pérdida por e l
e r r o r de tomar l a decis ión o. cuando © ( t ) e s t á en Cj . -
En es te caso e l espacio de decis iones se reduce a l conjun-
to d i sc re to < 1 9 „ O . , N [ •
El r iesgo medio serás
R(?f s, pd) = 2 1 2 L ^ i / P d ^ j l0 ) L ( c i * f j ) dGi d e n x
i=1 j = i -^Li
x / p(©|C±) S±(©*) d©* (2.1)
siendo? C±
5*. Probabi l idad "a p r i o r i " de que ©*(t) €C¿ ,
S^(9*) Densidad de probabi l idad de 9*(t) cuando
^ ( t jCCjL .
p^(
- 2 7 -
2 1 f± S i(9*) d0á == 1 f±^ O Si(9*) 2 0 V i
i=1 Jo±
N
Por otra parto pCOJC^) os la probabilidad condi
cional de que el vector observado sea Q cuando 0^(t)
- 2 8 -
E l r i e s g o "a p o s t e r i o r i " s e r á en toncess
-* JL - V.(9) r.(9) = X- ^i \¿ = "f—¿" (2.6)
s iendo -*• -#• Vd(©) = 2 1 F± L13 q±(©) (2.7)
i=1
2-3- DETERMINACIÓN DE UNA REGLA BAYBSIANA.
Apl icando e l teorema de Wald tendremos que: l a -
cond ic ión n e c e s a r i a y s u f i c i e n t e partí que p ¿ sea l a s o l u -
c ión b a y e s i a n a , dadas unas p r o b a b i l i d a d e s ,!a p r i o r i " , que
minimiza e l a n t e r i o r r i e s g o e s que
P d ( m i n r k ( 0 )
Es d e c i r que p - . ( £ . )©) e s n u l a pa ra t odos l o s -
v a l o r e s de j excep to paira uno que v a l e l a un idad y que e s
e l c o r r e s p o n d i e n t e a l mínimo de r . (9) que (por l a fórmula J
( 2 . 6 ) ) c o i n c i d e con e l í n d i c e p a r a e l que se hace mínimo -
V d ( 9 ) . E
ópt ima)s
V. (O). Es d e c i r (des ignando con -un a s t e r i s c o a l a d e c i s i ó n J
d
s iendo
P d ( §,* \ ©) = 1 s i j = k ^ ( 2 . 8 )
P
- 2 9 -
Vk(9) = min V.(0)
En resumen, tendremos que el riesgo mínimo vale
N
R(J, s, p*) =Y1 / ^i L^Ci^k) ̂ i ^ d91 ' d92 • i=1 «'IH
d0,o
o también R( s, P(f) » ^ j Vk(0) d O ^ , . .. . d9n
Jk .-*> siendo k el índice que minimiza V.?(@) .
2.4o APLICACIÓN A UN SISTEMA ADAPTIVO.
Es posible c o n s t r u i r un d i spos i t i vo de decis ión
que corresponda a l a a n t e r i o r reg la y u t i l i z a r l o en un s i s
tema de con t ro l adaptivo del modo que indican l a s f i gu ras
2.2 y 2.3 .
Entrada
Dispositivo de decisión
K&~
- 3 0 -
o(t) M u e s t r e d I I r
O-;N
|vy
- 3 1 -
N
* = ZL R(Ci,Pd)
i=1
R(c± , pd) = 0) q i(©) d01 . , d©n
Volviendo a u t i l i z a r e l teorema de Wald t e n d r e -
mos que en e s t e caso
P * ( á . j l O) = 0 s i j / k
s iendo k e l í n d i c e t a l que
Vk(9) = min V,(9)
k . 3
pero en e s t e casos
N N
y e ) = SIFiii3- q i ( í = Z fi %(" - y3 4d(sj i=1 i=1
es decir que el mínimo de V-(©) corresponde al máximo de J
? i q.i(&) ( l o c u a l e s l ó g i c o y r e p r e s e n t a a l a i d e a de ma~
x i m i z a r l a p r o b a b i l i d a d de e r r o r n u l o ) .
Por l o t a n t o , l lamando Xn-(©) = jT¡ Q.-?(©) Ia r o g l a
de d e c i s i ó n quedas Adoptar
Es fácil para el caso de procesos gaussianos en-
contrar formas simples de /L (©) que permiten dar reglas -d
de decisión en formas cómodas; las omitimos dado que no es
nuestro fin y pueden encontrarse en las referencias que se
citan. Del mismo modo pueden resolverse problemas comple-—
jos como el de la identificación de sistemas.
- 3 3 -
NOTAS Y REFERENCIAS AL CAPITULO 2
- A p l i c a c i o n e s de l a Teor ía do l a Dec i s ión a l o s
problemas de comunicación pueden e n c o n t r a r s e en l a monumen
t a l y e n c i c l o p é d i c a obra de Middle ton sobre l a t e o r í a e s t a
d í s t i c a , de l a s comunicaciones (más de 1100 págs .5 r e f e r e n -
c i a s abundan t í s imas a l o s t r a b a j o s o r i g i n a l e s , en inmensa
p roporc ión d e l p rop io a u t o r ) .
Midd le ton , D. 1 nAn I n t r o d u c t i o n t o S t a t i s t i c r a l
communication Theory11, McGraw-Hill , New Yocpk, 1960 0
-Una s u g e s t i v a i n i c i a c i ó n a l p a p e l de l a Teor í a
de l a Dec i s ión en e l C o n t r o l Adapt ivo ( e s c r i t a cuando no se
h a b í a t r a b a j a d o mucho en dicho s e n t i d o ) se puede l e e r ens
T r u x a l , J . G . y P a d a l i n o , J . J . s "Dec is ión Theory" ,
en l a obra c o l e c t i v a "Adaptive Con t ro l Systems" ( e d i t a d a -
por Mishkin , E. y Braun, L . ) , McGraw-Hill , New York, 1961.
- N u e s t r a d e s c r i p c i ó n s i g u e , en buena p a r t e , l a -
monografía a l u d i d a en l a I n t r o d u c c i ó n s
Sawaragi , Y , , Sunahara , Y. y N a k a m i z o , T . : " S t a -
t i s t i c a l Dec i s ión Theory i n Adapt ive C o n t r o l Sys tems" , Aca-
demic P r e s s , New York, 1967.
- 3 4 -
3 . PROCESOS DE DECISIÓN SECÜENCIALES EN CONTROL ADAPTIVO
S u n a r i o
3 . 1 . INTRODUCCIÓN.
3.2. RIESGO MEDIO EN UN PROCESO SECUENCIAL.
3.3. SOLUCIÓN BAYESIANA.
3.4. CASO BINARIO.
3.5. MODIFICACIÓN PARA EL CASO DE MAS DE DOS ALTER-
NATIVAS.
3.6. APLICACIÓN A LOS SISTEMAS ADAPTIVOS.
3.7. CALCULO DE LAS CONSTANTES.
NOTAS Y REFERENCIAS.
-35-
3- PROCESOS DE DECISIÓN SECUENCIALES EN CONTROL ADAPTIVO.
3-1. INTRODUCCIÓN.
En el capítulo anterior presentamos un sistema -
adaptivo que incluía un elemento de decisión de tipo no se
cuencial. En muchos casos una solución no secuencial es in
viable -o es poco práctica- y es necesario recurrir a una
de tipo secuencial9 en cuyo caso el tamaño de la muestra -
(o, lo que es lo mismo, el tiempo total de observación) no
se preestablece9 sino que queda indeterminado 5 es decir, -
después de cada toma de datos se consideran las alternati-
vas de aceptar una decisión final entre las varias posibles,
o de continuar el proceso. Como es obvio este procedimien-
to resulta lógicamente más correcto y económicamente más -
razonable ya que se toma la muestra del tamaño necesario y
suficiente para decidir con un nivel de seguridad acordado
de antemano.
3*2. RIESGO MEDIO EN UN PROCESO SECUENCIAL.
Cuando estamos efectuando un proceso de detección
secuencial el mdtodo a seguir es el siguiente.
Al observar los n primeros valores del parame—
tro ©̂ ,. o • 9 ©n que forman un vector ©n debe optarse entre
las decisiones siguientes? aceptar la hipótesis H-j de que
- 3 6 -
o. -P
© ( t )€C- j (á =1*••• ,N) a l a que designaremos SA (decis ión
f i n a l j ) , o l a de segui r observando v a l o r e s , a l a que de —
signaremos por S (dec is ión de c o n t i n u a r ) .
El vec tor
Pd = P d ( Í } = t d ^ / l ° n ) f •••» P d ^ / l ^ J
nos da l a regla de decis ión f i n a l ya que sus componentes -
representan l a s probabi l idades de tomar l a s dec is iones — c f ' c f -^ £,. , ••• ,
P*^ l°l> = [ P ( ^ Í "01).---.P(^|cN-)]
Entonces e l r i e s g o medio v a l d r á ;
ao N N / / * f ^ - |
RÍPÍ %) = Z E Z. / , / r k> ¿á (^)J *
k=1 3=1 1=1 / E ^ ^C± L
x p±(©*) p d ( ^ f ©fc) p C e ^ C ^ ) d©1 d©kd©* ( 3 . 2 ) Si se h a c e ;
p.(©*) = ? . S ± (©*) = ? i í (©* -©i*) ( 3 . 3 )
La e x p r e s i ó n d e l r i e s g o ( 3 . 2 ) puede p o n e r s e ;
R( 5"» Pd) = H H/ ? k=1 ig=1 ^E k
0 ± . ¿ l ( © f c ) X
x P d ( ¿ í | ©fe) p(©kl C±) d9 1 0 d ^ (3-4)
3 - 3 - SOLUCIÓN BAYESIANAo
posic
Llamemos 6 al conjunto de los puntos cuyo vector
ición 5 = ( j£p ... •,
- 3 8 -
que resultan aceptables, vamos a e legi r una que verifique
Ly = 0 si i = ó
L i ; j > O si i ¿ 3
Definamos la función
N
3 = 1 hi
Tenemos 9 pues, N funciones ^ . ( ^ ) de modo que
a K ^ S v le corresponden N valores 7?. ( TjT) ,. . • , ̂ gL( ̂ ) •
Nos es posible establecer una nueva función de forma que a
cada vector ^ se le asigne el mínimo de los ^P. (jy ); es -
decirs
Para cada valor de
dirá con alguna de las *2£(j§")« Entonces definimos el sub-
conjunto V. O Q por la siguiente condición
= muí i
Se pueden probar fácilmente los dos siguientes -
asertoss
12) Todos los V- son convexos y cerrados, J
- 3 9 -
2 )̂ Los Y^ son disjuntos dos a dos,
Si se define el conjunto V como
V = N
1=1
su complementario será
N
i=1 x
Entonces se puede establecer la regla "bayesiana"
de decisión correspondiente a las probabilidades "a priori , f
dadas por 1? = ( ^ \ 9 • . . 9 "3?JJ) que sigue.
R e g l a .
1*- Si 3i "kal Q.ue 5̂ 1 = y €. Vi no se hacen ob-f 5*
servaciones y se toma la decisión £ . j si ^ € V1 se hace
una observación 9. = (©.,) y se calcula el vector de proba-
bilidades ,!a posteriori" 2T2 = ( £ l p 9 . • . , *^TP) a Par*fcir de
^ y 01 (utilizando la fórmula de Bayes).
2.- Para cualquier S^j- (n = 1 ,. . . , oo) se actúa
análogamente; ew decir i si J - *^al «* o
la decisión £ . , si ^nj.-iSV1 se toma la decisión ^ pa-
ra lo que se hace una. nueva observación Q ± , se calcula
^ n x 2 a partir de y n + 1 y ©n+1 = (©-,,..., 9 n 4 1) .
3 . - Se continúa hasta tomar una £ ¿¡ . J
El paso de $*n a 2Tnj.-j aludido no es otra cosa -
- 4 0 -
que el cálculo de las probabilidades "a posteriori", a par
tir de las f,a priori11 y las condicionales, utilizando la -
fórmula de Bayes. De un modo simple podríamos representar
dicho paso por un producto de la matriz A(n) por el vector
inicial 5 9 e s 3-ecir;
£ + 1=A(n))T (3.5)
La matriz A(n) es diagonal y tiene por compo-
nentes
a±2in) = ~ww^Tñ~r ^ i j ( 3-6 ) WCií)~# i
cons i , j = 19, f , , N , n = 1 9 2 , . . • .
^ H Í l ° i ) - Í l ? i P(í|0i> i=1
5JL -n símbolos de Kronecker
Naturalmente S1 coincide con ^ .
3.4. CASO BINARIO o
En el caso de ser N = 2 se puede representar O
fácilmente o Se trata del segmento de recta representado en
la figura 3.1 .
Se cumple que
-41 -
Figura 3.1
fe V2 => % > n2=> ^2 L21 > 5*1 L12
Si llamamos ( ̂ , 5p) £ & al punto tal que
r„ '12 * i
J21 3f 2 4 ^ = 1
Entonces podemos poner que
? € V1
? € V C
J2 >1
F2 * 1
. 1
r2
"?r ^ o ^» ^ O
*2 * 92
Por se r L y Vg d i s jun tos y cerrados e x i s t i r á n
sendas cons tan tes a y b que cumplan
o < y < a < 1
y t a l e s que
- 4 2 -
wmmW
Scv1 o é ?2<
Por lo tan to la reg la dec i sor ia e s t ab lec ida en
e l párrafo a n t e r i o r puede ponerse como sigue
f Tomar $^ s i £^ n + . j < b
Tomar c£2 s i -2T2 nj..j > a
c w*
Tomar ^ s i b
- 4 3 -
Análogamente
. _ _ ^ P(%JO 2 ) a ri
Por l o t a n t o l a r e g l a d e c i s o r i a puede e s t a b l e c e r
se (cuando n ü ) como;
Tornar ¿^ s i A (9 n ) < B
Tomar S 2 s i ^ (9 n ) > A
Tomar A(© n ) > B
Habiendo hecho
a 'Sf. b S 1 A = — 1 - B = - -
1 - a T 2 1 - b ? 2
A (0 n ) = — . _ £ — £ - - (n = 1 , . . . . oo) PC^JC,)
Es d e c i r s en e l caso b i n a r i o l a r e g l a b a y e s i a n a conduce a l
" t e s t " de razón de v e r o s i m i l i t u d e s s e c u e n c i a l .
Es obvio que p a r a e l v a l o r e x c e p c i o n a l y s i n i n -
t e r é s r e a l n = o l a r e g l a e s f
Tomar ¿^ s i ^o< b
Tomar S 2 s^ 2 ^ a
Tomar £ s i b < S < a
- 4 4 -
3.5. MODIFICACIÓN PARA, EL CASO DE MAS DE DOS ALTERNATIVAS.
Cuando el valor auténtico de 9*(t) tiene un cam
po de variabilidad suficientemente amplio para que sea acón
segable elegir un N superior a dos se hace necesario apli
car la regla establecida en 3.3 . Ahora bien, la aplicación
estricta de la misma se hace prohibitiva? en primer lugar
por la complejidad matemática que puede entrañar la aparen
temente simple pregunta de si J^^V. ; en segando tdrmii&o
-aunque fundamental desde nuestra perspectiva actual- por
la complicación técnica del correspondiente sistema adapti
vo.
Se trata-, pues, de ampliar, convenientemente mo-
dificada, la regla del caso binario al muí ti dimensional*
Si 9*(t) puede variar en (-oo, 4-QO) y si se ha -(1\
dividido éste en los N intervalos siguientes^ ''
CJSC-GD, 9*),_.,cD. sCoji-p ©*)f..-# cN5(©¿-if +OD)
tendremos e l problema de c o n t r a s t a r l a h i p ó t e s i s
E. t 9*(t) 6Cd (3 = 1 M . M N )
.4.
Ahora biens la hipótesis, H^, de que © (tJfiO^
(1) Si el intervalo es acptado bastará sustituir -GD, +00 por los extremos del mismo? esta variación no altera nada de lo que digamos•
- 4 5 -
puede considerarse cono la conjunción (o intersección) de
las dos hipótesis más simples siguientes;
H~ : 9*( t )>9*_ 1 ( 9 * = - C D )
H * : 9 * ( t ) < 9 * ( 0 * = + QD)
H, = H .+ n H r J J U
Pero cualquiera de estas hipótesis puede ser con
trastada utilizando el test secuencial de la razón de vero
similitudes que establecimos en 3» 4 • Por otra parte es in
mediato comprobar que no hay que estudiar las 2N hipótesis
H. ,. . . , HN y H/ , • .. , HJJ' ya que EL y HN* son ciertas —
siempre y, por otra parte9 la hipótesis H. es la complemen
taria (o negación) de la H. 1 9 lo que denotaremos escri—
hiendo
Por todo lo dicho tendremos ques
Para contrastar H.* deberemos hacer e l t e s t des j
crito en 3.4 . Para ello vamos a introducir algunas peque-
ñas modificaciones,
a) La primera es afectar a las constantes A y B
y a la razón de verosimilitudes A (©n) de un subíndice que
- 4 6 -
exprese a qú¿ hipótesis Hj* nos roferinos.
b) La segunda os. ut i l izar sus logaritmos on vez
de ellas mismas (lo quo da expresiones las simples en los
casos más corrientes); así tendremos
log A-j f log" Bj 5 «A 3 ( °n) - l 0 S A j ( e n )
Con estas notaciones la política a seguir es la
siguiente
•.' R e g l a t ,>••'•''
• Aceptar Hj si log A^-j «* .A ̂ * (On) y logBjj>
- •'• Seguir el muestre o si no se cumplen ambas des i -
gualdades para ningún j = 1,.»•, N •
Teóricamente puoden calcularse A* y B*¡ del mis
mo modo seguido en 3f4, poro ello exigiría el conocimiento
de las probabilidades ?,a priorií} de que 9^(t) estuviera -
contenido en los intervalos correspondientes y además a la
asignación de valores a la función de pérdida. Por ello se
adoptará otro procedimiento quo describiremos en 3 #7 .
Por su parte A-í(©n) es9 siguiendo la pauta mar
cada en 3.4, el cociente de las probabilidades eondiciona-
les de que se encuentre en el muestreo el vector 0n cuan-
do el valor real 0 (t) está por encima de ©?* o por deba-
jo (análogo a pertenecer a C2 ó G-j- en el caso binario) ; -
en algunos casos puede c 0:1 si dorarse que ambas zonas quedan
- 47 -
caracterizadas -oor dos valores 0... y ©_. 0 tales que
a -* ^ -*• p(e£|0*o) AA%) = ios ^ (Q^)=iog —--jS--^-- (3.8)
0 píá.oj;
siendo p(© n|0^) ? con k=1 6 2? la densidad de probabili-
dad condicional de que se observe Q cuando el valor au-
téntico es 0^_ .
E s t o puede s e r p l a u s i b l e cuando e l ?6ampo de va
r i a c i ó n de 0 * ( t ) e s pequeño f r e n t e a l de n ( t ) y además / *-' i x
l a razón s e ñ a l a r u i d o e s grande « E l i n t e r v a l o (94-i90n-o) se denomina zona de i n d i f e r e n c i a 0
3 . 6 . APLICACIÓN A LOS SISTEMAS ADAPTIVOS.
Si ^ o s encontramos con un c i e r t o s i s t ema (proce
so d inámico , p l a n t a i n d u s t r i a l , e t c 0 ) 9 cuyas c a r a c t e r í s t i
c a s dependen de un pa rámet ro © ( t ) ? y queremos c o n t r o l a r
e l mismo de modo que l a r e s p u e s t a sea óp t ima , n o s encon—
t r a r ^ o s con e l problema de que l o s d i s p o s i t i v o s de con—
t r o l deberán t e n e r n a t u r a l e z a mudable pa ra i r s e " a d a p t a n -te
do11 a l o s v a l o r e s que tome 9 ^ ( t ) . Si hacemos l a h i p ó t e s i s
de que no e s n e c e s a r i o c o n s i d e r a r cambios c o n t i n u o s de -
0 ( t ) s i n o que e s p o s i b l e c u a n t i f i o a r en íT v a l o r e s d i s c r e
t o s su campo de v a r i a b i l i d a d y que a cada uno de e l l o s l e
conviene un c i e r t o s i s t ema de c o n t r o l podremos a p l i c a r l a
t e o r í a a n t e r i o r . E l r e s u l t a d o so esquemat iza en l a f i g u r a
adjunta
- 4 8 -
Entrada +
Selector
Calculador A,s B U Circuito
Logioo
r1
Controladores adaptados a los distintos valores de
o(t)
•A^V
J2_ ¿,
Elemento conmutación
Calculador
3E ¡Medidas de i muestreo
~]
_J
Sistema a con t ro l a r
R e a l i m e n t a c i o n
©*(t)
Salida
Fig. 3.2
Si se supone el caso especial de que la señal y
el ruido sean aditivos y dsto sea gaussiano (y aceptamos -
la hipótesis apuntada al final de 3.5) tendremos que las
densidades de probabilidad condicionales serán distribucio
nes normales multidimensiónales con la media en el valor
- 4 9 -
auténtico do la señal;
P ( 9 n l e j 2) = " 7 G ( 3 * 9 )
V(27T)n JM)
l w ' * >> ' M - 1
- e 2 V n
\¡(27T)n |M)
donde M y M""' son la matriz de correlación y su inversa.
|M| es ol determinante do la misma.
9^ el vector columna que tiene por componen-
tes los valores muostrales0
9.^ (k=1 ó 2) el vector cuyas n componentes
son iguales a 9 ^ .
(9n~9jk) el vector transpuesto del correspondiente
Si las variables aleatorias ©,.,...,©n son indo
pendientes 2
M = cr i
y se tiene que (3*8) en este caso quedas
¿ ^ i=1 ¿ 0 i=1
(3.11)
- 5 0 -
Que ope rando da:
n A/V = 2 ( e * )
2 - ( e * )2 W32 ^ j 1
n
^ i=1 G i
y finalmente
Apn) 9 n > a.-^-j (n)
s i e n d o ; — 1 n ©n = ^>~ 9. l a media m u e s t r a l de n o b s e r v a c i o
n -j n o s
a (n) - ° ~ l 0 g A 3 x ° 3 1 * ! 3 2 _
* (n)
-51 -
3.7. CALCULO DE LAS CONSTANTES,
El número de observaciones que hay que hacer es
una variable aleatoria. Por lo tanto podemos estudiar la
probabilidad condicional de tomar la decisión final de -
aceptar la hipótesis H-j de que 9 (t)€C-j cuando el valor
real es 8, ó QTk (supuestos dos valores únicamente corres
pondientes a las dos zonas C, y C2). Esta probabilidad
la designaremos por L(0. ) (i = 1 ó 2) y su valor será
L ( 9 Í ) = 5 T / p(en|e*) aor...., aon n=iJAi
siendo J7. el subconjunto de E^ formado por los vectores
9n tales que, según la regla adoptada, conducen a tomar -
la decisión final H-j después de n observaciones.
En el caso de regla bayesiana anteriormente des
crita SL estará definido por
(3.13)
La probabilidad M©j_ ) puedo también ponerse en
función de los errores 6.. y 6» de primer y segundo tipo
!(©*) = 1 - £-, (3.14)
!.(©*) = S 2 (3.15)
- 5 2 -
Por o t ra p a r t e , como;
© ^ / ^ z z ^ p ( ^ | 9 * ) : £ B p ( 9 > * )
se tendrá ( integrando en Jl y sumando)
L(©2*) ¡ ¿ S I (O*) (3.16)
y por lo t an to
2--;c:B (3.17)
Análogamente s i llamamos L ' (9^ ) l a probabi l idad
condicional de tomar l a decis ión f i n a l EU se tendrá
OD
'(©*) = 2 1 / P(^|©i*) d©- d 9 n /il¿
y ahora
9 € -a' B < JM~%- < A, V k
(3.19)
Pero, en es te caso ,
L ' ( 9 * ) = 1 - A L ' ( 9 * ) (3.22)
Es dec i r
-53 -
1 - £2 - — ¿ - ^ A (3.23) £1
Esto quiere decir que A y B deben tener unos va
lores tales que verifiquen las desigualdades anteriores -
respecto a las probabilidades de los errores de primero y
segundo tipo* Ahora biens resulta que determinar directa-
mente A y B obliga a una serie de cálculos, más o menos -
laboriosos, basadow en las probabilidades ,!a priori" (mu-
chas veces calculadas con hipótesis sólo relativamente —
plausibles) y en el establecimiento arbitrario de los va-
lores Lj_-j de la matriz de pago5 sin embargo es fácil y -
lógico establecer do antemano los valores de S y £
que nos dan los niveles de significación de nuestro test*
El único problema es que A y B están relacionados con £..
y S por medio de desigualdades y, por lo tanto, no so
puede calcular un valor único exacto (lo cual, por otra -
parte, no tiene sentido dado que depende de los valores -
de Lj-- arbitrarios que establezcamos).
Veamos cómo resolver la cuestión % en primer lu-
gar vamos a suponer dados ^ y * ? y que A y B los ha-
cemos
B = £ — A = ¿
1 - s a ' 1 1
naturalmente que las probabilidades de los errores de pri
.:/ ' - 5 4 -
mer y segundo t i p o entóneos no t ienen porqué c o i n c i d i r ~
con £* y &9% s;\ l a s dersignamos por £* y £•* se t e n -
drá
B = - _ £ L . > _ | L - (3o24)
1 - *? i - a ; A = -
- 5 5 -
que sumadas miembro a miembro dan
Por lo tantos eligiendo A y B por las fórmulas indicadas
se tiene un nivel de probabilidad de error inferior o igual
al prefijado.
Puede probarse que el test termina siempre (con
probabilidad la unidad) para algún valor finito de n .
En el caso de que haya más de dos alternativas
será necesario pasar de A, Bf &* y £~ a Aj, B-j, £j-. y -•
£0. como en 3,6 .
-56-
NOIAS Y REFERENCIAS AL CAPITULO 3
-Los métodos secuenciales tienen ya una larga Jais
toria en Estadística; un texto clásico sobre la materia es
el libro de Wald (citado seguidamente) en el que se encuen
tran importantes resultados matemáticos de interds en Esta
dística y otros campos de la Teoría de Probabilidades.
Wald, A.: "Sequential Analysis", Wiley, New York
1947.
-Una breve idea de los métodos secuenciales pue-
de leerse en el libro del Pr. Sixto 3íos que citamos.
Bí : 3. .: . "Métodos Estadísticos" (5S edición)
Ed. del Castillo, Madrid, 1967.
-Los conceptos básicos de Cálculo de Probabilida
des y Estadística que manejamos (fórmula de Bayes, distri-
buciones, etc.) pueden encontrarse en el libro que acabamos
de citar, o ens
Cramer, H.s "Mathematical Methods of Statistics"
Princeton University Press, 1946 (utilizamos la traducción
de Cansado, editada por Aguilar).
-Existe una abundante literatura sobre las apli-
caciones de los métodos secuenciales a los problemas de —
transmisión, detección, ruido, etc.* Sobre las aplicaciones
al control adaptivo puede verse la monografía, ya citadfc/ cía
el capítulo anterior, de Sawaragi, Sunahara y Nakamizo.
^ 5 7 -
-Una discusión interesante y profunda sobre sis-
temas adaptivos con dispositivos de decisión se puede leer
en el trabajo que citamos a continuación, y en el que se -
encuentran esquemas de sistemas análogos al propuesto en -
la figura 3 i 2 .
Hsu, J.C. y Meserve, W.E#: "Decision-making in
adaptive control systems", IRÉ Irons, PGAC 7 (N° 1), 24» 1962.
-Debemos señalar, al terminar la breve exposición
que ha constituido esta primera parte introductoria de núes
tro trabajo, que han quedado fuera do su ámbito numerosas
cuestiones de interés fundamental pero que se apartaban do
nuestro fin primordial% preparar la presentación de los re
sultados concretos que son objeto do I próximo capítulo*
(En las referencias citadas se puede obtener cumplida infor
mación sobre los temas aquí eludidos).
- 5 8 -4
SEGUNDA PARTE
CONTROL /ÜDAPTIVO CON DISPOSITIVOS DE DECISIÓN
4. SISTEMAS DE CONTROL ADAPTIVO CON DISPOSITIVOS DECISORIOS
S uní a r i o
4 . 1 . INTRODUCCIÓN.
4.2. FILOSOFÍA DE LOS SISTEMAS ADAPTIVOS CON DISPOSI-
TIVOS DE DECISIÓN.
4.3. REGLA SECUENCIAL PARA SISTEMAS ADAPTIVOS.
4.4. LEY MULTINOMIAL SUCEDÁNEA DE LA DISTRIBUCIÓN REAL.
4.5. REGLA DE DECISIÓN BASADA EN LA LEY MULTINOMIAL.
4.6. TAMAÑO MEDIO DE LA MUESTRA.
4.7. ESQUEMA DE SISTEMA ADAPTIVO CON DISPOSITIVO DECI-
SOR.
4.8. RECAPITULACIÓN Y COMPLEMENTOS.
NOTAS Y REFERENCIAS.
- 6 0 -
4. SISTEM/iS DE CONTROL ADilPTIVO CON DISPOSITIVOS DECISORIOS.
4.1. INTRODUCCIÓN.
En las páginas anteriores horneo hecho un ligero
"bosquejo de las ideas más elementales de la Teoría de la-
Decisión y aludido a algunas de sus aplicaciones a los -
problemas de control automático. Vamos c. continuación a -
utilizar dichas ideas para obtener regir.3 de decisión —
-plasmables en dispositivos tecnológicos físicamente reali
zables- que permitan la construcción de sistemas adaptivos
en supuestos más realistas que los usuales (no linealidad,
ruido no gaussiano9 etc.).
Como se ha señalado en el capítulo anterior cuan
do el ruido es gaussiano es relativamente fácil dar expre
siones explícitas9 y cómodamente manipulables, de las re-
glas de decisión correspondientes. Por el contrario cuan-
do el ruido no es gaussiano, o cuando el sistema no es li-
neal (lo que9 como es sabido, provoca que aún con entradas
gaussianas no lo sean las salidas), las formulaciones de
las reglas decisorias son impracticables e incómodas* Por
eso, después de una exposición general de la filosofía de
los sistemas adaptivos con dispositivos de decisión, pasa
remos a describir un método que permite la simplificación
de tales reglas para los oasos no lineales y no gaussianos
•-61 -
mediante la sustitución de la ley de probabilidad real
por una distribución multinomial que la aproxime apropia-
damente o
También propondremos un modelo teórico generico
de una posible configuración típica de sistema, lineal o
no, con parámetros variables y sometidos a perturbaciones
aleatorias, controlado mediante dispositivos adaptivos in
cluyendo elementos para la toma de decisiones de forma se
cuamcial.
4.2. FILOSOFÍA DE LOS SISTEMAS ADAPTIVOS CON DISPOSITIVOS
DE DECISIÓN.
Hemos presentado -a título de ejemplos- en los
capítulos anteriores algunos sistemas de control adaptivo
con dispositivos de decisión. Vamos ahora a esbozar las -
líneas generales de la filosofía a que obedecen.
Como es sabido un sistema controlado automática
mente no es otra cosa que un sistema dinámico, al que se
han superpuesto una serie de dispositivos de forma que el
conjunto tenga una salida que, en algún sentido preestable
cido, sea óptima. El ejemplo más simple es el del sistema
con un lazo de realimentación.
Un sistema dinámico tal que sus entradas varíen
dentro de una gama muy amplia de posibilidades, que esté
sometido a muy diferentes tipos de perturbaciones o que -
- 6 2 -
sus propias c a r a c t e r í s t i c a s cambien a lo la rgo del tiempo
no puede se r regulado apropiadamente por un controlador -
de configuración f i j a , sino que és t e debe cambiar do un -
modo que se adapte a l a s var iac iones suf r idas por e l s i s -
tema a c o n t r o l a r . Un sistema con con t ro l adaptivo es un -
sistema dinámico, cuyas condiciones de funcionamiento evo
lucionan con e l tiempo, a l que se ha conectado un conjun-
to de d i spos i t i vos suscep t ib le de adaptarse a l cambio del
sistema de forma que l a s a l i d a t o t a l sea óptima en todos
l o s regímenes de funcionamiento,, El ejemplo más simple
puede se r e l sistema con ion parámetro va r i ab le regulado -
por un controlador con una c a r a c t e r í s t i c a que se puede cam
b i a r mediante unos elementos que miden e l va lor del c i t a -
do parámetro, ca lculan e l más apropiado de l a c a r a c t e r í s -
t i c a y l a modifican en t a l sent ido ( f igura 4.1)
Entrada +
"* ĴT
Calculador de K(C) y adaptador
Valor de C| » II
Cambio de K
i.
Medidor de C
Controlador con K
variable
Medida de C
Sistema a con trolar con C variable
Salida
Figura 4#1
-63-
Las modalidades y posibilidades del control adajs
tivo son innumerables. Veamos en qué supuestos puede hacer
se intervenir el concepto de proceso de decisión, genera-
lizando así algunos de los ejemplos vistos en capítulos -
anteriores.
Supongamos un sistema a controlar que tiene uno
o varios parámetros característicos cambiantes con el tiom
po ( o incluso que es cambiante la propia configuración),
que se encuentra en un entorno mudable, o que varía el tí
po de entradas, y que estos cambios no pueden conocerse -
determinísticamenté porque las variables observadas son -
funciones aleatorias del tiempo debido a la existencia de
ruido. Entonces se hace necesario un control adaptivo del
sistema; pero el dispositivo de adaptación debe incluir -
un elemento que, mediante la oportuna regla, decida la con
figuración óptima no en función de un conocimiento cierto
de la situación y de un criterio de optimización dado, si
no en función de óste y de una estimación de la realidad
basada en la minimización de un riesgo medio en el senti-
do de la Teoría de la Decisión.
Ya hemos visto ejemplos en los capítulos 2 y 3,
en los que se tenían distintos controladores (por ejemplo
de funciones de transferencia í^,... ,Fn) adaptados para -
conseguir respuesta óptima segiin fuera el valor de un pa-
rámetro variable del sistema a controlar (que llamábamos
- 6 4 -
9*) ;. l a ragla.^dacxsoria,, permi t ía "'elegir-con ~riasgo mínimo
' a l valer- del- parámatro y por tanta* -el_ dal^3imtrjaladDr--apro
piadjcu-"
* '" •--"--—' ~YanuQ3-aliQra a planteamos-. .una-si tuación "basiran—^
i ^ - g a n a r a X ^ ^ de - v i s t a t a ó r i o o ŷ ^ii^,cianta—-^^
..mente operativa^.desda-.-un punto -de v i s t a - p r a c t i c a r .'•—---••• '^
"""""* -•••-••^ra.) Sea -un- sistema- a c o n t r o l a r - ^aractetó^ajdo^or •' i
*,tai,-*--paráme1n7a-v^2?iahl&-* 9^( t ) cuyos va lo res - supondrertas ~**w-
'di^scretizadas-en ¥ 2ronas? C^^^.^Cj^. - - (£s_lnmediato wqua~,, i
la.J£ormu33xiií5n ea...la .misma, si...las.jsonas- G-̂ > .̂̂ ^TC^ -CÍL ^vesf ~
.da- .corre sptm.dar-a^interva:Los de-, va loras de, 0^(t.)-—;sa"refier"
ran a subecnjuntos caíalasquiera da m o s p a c l a . multidjjaan^-^^
s l ona l cayos apuntos- fuesen, r e pre s e n t a t i v o s de- l a s .distin—-
tas.astados...del_...sistema),- .._ . ^._^—^-^ ~ -'
.„ ^ -,^....... , _i>) Se- -dispone de un con junte de iT 'Contro3aadaras^"
~-oy l a que e s l o misma, de un- con t ra lador da caa^acijerístár--
-cas v a r i a b l e a - que pueden, dise re t i z a r s e * en- N "conjuntos-apro
xiioadaman t e af ina s a c a d a uno de e s t o s cen t ro oidores" es--él
apropiada- para--dar . respues ta óptima del- sj^stama conjuntToy ^"^
sagrin~um- criiiariQ-- de proyecto apropiado^ - ' - " -- — - __
'•""" '^"'-~-^ de l sistema a - con t ro l a r T- -
o una magnitud derivada- (por e jer tpla l a • dasviacdLán.. o - ~sonal_ A
. de ~ e r r o r )-^.no "son^axac t amen t e -. conoc i d a s ^ p or l a presencia--•-"' •
de ru ido-y e~s necesar ia .^utdJá^ar un -elemento, dacjasarlo que'
^permitaJaacer -una, est imación de r iosgq mlnijn.0, .(lo qua.^su—
pone, n a t u r a l n e n t e , que se conocen o se imaginan l a s l e —
yes p r o b a b i l í s t i c a s de l a s c a r a c t e r í s t i c a s c i t a d a s y d e l
r u i d o ) .
d) Hecha l a e s t i n a c i 6 n se e l i g e e l c o n t r o l a d o r
apropiadoo
Es obvio que problemas p a r t i c u l a r e s cono e l de
l a i d e n t i f i c a c i ó n de p r o c e s o s , a j u s t e a d a p t i v o de p a r á n e -
t r o s , e t c « 9 son c a s o s p a r t i c u l a r e s d e l esquema p l a n t e a d o ,
4 . 3 . REGLA SECUENCIA! PARA SISTEMAS ADAPTIVOS.
Vamos gá /p l i ca r a l modelo d e s c r i t o en l a s ecc ión
a n t e r i o r l a r e g l a do d e c i s i ó n que dedujimos en e l c a p í t u -
l o a n t e r i o r pa ra p r o c e s o s s e c u e n c i a l e s de d e c i s i ó n .
Cono h i c i n o s en l a s ecc ión 3*5 d i v i d i r e n o s e l -
i n t e r v a l o de v a r i a c i ó n de 9 ( t ) en N zonas C p # . . 0 , C j j •
Por o t r a p a r t e c o n s i d e r á r o n o s cono magni tud observada no
e l v a l o r p e r t u r b a d o ©(t) s i n o l a s e ñ a l de e r r o r d e l s i s -
t e n a e ( t ) - d i f e r e n c i a de l a e n t r a d a x ( t ) y l a s a l i d a y ( t ) -
de l a que i r e n o s hac iendo n e d i d a s s e e u e n c i a l n e n t e s e ( t ^ ) =
= e . , . 0 . , e ^ n ^ = e n 9 # # ° # $ ^OTinDJ0L^0 l ° s s u c e s i v o s v e c t o
r e s de l a s o b s e r v a c i o n e s
con e l n f i n a l no p r o f i j a d o .
Nues t ro p r o b l e n a e s e l e g i r e l c o n t r o l a d o r ó p t i -
-66-
mo, que caracterizaremos por el valor de un parámetro a ,
entre los N posibles, que corresponderán a los valores —
a^,a2,.M,ajj adaptados según el criterio de proyecto -
adecuado a los valores de 9^(t) comprendidos en Cj,..#.
.., Ojq- . En cada instante e(t) depende, aparte de la en-
trada y de las perturbaciones, de y del parámetro
a^ del controlador conectado en ese instante.
En tales circunstancias -y en la hipótesis de
que sean conocidas, o razonablemente estimadas, las propio
dades estadísticas del sistema- podremos aplicar el test
de la razón de verosimilitudes que dedujimos en 3.5 . En
primer lugar: a la probabilidad condicional de que el ve£
tor observado en n etapas sea e cuando el valor — —
9*(t)€Cj y el parámetro del controlador es a¿ le desig
naremos por g(en ja^C-j) • Análogamente a lo hecho en 3*5.
consideraremos las probabilidades p(e^ I ^ Í ^ ^ ) y
p(enJa¿,Dj) en las que:
Df. es el complementario de D-*
Di = U Ck
y por lo tanto (ver figura 4.2)s
Ci = D.-fi D». ', 3 J 3-1
- 6 7 -
D'. .0
Dá
t
D á-i
Parámetro del sistema
a controlar © (tj
I" i 2 *
C J
I 4' "d-1 %
h- CD
Parámetro del con-
trol ador óptimos a-
Párametro del con-
trolador óptimos a. A 3-1
?igura 4.2
Con las anter iores notaciones la razón de vero-
similitudes generalizada para e l caso binario equivalente
del t e s t secuencial ess
P( í i | a i? D , ; j ) Ai.i
- 6 8 -
A i á = - — - ^ ¿ - ( 4 . 2 a )
113
Bii = -fJ— (4.2b)
s i g n i f i c a n d o : e l p r imer s u b í n d i c e ( i en l a s fó rmulas ) e l
e s t a d o a c t u a l d e l c o n t r o l a d o r ; e l segundo s u b í n d i c e ( j en
l a s fó rmulas ) co r re sponde a l a h i p ó t e s i s a c o n t r a s t a r ; e l
í n d i c e numérico 1 ó 2 a l u d e a l o s e r r o r e s de p r imera o se
gunda c l a s e , cuyas p r o b a b i l i d a d e s r e s p e c t i v a s se des ignan
^ 1 i i y ^21 j * ^~ " b a i a a a o d G l a mues t ra v a r i a b l e e s n .
Con d i c h a s n o t a c i o n e s l a r e g l a de d e c i s i ó n os -
l a s i g u i e n t e .
REGLA
a) En una e t a p a n y cuando e l c o n t r o l a d o r oonec
t a d o e s e l de pa rámet ro a^ .
Si 3 j , l o g A . . ^ < J L l f j » 1 ( n ) 7 l o g B i á >
> J f L . . (n ) se pone e l c o n t r o l a d o r de pa rámet ro a^ ( j pue
de c o i n c i d i r con i ) .
b) Si no hay ningún 3 t a l que se cumplan s imul
táneamente l a s dos d e s i g u a l d a d e s a n t e r i o r e s se c o n t i n ú a -
e l mues t reo pasando a e ± 1 .
OBSERVACIÓN
Se ha supues to que e l s i s t ema t i e n e un e lemento
- 6 9 -
de memoria y que, por lo tanto, "sabe" el controlador que
está conectado; esto es tecnológicamente muy simple de ~-
conseguir (cualquier circuito multiestable puede servir a
tal fin). Caso de que el sistema no tenga memoria sería -
válida la anterior regla pero habría que hacer variar el
índice del controlador también de 0 a N y buscar la pare-
ja (ij) que cumpliera las desigualdades*
En muchos casos será posible sustituir en la ex
presión de «JL. .(n) los subconjuntos Dj y D1. por valores
característicos de que llamaremos 0 ^ y 9-2 •
En algunos casos es posible obtener expresiones
de A. .(n) relativamente manejables; uno típico es el del
sistema lineal con un parámetro 0*(t) variable y con en-
trada aleatoria formada por ruido gaussiano (como es sabi
do también lo será la salida y el error e(t) ). Cuando el
sistema no sea lineal o el ruido no sea gaussiano raranen
te será posible obtener una expresión de la razón de vero
similitudes cómoda; per eso vamos a introducir una distri
bución multinomial para sustituir a la auténtica en la -
próxima sección.
(1) Véase lo dicho en la sección 3.5 .
- 7 0 -
4.4. LEY MULTINOMIAL SUCEDÁNEA DE LA DISTRIBUCIÓN REAL,
So trata de obtener una distribución de probabi
lidad que aproxime la distribución de la probabilidad con
dicional p(en|a¿,D^) en los casos que asta sea inmaneja-
ble -como sucede, por ejemplo, en la mayoría de los siste
mas no lineales- o, inclusive, sólo se conozca una expre-
sión aproximada*
La distribución que vamos a utilizar es la mul-
tinomial (o polinomial). Como es sabido se trata de una -
distribución multidimensional de tipo discreto cuya dofir (1) nición y propiedades recordamos en las siguientes notasv lJ
NOTAS SOBRE LA DISTRIBUCIÓN MULTINOMIAL.
Sea una prueba aleatoria en la que pueden apare
cer el conjunto completo de sucesos incompatibles: S-j,...
. . , S^ de probabilidades P(S^) = p¿ tales que
p( v Si) = z PÍ = i 1 i
Si se hace l a exper iencia un número n de veces
cabe preguntarse cuál e s l a probabi l idad de que se dó n^
veces e l suceso S-, n^ veces e l Sp> e t c . (naturalmente -
¿ L n ^ ^ n ) , abs t racc ión hecha del orden en que se presenten .
(1) Ver r e fe renc ias a l f i n a l de e s t e c a p í t u l o .
-71 -
Un razonamiento elemental conduce a l a conclusión de que
t a l probabi l idad es e l producto del número de permutacio-
nes de n elementos en t re l o s que se r ep i t en n* , n2*••••* tt^
por e l numero p . * . , . . Q p, LL >
Queda a s í def inida una va r i ab le a l e a t o r i a , a s o -
ciada a l a prueba repetida, que se denomina multinomial y
qup*# é , > ''h)* donde I a *±
representa e l ni5mei*o de veces que se presenta S^, t i ene -
l a s igu ien te l ey de probabi l idad
PC S1 - n1,,.. , J^ = nh) = ------------ P-J .•...p^
1 h (4.3)
Inmediatamente se comprueba (fórmula de Leibniz)
que se trata de una distribución %
yr—__u__ pf1 •.... p.ni1 = (Zl P± )n = 1
*—** n l n, f ' n i
(estando l a primera suma extendida a todos l o s casos posi
b les de va lores p o s i t i v o s de n^ que sumen n ) .
Como es evidente no es una d i s t r i buc ión de h di
mensiones sino de h-1 ya ques
h-1 nh ^ n - 2 1 ni
i=1
La función característica vale
- 7 2 -
n ! r i | r / ( * • ! » • • • '"^h-i) ~ áíL - ' — ~ P-j Pjj
n h i t 1 n l 4 • • • • ^ » «
es decid
XX Jt • f • o • « XXT_ -
h-1
••«i e
ith-1nh-1
i t • / ( t 1 , . . . , t h _ 1 ) = (2I - P-j o "Up^)* (4.4)
o también 7^(t^ , . . . i*^.^) -
3=1
1+ ZLte 1 d - l ) p . L 3=1 3.
n (4.5)
Fácilmente se deducen l o s momentos c e n t r a l e s
E [Fj] - n pj
E [(r-?3)2] = np (1-p)
E '[(r-'y^cy-^J^-npjp^. (j^k)
Volviendo a nuestra distribución p(en|a^,D.)
veamos como puede ser sustituida en la expresión de la ra
zón de verosimilitudes por una distribución multinomial #
Bastará para ello.dividir el campo de variabilidad de o(t)
(1) en li intervalos^ ' y sustituir la variable aleatoria — (e-j,... , on) por la (n^ , Ü2,.. M n^) representativa de la -
(1) Puede hacerse que h y N sean iguales y los interva-los de variación de e(t) se correspondan con los de 0*(t) pero no es necesario ni tiene ningún sentido 03 pecial.
- 7 3 -
repartición de los e ( t ) en los li intervalos citados»
Llamando a los intervalos de e ( t ) , S- j , . , . , S^ y
a las probabilidades %
P [ e ( * ) € M a i > D ; j ] = ^ ( i j ) (4.6a)
P [ o ( t ) € S k | a i , Dí; I ] = q.k(i,3) (4.6b)
se tendrá que
Pk( i»d) = / v(el&±,V.) de (4.7a)
q k ( i , j ) = / p íefa^D' . ) de (4.7b) s k
Las leyes nul t inoniales sus t i tu t ivas de l a s rea-
les serán las siguientes?
a) p(enJa i?D*-) se sus t i tu i rá por
n! -_ - . n r ^h , . [q^i^JJ . . . . . Ĵq.-̂ (± , j)J (4.8)
n1 ! , n h !
b) p(en la i ,D^) se sus t i tu i rá por
n! r -in1 r -i
nh
^.—_ p 1 ( i , j ) J P h ^ ' J ' ü (4.9) n ^ ! , . . . , n h ! ^
J L
donde: ^
H nk = h 1
- 7 4 -
h
h
1
Quedan por determinar los límites de los interna
los Su,..#,S. • En principio podrían ser arbitrarios? sin
embargo es lógico que se dimensionen segán algún criterio
de optimizad ón matemático o económico o fijados por razo-
nes tecnológicas .
Por otra parte hay que indicar que el sistema de
formación del vector observación ( e 1 f . . . , e ) es diferente
del de (n-,,.. . , iO o 9 si se prefiere (n.. $. • . j * ^ . ) 9 ya que
n^ es inmediatamente calculable 9 pues el primero se obtenía
a través de una sucesión de medidas en los instantes
t1 , t p , . . . , t , • . . mientras que para el segundo se debo -
contar con un elemento no lineal que discretice la señal y (2)
un sistema contadorN
4.5. REGLA DE DECISIÓN BASADA EN LA LEY MULTINOMIAL,
Vamos a transformar la regla de decisión obteni-
da en la sección 4*3. introduciendo los resultados de la -
(1) Ver más adelante la sección 4.8 •
(2) Ver más adelante la sección 4.7 .
- 7 5 -
sección 4 .4 , para l o cual vamos a obtener l a nueva expre—
sión de . ^ . ( n ) .
Ahora se rá ;
JL±An) = log P ( n r . . . , n l l | a i , D ' ; . )
p ( n 1 , . . . , n h | a l , D p (4.10)
pero l a s probabi l idades multinomiales pueden s u s t i t u i r s e -
por sus va lores (4.8) y (4 .9) quedando
h h A±i(n) = ¿L n k l o g q k ( i , j ) - 2 ~ . n k l o g p k ( i , j ) (4.11)
k=1 k=1
pero, como ¿^nv = n , puede ponerse (4.11) a s í :
£ L 1 q k ( i , a )
k=i p k d , d )
h-1
k=1 log
^ ( i í j )
Pn(i»a)
y s impli f icando:
A± i (n) = n log ~x - ± - — - - 4- > ~ ii log
q.k(iȇ) PhC1^')
p k ( i , j ) q . h ( i , j )
(4.12)
s i se desea puede ponerse de manif ies to que p ^ í i j j ) y -
q^(±,d) e s tán l i gadas a l a s o t r a s probabi l idades
h-1
1^(1,0') = 1 - 2 Z Pfc^1»^ = 1 " P i -k=1
(4.13a)
- 7 6 -
h-1 q i l ( i>3) = 1 - ^ " " q k ( i , 3 ) = 1 - Q i j
k=1
Con lo que se t i ene defini t ivamente?
(4.13b)
A±¿(n) = n log 1 - P .
h-1
k=1
id J
1 - p - •
L 1-QL-
q.ic(i»d)
p k( i»d) (4.14)
Como vicios en la sección 4 . 3 , l a r eg la de deci—
sión e s t a b l e c í a que: s i se cumplían simultáneamente l a s -
dos desigualdades
• 4 i , d - i ( n ) > l o g A i , ; H i
y l i ; j ( n ) 4 l o g B i ; j
se adoptaba l a decisión de conmutar e l cont ro lador de paró
metro aj ; en caso de no e x i s t i r ningún j que l a s cumplie
ra se seguía e l t e s t . Veamos ahora e l modo de t ransformar
dichas desigualdades que ahora se expresarán:
- 7 7 -
L I - P Ü J
±
+ • i d
33.-1
^1,0-1 + * ^ - 1 .(4-18a) k=1 h -1
E f i a k n k ^ b i ó + n f i j ( 4 ' l 8 b ) k=1
Por l o t a n t o l a r e g l a de d e c i s i ó n s e c u e n c i a l con
p r o b a b i l i d a d e s n u l t i n o m i a l e s puede e n u n c i a r s e a s í ;
REGIA
a ) Si cuando se t i e n e conmutado e l c o n t r o l a d o r -
de pa rámet ro a¿ y se e s t á en l a e t a p a n d e l t e s t se oum-
píen simultáneamente, para algún j, las desigualdadesi
h-1
k=1
h-1
71 fijk nk < bij * n f i j fc=1
teniendo f^^? ^ii> aij y bii l o s significados dados en —
(4.17d), (4*17c), (4.17b) y (4.17a), se conmuta el contro-
lador de parámetro a^ .
b) En caso contrario se sigue el test pasando a
la etapa n + 1 ,
Es perfectamente válida la observación hecha en
la sección 4.3 sobre el elemento de memoria del sistema.
4.6. TAMAÑO MEDIO DE LA MUESTRA,
Vamos ahora a ocuparnos de una cuestión que sólo
se aludió en el capítulo 3 y que, sin embargo, es fundamen
tal en todo proceso secuencials la del tamaño de la mues-
tra.
La justificación del análisis secuencial es do-
bles por un lado, que pudiéramos llamar "técnico", se tra-
ta de no prejuzgar el tamaño de la muestra sino de ir adajD
tando éste al problema y a la cantidad de información que
se vaya obteniendo5 de otra parte, que podría considerarse
-?9-
cono "económica", se pretende que el tamaño de la muestra
sea lo menor posible dados unos niveles de significación -
preestablecidos (es obvio que con muestras muy grandes., so
(1) tienen buenas estimaciones a costa de un gran precio) f
Por lo tanto es necesario dar contestación a dos
cuestiones básicass
1) ¿Se puede estar seguro de que el test termina
rá alguna vez?. 0, en otros términos, tiene respuesta afir
mativa la preguntas ¿Existe un tamaño finito de la muestra
tal que para él se llega siempre a una decisión?.
2) El citado tamaño de la muestra es una varia-—
ble aleatoria y no sólo nos interesa la certeza de que tie
ne un máximo finito sino también cuál es su valor medio.
Como es lógico no abordaremos aquí la problemati
ca general que plantean ambas cuestiones pues la misma no
es otra cosa que el tema básico del Análisis Secuencial. -
Solo enunciaremos algunos resultados importantes que nos -
permitirán resolver afirmativamente en nuestro problema ac
tual ambos interrogantes.
En primer lugar estableceremos algunos resulta—
(1) Cuando se habla de "costo", "economía", etc., puedo dar sele una significación monetaria para concretar, pero la cuestión es más amplia 5 piénsese, por ejemplo, en -una misión espacial y en el factor tiempo del muestreo.
- 8 0 -
dos de i n t e r é s s
1) Las razones de ve ros imi l i tud forman una ífmar-
t i n g a l a " ^ 1 ' (bajo condiciones bas tan te amplias sobre l a s -
d i s t r i b u c i o n e s que ent ran en e l c o c i e n t e ) . Es dec i r que s i
P n ( y 1 ? . . , , y n )
donde q-̂ Cy-j ,-•.-. ,yn) y P n (y 1 $ • • • »yn) representan l a s po-
s i b l e s probabi l idades de va r i ab le a l e a t o r i a ( y - j , . . . ,yn) , -
se t i e n e que l a sucesión de va r i ab l e s a l e a t o r i a s
es una mar t inga la .
2) Un teorema de l a t e o r í a de mar t ingalas asegu-
ra que, con probabi l idad 1, e x i s t e
l l n *n = XQD n - > 00
por otra parte -siempre que las dos distribuciones no sean
iguales- dicho límite es inferior a la unidad y, en el oa-
so de suponer las y^ independientes, por ejemplo, es nulo.
3) La identidad de Wald (o teorema fundamental -
(1) Véanse las Notas a este Capítulo.
- 8 1 -
d e l a n á l i s i s s ecue r i c i a l ) se e x p r e s a ; n
E <
1
[# MT = 1 (4 .19 )
s i e n d o : z ima variable compleja
Las ug variables aleatorias independientes con distribución coman.
En particular la sucesión n
m ""^s.. V ŝj
Si en la identidad de Wald se deriva respecto a
z se tienes n
I z Z u r e
E < c# ) 2a [f (2)]U Z^-n $W [J(z)] J U 0
haciendo z = o y simplificando quedas
i—n
E 2 1 u j - E(n) E (us) = O L 1
es decir : E
E(n) = GN E(us)
(4.21)
Podronos aplicar la fórmula a nuestro caso si ha
ceños n tamaño final de la nuestra y si las u las identi
ficanos con las razones de verosinilitud j]^ . Hay un peque
ño inconveniente y os el de que al hacer nuestro test —
9 (t)€Cj en realidad débenos contrastar dos hipótesis: -
£*(t)€D!¡ ., y ©*(t)6Dj ; por lo tanto el tamaño final de
la nuestra corresponderá al nayor de los dos de terminación
de cada uno de los tests que lo conponen y nos encontrare-
(1) Este resultado podría haberse obtenido por un razona niento directo (ver notas fin de capítulo).
- 8 3 -
nos de hecho con dos casos binarios. Es decir, prinero en-
contráronos
(4.22)
E l nune rador puede s e r c a l c u l a d o aproxima dáñente
por l a s i g u i e n t e c o n s i d e r a c i ó n : supónganos que -A. -«(r) t o (1)
na sienpre exactanentev ' los valores logiL-j y logB:^ 21 XJ J - j
a l a c a b a r e l t e s t y , por l o t a n t o , ^ j j j ^ ( r ) t i e n e s i e n p r e
t a l e s v a l o r e s con l a s p r o b a b i l i d a d e s r e s p e c t i v a s ^ - j i j 7
1- ^ - J Í ^ ( s i cono suponenos 9 ( t ) 6 D - ) y e n t o n c e s ;
1 « ( 1 - £ 1 J L . ) l o g B i ; j 4- £ r i . l ogA-y (4 .23 )
Por o t r a p a r t e e l denominador e s en n u e s t r o caso
de r e g l a d e r i v a d a de l a l e y n u l t i n o n i a l
E [A ± 3 (n)] = lo
h-1
+ j ~ - : P t ( i f d ) IOS k=1
cr 1 - Q j j -
- 1 - p i ^
; x
\
[~ 1 - p i j OfeCifá)"]
i H 1 - Q i á P k ( i f ó ) J
(4.24)
(1) Lo c u a l no p a s a r á r e a l n e n t e pero s í se t e n d r á que s u -p e r a r á poco t a l e s v a l o r e s .
- 8 4 -
ya que las p^Ci/j) Son l a s esperanzas matemáticas de l a s
frecuencias.
Por lo tantos
log Pjj .dfd) l o g L Í - Q i i Pk(i,D)J
(4.25)
Por consideraciones completamente análogas ten—
dríamos que
?2ili-D l0iBix¿zi * (1 ~ ia-úztl l0f Aizi-1 *
Y por lo tantos
r E kla^cj » SUP4E [n^a^D.,] , E [^a^D'^] (4.27)
Conviene señalar que E [nIa¿,C-;J depende, natu
raímente9 de la situación rea l (zona de 9* y controlador
conectado) de los niveles de probabilidad de los errores . j -
pero también está influido por la descomposición en i n t e r -
-85-
valos que se haya hecho en el campo de variabilidad de e(t)
-a través de los valores de p^Ci^j), qk(i,;j), etc.- y haoe . (1)
la elección de estos un problema delicado para el proyectov ;
En cuanto a la influencia de los errores es fácil
ver de quá orden es. Pensemos por un instante que todos los
errores ^-JÍJ» 211 ^»3 variando de 1 a N) son iguales a
£ y que, por consiguiente, todas las JLy y B̂ -? son igua
les a A y B j además
1 • - 6 • _ 1
€ B
y resulta que las dos expresiones de los numeradores'coin-
ciden en valor absoluto con (1 -2 £ ) logA que, con & pe-
queño, es aproximadamente del orden de (1-2 6 ) log |£ | .
Es decir que, con las demás variables fijas, el número de
etapas del test secuencial crece con el logaritmo de la -
probabilidad del error preestablecido.
4.7• ESQUEMA DE SISTEMA ADAPTIVO CON DISPOSITIVO DEOISOR.
Las ideas expuestas anteriormente nos van a per-
mitir dar un modelo de un sistema de control adaptivo con
(1) Ver, más adelante9 sección 4.8 .
-86-
elementos de decisión.
Sea un sistema a controlar con un parámetro v a -
riable ©*(t) y con un controlador con una característica
adaptable, a, de tal modo que dsta se elige a lo largo del
tiempo de modo que mantenga, a pesar de los cambios de —
9*(t), la salida optimizada, según algún criterio estable-
cido "a priori», y todo ello en presencia de perturbaciones
aleatorias.
r- Dispositivos adaptivos
Perturba' cíones— I
i
x(t) *i o(t)
Muestreador *n Calculador
Comparador
Decisor
-¡
l
Controlador conj "*"[ a regulable
Sistema a con-trolar con G* variable
*-y(t).
Figura 4.3
La figura 4.3 nos muestra esquemáticamente su mo
do de funcionamiento. Si queremos detallar más y, sobre to
do, introducir las variantes que hemos desarrollado a par-
tir de la regla multinomial nos será necesario pasar al —
diagrama en bloques más preciso de la figura 4.4 donde, en
"7
H Contador n
Memoria constan t e s y programa
r fcn Contador n 1
\^A "^O^f
n ,
Contador n. •h-1
i n. -̂ w h-1
* -
Calculador i a c tua l
-H l,,, b1 b ? j ^ S/í °°i
"n
Memoria i
i ac tua l
L
- 8 8 -
tro otras peculiaridades se destacans el carácter digital
de la característica adaptable a ; la forma de obtener la
ley multinomial sustitutiva de la real? cómo aplicar la re
gla decisoria resultante, etc. .
4.8. RECAPITULACIÓN Y COMPLEMENTOS.
Solo nos queda, antes de pasar a la aplicación -
de las técnicas descritas, hacer unos comentarios comple—
mentarios. Pero antes vamos a recapitular brevemente sobre
lo dicho.
a) Hemos establecido con las fórmulas (4#1) y -
(4.2) y la regla de la sección 4.3 un proceso de decisión
secuencial para sistemas adaptivos.
b) En la sección 4.4 hemos calculado una ley muí
tinomial aproximada a la distribución real.
c) En la sección 4.5, especialmente en las expre
siones (4.15) a (4.18), hemos sentado las bases de la r e —
gla de decisión que usaremos más adelante.
d) En la fórmula (4.27) hemos dado -una expresión
del tamaño medio de la muestra en el proceso de decisión.
Aún nos queda señalar que un punto sumamente im-
portante es el de la elección de los intervalos Sk en e(t)
para la formación de la distribución multinomialo Deben ele
girse de modo que la aproximación sea razonable (por ejem-
plo no deben contener masas de probabilidad muy desiguales.
-89-
y tener un número suficientemente amplio) % por otra parto
pueden escogerse, en algunos casos, de forma que se dismi-
nuya el tamaño medio de la muestra^ ' •
Tambidn es interesante recordar que algunas veces
podrán sustituirse los conjuntos D-j D1. por valores carao
i * terísticos que denominaremos O y ©.0*
(1) Ver notas.
- 9 0 -
NOTAS Y REFERENCIAS AL CAPITULO 4
-Se debe s e ñ a l a r l a ampl i ac ión de p e r s p e c t i v a s -
que se ha e f e c t u a d o , t a l vez s i n s u f i c i e n t e é n f a s i s , a l sus
t i t u i r l a medida de ©(t) por e l de c u a l q u i e r magnitud c a r a £
t e r í s t i c a d e l e s t a d o d e l s i s t e m a , por ejemplos l a s a l i d a o
l a s e ñ a l de e r r o r . Así puede imag ina r se que l a s per turbaci^o
n e s "entran f f en e l s i s t ema de c u a l q u i e r manera en vez de -
suponer un " r u i d o " p e r t u r b a d o r únicamente de
-Conviene i n s i s t i r en l a problema t i c i dad de un -
conocimiento e x a c t o de l a s p r o b a b i l i d a d e s "a p r i o r i " y tam
b i e n , como e s n a t u r a l , de l a p o s i b i l i d a d de c o n t a r con i n -
formación r u f i c i e n t e do l a s p r o p i e d a d e s e s t a d í s t i c a s d e l ~
ruidoo
-Además, .de l o s l i b r o s g e n e r a l e s de Cá lcu lo de Pr£
b a b i l i d a d e s y E s t a d í s t i c a , c i t a d o s a n t e r i o r m e n t e , se han -
u t i l i z a d o - p a r a a l g u n a s c u e s t i o n e s s u s c i t a d a s en é s t e - en
t r e o t r o s l o s s i g u i e n t e s §
F e l l e r , W.: "An I n t r o d u c t i o n t o P r o b a b i l i t y -
Thoory and i t s A p p l i c a t i o n s " , Wi ley , New York, I ( 2 § e d . ) ,
1957, I I , 1966.
Breiman, L . : " P r o b a b i l i t y " , Addison-Wesley, Rea-
d ing , 1968.
-La i d e a de u s a r v a r i a b l e s de B e r n o u i l l i en a p l i
c a c i o n e s c i b e r n é t i c a s de l a T e o r í a de l a Dec i s ión e s de —
- 9 1 -
Blasbalg, H#; "The R
Top Related