MANUEL_ABEJON_ADAMEZ.pdf · 2014. 9. 22. · -II-nuestros compañeros y amigos más próximos, cuyo empeño en verla concluida ha sido quizás mayor que el propio;

Transcript

V A "Mr,,. \ r3

ESCUELA TÉCNICA SUPERIOR DE INGENIEROS AERONÁUTICOS

Manue l Abe jón Adamez

- SISTEMAS ADAPTIVOS DE DECISIÓN EN CONTROL AUTOMÁTICO -

UNM-ilÜDAD POLITÉCNICA DE MADRID £ T. S. S. AERONÁUTICOS

8 ' 8 L ¡ O T E C A ÍÍCJ - 1* Cí,r,"»AfVí>

•;' :>(-c-'H^\u )fr5.52.5 f-í- í.kitvi.t̂ '.Aa *.552'.'í

h:tt.\AR)H* .ÍO&J) . .ABÉ, >JlS>. j fc

I i

ÍONSÜLTA EN BIBLIOTECA

Tesis doctoral dirigida por el Dr. Ings D. Julio González Bernaldo de Quirós, catedráti-co de la E.T.S.I. Aeronáuticos

ESCt DE

B 1

ELA TEGN'iO.A S!;f'tR!0R lfJGtNlíl.GS i-WiYYY'o

Qr$qy?>\ E3 L 1 O Y Y C A

-1971 -

INSTITUTO POLITÉCNICO DE MADRID
-1 -

Antes de entrar en el tema ob;^to d§ este traba-

jo queremos cumplir el gratísimo deber ce manifestar nues-

tro agradecimiento a las personas sin cu3-a colaboración, -

más o menos directa, no nos hubiera side posible llevarlo

a cabo.

En primer lugar al Profesor Gcn.zález Berna]do de

Quirós -maestro, compañero y amigo- al cue el autor debe no

sólo la inestimable dirección de esta tenis, sino su propia

iniciación en la Automática9 durante sus estudios de Inge-

niería Aeronáutica, y su posterior formealón en dicho cam-

po.

También a todos aquellos profesores de nuestra -

Escuela y de la Facultad de Ciencias de Madrid -demasiados

para que les podamos citar sin incurrir en lamentables rmi

siones- que contribuyeron a nuestra formación matemática y,

sobre todo, a nuestra capacidad de aplicarla.

Igualmente hemos de reconocer la deuda de grati-

tud que tenemos contraída con todas las personas que estu-

dian y trabajan en la Escuela Técnica Superior de Ingenie-

ros Aeronáuticos por cosas tan intangibles, pero tan impor

tantea, come el "ambiente de trabajo" y el "clima humano" -

que nos han rodeado. Es ésta especialmente importante con

el limo. Sr. Director, D. Manuel Avello Ugalde 0 cuyo alien

to para la realización de esta tesis ha sido constante; con
- I I -

nuestros compañeros y amigos más próximos, cuyo empeño en

verla concluida ha sido quizás mayor que el propio; y, en

di tino pero principal lugar, con nuestros alumnos, sin -

los que nuestra labor carecería de sentido.

Queremos finalmente agradecer a los Sres. Sánchez

Vállez y Sánchez Gómez -competentísimos funcionarios y bue

nos amigos nuestros- su meritoria labor de mecanografía y

su pulcra delineación respectivamente.

Madrid, Enero de 1971

Manuel Abejón
Í N D I C E

INTRODUCCIÓN 1

P r i m e r a P a r t e

-ELEMENTOS DE TEORÍA DE LA DECISIÓN

Y APLICACIONES AL CONTROL ADAPTIVO

INTRODUCCIÓN A LA TEORÍA DE LA DECISIÓN 9

PROCESOS DE DECISIÓN NO SECUENCIALES

EN CONTROL ADAPTIVO 23

PROGESOS DE DECISIÓN SECUENCIALES EN

CONTROL ADAPTIVO . .. . 34

Segunda Parte

-CONTROL ADAPTIVO CON DISPOSITIVOS DE DECISIÓN

SISTEMAS DE CONTROL ADAPTIVO CON

DISPOSITIVOS DECISORIOS 59

UN CASO DE SISTEMA ADAPTIVO DE DECISIÓN ..... 93

CONCLUSIONES 134

Apéndices

RESUMEN DE DEFINICIONES Y TEOREMAS

DE TEORÍA DE LA DECISIÓN 140

UNAS NOTAS SOBRE LA ECUACIÓN DE FOKKER-PLANCK 144

UN COMENTARIO CRITICO 155

=ooOoo=
0. INTRODUCCI ON

Suaario

0 . 1 . OBJETO

0 . 2 . BREVE DESCRIPCIÓN

0 . 3 . OBSERVACIONES SOBRE FINES Y MÉTODOS
- 2~

O. I N T R O P Ü C C I ON

0 . 1 . OBJETO.

En el presente trabajo se trata de estudiar -sin

ninguna pretensión de exhaustividad- algunas cuestiones re

lativas a la aplicación de la Teoría de la Decisión Esta—

dística al Control Adaptivo. En especial se llega a la ola

boración de una regla de decisión original válida para sis

temas no lineales de control adaptivo y se hace aplicación

de la misma a un supuesto práctico.

Como es sabido el control automático -utilizando

las técnicas de análisis lineal y la idea clave de realimen

tación- se desarrolló sobremanera9 tanto en el aspecto toó*

rico como en el tecnológico 9 durante la década de los 40 y

primeros años 50. Al filo del medio siglo la complejidad -

de los procesos a controlar y la progresiva sofisticación

de la propia teoría -sin contar con la creciente importan-

cia de las técnicas digitales, la influencia de la investí

gación aeroespacial, etc.- condujeron al estudio de siste-

mas no lineales crecientemente complejos, sistemas de mués

treo, etc., hasta llegar a los sistemas adaptivos que han

ocupado destacadamente el estudio de los especialistas du-

rante estos últimos años.

El control adaptivo consiste simplemente en dis-

poner de controladores cuyas características sean suscepti
- 3 -

bles de variar automáticamente, adaptándose a los cambios

de configuración del sistema a controlar, de las entradas

al mismo, de las perturbaciones, etc. . El "quid" de la —

cuestión está en la consecución de dispositivos que sean -

capaces de medir u observar dichos cambios, calcular a par

tir de los mismos, y de los criterios de optimización pre-

establecidos, los valores ideales de las características -

instantáneas del controlador y ajustar las reales a ellas.

Por lo tanto un punto esencial es el de la observación de

los parámetros del sistema a controlar, cosa que resulta -

imposible de hacer en plan determinista, en la mayoría de

las situaciones reales, por la presencia de ruidoa

Por la razón apuntada es necesario utilizar cri-

terios que permitan -a falta de determinaciones exactas- la

consecución de estimaciones, lo más realistas posibles, de

los parámetros del sistema. Aquí es donde aparece la Teoría

de la Decisión.

La Teoría de la Decisión, como veremos más adelan

te, permite con una base estadística apropiada hacer tales

estimaciones con -un riesgo mínimo. Nuestro trabajo consis-

tirá en mostrar cómo se consiguen tales resultados, en es-

pecial para los sistemas de tipo no lineal no suficientemen

te estudiados aún en este aspecto.

La Teoría de la Decisión que adquiere un "status"

de prestigio con la obra de Wald "Statistical Decisión Pune
-4-

tions,! (1950) ha sido aplicado durante la década de los 50

a numerosos problemas de teoría y práctica de las comunica

ciones; en los años 60 tales aplicaciones alcanzaron a los

problemas de control9 en cuya tarea se sigue actualmente .

La presente es9 pues9 una aportación más a tal línea de in

vestigación*

0.2. BREVE DESCRIPCIÓN.

Aparte de esta introducción y de unos apéndices

finales9 la tesis está dividida en dos partes; en una pri-

mera se hace una exposición de ideas elementales con el fin

de aclarar y dotar de una base al contenido más original -

de la segunda parte. Cada una de ellas está formada por —

tres capítulos.

En el primero se dan los conceptos fundamentales

de teoría de la decisión y sus aplicaciones a los proble—

mas de comunicación y control.

En el segundo se tratan los métodos no secuencia

les.

En el tercero -y fundament dí> la primera párte-

se trata de los métodos secuenciales9 que se aplicarán en

los que siguen a los sistemas adaptivos? algunos resulta—

dos, aunque básicamente conocidos9 han sido modificados9 -

ampliados y adaptados con al fin de aplicarlos al control

adaptivo de sistemas no linéales9 alternativa no binaria y
- 5 -

ruido no gaussiano0

El capítulo cuarto (ya en la segunda parte) es -

el fundamental del trabajo por su amplitud y por contener

resultados inéditos. En particular se obtiene en él una re

gla de decisión aplicable a sistemas no lineales con ruido,

basándose en una sustitución de la ley de probabilidad real

por una aproximación multinomialo

El capítulo quinto so dedica íntegramente a apla-

car dicha regla a un supuesto práctico.

El último capítulo -el sexto- contiene un breve

resumen y una lista do conclusiones.

Se han añadido tres apéndices al final, cuyos —

respectivos finos son los siguientess el A, dar una lista

de definiciones y teoremas de Teoría de la Decisión? el B,

resumir unas ideas sobre la ecuación de Fokker-Planck de -

los procosos markovianos y la solución de Caughey para el

caso estacionario 5 y el C9 dar unas notas críticas sobre -

la monografía de Y. Sawaragi, YG Sunahara y T„ Nakamizo, -

advirtiendo do algunos errores que contiene.

0.3. OBSERVACIONES SOBRE EINES Y MÉTODOS.

Antes de terminar la introducción del presente -

trabajo es preciso hacer algunos comentarios y observacio-

nes sobre los finos perseguidos en el mismo y los métodos

utilizados.
- 6 -

En primer lugar hay que señalar que no hemos pro

tendido escribir una monografía completa sobre el toma, si

no exclusivamente comunicar algunas contribuciones al mis-

mo. Por lo tanto os inútil buscar muchos resultados ya co-

nocidos o cuestiones que son objeto actualmente de invosti

gacióna El lector que esto interosado on los mismos deberá

acudir a las referencias que damos o, mejor? a los números

recientes de las revistas do la especialidad.

Esa misma falta intencional do oxhaustividad lie

va consigo aparejada, on algunos pasajes do la primera par

te, un cierto asistematismo por omisión de resultados, --

pruebas o datos no absolutamente imprescindibles para com-

prender nuestra contribución concreta. No creemos que sea

ello un inconveniente, ya que debe quedar bien claro que -

los tres primeros capítulos no tienen mayor interés por sí

mismos y sólo cumplen los dos finos siguientes % 12. Dar al

gunos resultados y fórmulas de -un modo directamente utili-

zable para nuestras investigaciones°9 y 22. Hacer relativa-

mente legible el trabajo sin un exceso de prerrequisitos.

En cuanto al método seguido hemos de puntiializar

que está mucho más cerca del utilizado por los ingenieros

de control y los estadísticos -un tanto heurístico y prag

mático- que del riguroso y teórico de los matemáticos —

(aunque ello haya violentado a veces los escrúpulos, más -

matemáticos que ingenieriles, del autor). El motivo es '-
dobles por -una par te , t r a t a r se de cuestiones de aplicación

tdcnica (objeto de una t e s i s doctoral en ingenier ía ) ; por

otra refer i rse a problemas en los que un exceso de formali

zación y r igor no añade nuchas ventajas, ya que son sucia—

nente concretos y susceptibles de conprobación enpír ica. -

Nos parecen a este respecto nuy oportunas unas palabras —

(que oitárenos con c ie r ta l iber tad) del Profesor Sixto Ríos

señalancTo que de las t r e s etapas por l as que atraviesa t o -

da natenatización de un fenóneno reals conceptualización ,

razonaniento lógico-deductivo y desconceptualización se —

presta , indebidáñente, nás atención a la nenos inportante

y ñas sencil la que es la in temedia . Siguiendo tan au to r i -

zado consejo hemos procurado huir de ese extremo sin caer,

naturalmente, en el opuesto.
PRIMERA PARTE

ELEMENTOS DE TEORÍA DE LA DECISIÓN

Y APLICACIONES AL CONTROL ADAPTIVO
1. INTRODUCCIÓN A LA TEORÍA DE LA DECISIÓN

S u rna r i o

1 . 1 . GENERALIDADES.

1.2. DESCRIPCIÓN DE UN PROCESO DE DECISIÓN.

1.3. FORMULACIÓN GENERAL.

1.4. SOLUCIÓN BAYESIANA.

1.5. CASO BINARIO.

NOTAS Y REFERENCIAS.
- 1 0 -

1. INTRODUCCIÓN A LA TEORÍA DE LA DECISIÓN

1,1. GENERALIDADESo

Vamos9 en este primer capítulo, a dar un breve -

resumen de las ideas básicas de la Teoría de la Decisión y

de sus aplicaciones a los problemas de comunicación y con-

trol. Estos últimos se reducirán al de la detección bina—

ria.

En un proceso de decisión se trata (si se nos per

mite una definición aproximativa) da estimar una situación

imperfectamente conocida por su aleatoriedad intrínseca o

por falta de información? valorar las posibles consecuen—

cias de las decisiones que se adopten en función de tal ejs

timación y adoptar la política o estrategia óptima. Natu—

raímente se considerará una política óptima cuando para ca

da caso nos dé la decisión óptima, es decir la que maximi-

za o minimiza una cierta función criterio9 preestablecida

de acuerdo con el plantel de objetivos que se tengan.

Los primeros estudios de procesos de decisión -

aparecieron en el campo do la Teoría de la Estimación esta

dística por obra de Neyman y Pearson. Posteriormente Wald

creó toda una Teoría de la Decisión con amplias aplicacio-

nes en diversas ramas de .".a Estadística y la Investigación

Operativa.

Las aplicaciones de dicha Teoría se han prolonga
-11 -

do después a los problemas de comunicación y en el decenio

último a los de control.

1.2. DESCRIPCIÓN DE ÜN PROCESO DE DECISIÓN.

Tenemos una situación definida por un parámetro

© . Suponemos que éste puede tomar la gama discreta de va

lores ©*.,...., © n con las probabilidades "a priori" -

Pi==p(©*)# En un caso concreto © puede ser el valor de

un parámetro de una distribución estadística, la posición

de un blanco buscado por un radar, el contenido de un men-

saje, el valor de una característica dinámica de un siste-

ma de control, etc.5 la ?(©.?) representa, en tal caso,

las probabilidades estimadas "a priori" de que el valor de

© sea precisamente © . .

Si © estuviera dado determinísticamente bastaría

una observación empírica para conocer su valor real (con -

el nivel de precisión permitido por el sistema de medida)-

pero si, como sucede en los casos aludidos, su valor real

es alterado por la presencia de perturbaciones o "ruido" -

aleatorios, es necesario estimar el valor del mismo a par-

(1) La descripción se hace para el caso de © discreto por comodidad, pero no hay problema en considerar el caso continuo (así lo haremos en la sección siguiente al dar una formulación general).
- 1 2 -

tir del valor observado.

Imaginemos que los valores muéstrales posibles -

son 91 9. . . . $©m . Para cada valor real © . existe, una proba

bilidad condicional p. . =p(9- (9*.) de que se obtenga el -i J j i

valor observado 9̂ (estas probabilidades podrían calcular-

le 9 naturalmente, si se conoce la ley de probabilidad con-

junta o$ lo que es lo mismo, si se conoce el tipo de ruido).

En el supuesto discreto las P-ĵ formarán una matriz de di-

mensiones n xm .

A la vista del valor observado y de las correspon

dientes probabilidades Pj_ y P• . pueden tomarse las distin

tas decisiones de aceptar la hipótesis de que el valor real * i' =fe c e

de ©"" es 9 , ? ( , , , ,©~ que designaremos & - . , . . . a ,
-13-

1.3. FORMULACIÓN GENERALa

Vamos ahora a formalizar matemáticamente lo di—

cho en la sección anterior, cuando describimos de un modo

somero un proceso de decisión.

Vamos a suponer que tratamos de estimar la fun—

ción de t, 9*(t). Como es natural sus verdaderos valores -

no nos son accesibles porque son perturbados por un cierto

ruido n(t), de forma que los valores observados correspon-

den a ©(t). En principio puede suponerse que la superposi-

( 1 ) ción del ruido a l a seña l es ad i t i va v J

©(t) = ©*(t) + n ( t )

lo que nos pe rmi t i rá e s t a b l e c e r r e l ac iones en t re l a s l eyes

de probabi l idad respect ivasc

Tomaremos -una muestra de © de n v a l o r e s , ©.* ,

©2?.. • • * 9 n , en l o s i n s t a n t e s t - , . * . v , t , y formaremos -

con e l l o s e l vec tor de l a s observaciones 8= ( 9 1 , . . i # 1 6 r l ) •

Este se corresponde con e l formado por l o s va lores r e a l e s

©*(t.j) =©* , . . . . . , ©*(tn) =©* , es dec i r con O* = ( .©*, . . . . .

©* )

(1) Dicha h i p ó t e s i s no es gene ra l , n i s iqu ie ra r e a l i s t a en muchos casos o Esto no obsta a l a va l idez del razonamien to que s igue .
- 1 4 -

En nuestra primitiva descripción, tomar una deci

sión era simplemente dar como valor real un determinado ©*!

y se la designaba por
P C Í , " ? * ) = P d ( ¿ ( "©) P ( © , © * ) =

= p a ( 5 | ©) p ( 9 | © * ) s(9*) (1.2)

siendo s ^ / ^ . «*,

p (9 , 9 ) Densidad de probabi l idad conjunta de 9 a5

p¿( S j 9) Densidad de probabi l idad condicionada

de tonar £ cuando se ha observado 9 #

p(©|© ) Densidad de probabi l idad condicionada

de observar 9 cuando e l va lo r r e a l es

9 ~ .

/"^¿\ s(9 ) Probabi l idad ,fa pr ior i 1 1 de que e l va lo r

r e a l sea 9 .

Como es lógico, el conocimiento de las anteriores

funciones de densidad presupone el conocimiento de las ca-

racterísticas estadísticas de la señal y el ruido, salvo -

pn(£|9) que 9 naturalmente, es la que queremos determinar.

Por otra parte conviene señalar que, en algunos casos, di-

chas densidades se convertirán en distribuciones tipo "del

ta de Dirae" o, lo que es lo mismo, se tratará de probabi-

lidades discretas.

Con la ayuda de (1.2) la expresión (1.1) se oon-

vierte en la siguientes
- 1 6 -

R ( s , p a ) =

= / / J L ( 9 * , S) p d ( ? / 0 ) p(©("©*) s(9**)d9* cl91 ..M. dcTj — d¿n E v E o E d ( 1 . 3 )

(E , E 0 y E¿ son l o s e s p a c i o s do l a s e ñ a l , de l a s o b s e r v a -

c i o n e s y de l a s d e c i s i o n e s ) .

A ' E [L(9 , «§ ) J l o hemos des ignado por R(s 9 p d )

y l e l l amaremos , s i g u i e n d o l a t e r m i n o l o g í a de Wald, r i e s g o

medio. Depende, supues t a dada de antemano L(9 ? c> ) * ¿le l a s

p r o b a b i l i d a d e s ,!a p r i o r i M s ( 9 ) y de p d (o>)9 ) .

Si se de f ine un f ? r iesgo c o n d i c i o n a l " 1 (9 , P-J

c orno

1(3* , Pd) =

L("9*9
- 1 7 -

R(s9pd)= Z L±3 p i k p d ( f j K ) s i

i , j , k

K©i* ,P d ) = 2 Li j P i k P d ^ o l ^ k ) ^ -8 )

Se t r a t a 9 pues, de monimizar e l r iesgo e l ig iendo —*» « •

l a P¿(
-18-

1.5. CASO BINARIO.

El problema de la detección binaria es suficien-

temente conocido, pero vamos a dar una ligera ojeada al -—

mismo que nos servirá de introducción.

Suponemos que en el espacio de las señales hay -

dos subconjuntos posibless el correspondiente al mensaje -

nulo y el del mensaje no nulo con las probabilidades respec)

tivas Q y P (naturalmente P + Q=1) y que la función do

densidad del mensaje no nulo es S- (O ) . Por lo tanto la -

(1)

densidad s e r á v ' } i

S(9**) = P S ^ ? * ) +Q S (&*-o) (1.10)

Supondremos que sólo hay dos hipótesis H y H-,

correspondientes a admitir que no hay mensaje o que sí lo

kay* y Por 1° tanto sólo son posibles las decisiones £Q y

o-. . Entonces?

P d ( l |e) = Pd(J0l ©) S (S-¿0) +Pd(á,l©5 § (é-3,) (1.11)

Como es n a t u r a l se t i ene que s

P d ^ o l ® > + P d ^ l ' ^ = 1

La función de pérdida puede darse cornos

(1) Las £ (•) son d i s t r i b u c i o n e s "de l ta de Dirac'1 .
-19-

"* -* L(9* = o, §Q) = L ^ *] ,-fi± L(9 S = o, ^) = L12 i

L(*©* ¿ o, $Q) = L21 L("0* ¿ o, ¿.f) = L 2 2 J

(1.12)

Llevando (1.10), (1.11) y (1.12) a la expresión

del riesgo se tiene (llamando E v y Ev- a los subconjun-

tos de E v correspondientes a señal nula y no nula)%

R(s ,pd) = / Cp s1 &*) + Q ̂ (®* " o)] a©*..... de¿* x

x /" P(T|i**) [Ll 1 Pd( í 0 | ©5 + L21 P d ( JQ | £j

+ L 1 2 p d ( < 5 1 | ©) •Í-L22pd(1 / S1 (©*) p(9*"( "?*) d © * , . . . . d9n*J d©1 . . . . „d9n

'E0

+ PL,

v

*• / P a ^ i l " ^ rQL12p(©*Jo) +

/ S.,(©*) p(©'|'©*)d©*. d©^J d © r . . . . d©n 4-PL22 1 (1.14)

Si introducimos l a s probabi l idades de los e r r o r e s
- 2 0 -

de p r imera y segunda c l a s e

£, = / p ( 9 | o ) Pd(
- 2 1 -

Es decir

R(s ,p d ) =QL 1 2 4-PL 2 2 4- / Vd(S0¡

JB0

T) P(Lo, -Loo) I -

- Q Í L ^ - L ^ ) p(0 | O )

siendo I =

UVJ r e © o a ~ C l f e v

,7 * *x ^ *

(1.17)

*

'EV

p ( © | 0 * ) ' s 1 (9*) d©', d©^ (1.18)

1

A la v i s t a de (1.17) e l r i esgo será minino cuan-

do se n in in ice l a i n t e g r a l del segundo miembro. Habrá dos

casos?

12) P(L2 1 - L 2 2 ) I - Q d ^ - L ^ ) p ( 9 | o ) > 0

entonces debe se r P¿L^ol ®) = 0

22) En caso c o n t r a r i o debe se r P^ít^oj ©) = 1

Si fornanos l a l l anada "razón de ve ros imi l i tud

genera l izada"

A =

y nácenoss

p f .s.,(©*) p(G*|^*) d©*, d©n*

Q p(© |o )

y= _- l£J l - l l . L21 ~L22

tendremos que l a reg la bayesiana será

A )f escoger £^
NOTAS Y REFERENCIAS AL CAPITULO 1

-La Teoría de la Decisión es principalmente crea

ción de Wald^ las referencias básicas sons

Wald, A.: "Basic ideas of a General Theory of

Statistical Decisión Rules", Proc. Int. Cong. Math, , 1950

(visión general e introductoria sobre la materia).

Wald, A.s "Statistical Decisión Functions", Wi~

loy, New York, 1950 (texto fundamental que recoge la labor

del autor y otros matemáticos sobre la materia en los años

anteriores).

-La formulación de la Teoría de juegos se debe al

genial Von Neunann (a partir de 1928)5 la primera obra de

conjunto esz

Von Neumann, J. y Morgenstern, 0.: "Theory of -

Games and Economic Behavior", Princeton University Press,

1941 (2S ed. , 1947).

-Una obra didáctica sobre la materia es:

McKinsey, J.: "Introduction to the Theory of Ga-

nes% McGraw-Hill, New York, 1952. (ed. esp. en Aguilar).

-Obras tratando conjuntamente Teoría de la Deci-

sión y Teoría de juegos sons

Blackwell, D.. y Girshick, M.A. t "Theory of Games

and Statistical Decisions", Wiley, New York, 1954.

Luce, R.D, y Raiffa, H. 1 "Ganes and decisions",

Wiley, New York, 19 57.
- 2 3 -

2. PROCESOS DE DECISIÓN NO SECUENCIALES EN CONTROL ADAPTIVO

S un a r i o

2.1. INTRODUCCIÓN.

2.2. DETECCIÓN PARA UN CASO NO BINARIO. CALCULO

DEL RIESGO.

2.3. DETERMINACIÓN DE UNA REGLA BAYESIANA.

2.4. APLICACIÓN A UN SISTEMA ADAPTIVO.

NOTAS Y REFERENCIAS.
- 2 4 -

2- PBCCESOS DE DECISIÓN NO SECUENCIALES EN CONTROL ADAPTIVO

2.1. INTRODUCCIÓN.

Hemos adelantado en la exposición hecha anterior

mente que la Teoría de la Decisión permite resolver proble

mas de Comunicación y Control sumamente interesantes. Sin

embargo nos hemos limitado al caso de detección "binaria -

con un sentido elemental y poco realista.

En efectos en situaciones normales es frecuente

que nos veamos en la necesidad de estimar el valor de para

metros (características de sistemas dinámicos, factores am

tiéntales, etc.) con un campo de variabilidad amplio. En -

tales casos supondría una simplificación drástica el redu-

cir dicha gama de valores a una opción binaria y es, por -

lo tanto, lógico extender ésta a una serie de valores dis-

cretos, suponiendo que durante intervalos de tiempo prees-

tablecidos dicho parámetro permanece constante y cambia al

pasar de uno a otro. Esta hipótesis será tanto más apropia

da cuanto menor sea la máxima de las amplitudes de los in-

tervalos y monos rápida la variación del parámetro conside

rado.

En una primera fase nos ocuparemos de procesos -

de decisión no secuenciales, es decir de procesos tales que

se toma una muestra de tamaño pre de te armiñado y se decide -
- 2 5 -

en consecuencxa e

2 . 2 . DETECCIÓN PARA UN CASO NO BINARIO, CALCULO DEL RIESGO,

Supongamos que se t r a t a , de e s t i m a r e l v a l o r 9 * ( t )

d e l parámet ro observado O(t ) = Q ^ ( t ) + n(fc) como hemos h e -

cho anter iormentOo Dividamos e l campo de v a r i a b i l i d a d do l

c i t a d o parámet ro en N i n t e r v a l o s Cj , Cp? * . . . * %«i?°N como

se i n d i c a en l a f i g u r a 2,1

e(t)

o*(t)

f °N

e( t )

¿^©4(t)

^ - ^ < /

\~^^7%?Q^ i ©V | 1

r^\ *?T 1 c 2

¡ c1 i J ! l

e n

I mm

t1 t2 n

Figura 2 * 1

Se trata9 pues, de sustituir el problema de deter

minar exactamente 0*(t) por el de saber en qué intervalo -

se encuentra.

Tomemos n observaciones en los instantes t-j ,. .

. o 9 tn y sean sus valores 9̂ ,. . .. 99 n . Formemos el vector

1 '̂ n-
- 2 6 -

siendo E0 e l espacio de l a s observaciones y n e l tamaño

es tab lec ido "a p r i o r i " de l a muestra no secuenc ia l .

Imaginemos que e l espacio n~dimensional E0 e s t á

dividido en N subcon juntos L-, • .... ,L¡j cada uno en cor res—

pondencia con los i n t e r v a l o s C J , . . , . , C J J del campo de va r i a

b i l i dad de 9 * ( t ) . La h i p ó t e s i s % de que e l ©*(t) verdade-

ro e s t á en C¿ so acepta cuando 9 6L^ . La decisión de acej3

t a r HJL se designa por ¿¡. ( i = 19 2 , . . . , N) * Llamaremos

Lj_.j =L(C¿, £•) a l a función no negat iva de pérdida por e l

e r r o r de tomar l a decis ión o. cuando © ( t ) e s t á en Cj . -

En es te caso e l espacio de decis iones se reduce a l conjun-

to d i sc re to < 1 9 „ O . , N [ •

El r iesgo medio serás

R(?f s, pd) = 2 1 2 L ^ i / P d ^ j l0 ) L ( c i * f j ) dGi d e n x

i=1 j = i -^Li

x / p(©|C±) S±(©*) d©* (2.1)

siendo? C±

5*. Probabi l idad "a p r i o r i " de que ©*(t) €C¿ ,

S^(9*) Densidad de probabi l idad de 9*(t) cuando

^ ( t jCCjL .

p^(
- 2 7 -

2 1 f± S i(9*) d0á == 1 f±^ O Si(9*) 2 0 V i

i=1 Jo±

N

Por otra parto pCOJC^) os la probabilidad condi

cional de que el vector observado sea Q cuando 0^(t)
- 2 8 -

E l r i e s g o "a p o s t e r i o r i " s e r á en toncess

-* JL - V.(9) r.(9) = X- ^i \¿ = "f—¿" (2.6)

s iendo -*• -#• Vd(©) = 2 1 F± L13 q±(©) (2.7)

i=1

2-3- DETERMINACIÓN DE UNA REGLA BAYBSIANA.

Apl icando e l teorema de Wald tendremos que: l a -

cond ic ión n e c e s a r i a y s u f i c i e n t e partí que p ¿ sea l a s o l u -

c ión b a y e s i a n a , dadas unas p r o b a b i l i d a d e s ,!a p r i o r i " , que

minimiza e l a n t e r i o r r i e s g o e s que

P d ( m i n r k ( 0 )

Es d e c i r que p - . ( £ . )©) e s n u l a pa ra t odos l o s -

v a l o r e s de j excep to paira uno que v a l e l a un idad y que e s

e l c o r r e s p o n d i e n t e a l mínimo de r . (9) que (por l a fórmula J

( 2 . 6 ) ) c o i n c i d e con e l í n d i c e p a r a e l que se hace mínimo -

V d ( 9 ) . E

ópt ima)s

V. (O). Es d e c i r (des ignando con -un a s t e r i s c o a l a d e c i s i ó n J

d

s iendo

P d ( §,* \ ©) = 1 s i j = k ^ ( 2 . 8 )

P
- 2 9 -

Vk(9) = min V.(0)

En resumen, tendremos que el riesgo mínimo vale

N

R(J, s, p*) =Y1 / ^i L^Ci^k) ̂ i ^ d91 ' d92 • i=1 «'IH

d0,o

o también R( s, P(f) » ^ j Vk(0) d O ^ , . .. . d9n

Jk .-*> siendo k el índice que minimiza V.?(@) .

2.4o APLICACIÓN A UN SISTEMA ADAPTIVO.

Es posible c o n s t r u i r un d i spos i t i vo de decis ión

que corresponda a l a a n t e r i o r reg la y u t i l i z a r l o en un s i s

tema de con t ro l adaptivo del modo que indican l a s f i gu ras

2.2 y 2.3 .

Entrada

Dispositivo de decisión

K&~
- 3 0 -

o(t) M u e s t r e d I I r

O-;N

|vy
- 3 1 -

N

* = ZL R(Ci,Pd)

i=1

R(c± , pd) = 0) q i(©) d01 . , d©n

Volviendo a u t i l i z a r e l teorema de Wald t e n d r e -

mos que en e s t e caso

P * ( á . j l O) = 0 s i j / k

s iendo k e l í n d i c e t a l que

Vk(9) = min V,(9)

k . 3

pero en e s t e casos

N N

y e ) = SIFiii3- q i ( í = Z fi %(" - y3 4d(sj i=1 i=1

es decir que el mínimo de V-(©) corresponde al máximo de J

? i q.i(&) ( l o c u a l e s l ó g i c o y r e p r e s e n t a a l a i d e a de ma~

x i m i z a r l a p r o b a b i l i d a d de e r r o r n u l o ) .

Por l o t a n t o , l lamando Xn-(©) = jT¡ Q.-?(©) Ia r o g l a

de d e c i s i ó n quedas Adoptar
Es fácil para el caso de procesos gaussianos en-

contrar formas simples de /L (©) que permiten dar reglas -d

de decisión en formas cómodas; las omitimos dado que no es

nuestro fin y pueden encontrarse en las referencias que se

citan. Del mismo modo pueden resolverse problemas comple-—

jos como el de la identificación de sistemas.
- 3 3 -

NOTAS Y REFERENCIAS AL CAPITULO 2

- A p l i c a c i o n e s de l a Teor ía do l a Dec i s ión a l o s

problemas de comunicación pueden e n c o n t r a r s e en l a monumen

t a l y e n c i c l o p é d i c a obra de Middle ton sobre l a t e o r í a e s t a

d í s t i c a , de l a s comunicaciones (más de 1100 págs .5 r e f e r e n -

c i a s abundan t í s imas a l o s t r a b a j o s o r i g i n a l e s , en inmensa

p roporc ión d e l p rop io a u t o r ) .

Midd le ton , D. 1 nAn I n t r o d u c t i o n t o S t a t i s t i c r a l

communication Theory11, McGraw-Hill , New Yocpk, 1960 0

-Una s u g e s t i v a i n i c i a c i ó n a l p a p e l de l a Teor í a

de l a Dec i s ión en e l C o n t r o l Adapt ivo ( e s c r i t a cuando no se

h a b í a t r a b a j a d o mucho en dicho s e n t i d o ) se puede l e e r ens

T r u x a l , J . G . y P a d a l i n o , J . J . s "Dec is ión Theory" ,

en l a obra c o l e c t i v a "Adaptive Con t ro l Systems" ( e d i t a d a -

por Mishkin , E. y Braun, L . ) , McGraw-Hill , New York, 1961.

- N u e s t r a d e s c r i p c i ó n s i g u e , en buena p a r t e , l a -

monografía a l u d i d a en l a I n t r o d u c c i ó n s

Sawaragi , Y , , Sunahara , Y. y N a k a m i z o , T . : " S t a -

t i s t i c a l Dec i s ión Theory i n Adapt ive C o n t r o l Sys tems" , Aca-

demic P r e s s , New York, 1967.
- 3 4 -

3 . PROCESOS DE DECISIÓN SECÜENCIALES EN CONTROL ADAPTIVO

S u n a r i o

3 . 1 . INTRODUCCIÓN.

3.2. RIESGO MEDIO EN UN PROCESO SECUENCIAL.

3.3. SOLUCIÓN BAYESIANA.

3.4. CASO BINARIO.

3.5. MODIFICACIÓN PARA EL CASO DE MAS DE DOS ALTER-

NATIVAS.

3.6. APLICACIÓN A LOS SISTEMAS ADAPTIVOS.

3.7. CALCULO DE LAS CONSTANTES.

NOTAS Y REFERENCIAS.
-35-

3- PROCESOS DE DECISIÓN SECUENCIALES EN CONTROL ADAPTIVO.

3-1. INTRODUCCIÓN.

En el capítulo anterior presentamos un sistema -

adaptivo que incluía un elemento de decisión de tipo no se

cuencial. En muchos casos una solución no secuencial es in

viable -o es poco práctica- y es necesario recurrir a una

de tipo secuencial9 en cuyo caso el tamaño de la muestra -

(o, lo que es lo mismo, el tiempo total de observación) no

se preestablece9 sino que queda indeterminado 5 es decir, -

después de cada toma de datos se consideran las alternati-

vas de aceptar una decisión final entre las varias posibles,

o de continuar el proceso. Como es obvio este procedimien-

to resulta lógicamente más correcto y económicamente más -

razonable ya que se toma la muestra del tamaño necesario y

suficiente para decidir con un nivel de seguridad acordado

de antemano.

3*2. RIESGO MEDIO EN UN PROCESO SECUENCIAL.

Cuando estamos efectuando un proceso de detección

secuencial el mdtodo a seguir es el siguiente.

Al observar los n primeros valores del parame—

tro ©̂ ,. o • 9 ©n que forman un vector ©n debe optarse entre

las decisiones siguientes? aceptar la hipótesis H-j de que
- 3 6 -

o. -P

© ( t )€C- j (á =1*••• ,N) a l a que designaremos SA (decis ión

f i n a l j ) , o l a de segui r observando v a l o r e s , a l a que de —

signaremos por S (dec is ión de c o n t i n u a r ) .

El vec tor

Pd = P d ( Í } = t d ^ / l ° n ) f •••» P d ^ / l ^ J

nos da l a regla de decis ión f i n a l ya que sus componentes -

representan l a s probabi l idades de tomar l a s dec is iones — c f ' c f -^ £,. , ••• ,
P*^ l°l> = [ P ( ^ Í "01).---.P(^|cN-)]

Entonces e l r i e s g o medio v a l d r á ;

ao N N / / * f ^ - |

RÍPÍ %) = Z E Z. / , / r k> ¿á (^)J *

k=1 3=1 1=1 / E ^ ^C± L

x p±(©*) p d ( ^ f ©fc) p C e ^ C ^ ) d©1 d©kd©* ( 3 . 2 ) Si se h a c e ;

p.(©*) = ? . S ± (©*) = ? i í (©* -©i*) ( 3 . 3 )

La e x p r e s i ó n d e l r i e s g o ( 3 . 2 ) puede p o n e r s e ;

R( 5"» Pd) = H H/ ? k=1 ig=1 ^E k

0 ± . ¿ l ( © f c ) X

x P d ( ¿ í | ©fe) p(©kl C±) d9 1 0 d ^ (3-4)

3 - 3 - SOLUCIÓN BAYESIANAo

posic

Llamemos 6 al conjunto de los puntos cuyo vector

ición 5 = ( j£p ... •,
- 3 8 -

que resultan aceptables, vamos a e legi r una que verifique

Ly = 0 si i = ó

L i ; j > O si i ¿ 3

Definamos la función

N

3 = 1 hi

Tenemos 9 pues, N funciones ^ . ( ^ ) de modo que

a K ^ S v le corresponden N valores 7?. ( TjT) ,. . • , ̂ gL( ̂ ) •

Nos es posible establecer una nueva función de forma que a

cada vector ^ se le asigne el mínimo de los ^P. (jy ); es -

decirs

Para cada valor de

dirá con alguna de las *2£(j§")« Entonces definimos el sub-

conjunto V. O Q por la siguiente condición

= muí i

Se pueden probar fácilmente los dos siguientes -

asertoss

12) Todos los V- son convexos y cerrados, J
- 3 9 -

2 )̂ Los Y^ son disjuntos dos a dos,

Si se define el conjunto V como

V = N

1=1

su complementario será

N

i=1 x

Entonces se puede establecer la regla "bayesiana"

de decisión correspondiente a las probabilidades "a priori , f

dadas por 1? = ( ^ \ 9 • . . 9 "3?JJ) que sigue.

R e g l a .

1*- Si 3i "kal Q.ue 5̂ 1 = y €. Vi no se hacen ob-f 5*

servaciones y se toma la decisión £ . j si ^ € V1 se hace

una observación 9. = (©.,) y se calcula el vector de proba-

bilidades ,!a posteriori" 2T2 = ( £ l p 9 . • . , *^TP) a Par*fcir de

^ y 01 (utilizando la fórmula de Bayes).

2.- Para cualquier S^j- (n = 1 ,. . . , oo) se actúa

análogamente; ew decir i si J - *^al «* o

la decisión £ . , si ^nj.-iSV1 se toma la decisión ^ pa-

ra lo que se hace una. nueva observación Q ± , se calcula

^ n x 2 a partir de y n + 1 y ©n+1 = (©-,,..., 9 n 4 1) .

3 . - Se continúa hasta tomar una £ ¿¡ . J

El paso de $*n a 2Tnj.-j aludido no es otra cosa -
- 4 0 -

que el cálculo de las probabilidades "a posteriori", a par

tir de las f,a priori11 y las condicionales, utilizando la -

fórmula de Bayes. De un modo simple podríamos representar

dicho paso por un producto de la matriz A(n) por el vector

inicial 5 9 e s 3-ecir;

£ + 1=A(n))T (3.5)

La matriz A(n) es diagonal y tiene por compo-

nentes

a±2in) = ~ww^Tñ~r ^ i j ( 3-6 ) WCií)~# i

cons i , j = 19, f , , N , n = 1 9 2 , . . • .

^ H Í l ° i ) - Í l ? i P(í|0i> i=1

5JL -n símbolos de Kronecker

Naturalmente S1 coincide con ^ .

3.4. CASO BINARIO o

En el caso de ser N = 2 se puede representar O

fácilmente o Se trata del segmento de recta representado en

la figura 3.1 .

Se cumple que
-41 -

Figura 3.1

fe V2 => % > n2=> ^2 L21 > 5*1 L12

Si llamamos ( ̂ , 5p) £ & al punto tal que

r„ '12 * i

J21 3f 2 4 ^ = 1

Entonces podemos poner que

? € V1

? € V C

J2 >1

F2 * 1

. 1

r2

"?r ^ o ^» ^ O

*2 * 92

Por se r L y Vg d i s jun tos y cerrados e x i s t i r á n

sendas cons tan tes a y b que cumplan

o < y < a < 1

y t a l e s que
- 4 2 -

wmmW

Scv1 o é ?2<

Por lo tan to la reg la dec i sor ia e s t ab lec ida en

e l párrafo a n t e r i o r puede ponerse como sigue

f Tomar $^ s i £^ n + . j < b

Tomar c£2 s i -2T2 nj..j > a

c w*

Tomar ^ s i b
- 4 3 -

Análogamente

. _ _ ^ P(%JO 2 ) a ri

Por l o t a n t o l a r e g l a d e c i s o r i a puede e s t a b l e c e r

se (cuando n ü ) como;

Tornar ¿^ s i A (9 n ) < B

Tomar S 2 s i ^ (9 n ) > A

Tomar A(© n ) > B

Habiendo hecho

a 'Sf. b S 1 A = — 1 - B = - -

1 - a T 2 1 - b ? 2

A (0 n ) = — . _ £ — £ - - (n = 1 , . . . . oo) PC^JC,)

Es d e c i r s en e l caso b i n a r i o l a r e g l a b a y e s i a n a conduce a l

" t e s t " de razón de v e r o s i m i l i t u d e s s e c u e n c i a l .

Es obvio que p a r a e l v a l o r e x c e p c i o n a l y s i n i n -

t e r é s r e a l n = o l a r e g l a e s f

Tomar ¿^ s i ^o< b

Tomar S 2 s^ 2 ^ a

Tomar £ s i b < S < a
- 4 4 -

3.5. MODIFICACIÓN PARA, EL CASO DE MAS DE DOS ALTERNATIVAS.

Cuando el valor auténtico de 9*(t) tiene un cam

po de variabilidad suficientemente amplio para que sea acón

segable elegir un N superior a dos se hace necesario apli

car la regla establecida en 3.3 . Ahora bien, la aplicación

estricta de la misma se hace prohibitiva? en primer lugar

por la complejidad matemática que puede entrañar la aparen

temente simple pregunta de si J^^V. ; en segando tdrmii&o

-aunque fundamental desde nuestra perspectiva actual- por

la complicación técnica del correspondiente sistema adapti

vo.

Se trata-, pues, de ampliar, convenientemente mo-

dificada, la regla del caso binario al muí ti dimensional*

Si 9*(t) puede variar en (-oo, 4-QO) y si se ha -(1\

dividido éste en los N intervalos siguientes^ ''

CJSC-GD, 9*),_.,cD. sCoji-p ©*)f..-# cN5(©¿-if +OD)

tendremos e l problema de c o n t r a s t a r l a h i p ó t e s i s

E. t 9*(t) 6Cd (3 = 1 M . M N )

.4.

Ahora biens la hipótesis, H^, de que © (tJfiO^

(1) Si el intervalo es acptado bastará sustituir -GD, +00 por los extremos del mismo? esta variación no altera nada de lo que digamos•
- 4 5 -

puede considerarse cono la conjunción (o intersección) de

las dos hipótesis más simples siguientes;

H~ : 9*( t )>9*_ 1 ( 9 * = - C D )

H * : 9 * ( t ) < 9 * ( 0 * = + QD)

H, = H .+ n H r J J U

Pero cualquiera de estas hipótesis puede ser con

trastada utilizando el test secuencial de la razón de vero

similitudes que establecimos en 3» 4 • Por otra parte es in

mediato comprobar que no hay que estudiar las 2N hipótesis

H. ,. . . , HN y H/ , • .. , HJJ' ya que EL y HN* son ciertas —

siempre y, por otra parte9 la hipótesis H. es la complemen

taria (o negación) de la H. 1 9 lo que denotaremos escri—

hiendo

Por todo lo dicho tendremos ques

Para contrastar H.* deberemos hacer e l t e s t des j

crito en 3.4 . Para ello vamos a introducir algunas peque-

ñas modificaciones,

a) La primera es afectar a las constantes A y B

y a la razón de verosimilitudes A (©n) de un subíndice que
- 4 6 -

exprese a qú¿ hipótesis Hj* nos roferinos.

b) La segunda os. ut i l izar sus logaritmos on vez

de ellas mismas (lo quo da expresiones las simples en los

casos más corrientes); así tendremos

log A-j f log" Bj 5 «A 3 ( °n) - l 0 S A j ( e n )

Con estas notaciones la política a seguir es la

siguiente

•.' R e g l a t ,>••'•''

• Aceptar Hj si log A^-j «* .A ̂ * (On) y logBjj>

- •'• Seguir el muestre o si no se cumplen ambas des i -

gualdades para ningún j = 1,.»•, N •

Teóricamente puoden calcularse A* y B*¡ del mis

mo modo seguido en 3f4, poro ello exigiría el conocimiento

de las probabilidades ?,a priorií} de que 9^(t) estuviera -

contenido en los intervalos correspondientes y además a la

asignación de valores a la función de pérdida. Por ello se

adoptará otro procedimiento quo describiremos en 3 #7 .

Por su parte A-í(©n) es9 siguiendo la pauta mar

cada en 3.4, el cociente de las probabilidades eondiciona-

les de que se encuentre en el muestreo el vector 0n cuan-

do el valor real 0 (t) está por encima de ©?* o por deba-

jo (análogo a pertenecer a C2 ó G-j- en el caso binario) ; -

en algunos casos puede c 0:1 si dorarse que ambas zonas quedan
- 47 -

caracterizadas -oor dos valores 0... y ©_. 0 tales que

a -* ^ -*• p(e£|0*o) AA%) = ios ^ (Q^)=iog —--jS--^-- (3.8)

0 píá.oj;

siendo p(© n|0^) ? con k=1 6 2? la densidad de probabili-

dad condicional de que se observe Q cuando el valor au-

téntico es 0^_ .

E s t o puede s e r p l a u s i b l e cuando e l ?6ampo de va

r i a c i ó n de 0 * ( t ) e s pequeño f r e n t e a l de n ( t ) y además / *-' i x

l a razón s e ñ a l a r u i d o e s grande « E l i n t e r v a l o (94-i90n-o) se denomina zona de i n d i f e r e n c i a 0

3 . 6 . APLICACIÓN A LOS SISTEMAS ADAPTIVOS.

Si ^ o s encontramos con un c i e r t o s i s t ema (proce

so d inámico , p l a n t a i n d u s t r i a l , e t c 0 ) 9 cuyas c a r a c t e r í s t i

c a s dependen de un pa rámet ro © ( t ) ? y queremos c o n t r o l a r

e l mismo de modo que l a r e s p u e s t a sea óp t ima , n o s encon—

t r a r ^ o s con e l problema de que l o s d i s p o s i t i v o s de con—

t r o l deberán t e n e r n a t u r a l e z a mudable pa ra i r s e " a d a p t a n -te

do11 a l o s v a l o r e s que tome 9 ^ ( t ) . Si hacemos l a h i p ó t e s i s

de que no e s n e c e s a r i o c o n s i d e r a r cambios c o n t i n u o s de -

0 ( t ) s i n o que e s p o s i b l e c u a n t i f i o a r en íT v a l o r e s d i s c r e

t o s su campo de v a r i a b i l i d a d y que a cada uno de e l l o s l e

conviene un c i e r t o s i s t ema de c o n t r o l podremos a p l i c a r l a

t e o r í a a n t e r i o r . E l r e s u l t a d o so esquemat iza en l a f i g u r a
adjunta

- 4 8 -

Entrada +

Selector

Calculador A,s B U Circuito

Logioo

r1

Controladores adaptados a los distintos valores de

o(t)

•A^V

J2_ ¿,

Elemento conmutación

Calculador

3E ¡Medidas de i muestreo

~]

_J

Sistema a con t ro l a r

R e a l i m e n t a c i o n

©*(t)

Salida

Fig. 3.2

Si se supone el caso especial de que la señal y

el ruido sean aditivos y dsto sea gaussiano (y aceptamos -

la hipótesis apuntada al final de 3.5) tendremos que las

densidades de probabilidad condicionales serán distribucio

nes normales multidimensiónales con la media en el valor
- 4 9 -

auténtico do la señal;

P ( 9 n l e j 2) = " 7 G ( 3 * 9 )

V(27T)n JM)

l w ' * >> ' M - 1

- e 2 V n

\¡(27T)n |M)

donde M y M""' son la matriz de correlación y su inversa.

|M| es ol determinante do la misma.

9^ el vector columna que tiene por componen-

tes los valores muostrales0

9.^ (k=1 ó 2) el vector cuyas n componentes

son iguales a 9 ^ .

(9n~9jk) el vector transpuesto del correspondiente

Si las variables aleatorias ©,.,...,©n son indo

pendientes 2

M = cr i

y se tiene que (3*8) en este caso quedas

¿ ^ i=1 ¿ 0 i=1

(3.11)
- 5 0 -

Que ope rando da:

n A/V = 2 ( e * )

2 - ( e * )2 W32 ^ j 1

n

^ i=1 G i

y finalmente

Apn) 9 n > a.-^-j (n)

s i e n d o ; — 1 n ©n = ^>~ 9. l a media m u e s t r a l de n o b s e r v a c i o

n -j n o s

a (n) - ° ~ l 0 g A 3 x ° 3 1 * ! 3 2 _

* (n)
-51 -

3.7. CALCULO DE LAS CONSTANTES,

El número de observaciones que hay que hacer es

una variable aleatoria. Por lo tanto podemos estudiar la

probabilidad condicional de tomar la decisión final de -

aceptar la hipótesis H-j de que 9 (t)€C-j cuando el valor

real es 8, ó QTk (supuestos dos valores únicamente corres

pondientes a las dos zonas C, y C2). Esta probabilidad

la designaremos por L(0. ) (i = 1 ó 2) y su valor será

L ( 9 Í ) = 5 T / p(en|e*) aor...., aon n=iJAi

siendo J7. el subconjunto de E^ formado por los vectores

9n tales que, según la regla adoptada, conducen a tomar -

la decisión final H-j después de n observaciones.

En el caso de regla bayesiana anteriormente des

crita SL estará definido por

(3.13)

La probabilidad M©j_ ) puedo también ponerse en

función de los errores 6.. y 6» de primer y segundo tipo

!(©*) = 1 - £-, (3.14)

!.(©*) = S 2 (3.15)
- 5 2 -

Por o t ra p a r t e , como;

© ^ / ^ z z ^ p ( ^ | 9 * ) : £ B p ( 9 > * )

se tendrá ( integrando en Jl y sumando)

L(©2*) ¡ ¿ S I (O*) (3.16)

y por lo t an to

2--;c:B (3.17)

Análogamente s i llamamos L ' (9^ ) l a probabi l idad

condicional de tomar l a decis ión f i n a l EU se tendrá

OD

'(©*) = 2 1 / P(^|©i*) d©- d 9 n /il¿

y ahora

9 € -a' B < JM~%- < A, V k

(3.19)

Pero, en es te caso ,

L ' ( 9 * ) = 1 - A L ' ( 9 * ) (3.22)

Es dec i r
-53 -

1 - £2 - — ¿ - ^ A (3.23) £1

Esto quiere decir que A y B deben tener unos va

lores tales que verifiquen las desigualdades anteriores -

respecto a las probabilidades de los errores de primero y

segundo tipo* Ahora biens resulta que determinar directa-

mente A y B obliga a una serie de cálculos, más o menos -

laboriosos, basadow en las probabilidades ,!a priori" (mu-

chas veces calculadas con hipótesis sólo relativamente —

plausibles) y en el establecimiento arbitrario de los va-

lores Lj_-j de la matriz de pago5 sin embargo es fácil y -

lógico establecer do antemano los valores de S y £

que nos dan los niveles de significación de nuestro test*

El único problema es que A y B están relacionados con £..

y S por medio de desigualdades y, por lo tanto, no so

puede calcular un valor único exacto (lo cual, por otra -

parte, no tiene sentido dado que depende de los valores -

de Lj-- arbitrarios que establezcamos).

Veamos cómo resolver la cuestión % en primer lu-

gar vamos a suponer dados ^ y * ? y que A y B los ha-

cemos

B = £ — A = ¿

1 - s a ' 1 1

naturalmente que las probabilidades de los errores de pri
.:/ ' - 5 4 -

mer y segundo t i p o entóneos no t ienen porqué c o i n c i d i r ~

con £* y &9% s;\ l a s dersignamos por £* y £•* se t e n -

drá

B = - _ £ L . > _ | L - (3o24)

1 - *? i - a ; A = -
- 5 5 -

que sumadas miembro a miembro dan

Por lo tantos eligiendo A y B por las fórmulas indicadas

se tiene un nivel de probabilidad de error inferior o igual

al prefijado.

Puede probarse que el test termina siempre (con

probabilidad la unidad) para algún valor finito de n .

En el caso de que haya más de dos alternativas

será necesario pasar de A, Bf &* y £~ a Aj, B-j, £j-. y -•

£0. como en 3,6 .
-56-

NOIAS Y REFERENCIAS AL CAPITULO 3

-Los métodos secuenciales tienen ya una larga Jais

toria en Estadística; un texto clásico sobre la materia es

el libro de Wald (citado seguidamente) en el que se encuen

tran importantes resultados matemáticos de interds en Esta

dística y otros campos de la Teoría de Probabilidades.

Wald, A.: "Sequential Analysis", Wiley, New York

1947.

-Una breve idea de los métodos secuenciales pue-

de leerse en el libro del Pr. Sixto 3íos que citamos.

Bí : 3. .: . "Métodos Estadísticos" (5S edición)

Ed. del Castillo, Madrid, 1967.

-Los conceptos básicos de Cálculo de Probabilida

des y Estadística que manejamos (fórmula de Bayes, distri-

buciones, etc.) pueden encontrarse en el libro que acabamos

de citar, o ens

Cramer, H.s "Mathematical Methods of Statistics"

Princeton University Press, 1946 (utilizamos la traducción

de Cansado, editada por Aguilar).

-Existe una abundante literatura sobre las apli-

caciones de los métodos secuenciales a los problemas de —

transmisión, detección, ruido, etc.* Sobre las aplicaciones

al control adaptivo puede verse la monografía, ya citadfc/ cía

el capítulo anterior, de Sawaragi, Sunahara y Nakamizo.
^ 5 7 -

-Una discusión interesante y profunda sobre sis-

temas adaptivos con dispositivos de decisión se puede leer

en el trabajo que citamos a continuación, y en el que se -

encuentran esquemas de sistemas análogos al propuesto en -

la figura 3 i 2 .

Hsu, J.C. y Meserve, W.E#: "Decision-making in

adaptive control systems", IRÉ Irons, PGAC 7 (N° 1), 24» 1962.

-Debemos señalar, al terminar la breve exposición

que ha constituido esta primera parte introductoria de núes

tro trabajo, que han quedado fuera do su ámbito numerosas

cuestiones de interés fundamental pero que se apartaban do

nuestro fin primordial% preparar la presentación de los re

sultados concretos que son objeto do I próximo capítulo*

(En las referencias citadas se puede obtener cumplida infor

mación sobre los temas aquí eludidos).
- 5 8 -4

SEGUNDA PARTE

CONTROL /ÜDAPTIVO CON DISPOSITIVOS DE DECISIÓN
4. SISTEMAS DE CONTROL ADAPTIVO CON DISPOSITIVOS DECISORIOS

S uní a r i o

4 . 1 . INTRODUCCIÓN.

4.2. FILOSOFÍA DE LOS SISTEMAS ADAPTIVOS CON DISPOSI-

TIVOS DE DECISIÓN.

4.3. REGLA SECUENCIAL PARA SISTEMAS ADAPTIVOS.

4.4. LEY MULTINOMIAL SUCEDÁNEA DE LA DISTRIBUCIÓN REAL.

4.5. REGLA DE DECISIÓN BASADA EN LA LEY MULTINOMIAL.

4.6. TAMAÑO MEDIO DE LA MUESTRA.

4.7. ESQUEMA DE SISTEMA ADAPTIVO CON DISPOSITIVO DECI-

SOR.

4.8. RECAPITULACIÓN Y COMPLEMENTOS.

NOTAS Y REFERENCIAS.
- 6 0 -

4. SISTEM/iS DE CONTROL ADilPTIVO CON DISPOSITIVOS DECISORIOS.

4.1. INTRODUCCIÓN.

En las páginas anteriores horneo hecho un ligero

"bosquejo de las ideas más elementales de la Teoría de la-

Decisión y aludido a algunas de sus aplicaciones a los -

problemas de control automático. Vamos c. continuación a -

utilizar dichas ideas para obtener regir.3 de decisión —

-plasmables en dispositivos tecnológicos físicamente reali

zables- que permitan la construcción de sistemas adaptivos

en supuestos más realistas que los usuales (no linealidad,

ruido no gaussiano9 etc.).

Como se ha señalado en el capítulo anterior cuan

do el ruido es gaussiano es relativamente fácil dar expre

siones explícitas9 y cómodamente manipulables, de las re-

glas de decisión correspondientes. Por el contrario cuan-

do el ruido no es gaussiano, o cuando el sistema no es li-

neal (lo que9 como es sabido, provoca que aún con entradas

gaussianas no lo sean las salidas), las formulaciones de

las reglas decisorias son impracticables e incómodas* Por

eso, después de una exposición general de la filosofía de

los sistemas adaptivos con dispositivos de decisión, pasa

remos a describir un método que permite la simplificación

de tales reglas para los oasos no lineales y no gaussianos
•-61 -

mediante la sustitución de la ley de probabilidad real

por una distribución multinomial que la aproxime apropia-

damente o

También propondremos un modelo teórico generico

de una posible configuración típica de sistema, lineal o

no, con parámetros variables y sometidos a perturbaciones

aleatorias, controlado mediante dispositivos adaptivos in

cluyendo elementos para la toma de decisiones de forma se

cuamcial.

4.2. FILOSOFÍA DE LOS SISTEMAS ADAPTIVOS CON DISPOSITIVOS

DE DECISIÓN.

Hemos presentado -a título de ejemplos- en los

capítulos anteriores algunos sistemas de control adaptivo

con dispositivos de decisión. Vamos ahora a esbozar las -

líneas generales de la filosofía a que obedecen.

Como es sabido un sistema controlado automática

mente no es otra cosa que un sistema dinámico, al que se

han superpuesto una serie de dispositivos de forma que el

conjunto tenga una salida que, en algún sentido preestable

cido, sea óptima. El ejemplo más simple es el del sistema

con un lazo de realimentación.

Un sistema dinámico tal que sus entradas varíen

dentro de una gama muy amplia de posibilidades, que esté

sometido a muy diferentes tipos de perturbaciones o que -
- 6 2 -

sus propias c a r a c t e r í s t i c a s cambien a lo la rgo del tiempo

no puede se r regulado apropiadamente por un controlador -

de configuración f i j a , sino que és t e debe cambiar do un -

modo que se adapte a l a s var iac iones suf r idas por e l s i s -

tema a c o n t r o l a r . Un sistema con con t ro l adaptivo es un -

sistema dinámico, cuyas condiciones de funcionamiento evo

lucionan con e l tiempo, a l que se ha conectado un conjun-

to de d i spos i t i vos suscep t ib le de adaptarse a l cambio del

sistema de forma que l a s a l i d a t o t a l sea óptima en todos

l o s regímenes de funcionamiento,, El ejemplo más simple

puede se r e l sistema con ion parámetro va r i ab le regulado -

por un controlador con una c a r a c t e r í s t i c a que se puede cam

b i a r mediante unos elementos que miden e l va lor del c i t a -

do parámetro, ca lculan e l más apropiado de l a c a r a c t e r í s -

t i c a y l a modifican en t a l sent ido ( f igura 4.1)

Entrada +

"* ĴT

Calculador de K(C) y adaptador

Valor de C| » II

Cambio de K

i.

Medidor de C

Controlador con K

variable

Medida de C

Sistema a con trolar con C variable

Salida

Figura 4#1
-63-

Las modalidades y posibilidades del control adajs

tivo son innumerables. Veamos en qué supuestos puede hacer

se intervenir el concepto de proceso de decisión, genera-

lizando así algunos de los ejemplos vistos en capítulos -

anteriores.

Supongamos un sistema a controlar que tiene uno

o varios parámetros característicos cambiantes con el tiom

po ( o incluso que es cambiante la propia configuración),

que se encuentra en un entorno mudable, o que varía el tí

po de entradas, y que estos cambios no pueden conocerse -

determinísticamenté porque las variables observadas son -

funciones aleatorias del tiempo debido a la existencia de

ruido. Entonces se hace necesario un control adaptivo del

sistema; pero el dispositivo de adaptación debe incluir -

un elemento que, mediante la oportuna regla, decida la con

figuración óptima no en función de un conocimiento cierto

de la situación y de un criterio de optimización dado, si

no en función de óste y de una estimación de la realidad

basada en la minimización de un riesgo medio en el senti-

do de la Teoría de la Decisión.

Ya hemos visto ejemplos en los capítulos 2 y 3,

en los que se tenían distintos controladores (por ejemplo

de funciones de transferencia í^,... ,Fn) adaptados para -

conseguir respuesta óptima segiin fuera el valor de un pa-

rámetro variable del sistema a controlar (que llamábamos
- 6 4 -

9*) ;. l a ragla.^dacxsoria,, permi t ía "'elegir-con ~riasgo mínimo

' a l valer- del- parámatro y por tanta* -el_ dal^3imtrjaladDr--apro

piadjcu-"

* '" •--"--—' ~YanuQ3-aliQra a planteamos-. .una-si tuación "basiran—^

i ^ - g a n a r a X ^ ^ de - v i s t a t a ó r i o o ŷ ^ii^,cianta—-^^

..mente operativa^.desda-.-un punto -de v i s t a - p r a c t i c a r .'•—---••• '^

"""""* -•••-••^ra.) Sea -un- sistema- a c o n t r o l a r - ^aractetó^ajdo^or •' i

*,tai,-*--paráme1n7a-v^2?iahl&-* 9^( t ) cuyos va lo res - supondrertas ~**w-

'di^scretizadas-en ¥ 2ronas? C^^^.^Cj^. - - (£s_lnmediato wqua~,, i

la.J£ormu33xiií5n ea...la .misma, si...las.jsonas- G-̂ > .̂̂ ^TC^ -CÍL ^vesf ~

.da- .corre sptm.dar-a^interva:Los de-, va loras de, 0^(t.)-—;sa"refier"

ran a subecnjuntos caíalasquiera da m o s p a c l a . multidjjaan^-^^

s l ona l cayos apuntos- fuesen, r e pre s e n t a t i v o s de- l a s .distin—-

tas.astados...del_...sistema),- .._ . ^._^—^-^ ~ -'

.„ ^ -,^....... , _i>) Se- -dispone de un con junte de iT 'Contro3aadaras^"

~-oy l a que e s l o misma, de un- con t ra lador da caa^acijerístár--

-cas v a r i a b l e a - que pueden, dise re t i z a r s e * en- N "conjuntos-apro

xiioadaman t e af ina s a c a d a uno de e s t o s cen t ro oidores" es--él

apropiada- para--dar . respues ta óptima del- sj^stama conjuntToy ^"^

sagrin~um- criiiariQ-- de proyecto apropiado^ - ' - " -- — - __

'•""" '^"'-~-^ de l sistema a - con t ro l a r T- -

o una magnitud derivada- (por e jer tpla l a • dasviacdLán.. o - ~sonal_ A

. de ~ e r r o r )-^.no "son^axac t amen t e -. conoc i d a s ^ p or l a presencia--•-"' •

de ru ido-y e~s necesar ia .^utdJá^ar un -elemento, dacjasarlo que'

^permitaJaacer -una, est imación de r iosgq mlnijn.0, .(lo qua.^su—
pone, n a t u r a l n e n t e , que se conocen o se imaginan l a s l e —

yes p r o b a b i l í s t i c a s de l a s c a r a c t e r í s t i c a s c i t a d a s y d e l

r u i d o ) .

d) Hecha l a e s t i n a c i 6 n se e l i g e e l c o n t r o l a d o r

apropiadoo

Es obvio que problemas p a r t i c u l a r e s cono e l de

l a i d e n t i f i c a c i ó n de p r o c e s o s , a j u s t e a d a p t i v o de p a r á n e -

t r o s , e t c « 9 son c a s o s p a r t i c u l a r e s d e l esquema p l a n t e a d o ,

4 . 3 . REGLA SECUENCIA! PARA SISTEMAS ADAPTIVOS.

Vamos gá /p l i ca r a l modelo d e s c r i t o en l a s ecc ión

a n t e r i o r l a r e g l a do d e c i s i ó n que dedujimos en e l c a p í t u -

l o a n t e r i o r pa ra p r o c e s o s s e c u e n c i a l e s de d e c i s i ó n .

Cono h i c i n o s en l a s ecc ión 3*5 d i v i d i r e n o s e l -

i n t e r v a l o de v a r i a c i ó n de 9 ( t ) en N zonas C p # . . 0 , C j j •

Por o t r a p a r t e c o n s i d e r á r o n o s cono magni tud observada no

e l v a l o r p e r t u r b a d o ©(t) s i n o l a s e ñ a l de e r r o r d e l s i s -

t e n a e ( t ) - d i f e r e n c i a de l a e n t r a d a x ( t ) y l a s a l i d a y ( t ) -

de l a que i r e n o s hac iendo n e d i d a s s e e u e n c i a l n e n t e s e ( t ^ ) =

= e . , . 0 . , e ^ n ^ = e n 9 # # ° # $ ^OTinDJ0L^0 l ° s s u c e s i v o s v e c t o

r e s de l a s o b s e r v a c i o n e s

con e l n f i n a l no p r o f i j a d o .

Nues t ro p r o b l e n a e s e l e g i r e l c o n t r o l a d o r ó p t i -
-66-

mo, que caracterizaremos por el valor de un parámetro a ,

entre los N posibles, que corresponderán a los valores —

a^,a2,.M,ajj adaptados según el criterio de proyecto -

adecuado a los valores de 9^(t) comprendidos en Cj,..#.

.., Ojq- . En cada instante e(t) depende, aparte de la en-

trada y de las perturbaciones, de y del parámetro

a^ del controlador conectado en ese instante.

En tales circunstancias -y en la hipótesis de

que sean conocidas, o razonablemente estimadas, las propio

dades estadísticas del sistema- podremos aplicar el test

de la razón de verosimilitudes que dedujimos en 3.5 . En

primer lugar: a la probabilidad condicional de que el ve£

tor observado en n etapas sea e cuando el valor — —

9*(t)€Cj y el parámetro del controlador es a¿ le desig

naremos por g(en ja^C-j) • Análogamente a lo hecho en 3*5.

consideraremos las probabilidades p(e^ I ^ Í ^ ^ ) y

p(enJa¿,Dj) en las que:

Df. es el complementario de D-*

Di = U Ck

y por lo tanto (ver figura 4.2)s

Ci = D.-fi D». ', 3 J 3-1
- 6 7 -

D'. .0

Dá

t

D á-i

Parámetro del sistema

a controlar © (tj

I" i 2 *

C J

I 4' "d-1 %

h- CD

Parámetro del con-

trol ador óptimos a-

Párametro del con-

trolador óptimos a. A 3-1

?igura 4.2

Con las anter iores notaciones la razón de vero-

similitudes generalizada para e l caso binario equivalente

del t e s t secuencial ess

P( í i | a i? D , ; j ) Ai.i
- 6 8 -

A i á = - — - ^ ¿ - ( 4 . 2 a )

113

Bii = -fJ— (4.2b)

s i g n i f i c a n d o : e l p r imer s u b í n d i c e ( i en l a s fó rmulas ) e l

e s t a d o a c t u a l d e l c o n t r o l a d o r ; e l segundo s u b í n d i c e ( j en

l a s fó rmulas ) co r re sponde a l a h i p ó t e s i s a c o n t r a s t a r ; e l

í n d i c e numérico 1 ó 2 a l u d e a l o s e r r o r e s de p r imera o se

gunda c l a s e , cuyas p r o b a b i l i d a d e s r e s p e c t i v a s se des ignan

^ 1 i i y ^21 j * ^~ " b a i a a a o d G l a mues t ra v a r i a b l e e s n .

Con d i c h a s n o t a c i o n e s l a r e g l a de d e c i s i ó n os -

l a s i g u i e n t e .

REGLA

a) En una e t a p a n y cuando e l c o n t r o l a d o r oonec

t a d o e s e l de pa rámet ro a^ .

Si 3 j , l o g A . . ^ < J L l f j » 1 ( n ) 7 l o g B i á >

> J f L . . (n ) se pone e l c o n t r o l a d o r de pa rámet ro a^ ( j pue

de c o i n c i d i r con i ) .

b) Si no hay ningún 3 t a l que se cumplan s imul

táneamente l a s dos d e s i g u a l d a d e s a n t e r i o r e s se c o n t i n ú a -

e l mues t reo pasando a e ± 1 .

OBSERVACIÓN

Se ha supues to que e l s i s t ema t i e n e un e lemento
- 6 9 -

de memoria y que, por lo tanto, "sabe" el controlador que

está conectado; esto es tecnológicamente muy simple de ~-

conseguir (cualquier circuito multiestable puede servir a

tal fin). Caso de que el sistema no tenga memoria sería -

válida la anterior regla pero habría que hacer variar el

índice del controlador también de 0 a N y buscar la pare-

ja (ij) que cumpliera las desigualdades*

En muchos casos será posible sustituir en la ex

presión de «JL. .(n) los subconjuntos Dj y D1. por valores

característicos de que llamaremos 0 ^ y 9-2 •

En algunos casos es posible obtener expresiones

de A. .(n) relativamente manejables; uno típico es el del

sistema lineal con un parámetro 0*(t) variable y con en-

trada aleatoria formada por ruido gaussiano (como es sabi

do también lo será la salida y el error e(t) ). Cuando el

sistema no sea lineal o el ruido no sea gaussiano raranen

te será posible obtener una expresión de la razón de vero

similitudes cómoda; per eso vamos a introducir una distri

bución multinomial para sustituir a la auténtica en la -

próxima sección.

(1) Véase lo dicho en la sección 3.5 .
- 7 0 -

4.4. LEY MULTINOMIAL SUCEDÁNEA DE LA DISTRIBUCIÓN REAL,

So trata de obtener una distribución de probabi

lidad que aproxime la distribución de la probabilidad con

dicional p(en|a¿,D^) en los casos que asta sea inmaneja-

ble -como sucede, por ejemplo, en la mayoría de los siste

mas no lineales- o, inclusive, sólo se conozca una expre-

sión aproximada*

La distribución que vamos a utilizar es la mul-

tinomial (o polinomial). Como es sabido se trata de una -

distribución multidimensional de tipo discreto cuya dofir (1) nición y propiedades recordamos en las siguientes notasv lJ

NOTAS SOBRE LA DISTRIBUCIÓN MULTINOMIAL.

Sea una prueba aleatoria en la que pueden apare

cer el conjunto completo de sucesos incompatibles: S-j,...

. . , S^ de probabilidades P(S^) = p¿ tales que

p( v Si) = z PÍ = i 1 i

Si se hace l a exper iencia un número n de veces

cabe preguntarse cuál e s l a probabi l idad de que se dó n^

veces e l suceso S-, n^ veces e l Sp> e t c . (naturalmente -

¿ L n ^ ^ n ) , abs t racc ión hecha del orden en que se presenten .

(1) Ver r e fe renc ias a l f i n a l de e s t e c a p í t u l o .
-71 -

Un razonamiento elemental conduce a l a conclusión de que

t a l probabi l idad es e l producto del número de permutacio-

nes de n elementos en t re l o s que se r ep i t en n* , n2*••••* tt^

por e l numero p . * . , . . Q p, LL >

Queda a s í def inida una va r i ab le a l e a t o r i a , a s o -

ciada a l a prueba repetida, que se denomina multinomial y

qup*# é , > ''h)* donde I a *±

representa e l ni5mei*o de veces que se presenta S^, t i ene -

l a s igu ien te l ey de probabi l idad

PC S1 - n1,,.. , J^ = nh) = ------------ P-J .•...p^

1 h (4.3)

Inmediatamente se comprueba (fórmula de Leibniz)

que se trata de una distribución %

yr—__u__ pf1 •.... p.ni1 = (Zl P± )n = 1

*—** n l n, f ' n i

(estando l a primera suma extendida a todos l o s casos posi

b les de va lores p o s i t i v o s de n^ que sumen n ) .

Como es evidente no es una d i s t r i buc ión de h di

mensiones sino de h-1 ya ques

h-1 nh ^ n - 2 1 ni

i=1

La función característica vale
- 7 2 -

n ! r i | r / ( * • ! » • • • '"^h-i) ~ áíL - ' — ~ P-j Pjj

n h i t 1 n l 4 • • • • ^ » «

es decid

XX Jt • f • o • « XXT_ -

h-1

••«i e

ith-1nh-1

i t • / ( t 1 , . . . , t h _ 1 ) = (2I - P-j o "Up^)* (4.4)

o también 7^(t^ , . . . i*^.^) -

3=1

1+ ZLte 1 d - l ) p . L 3=1 3.

n (4.5)

Fácilmente se deducen l o s momentos c e n t r a l e s

E [Fj] - n pj

E [(r-?3)2] = np (1-p)

E '[(r-'y^cy-^J^-npjp^. (j^k)

Volviendo a nuestra distribución p(en|a^,D.)

veamos como puede ser sustituida en la expresión de la ra

zón de verosimilitudes por una distribución multinomial #

Bastará para ello.dividir el campo de variabilidad de o(t)

(1) en li intervalos^ ' y sustituir la variable aleatoria — (e-j,... , on) por la (n^ , Ü2,.. M n^) representativa de la -

(1) Puede hacerse que h y N sean iguales y los interva-los de variación de e(t) se correspondan con los de 0*(t) pero no es necesario ni tiene ningún sentido 03 pecial.
- 7 3 -

repartición de los e ( t ) en los li intervalos citados»

Llamando a los intervalos de e ( t ) , S- j , . , . , S^ y

a las probabilidades %

P [ e ( * ) € M a i > D ; j ] = ^ ( i j ) (4.6a)

P [ o ( t ) € S k | a i , Dí; I ] = q.k(i,3) (4.6b)

se tendrá que

Pk( i»d) = / v(el&±,V.) de (4.7a)

q k ( i , j ) = / p íefa^D' . ) de (4.7b) s k

Las leyes nul t inoniales sus t i tu t ivas de l a s rea-

les serán las siguientes?

a) p(enJa i?D*-) se sus t i tu i rá por

n! -_ - . n r ^h , . [q^i^JJ . . . . . Ĵq.-̂ (± , j)J (4.8)

n1 ! , n h !

b) p(en la i ,D^) se sus t i tu i rá por

n! r -in1 r -i

nh

^.—_ p 1 ( i , j ) J P h ^ ' J ' ü (4.9) n ^ ! , . . . , n h ! ^

J L

donde: ^

H nk = h 1
- 7 4 -

h

h

1

Quedan por determinar los límites de los interna

los Su,..#,S. • En principio podrían ser arbitrarios? sin

embargo es lógico que se dimensionen segán algún criterio

de optimizad ón matemático o económico o fijados por razo-

nes tecnológicas .

Por otra parte hay que indicar que el sistema de

formación del vector observación ( e 1 f . . . , e ) es diferente

del de (n-,,.. . , iO o 9 si se prefiere (n.. $. • . j * ^ . ) 9 ya que

n^ es inmediatamente calculable 9 pues el primero se obtenía

a través de una sucesión de medidas en los instantes

t1 , t p , . . . , t , • . . mientras que para el segundo se debo -

contar con un elemento no lineal que discretice la señal y (2)

un sistema contadorN

4.5. REGLA DE DECISIÓN BASADA EN LA LEY MULTINOMIAL,

Vamos a transformar la regla de decisión obteni-

da en la sección 4*3. introduciendo los resultados de la -

(1) Ver más adelante la sección 4.8 •

(2) Ver más adelante la sección 4.7 .
- 7 5 -

sección 4 .4 , para l o cual vamos a obtener l a nueva expre—

sión de . ^ . ( n ) .

Ahora se rá ;

JL±An) = log P ( n r . . . , n l l | a i , D ' ; . )

p ( n 1 , . . . , n h | a l , D p (4.10)

pero l a s probabi l idades multinomiales pueden s u s t i t u i r s e -

por sus va lores (4.8) y (4 .9) quedando

h h A±i(n) = ¿L n k l o g q k ( i , j ) - 2 ~ . n k l o g p k ( i , j ) (4.11)

k=1 k=1

pero, como ¿^nv = n , puede ponerse (4.11) a s í :

£ L 1 q k ( i , a )

k=i p k d , d )

h-1

k=1 log

^ ( i í j )

Pn(i»a)

y s impli f icando:

A± i (n) = n log ~x - ± - — - - 4- > ~ ii log

q.k(i»á) PhC1^')

p k ( i , j ) q . h ( i , j )

(4.12)

s i se desea puede ponerse de manif ies to que p ^ í i j j ) y -

q^(±,d) e s tán l i gadas a l a s o t r a s probabi l idades

h-1

1^(1,0') = 1 - 2 Z Pfc^1»^ = 1 " P i -k=1

(4.13a)
- 7 6 -

h-1 q i l ( i>3) = 1 - ^ " " q k ( i , 3 ) = 1 - Q i j

k=1

Con lo que se t i ene defini t ivamente?

(4.13b)

A±¿(n) = n log 1 - P .

h-1

k=1

id J

1 - p - •

L 1-QL-

q.ic(i»d)

p k( i»d) (4.14)

Como vicios en la sección 4 . 3 , l a r eg la de deci—

sión e s t a b l e c í a que: s i se cumplían simultáneamente l a s -

dos desigualdades

• 4 i , d - i ( n ) > l o g A i , ; H i

y l i ; j ( n ) 4 l o g B i ; j

se adoptaba l a decisión de conmutar e l cont ro lador de paró

metro aj ; en caso de no e x i s t i r ningún j que l a s cumplie

ra se seguía e l t e s t . Veamos ahora e l modo de t ransformar

dichas desigualdades que ahora se expresarán:
- 7 7 -

L I - P Ü J

±

+ • i d

33.-1

^1,0-1 + * ^ - 1 .(4-18a) k=1 h -1

E f i a k n k ^ b i ó + n f i j ( 4 ' l 8 b ) k=1

Por l o t a n t o l a r e g l a de d e c i s i ó n s e c u e n c i a l con

p r o b a b i l i d a d e s n u l t i n o m i a l e s puede e n u n c i a r s e a s í ;

REGIA

a ) Si cuando se t i e n e conmutado e l c o n t r o l a d o r -

de pa rámet ro a¿ y se e s t á en l a e t a p a n d e l t e s t se oum-
píen simultáneamente, para algún j, las desigualdadesi

h-1

k=1

h-1

71 fijk nk < bij * n f i j fc=1

teniendo f^^? ^ii> aij y bii l o s significados dados en —

(4.17d), (4*17c), (4.17b) y (4.17a), se conmuta el contro-

lador de parámetro a^ .

b) En caso contrario se sigue el test pasando a

la etapa n + 1 ,

Es perfectamente válida la observación hecha en

la sección 4.3 sobre el elemento de memoria del sistema.

4.6. TAMAÑO MEDIO DE LA MUESTRA,

Vamos ahora a ocuparnos de una cuestión que sólo

se aludió en el capítulo 3 y que, sin embargo, es fundamen

tal en todo proceso secuencials la del tamaño de la mues-

tra.

La justificación del análisis secuencial es do-

bles por un lado, que pudiéramos llamar "técnico", se tra-

ta de no prejuzgar el tamaño de la muestra sino de ir adajD

tando éste al problema y a la cantidad de información que

se vaya obteniendo5 de otra parte, que podría considerarse
-?9-

cono "económica", se pretende que el tamaño de la muestra

sea lo menor posible dados unos niveles de significación -

preestablecidos (es obvio que con muestras muy grandes., so

(1) tienen buenas estimaciones a costa de un gran precio) f

Por lo tanto es necesario dar contestación a dos

cuestiones básicass

1) ¿Se puede estar seguro de que el test termina

rá alguna vez?. 0, en otros términos, tiene respuesta afir

mativa la preguntas ¿Existe un tamaño finito de la muestra

tal que para él se llega siempre a una decisión?.

2) El citado tamaño de la muestra es una varia-—

ble aleatoria y no sólo nos interesa la certeza de que tie

ne un máximo finito sino también cuál es su valor medio.

Como es lógico no abordaremos aquí la problemati

ca general que plantean ambas cuestiones pues la misma no

es otra cosa que el tema básico del Análisis Secuencial. -

Solo enunciaremos algunos resultados importantes que nos -

permitirán resolver afirmativamente en nuestro problema ac

tual ambos interrogantes.

En primer lugar estableceremos algunos resulta—

(1) Cuando se habla de "costo", "economía", etc., puedo dar sele una significación monetaria para concretar, pero la cuestión es más amplia 5 piénsese, por ejemplo, en -una misión espacial y en el factor tiempo del muestreo.
- 8 0 -

dos de i n t e r é s s

1) Las razones de ve ros imi l i tud forman una ífmar-

t i n g a l a " ^ 1 ' (bajo condiciones bas tan te amplias sobre l a s -

d i s t r i b u c i o n e s que ent ran en e l c o c i e n t e ) . Es dec i r que s i

P n ( y 1 ? . . , , y n )

donde q-̂ Cy-j ,-•.-. ,yn) y P n (y 1 $ • • • »yn) representan l a s po-

s i b l e s probabi l idades de va r i ab le a l e a t o r i a ( y - j , . . . ,yn) , -

se t i e n e que l a sucesión de va r i ab l e s a l e a t o r i a s

es una mar t inga la .

2) Un teorema de l a t e o r í a de mar t ingalas asegu-

ra que, con probabi l idad 1, e x i s t e

l l n *n = XQD n - > 00

por otra parte -siempre que las dos distribuciones no sean

iguales- dicho límite es inferior a la unidad y, en el oa-

so de suponer las y^ independientes, por ejemplo, es nulo.

3) La identidad de Wald (o teorema fundamental -

(1) Véanse las Notas a este Capítulo.
- 8 1 -

d e l a n á l i s i s s ecue r i c i a l ) se e x p r e s a ; n

E <

1

[# MT = 1 (4 .19 )

s i e n d o : z ima variable compleja

Las ug variables aleatorias independientes con distribución coman.

En particular la sucesión n
m ""^s.. V ŝj

Si en la identidad de Wald se deriva respecto a

z se tienes n

I z Z u r e

E < c# ) 2a [f (2)]U Z^-n $W [J(z)] J U 0

haciendo z = o y simplificando quedas

i—n

E 2 1 u j - E(n) E (us) = O L 1

es decir : E

E(n) = GN E(us)

(4.21)

Podronos aplicar la fórmula a nuestro caso si ha

ceños n tamaño final de la nuestra y si las u las identi

ficanos con las razones de verosinilitud j]^ . Hay un peque

ño inconveniente y os el de que al hacer nuestro test —

9 (t)€Cj en realidad débenos contrastar dos hipótesis: -

£*(t)€D!¡ ., y ©*(t)6Dj ; por lo tanto el tamaño final de

la nuestra corresponderá al nayor de los dos de terminación

de cada uno de los tests que lo conponen y nos encontrare-

(1) Este resultado podría haberse obtenido por un razona niento directo (ver notas fin de capítulo).
- 8 3 -

nos de hecho con dos casos binarios. Es decir, prinero en-

contráronos

(4.22)

E l nune rador puede s e r c a l c u l a d o aproxima dáñente

por l a s i g u i e n t e c o n s i d e r a c i ó n : supónganos que -A. -«(r) t o (1)

na sienpre exactanentev ' los valores logiL-j y logB:^ 21 XJ J - j

a l a c a b a r e l t e s t y , por l o t a n t o , ^ j j j ^ ( r ) t i e n e s i e n p r e

t a l e s v a l o r e s con l a s p r o b a b i l i d a d e s r e s p e c t i v a s ^ - j i j 7

1- ^ - J Í ^ ( s i cono suponenos 9 ( t ) 6 D - ) y e n t o n c e s ;

1 « ( 1 - £ 1 J L . ) l o g B i ; j 4- £ r i . l ogA-y (4 .23 )

Por o t r a p a r t e e l denominador e s en n u e s t r o caso

de r e g l a d e r i v a d a de l a l e y n u l t i n o n i a l

E [A ± 3 (n)] = lo

h-1

+ j ~ - : P t ( i f d ) IOS k=1

cr 1 - Q j j -

- 1 - p i ^

; x

\

[~ 1 - p i j OfeCifá)"]

i H 1 - Q i á P k ( i f ó ) J

(4.24)

(1) Lo c u a l no p a s a r á r e a l n e n t e pero s í se t e n d r á que s u -p e r a r á poco t a l e s v a l o r e s .
- 8 4 -

ya que las p^Ci/j) Son l a s esperanzas matemáticas de l a s

frecuencias.

Por lo tantos

log Pjj .dfd) l o g L Í - Q i i Pk(i,D)J

(4.25)

Por consideraciones completamente análogas ten—

dríamos que

?2ili-D l0iBix¿zi * (1 ~ ia-úztl l0f Aizi-1 *

Y por lo tantos

r E kla^cj » SUP4E [n^a^D.,] , E [^a^D'^] (4.27)

Conviene señalar que E [nIa¿,C-;J depende, natu

raímente9 de la situación rea l (zona de 9* y controlador

conectado) de los niveles de probabilidad de los errores . j -

pero también está influido por la descomposición en i n t e r -
-85-

valos que se haya hecho en el campo de variabilidad de e(t)

-a través de los valores de p^Ci^j), qk(i,;j), etc.- y haoe . (1)

la elección de estos un problema delicado para el proyectov ;

En cuanto a la influencia de los errores es fácil

ver de quá orden es. Pensemos por un instante que todos los

errores ^-JÍJ» 211 ^»3 variando de 1 a N) son iguales a

£ y que, por consiguiente, todas las JLy y B̂ -? son igua

les a A y B j además

1 • - 6 • _ 1

€ B

y resulta que las dos expresiones de los numeradores'coin-

ciden en valor absoluto con (1 -2 £ ) logA que, con & pe-

queño, es aproximadamente del orden de (1-2 6 ) log |£ | .

Es decir que, con las demás variables fijas, el número de

etapas del test secuencial crece con el logaritmo de la -

probabilidad del error preestablecido.

4.7• ESQUEMA DE SISTEMA ADAPTIVO CON DISPOSITIVO DEOISOR.

Las ideas expuestas anteriormente nos van a per-

mitir dar un modelo de un sistema de control adaptivo con

(1) Ver, más adelante9 sección 4.8 .
-86-

elementos de decisión.

Sea un sistema a controlar con un parámetro v a -

riable ©*(t) y con un controlador con una característica

adaptable, a, de tal modo que dsta se elige a lo largo del

tiempo de modo que mantenga, a pesar de los cambios de —

9*(t), la salida optimizada, según algún criterio estable-

cido "a priori», y todo ello en presencia de perturbaciones

aleatorias.

r- Dispositivos adaptivos

Perturba' cíones— I

i

x(t) *i o(t)

Muestreador *n Calculador

Comparador

Decisor

-¡

l

Controlador conj "*"[ a regulable

Sistema a con-trolar con G* variable

*-y(t).

Figura 4.3

La figura 4.3 nos muestra esquemáticamente su mo

do de funcionamiento. Si queremos detallar más y, sobre to

do, introducir las variantes que hemos desarrollado a par-

tir de la regla multinomial nos será necesario pasar al —

diagrama en bloques más preciso de la figura 4.4 donde, en
"7

H Contador n

Memoria constan t e s y programa

r fcn Contador n 1

\^A "^O^f

n ,

Contador n. •h-1

i n. -̂ w h-1

* -

Calculador i a c tua l

-H l,,, b1 b ? j ^ S/í °°i

"n

Memoria i

i ac tua l

L
- 8 8 -

tro otras peculiaridades se destacans el carácter digital

de la característica adaptable a ; la forma de obtener la

ley multinomial sustitutiva de la real? cómo aplicar la re

gla decisoria resultante, etc. .

4.8. RECAPITULACIÓN Y COMPLEMENTOS.

Solo nos queda, antes de pasar a la aplicación -

de las técnicas descritas, hacer unos comentarios comple—

mentarios. Pero antes vamos a recapitular brevemente sobre

lo dicho.

a) Hemos establecido con las fórmulas (4#1) y -

(4.2) y la regla de la sección 4.3 un proceso de decisión

secuencial para sistemas adaptivos.

b) En la sección 4.4 hemos calculado una ley muí

tinomial aproximada a la distribución real.

c) En la sección 4.5, especialmente en las expre

siones (4.15) a (4.18), hemos sentado las bases de la r e —

gla de decisión que usaremos más adelante.

d) En la fórmula (4.27) hemos dado -una expresión

del tamaño medio de la muestra en el proceso de decisión.

Aún nos queda señalar que un punto sumamente im-

portante es el de la elección de los intervalos Sk en e(t)

para la formación de la distribución multinomialo Deben ele

girse de modo que la aproximación sea razonable (por ejem-

plo no deben contener masas de probabilidad muy desiguales.
-89-

y tener un número suficientemente amplio) % por otra parto

pueden escogerse, en algunos casos, de forma que se dismi-

nuya el tamaño medio de la muestra^ ' •

Tambidn es interesante recordar que algunas veces

podrán sustituirse los conjuntos D-j D1. por valores carao

i * terísticos que denominaremos O y ©.0*

(1) Ver notas.
- 9 0 -

NOTAS Y REFERENCIAS AL CAPITULO 4

-Se debe s e ñ a l a r l a ampl i ac ión de p e r s p e c t i v a s -

que se ha e f e c t u a d o , t a l vez s i n s u f i c i e n t e é n f a s i s , a l sus

t i t u i r l a medida de ©(t) por e l de c u a l q u i e r magnitud c a r a £

t e r í s t i c a d e l e s t a d o d e l s i s t e m a , por ejemplos l a s a l i d a o

l a s e ñ a l de e r r o r . Así puede imag ina r se que l a s per turbaci^o

n e s "entran f f en e l s i s t ema de c u a l q u i e r manera en vez de -

suponer un " r u i d o " p e r t u r b a d o r únicamente de

-Conviene i n s i s t i r en l a problema t i c i dad de un -

conocimiento e x a c t o de l a s p r o b a b i l i d a d e s "a p r i o r i " y tam

b i e n , como e s n a t u r a l , de l a p o s i b i l i d a d de c o n t a r con i n -

formación r u f i c i e n t e do l a s p r o p i e d a d e s e s t a d í s t i c a s d e l ~

ruidoo

-Además, .de l o s l i b r o s g e n e r a l e s de Cá lcu lo de Pr£

b a b i l i d a d e s y E s t a d í s t i c a , c i t a d o s a n t e r i o r m e n t e , se han -

u t i l i z a d o - p a r a a l g u n a s c u e s t i o n e s s u s c i t a d a s en é s t e - en

t r e o t r o s l o s s i g u i e n t e s §

F e l l e r , W.: "An I n t r o d u c t i o n t o P r o b a b i l i t y -

Thoory and i t s A p p l i c a t i o n s " , Wi ley , New York, I ( 2 § e d . ) ,

1957, I I , 1966.

Breiman, L . : " P r o b a b i l i t y " , Addison-Wesley, Rea-

d ing , 1968.

-La i d e a de u s a r v a r i a b l e s de B e r n o u i l l i en a p l i

c a c i o n e s c i b e r n é t i c a s de l a T e o r í a de l a Dec i s ión e s de —
- 9 1 -

Blasbalg, H#; "The R