UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I...

37
1 UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I. INTRODUCCIÓN En esta unidad el alumno conocerá métodos de análisis básicamente aplicables en contextos en los cuales los hechos o los cursos de acción posibles y sus consecuencias se caracterizan por ser inciertos, y por lo tanto el análisis probabilístico se hace fundamental. Los métodos que comprende la unidad serán tratados en su forma más básica dado que un tratamiento a fondo de estos temas queda fuera del alcance de este texto cuyo objetivo principal es que el alumno comprenda la utilidad de estas metodologías en el área económico-administrativa. El estudio de las cadenas de Markov se restringe a los casos de un número finito de estados y de probabilidades de transición estacionarias. En el caso de la teoría de juegos se estudian los juegos de dos participantes y de suma cero. 1. OBJETIVOS DE LA UNIDAD Al final de esta unidad el alumno deberá ser capaz de : Reconocer una cadena de Markov Describir una cadena de Markov en forma matricial Determinar e interpretar las probabilidades de transición Calcular e interpretar las probabilidades de transición para estado estable Aplicar cadenas de Markov en ciertas áreas de la Administración Comprender la naturaleza de la teoría de juegos Aplicar la teoría de juegos en problemas simples

Transcript of UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I...

Page 1: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

1

UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES

I. INTRODUCCIÓN En esta unidad el alumno conocerá métodos de análisis básicamente aplicables en contextos en los cuales los hechos o los cursos de acción posibles y sus consecuencias se caracterizan por ser inciertos, y por lo tanto el análisis probabilístico se hace fundamental. Los métodos que comprende la unidad serán tratados en su forma más básica dado que un tratamiento a fondo de estos temas queda fuera del alcance de este texto cuyo objetivo principal es que el alumno comprenda la utilidad de estas metodologías en el área económico-administrativa. El estudio de las cadenas de Markov se restringe a los casos de un número finito de estados y de probabilidades de transición estacionarias. En el caso de la teoría de juegos se estudian los juegos de dos participantes y de suma cero. 1. OBJETIVOS DE LA UNIDAD Al final de esta unidad el alumno deberá ser capaz de : • Reconocer una cadena de Markov • Describir una cadena de Markov en forma matricial • Determinar e interpretar las probabilidades de transición • Calcular e interpretar las probabilidades de transición para estado estable • Aplicar cadenas de Markov en ciertas áreas de la Administración • Comprender la naturaleza de la teoría de juegos • Aplicar la teoría de juegos en problemas simples

Page 2: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

2

II. ACTIVIDADES DE ENTRADA En esta unidad el alumno deberá aplicar sus conocimientos de los siguientes temas : • conceptos elementales de la teoría de probabilidades. • probabilidades condicionales. • esperanza o valor esperado. • operaciones con matrices. • resolución de sistemas de ecuaciones lineales . Ejercicios i) Si los sucesos disjuntos E1, E2, E3 y E4 conforman un espacio de muestra, ¿cuál es el valor de E1 + E2 + E3 + E4?

ii) Si

y

Obtenga : A*B, B2 , C3 , B*C

=

6,01,03,03,02,05,07,02,01,0

C

=

211056

A

=

11726

B

( )2,035,045,0=V

Page 3: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

3

iii) Resuelva :

X1 + X2 - 2X3 = 12 2X1 + 4X2 -6X3 = 15 7X1 + 10X2 -3X3 = 10

0,1P1 + P2 – 0,2P3 – 0,3P4 = 2 0,2P1 + 0,4P2 –0,6P3 + 0,1P4 = 5 -0,1P1 + 0,2P2 –0,1P3 + 0,3P4 = 0 P1 + P2 + P3 + P4 = 1

Se recuerda al alumno que estos temas ya han sido tratados y se encuentran desarrollados en los libros de Estadística y Matemáticas correspondientes al programa de educación a distancia.

Page 4: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

4

III. DESARROLLO DE CONTENIDOS CAPÍTULO PRIMERO: CADENAS DE MARKOV 1. Proceso estocástico y Cadena de Markov Una sucesión de observaciones X1, X2, X3,. . . se denomina proceso estocástico o proceso aleatorio , porque los valores de estas observaciones o estados del proceso no se pueden predecir de antemano, pero se pueden especificar las probabilidades de ocurrencia para los distintos valores en cualquier instante del tiempo. En un proceso estocástico la primera observación X1 se denomina estado inicial del proceso y para n = 2, 3, . . . la observación Xn se denomina estado del proceso en el instante de tiempo n. Ejemplo: El número de atrasos por día registrados en una empresa. Correspondería a un proceso estocástico porque no se puede decir con certeza cuántos atrasos se van a registrar, por ejemplo, el próximo lunes o el miércoles de la próxima semana, pero es posible asignar probabilidades a los estados posibles (0 atrasos, 1 atraso, 2 atrasos, ...) Una cadena de Markov o proceso de Markov es un tipo especial de proceso estocástico en el cual para cualquier instante de tiempo dado cuando el estado actual y todos los estados previos del proceso son conocidos, las probabilidades de los estados futuros dependen solamente del estado actual y no dependen de los estados anteriores, dicho de otro modo si se tiene una serie de eventos, la probabilidad de que ocurra un evento depende del evento inmediatamente anterior. Por este motivo se dice que estos procesos tienen memoria, “recuerdan” el último evento, lo que condiciona las probabilidades de ocurrencia de eventos futuros. ACTIVIDADES DE APRENDIZAJE Analicemos las situaciones siguientes: a) Se observa cada día el estado de salud de una persona. Corresponde a un proceso estocástico, dado que el estado de salud de una persona en un día determinado no se puede establecer con certeza de antemano, pero se puede asignar probabilidades a los estados de salud posibles. En esta situación se puede plantear que la probabilidad de que una persona se encuentre en un determinado estado de salud en un día determinado depende principalmente de su estado de salud el día inmediatamente anterior, y en tal caso se puede representar esta serie de observaciones por una cadena de Markov. b) Se observa la cara superior de un dado al lanzarlo repetidas veces. Es claro que el resultado del lanzamiento de un dado no se puede predecir con certeza, pero podemos calcular las probabilidades de ocurrencia de cada resultado posible. En este caso el proceso estocástico no corresponde a una cadena de Markov ya que el resultado de lanzar un dado en una oportunidad cualquiera es independiente del resultado obtenido en la oportunidad anterior.

Page 5: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

5

Formalmente, una cadena de Markov es un proceso estocástico tal que para n = 1, 2, 3, . . . y para cualquier sucesión posible de estados x1, x2, x3, . . . , xn+1 , P(X n+1= xn+1 / X1 = x1 , X2 = x2 , . . . , Xn = xn ) = P(X n+1= xn+1 / Xn = xn ) Este método, que debe su nombre al matemático ruso Markov que lo desarrolló en el año 1907, permite encontrar la probabilidad de que un proceso o sistema se encuentre en un estado en particular en un momento dado. Ejemplo : Suponga que una empresa financiera tiene 3 cajas para la atención de clientes y en un instante de tiempo dado puede haber un número cualquiera de cajas ocupadas. Se observan las cajas cada 3 minutos anotando el número de ellas que están ocupadas en ese instante. Entonces para n = 1,2,. . . , Xn representa el número de cajas ocupadas cuando se observan en el instante de tiempo n-ésimo, así X2 representa el número de cajas ocupadas cuando se observan en el instante de tiempo 2, X6 representa el número de cajas ocupadas cuando se observan en el instante de tiempo 6, etc. Este proceso será una cadena de Markov si la probabilidad de que en un instante de tiempo haya un número determinado de cajas ocupadas depende solo del número de cajas ocupadas en el instante de tiempo de observación inmediatamente anterior. 1.1. Cadenas de Markov finitas con probabilidades de transición estacionarias. Si tenemos una cadena de Markov para la cual existe sólo un número finito k de estados posibles e1 , e2 , . . . , ek y en cualquier instante de tiempo la cadena debe estar en uno de estos k estados, entonces ésta se denomina cadena de Markov finita . La probabilidad condicional P(X n+1= ej / Xn = ei ) de que la cadena de Markov esté en el estado ej en el instante de tiempo n+1 si está en el estado ei en el instante de tiempo n se denomina probabilidad de transición. Si para una cadena de Markov esta probabilidad de transición tiene el mismo valor para todos los instantes de tiempo n ( n = 1, 2, 3, . . . ), se dice que la cadena de Markov tiene probabilidades de transición estacionarias. Dicho de otro modo, una cadena de Markov tiene probabilidades de transición estacionarias si, para cualquier par de estados ei y ej existe una probabilidad de transición tal que : P(X n+1= ej / Xn = ei ) = pij para n = 1, 2, 3, . . .

Page 6: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

6

Esquemáticamente :

Figura 1. Esquema de una cadena de Markov con 2 estados posibles

En nuestro ejemplo los estados posibles de la cadena en los distintos tiempos son : e1 = 0 cajas ocupadas, e2 = una caja ocupada, e3 = dos cajas ocupadas y e4 = tres cajas ocupadas 1.1.1. Matriz de probabilidades de transición para un solo paso. Consideremos una cadena de Markov con k estados posibles e1 , e2 , . . . , ek y probabilidades de transición estacionarias pij con i = 1, . . . , k y j = i = 1, . . . , k , entonces la matriz de probabilidades de transición de la cadena de Markov se define como la matriz P con elementos pij , es decir :

Figura 2. Matriz de probabilidades de transición para un solo paso

=

kkkk

k

k

ppp

pppppp

P

......

...

...

...

.

.

.

.

.

.......

21

22221

11211

Page 7: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

7

Aquí :

y

También la matriz de probabilidades de transición podemos representarla así :

A :

e1 e2 . . . ek

e1 p11 p12 . . . p1k

De : e2 p21 p22 . . . p2k .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

ek pk1 pk2 . . . pkk

Figura 3. Esquema de la matriz de probabilidades de transición para un solo paso Ejemplo : Para el caso en estudio supongamos que el número de cajas que están ocupadas en los instantes de tiempo 1, 2, . . . es una cadena de Markov con probabilidades de transición estacionarias. Supóngase también que la matriz de transición P es la siguiente:

A :

e1 e2 e3 e4

e1 0,1 0,5 0,3 0,1 De : e2 0,2 0,3 0,4 0,1 e3 0,2 0,3 0,3 0,2 e4 0,1 0,2 0,3 0,4

Figura 4. Matriz de probabilidades de transición para un solo paso para el caso del estudio de las

cajas de una empresa financiera

ipk

jij ∀=∑

=

,11

jipij ,,10 ∀≤≤

Page 8: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

8

Aquí : e1 : El número de cajas ocupadas es 0 e2 : El número de cajas ocupadas es 1 e3 : El número de cajas ocupadas es 2 e4 : El número de cajas ocupadas es 3 p12 = 0,5 es la probabilidad de que la cadena se encuentre en el estado 2 (e2), dado que en el instante de tiempo inmediatamente anterior se encontraba en el estado 1 (e1), es decir es la probabilidad de que en un instante de tiempo haya una caja ocupada dado que en el instante de tiempo inmediatamente anterior no había cajas ocupadas. En otras palabras, suponiendo que en un instante de tiempo no hay cajas ocupadas, la probabilidad de que en el instante de tiempo siguiente haya una caja ocupada es 0,5. ACTIVIDADES DE APRENDIZAJE • ¿Que indica p34? Respuesta : Suponiendo que en un instante de tiempo hay 2 cajas ocupadas, la probabilidad de que en el instante de tiempo siguiente haya 3 cajas ocupadas es 0,2. • Si en un instante de tiempo hay 2 cajas ocupadas, ¿cuál es la probabilidad de que en el instante

de tiempo siguiente haya al menos una caja ocupada? Respuesta : 0,3+0,3+0,2 = 0,8 Como en todo modelo teórico, los supuestos bajo los cuales se desarrollan se deben cumplir para su aplicación óptima, pero en situaciones reales esto es muy discutible en la mayoría de los casos. En la situación que estamos estudiando, para que las probabilidades de transición sean estacionarias el supuesto es que no deben existir instantes de tiempo en los cuales se concentre un gran flujo de público en las cajas, ni instantes de tiempo prolongados en los cuales no haya flujo de público. 1.1.2. Matriz de transición para varios pasos. Consideremos una cadena de Markov con k estados posibles e1 , e2 , . . . , ek y una matriz de transición P y supongamos que la cadena está en el estado ei en un instante de tiempo n. La probabilidad de que la cadena esté en el estado ej en el instante de tiempo n +2 es : pij

(2) = P(Xn+2 = ej / Xn = ei ) El valor de pij

(2) se puede determinar elevando al cuadrado la matriz de transición P , es decir P2 =P*P, entonces el elemento de la fila i-ésima y la columna j-ésima de la matriz P2 será pij

(2) . En general se tiene que para cualquier valor de m (m=2,3,. . . ), la m-ésima potencia de la matriz P, es decir Pm, será la matriz de transición de m pasos de la cadena de Markov y proporcionará la probabilidad pij

(m) de que la cadena pase de cualquier estado ei a cualquier estado ej en m pasos.

Page 9: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

9

Ejemplo: En el caso de la empresa financiera la matriz de transición de 2 pasos (P2) queda dada por:

A : e1 e2 e3 e4 e1 0,18 0,31 0,35 0,16 De : e2 0,17 0,33 0,35 0,17 e3 0,16 0,32 0,33 0,19 e4 0,15 0,28 0,32 0,25

Figura 5. Matriz de probabilidades de transición para 2 pasos para el caso del estudio de las cajas de

una empresa financiera. Esta matriz muestra la probabilidad de que, si i cajas están ocupadas en un instante de tiempo, haya exactamente j cajas ocupadas dos instantes de tiempo después. Así : P32

(2) indica que si 2 cajas están ocupadas en un instante de tiempo concreto, entonces la probabilidad de que dos instantes de tiempo después haya exactamente una caja ocupada es 0,32 1.1.3. Vector de probabilidades iniciales Consideremos una cadena de Markov finita con k estados posibles e1 , e2 , . . . , ek y que la cadena puede estar en cualquiera de estos k estados en un tiempo de observación inicial n=1. Además supongamos que la probabilidad de que la cadena esté en el estado ei al inicio del proceso es vi para i = 1 , . . . , k con v1 + v2 + . . . + vk = 1 , es decir , V = (v1 . . . vk) es el vector de probabilidades iniciales de la cadena. Entonces las probabilidades de los diversos estados en el instante de tiempo n+1 se especifican por el vector de probabilidades V*Pn Ejemplo: Consideremos la cadena de Markov constituida por el número de cajas ocupadas en distintos instantes de tiempo con matriz de transición P dada anteriormente (figura 4). Supongamos que al inicio de un proceso de observación (instante de tiempo 1) las probabilidades de los diferentes posibles estados son : P(e1) = 0,2 P(e2) = 0,4 P(e3) = 0,3 P(e4) = 0,1 Es decir que para el instante de observación inicial existe una probabilidad de 0,2 de no tener cajas ocupadas, una probabilidad de 0,4 de tener una caja ocupada, etc.

Page 10: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

10

Aquí : P(e1) = v1 , P(e2) = v2 , P(e3) = v3 y P(e4) = v4 Es decir el vector de probabilidades iniciales es V= (0,2 ; 0,4 ; 0,3 ; 0,1) Entonces las probabilidades para cada estado en el instante de tiempo 2 están dadas por:

Estos resultados se interpretan así : • Si al inicio del proceso existe una probabilidad de 0,2 de no tener cajas ocupadas, la

probabilidad de que no haya cajas ocupadas en el instante de tiempo 2 (instante de tiempo siguiente) es 0,17

• Si al inicio del proceso existe una probabilidad de 0,3 de tener 2 cajas ocupadas, la probabilidad de que haya 2 cajas ocupadas en el instante de tiempo 2 es 0,34

ACTIVIDADES DE APRENDIZAJE • Para obtener las probabilidades para cada estado en el instante de tiempo 3 se debe obtener el

vector resultante de V*P2 Entonces :

De aquí tenemos que si al inicio del proceso existe una probabilidad de 0,1 de tener 3 cajas ocupadas dos instantes de tiempo después esta probabilidad es de 0,182. • Realizando los calculos para el tiempo 4 obtenemos:

(0,165 0,315 0,332 0,188) 1.1.4 Probabilidades de estado estable Las cadenas de Markov poseen una propiedad en cuanto a la convergencia de las probabilidades hacia un límite, es decir hacia un estado estable. En el caso que estamos analizando vemos que : Tiempo P(e1) P(e2) P(e3) P(e4) 1 0,2 0,4 0,3 0,1 2 0,17 0,33 0,34 0,16 3 0,167 0,318 0,333 0,182 4 0,1651 0,3152 0,3318 0,1879 5 0,1647 0,3142 0,3315 0,1896 6 0,1646 0,3140 0,3314 0,1900

( ) ( )16,034,033,017,0

4,03,02,01,02,03,03,02,01,04,03,02,01,03,05,01,0

1,03,04,02,0* =

=PV

( ) ( )182,0333,0318,0167,0

25,032,028,015,019,033,032,016,017,035,033,017,016,035,031,018,0

1,03,04,02,0* 2 =

=PV

Page 11: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

11

Esta propiedad no significa que se alteran las probabilidades de transición, solo muestran el comportamiento de la cadena en el largo plazo. En muchas aplicaciones estas probabilidades de estado estable tienen gran importancia. Para encontrar las probabilidades de estado estable se debe construir un sistema de ecuaciones simultáneas de la siguiente forma :

De este modo las ecuaciones para el ejemplo que tratamos serían :

P(e1) = p11 P(e1) + p21 P(e2) + p31 P(e3) + p41 P(e4) P(e2) = p12 P(e1) + p22 P(e2) + p32 P(e3) + p42 P(e4) P(e3) = p13 P(e1) + p23 P(e2) + p33 P(e3) + p43 P(e4) P(e4) = p14 P(e1) + p24 P(e2) + p34 P(e3) + p44 P(e4) P(e1) + P(e2) + P(e3) + P(e4) = 1

P(e1) = 0,1 P(e1) + 0,2 P(e2) + 0,2 P(e3) + 0,1 P(e4) P(e2) = 0,5 P(e1) + 0,3 P(e2) + 0,3 P(e3) + 0,2 P(e4) P(e3) = 0,3 P(e1) + 0,4 P(e2) + 0,3 P(e3) + 0,3 P(e4) P(e4) = 0,1 P(e1) + 0,1 P(e2) + 0,2 P(e3) + 0,4 P(e4) P(e1) + P(e2) + P(e3) + P(e4) = 1

Luego :

-0,9 P(e1) + 0,2 P(e2) + 0,2 P(e3) + 0,1 P(e4) = 0 0,5 P(e1) - 0,7 P(e2) + 0,3 P(e3) + 0,2 P(e4) = 0 0,3 P(e1) + 0,4 P(e2) - 0,7 P(e3) + 0,3 P(e4) = 0 0,1 P(e1) + 0,1 P(e2) + 0,2 P(e3) – 0,6 P(e4) = 0 P(e1) + P(e2) + P(e3) + P(e4) = 1 Para resolver este sistema es absolutamente necesario considerar la última ecuación con cualesquiera 3 de las otras.

1)(

)()(

1

1

=

=

=

=

n

jj

n

iiijj

eP

ePpeP

Page 12: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

12

Resolviendo tenemos : P(e1) = 0,165 P(e2) = 0,314 P(e3) = 0,331 P(e4) = 0,190 Esto significa que en el largo plazo la probabilidad de que no haya cajas ocupadas es 0,165 ; la probabilidad de que haya una caja ocupada es de 0,314. La misma interpretación se dá para los otros estados de la cadena.

Page 13: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

13

CAPÍTULO SEGUNDO : TEORÍA DE JUEGOS 1. ¿Qué es la Teoría de juegos? La Teoría de Juegos fué creada por el gran matemático húngaro John von Neuman (1903-1957), quién junto al economista matemático Oskar Morgenstern escribió el libro The Theory of Games and Economic Behavior, publicado en 1944. Posteriormente otros investigadores como Kuhn, Shapley y Nash hicieron nuevas contribuciones a la naciente disciplina. Pero no es hasta mediados de la década de los ochenta que se empieza a impartir como cátedra en las universidades. Como resultado, lo que la teoría de juegos prometía en un principio se está empezando a cumplir. En los últimos años, sus aplicaciones en la teoría económica y en otras áreas del conocimiento van en aumento. En esta teoría el concepto de juego no necesariamente se refiere a las actividades lúdicas que conocemos y que desarrollamos en forma individual o grupal, la palabra juego se refiere a un tipo especial de conflicto en el que toman parte dos o más individuos o grupos (los jugadores). Se realiza un juego cada vez que unos individuos se relacionan con otros. Los postores en un remate están llevando a cabo un juego. Cuando una persona toma una decisión sobre el precio al que intentará vender su mercadería está realizando un juego con sus clientes y con los negocios de la competencia. También están desarrollando un juego una empresa y un sindicato en el proceso de negociación colectiva. El llamarle “juegos” a las situaciones mencionadas anteriormente no significa que se trate de modo superficial los problemas que afectan a las personas. Un juego incluye dos o más jugadores en conflicto que buscan ganar maximizando su propio beneficio, cada uno suponiendo que los demás jugadores actuarán racionalmente. El resultado del juego depende de las acciones que toma cada uno de los jugadores. Reinhard Selten, premio Nobel de economía en el año1994, define a la teoría de juegos como un “análisis matemático que modela los conflictos en competencia” y agrega que es una “herramienta para el análisis y, en algunos casos, puede dar ciertas recomendaciones sobre qué hacer en una situación concreta; pero esto es raro, porque las situaciones reales son demasiado complejas para modelarlas completamente”. Von Neumann y Morgenstern investigaron dos planteamientos distintos de la teoría de juegos. El primero de ellos es el planteamiento estratégico o no cooperativo. Este planteamiento requiere especificar muy detalladamente lo que los jugadores pueden y no pueden hacer durante el juego, y después buscar para cada jugador una estrategia óptima. Aquí, ni siquiera está claro qué puede querer decir óptimo en este contexto. Lo que es mejor para un jugador depende de lo que los otros jugadores piensan hacer, y esto a su vez depende de lo que ellos piensan que el primer jugador hará. Von Neumann y Morgenstern resolvieron este problema en el caso particular de juegos con dos jugadores. Los juegos de dos personas son los más fáciles de analizar; aquellos con más de dos jugadores presentan mayores dificultades analíticas para encontrar su solución. 2. Estrategia En teoría de juegos, el término estrategia significa curso de acción. En los negocios, por ejemplo, puede disponerse de una gran variedad de estrategias competitivas, que incluyen reducción de precios, publicidad, introducción de un nuevo producto, la prestación de un mejor servicio, etc.

Page 14: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

14

3. Juegos de suma cero y de suma distinta de cero Cualquier juego en que las ganancias de los ganadores igualan exactamente a las pérdidas de los perdedores se llama un juego de suma cero. Ejemplos de esto son las apuestas amistosas con los amigos. La suma algebraica de los pagos es cero. Un juego en el cual existe una diferencia entre las ganancias y las pérdidas se llama un juego de suma distinta de cero. Si la competencia entre dos negocios extiende su mercado total, ambos reciben pagos positivos y se obtiene una suma total distinta de cero. Los juegos de suma no cero son mas dificiles de analizar. En este capítulo se revisan los juegos de dos personas y suma cero, ya que la teoría correspondiente está bien desarrollada. Aunque éstos son un tipo muy sencillo de juego, se han encontrado algunas aplicaciones en política internacional , en relaciones obrero-patronales, en el análisis de políticas dobles, en comercialización, en la planeación empresarial, entre otras. 4. La matriz de pagos o matriz de consecuencias En la teoría de juegos las acciones posibles que puede tomar un jugador se denominan estrategias. En un juego cada decisión o cada estartegia que tome un jugador traerá consigo una pérdida o una ganancia, la cuál también dependerá de la decisión que tomen él o los oponentes. Tales valores se denominan pagos y se presentan en una matriz para analizar el juego. Esta matriz de pagos es una forma esquemática de presentar las acciones posibles de los jugadores y sus pagos asociados. El tamaño de la matriz está determinado por el número de jugadores y el número de estrategias disponibles. Los jugadores pueden tener diferente número de estrategias, así el jugador A puede tener 3 estrategias y el jugador B disponer de 4 estrategias, entonces la matriz tendría 3 filas y 4 columnas. La matriz de pagos tendrá tantas dimensiones como jugadores participen en el juego, de este modo para juegos con mas de 2 jugadores no podría representarse graficamente la matriz de pagos pero si podría trabajarse algebraicamente. En la matriz de pagos los números que se utilizan expresan unidades en una escala de utilidad para ambos jugadores. Esto quiere decir que podrían representar millones de pesos, unidades de venta, porcentajes de participación de mercado, etc. En este texto solo se estudiará el caso de dos jugadores. 4.1. La matriz de pagos para juegos de suma cero Dado que en los juegos de suma cero lo que gana un jugador lo pierde el oponente, por convención sólo se anotan en la matriz los pagos correspondientes al jugador cuyas estrategias aparecen como las filas de la matriz; los pagos del oponente son los mismos pero con signo contrario. Ejemplo :

Jugador B B1 B2 Jugador A

A1

1

-3

A2

2

1

Figura 1. La matriz de pagos para un juego se suma cero.

Page 15: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

15

Aquí se puede ver que el jugador A tiene dos estrategias posibles A1 y A2 , el jugador B a su vez puede optar por las estrategias B1 y B2 . Si el jugador A opta por la estrategia A1 y el jugador B opta por la estrategia B1 entonces el jugador A gana 1 , lo mismo que pierde el jugador B. Ahora si el jugador A opta por la estrategia A1 y el jugador B decide la estrategia B2 entonces el jugador A pierde 3 y el jugador B gana 3; asimismo si el jugador A opta por la estrategia A2 y el jugador B opta por la estrategia B1 entonces el jugador A gana 2 y el jugador B pierde 2, y si el jugador A opta por la estrategia A2 y el jugador B opta por la estrategia B2 entonces el jugador A gana 1 y el jugador B pierde 1. La matriz de pagos desde el punto de vista del jugador B sería :

Jugador B

B1 B2

Jugador A

A1

-1

3

A2

-2

-1

Figura 2. La matriz de pagos desde el punto de vista del jugador B. 4.2. La matriz de pagos para juegos de suma distinta de cero Para juegos de suma distinta de cero la matriz de pagos incluiría los pagos de ambos jugadores. Ejemplo :

Jugador 2

B1 B2 Jugador 1 A1 1,2 -1,3

A2 -2,2 -1,-1

Figura 3. La matriz de pagos para un juego se suma distinta de cero. En este caso si el jugador 1 opta por la estrategia A1 y el jugador 2 opta por la estrategia B1 entonces el jugador 1 gana 1 y el jugador 2 gana 2, es decir, ambos tienen pagos positivos, ambos tienen ganancia. Si el jugador 1 opta por la estrategia A1 y el jugador 2 opta por la estrategia B2 entonces el jugador 1 pierde 1 y el jugador 2 gana 3 El caso mas recurrido para ilustrar un juego de suma distinta de cero en los textos que tratan la teoría de juegos es el llamado dilema del prisionero. (ver bibliografía)

Page 16: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

16

5. Solución del juego: estrategias puras y estrategias mixtas Una vez que se ha planteado la situación en conflicto como un juego es necesario encontrar formas de resolverlo, es decir, se debe encontrar la forma en que jugadores racionales jugarían el juego con el objetivo de ganar. Una estrategia pura es aquella acción que se toma con certeza. Una estrategia mixta es una distribución probabilística asociada al conjunto de las acciones disponibles que tienen los jugadores. Para determinar si el juego tiene como solución una estrategia pura o una estrategia mixta se deben examinar los criterios maximin y minimax . 5.1. El criterio maximin Uno de los resultados más importantes de la teoría de juegos para los juegos de dos personas suma cero es que la estrategia óptima se encuentra aplicando el criterio de decisión maximin. Esto es cierto para ambos jugadores. Este es un criterio pesimista y consiste en examinar los peores resultados (o mínimos) y se selecciona el mejor (o máximo) de éstos. Así, se está maximizando el pago mínimo. Ejemplo : Considere la matriz de pagos para el juego suma cero mostrado anteriormente. Para el jugador 1 se anotan los pagos mínmos para cada una de sus acciones posibles, es decir el valor mínimo por fila. De estos mínimos se selecciona el valor máximo.

Jugador 2

B1 B2 Mínimos

Jugador 1

A1 1 -3 -3

A2 2 1 1 maximin

Figura 4. Determinación de la estrategia maximin La estrategia maximin del jugador 1 consiste en elegir A2

Page 17: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

17

Dado que los pagos en la matriz se presentan para el jugador 1 el procedimiento debe invertirse para el jugador 2, esto es, se anotan los pagos máximos para cada una de sus acciones posibles, es decir el valor máximo por columna, y a continuación se selecciona el valor mínimo.

Jugador 2

B1 B2

Jugador 1 A1 1 -3

A2 2 1

Máximos 2 1

� minimax

Figura 5. Determinación de la estrategia minimax La estrategia minimax del jugador 2 consiste en elegir B2. Este resultado corresponde al criterio maximin cuando se resuelve con la matriz de pagos desde el punto de vista del jugador 2. 5.2. El punto de silla de montar Si el valor maximin obtenido para un jugador es igual al valor minimax obtenido para otro se dice que el juego tiene un punto de silla de montar (o punto de inflexión). ACTIVIDADES DE APRENDIZAJE • Para el caso de la figura 1 teníamos lo siguiente

Jugador B

B1 B2 Mínimos

Jugador A

A1 1 -3 -3

A2 2 1 1 maximin

Máximos 2 1

minimax

Figura 6. Un juego con punto de silla de montar.

Page 18: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

18

En este caso tenemos un juego con un punto de silla de montar dado que el valor maximin para el jugador A es igual al valor minimax del jugador B. • Consideremos ahora otro juego Empresa Y

A B C Mínimos

A 5 4 0 0 maximin

Empresa X B 2 0 -2 -2

C -6 -5 5 -6

Máximos 5 4 5

� minimax

Figura 7. Un juego sin punto de silla de montar. Como el valor maximin ( 0 ) para la empresa X es distinto del valor minimax (4) de la empresa Y este juego no tiene un punto de silla de montar. Cuando un juego posee un punto de silla de montar entonces tiene como solución una estrategia pura; si no lo posee entonces la solución será la aplicación de una estrategia mixta. Un juego puede tener más de un punto de silla de montar. 5.3. Estrategias puras En los juegos de estrategias puras cada jugador tiene sólo una estrategia óptima, la cual corresponde a aquella en que se produce el punto de silla de montar o punto de inflexión. Por ejemplo para el caso analizado en la figura 6 en que intervienen el jugador A y el jugador B la estrategia pura consiste en que el jugador A elija siempre la estrategia A2 y el jugador B elija siempre la estrategia B2. 5.3.1.Valor del juego El pago promedio recibido en cada entrada del juego o valor promedio que se gana o se pierde si el juego se realiza muchas veces se llama valor del juego. En el caso de estrategias puras corresponde al valor maximin para un jugador y minimax para el otro jugador. En el ejemplo de la figura 6 el valor del juego para el jugador A es 1 y para el jugador B es -1, es decir el jugador A gana en promedio 1 los mismos que pierde el jugador B, dado que este es un juego de suma cero. Resumen de juegos de estrategia pura El análisis de juegos de estrategia pura puede resumirse como sigue:

Page 19: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

19

1. Desarrollo de la matriz de pagos. 2. Identificación de los pagos mínimos por fila y selección del mayor como la estrategia maximin

del jugador 1. 3. Identificación de los pagos máximos por columna y selección del menor como la estrategia

maximin del oponente. 4. Si el valor maximin es igual que el valor minimax, el juego es de estrategia pura. 5.4. Estrategias mixtas Si un juego no tiene punto de silla de montar entonces ninguno de los jugadores tiene una sola estrategia óptima y por lo tanto la solución será utilizar una estrategia mixta, es decir, usar una estrategia en algunas jugadas y otra en el resto de las jugadas. ¿Qué proporción de las veces utilizar una u otra estrategia?

Jugador II

C D Mínimos

Jugador I

A 1 -2 -2 maximin

B -3 1,5 -3

Máximos 1 1,5

minimax

Figura 8. Un juego 2x2 sin punto de silla de montar Para encontrar la distribución probabilística asociada al conjunto de las acciones disponibles que tienen los jugadores se deben igualar los valores esperados para cada estrategia. Considérese el ejemplo de la figura 8. Si el jugador I selecciona la estrategia A p% del tiempo, y la estrategia B (1- p)% del tiempo. Si el jugador II juega la estrategia C, el pago esperado para el jugador I es:

1p + (-3)(1-p) = 4p -3 Si el jugador II juega la estrategia D, el pago esperado es -2p + 1,5(1-p) = 1,5 –3,5p

Jugador II C D

Jugador I A (p) 1 -2 B (1-p) -3 1,5

Figura 9. Esquema de la matriz para determinar la estrategia mixta del jugador I

Page 20: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

20

Igualando los dos pagos esperados, 4p –3 = 1,5 –3,5p

7,5p = 4,5

p = 0,6 En este caso las proporciones óptimas son :

De este modo como p representa la proporción de veces que el jugador I debe jugar con la estrategia A, entonces concluimos que la estrategia mixta para el jugador I consiste en seleccionar la estrategia A el 60% de las veces, y la estrategia B el 40%. de las veces.

¿Cuál será la estrategia mixta para el jugador II? Para encontrar la estrategia mixta del jugador II se realiza el mismo procedimiento pero tomando en cuenta que los signos de los pagos que aparecen en la matriz deben invertirse. Si el jugador II selecciona la estrategia C q % del tiempo, y la estrategia D (1- q) % del tiempo y si el jugador I juega la estrategia A, el pago esperado para el jugador II es: -q + 2(1-q) = -3q + 2 Si el jugador I juega la estrategia B, el pago esperado es 3q + (-1,5)(1-q) = 4,5q –1,5

Jugador II

C D q (1-q)

Jugador I

A -1 2

B 3 -1,5

Figura 10. Esquema de la matriz para determinar la estrategia mixta del jugador II

5,73)1(

5,75,4

=−

=

p

y

p

Page 21: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

21

Igualando los dos pagos esperados,

-3q + 2 = 4,5q –1,5 7,5q = 3,5 q = 3,5 / 7,5 q = 0,467

Así las proporciones óptimas son :

Entonces la estrategia mixta del jugador II consiste en seleccionar la estrategia C el 47% de las veces, y la estrategia D el 53%. de las veces. Una vez determinadas las proporciones óptimas para las estrategias de un jugador, éste debería seleccionar en forma aleatoria cuál de estas utilizará en cada entrada del juego. De este modo el oponente no sabrá cuál estrategia será usada la siguiente vez. 5.4.1. Valor del juego Para encontrar el valor del juego, ganancia o pérdida esperada si se juega gran cantidad de veces, cuando se utiliza una estrategia mixta se determina el valor esperado para cualquiera de las estrategias del otro jugador utilizando las proporciones óptimas. En el caso del ejemplo el jugador I tiene un valor del juego de:

Para el jugador II :

Dado que este es un juego de suma 0, la suma de los pagos esperados debe ser 0. El jugador I perderá, en promedio, 0,6 en el largo plazo, lo mismo que el jugador II ganará en promedio en el largo plazo.

5,74)1(

5,75,3

=−

=

q

y

q

6,05,7

3)3(7,54,51 juego delvalor −=

−+

=

6,05,7

427,53,5(-1) juego delvalor =

+

=

Page 22: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

22

6. Juegos con más de dos estrategias El método para analizar juegos de estrategia mixta no funciona si uno o ambos jugadores tienen más de dos estrategias posibles. Pueden resolverse juegos de este tipo subdividiéndolos en juegos separados de 2x2, pero esto resulta difícil de manejar. El mejor método de solución es la programación lineal. El lector debe consultar la bibliografía para revisar esta forma de solución de estos juegos. Resumen de juegos de estrategia mixta El procedimiento para analizar juegos de estrategia mixta de 2x2 se resumen enseguida: 1 Se establece la matriz de pagos. 2 Se aplica el criterio maximin para comprobar si el juego tiene un punto de silla de montar. Si no lo tiene, entonces se necesita una estrategia mixta. 3 Se determinan, para cada jugador, las proporciones óptimas de cada estrategia. El método óptimo de juego es seleccionar aleatoriamente las estrategias con las proporciones que se calcularon antes. 4 El valor del juego es el valor esperado de los pagos, suponiendo que el oponente siempre

selecciona una estrategia.

Page 23: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

23

IV. ACTIVIDADES DE DESARROLLO CADENAS DE MARKOV 1) Indique cuál (cuales) de las siguientes matrices representan matrices de probabilidad de

transición.

Respuesta: Las condiciones que debe cumplir una matriz de probabilidades es que todos sus elementos sean no negativos y menores o iguales a 1, además la suma de todos los elementos en cada fila debe ser igual a 1. También se debe tener presente que la matriz debe ser cuadrada. En consecuencia son matrices de probabilidad de transición A y C. 2) Sea :

Calcular P2

Solución:

3) Para el caso del estudio de las cajas de una empresa financiera determine la matriz de transición de 3 pasos ( P3 ). Interprete algunas de las probabilidades obtenidas.

=

7,03,09,01,0

P

=

7,03,09,01,0

A

=

3/13/12/12/1

B

=

76,024,072,028,02P

=

818582515351313131

C

=

012,08,0

75,025,0D

Page 24: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

24

Solución:

P3 :

A :

e1 e2 e3 e4

e1 0,166 0,320 0,331 0,183De : e2 0,170 0,323 0,339 0,188 e3 0,165 0,313 0,332 0,190 e4 0,160 0,305 0,328 0,207

P32

(3) Indica que si 2 cajas están ocupadas en un instante de tiempo concreto, entonces la probabilidad de que tres instantes de tiempo después haya exactamente una caja ocupada es 0,313. P44

(3) Si 3 cajas están ocupadas en un instante de tiempo, la probabilidad de que tres instantes de tiempo después estén ocupadas 3 cajas es de 0,207 4) El cambio de marca Suponga que estamos interesados en las compras de determinada marca de arroz (marca A) por parte de los consumidores, es decir, nos interesa la lealtad de los consumidores hacia la marca en sucesivas compras. Aquí la aplicación de las cadenas de Markov se basa en el hecho de que en gran medida la elección de la marca en la siguiente compra del consumidor depende del nivel de satisfacción que haya tenido con el producto en la compra anterior. Entonces en cada compra los estados posibles serán : e1 : el consumidor compra arroz de la marca A e2 : el consumidor compra otra marca de arroz Suponga que en un estudio de mercado se obtuvo la siguiente información : El 80% de los consumidores que compraron arroz de la marca A también lo habían hecho en la compra anterior, mientras que el 30% de los consumidores que compraron arroz de la marca A habían comprado otra marca en la compra anterior. Esto define la matriz de probabilidades de transición de la siguiente forma :

A : Marca A Otra marca

Marca A 0,8 0,2 De : Otra marca 0,3 0,7

Como se vé la marca A tiene una alta lealtad de sus consumidores. ¿Qué porcentaje de consumidores preferirán la marca A en la segunda compra si al inicio del proceso un 50% de consumidores lo hizo? Aquí el vector de probabilidades iniciales es V= (0,5 ; 0,5)

Page 25: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

25

Entonces la probabilidad pedida se obtiene del vector v*P, es decir :

Entonces el 55% de consumidores preferirán la marca A en la segunda compra. ¿Qué participación de mercado se espera en el largo plazo para la marca A? Para encontrar las probabilidades de estado estable planteamos el sistema de ecuaciones que para el caso de 2 estados es:

P(e1) = p11 P(e1) + p21 P(e2)

P(e2) = p12 P(e1) + p22 P(e2)

P(e1) + P(e2) = 1 Así tenemos :

P(e1) = 0,8 P(e1) + 0,3 P(e2)

P(e2) = 0,2 P(e1) + 0,7 P(e2)

P(e1) + P(e2) = 1 Resolviendo : P(e1) = 0,6 P(e2) = 0,4 Esto muestra que en el largo plazo la marca A tendrá un 60% de participación en el mercado y las otras marcas un 40%, siempre que las condiciones se mantengan. De este modo si se tiene información adicional el método de Markov permite analizar la situación en otros escenarios.

( ) ( )45,055,07,03,02,08,0

5,05,0 =

Page 26: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

26

TEORÍA DE JUEGOS 5) Obtenga para cada caso los valores Maximin y Minimax y diga si el juego tiene punto de silla de montar. a) Jugador Z Z1 Z2 Z3

A -1 -6 6 B 0 3 -3

Jugador Y

C 5 0 2 Solución: Jugador Z Z1 Z2 Z3 Mínimos A -1 -6 6 -6 Jugador Y B 0 3 -3 -3 C 5 0 2 0 → Maximin Máximos 5 3 6

Minimax Este juego no tiene punto de silla de montar. b) Empresa Alfa A1 A2 A3 G1 6 5 3 Empresa G2 1 6 2 Gamma G3 -6 0 -2 G4 -5 -8 2 Solución : Empresa Alfa

A1 A2 A3 Mínimos

G1 6 5 3 3 → Maximin Empresa G2 1 6 2 1

Gamma G3 -6 0 -2 -6

G4 -5 -8 2 -8

Máximos 6 6 3

Minimax

Page 27: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

27

Existe el punto de silla de montar para este juego 6) a) ¿Cuál es la solución del juego anterior? La solución es una estrategia pura y consiste en que la empresa Gamma elija siempre su estrategia G1 y la empresa Alfa elija siempre la estrategia A3 b) ¿Cuál es el valor del juego? En promedio la empresa Gamma ganará 3 y la empresa Alfa perderá en promedio 3. 7) Considere un juego de 2 personas con la siguiente matriz de pagos

Jugador 2

Azul Verde

Jugador 1 Azul 6 0

Verde -2 3

a) ¿Es este un juego de suma cero? Si porque la matriz de pagos presenta los pagos para un solo jugador, en este caso el jugador 1. Se entiende que los pagos del jugador 2 son los mismos valores pero con signo contrario. b) ¿Qué tipo de estrategia se debe usar en este caso para solucionar el juego? Primero se debe determinar si el juego tiene o no un punto de silla de montar.

Jugador 2

Azul Verde Mínimo

Jugador 1 Azul 6 0 0 Maximin

Verde -2 3 -2

Maximo 6 3 Minimax Como el valor maximin es distinto del valor minimax entonces el juego no tiene un punto de silla de montar y por lo tanto se debe utilizar una estrategia mixta.

Page 28: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

28

c) Determine las proporciones óptimas en que debe utilizar sus estrategias el jugador 1. 6p – 2 + 2 p = 3 – 3p 11p = 5 p = 5 / 11 p = 0,46 La estrategia azul debería utilizarla el 46% de las veces. La estrategia verde debería utilizarla el 54% de las veces. d) Determine con qué probabilidad debe jugar cada una de sus estrategias el jugador 2 para realizar su estrategia mixta.

6q = -2q + 3 – 3q 11q = 3

q = 3/11 q = 0,27

La estrategia azul deberá ser utilizada el 27% de las veces y la estrategia verde el 73% de las veces.

e) Determine el valor del juego, ¿para quién es favorable?

El juego es favorable al jugador 1, pues el pago esperado es positivo. Para el jugador 2 el pago esperado es -1,64.

8) Dos librerías están ubicadas en un mismo sector comercial y son de similares características. Dada esta situación deben usar como estrategia competitiva los precios, decidiendo entre tener precios altos o bajos. Si la librería 1 tiene precios altos y la librería 2 también entonces no hay ganancia adicional ni perdida adicional para ambas y lo mismo sucede si las dos librerías tienen precios bajos; ahora, si la librería 1 pone precios altos y la 2 precios bajos, entonces la librería 1 tiene una perdida de 10. La librería 1 ganará 10 si pone precios bajos cuando la librería 2 pone precios altos. a) Escribir la matriz de pagos que representa este juego.

Librería 2 Precios altos Precios Bajos

Librería 1 Precios altos Precios bajos

0 –10 10 0

64,11118

116)2(

115)6(juego delalor ==

−+

=V

Page 29: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

29

b) ¿Tiene este juego punto de silla de montar?

Librería 2 Precios altos Precios Bajos Min Precios altos Precios bajos

1 –10 10 0

-10 0

Maximin

Librería 1

Max 10 0

Minimax Como el valor Maximin es igual al valor Minimax el juego tiene punto de silla de montar. c) ¿Qué tipo de solución tiene este juego? ¿En qué consiste?

Como existe el punto de silla de montar el juego tiene como solución una estrategia pura, la cual consiste en que ambas librerías tengan precios bajos.

d) ¿Cuál es el valor del juego? El valor del juego es 0.

Page 30: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

30

V. RESUMEN DE LA UNIDAD Los métodos revisados en este capítulo dicen relación con los hechos inciertos que afectan a la administración de empresas en el problema de toma decisiones. Las Cadenas de Markov y la Teoría de juegos han sido tratados en su forma mas elemental para introducir al estudiante en el estudio de estas técnicas y su aplicación en el área de la administración; es así que se limita el estudio de las cadenas de Markov al caso de probabilidades estacionarias y en la teoría de juegos se analiza el caso de dos participantes con dos estrategias posibles. Una Cadena de Markov es un proceso en el cual la ocurrencia de un suceso (estado de la cadena) en un tiempo de observación, depende de lo que haya ocurrido en el tiempo de observación inmediatamente anterior; la probabilidad de pasar de un estado a otro se denomina probabilidad de transición y es estacionaria si no cambia para cualquier par de tiempos de observación consecutivos. De este modo se puede calcular la probabilidad de cada estado de la cadena en cualquier tiempo de observación a partir de un tiempo inicial, lo que también posibilita el calculo de la probabilidad de que la cadena se encuentre en determinado estado en el largo plazo. La teoría de juegos se estudia para la confrontación de dos jugadores que buscan maximizar sus beneficios, para esto ambos disponen de alternativas de acción llamadas estrategias que tienen sus ganancias o pérdidas asociadas. Cuando las ganancias (pérdidas) de un jugador son iguales a las pérdidas(ganancias) del oponente el juego se llama de suma cero. Realizando el análisis maximin se determina si el juego tiene como solución una estratregia pura (acción tomada con certeza) o una estrategia mixta (cada acción posible se elige una determinada proporción de veces). El alumno debe tener presente las limitaciones en la aplicación práctica de estas técnicas en cuanto al cumplimiento riguroso de los supuestos teóricos en que se fundamentan, lo que es también válido en otras áreas como por ejemplo los sistemas predictivos en meteorología, los modelos econométricos, etc. Pero sin duda estos métodos son de gran utilidad para analizar algunos de los fenómenos que se presentan en la Economía y la Administración y sin lugar a dudas serán perfeccionados en el futuro porque ésa es la esencia de lo que llamamos ciencia.

Page 31: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

31

VI. AUTOEVALUACIÓN CADENAS DE MARKOV 1) ¿Cuál (cuales) de las siguientes matrices representan matrices de probabilidad de transición?

2) Para el ejercicio del cambio de marca (ejercicio nº 4 de las actividades de aprendizaje) calcule la matriz de transición de 2 y 3 pasos. Interprete los valores obtenidos. 3) Si la matriz P siguiente es la matriz de probabilidades de transición para una cadena de Markov

a) ¿Cuántos estados posibles tiene la cadena de Markov? b) Obtenga P2 y P3 c) Si el vector de probabilidades iniciales es v = (0,25 0,20 0,55) obtenga las probabilidades para cada estado en el instante de tiempo 2 y en el instante de tiempo 3. 4) La empresa fabricante de la seda dental Suave realizó un estudio de mercado para analizar los patrones de compra de las personas usuarias de este tipo de producto. En este estudio se determinó que la probabilidad de que un cliente compre la seda dental Suave habiéndolo hecho también en la compra anterior es de 0,6 , además la probabilidad de que un cliente compre la seda dental Suave habiendo comprado seda dental de otra marca en la compra anterior es de 0,3. Suponga que las sucesivas compras forman una cadena de Markov, entonces a) Determine la matriz de probabilidades de transición. b) Si una persona adquiere seda dental Suave en una salida de compras ¿cuál es la probabilidad de

que en la subsiguiente compra también lo haga? c) ¿Cuál será la participación de mercado en el largo plazo de la seda dental Suave? 5) Cada año los empleados de una compañía son clasificados según su desempeño en Bueno, Regular y Malo. Suponga que esta situación representa una cadena de Markov cuyas probabilidades de transición de estados son :

76,023,001,02,048,032,06,02,02,0

=

99,001,05,05,0

A

=

80,020,010,090,055,045,0

B

=

5,025,025,02,03,05,02,044,026,0

C

Page 32: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

32

A : Bueno Regular Malo Bueno 0,75 0,2 p13

De : Regular 0,3 0,5 0,2 Malo 0,15 0,35 0,5

a) ¿Cuál es el valor de p13 para que ésta sea una matriz de probabilidades de transición? b) Interprete 2 valores de esta matriz. c) Obtenga P2 y P3 e interprete un valor de cada matriz. d) ¿Cuál es la probabilidad de que un empleado sea clasificado como Bueno el próximo año, si éste

año será clasificado como Regular?. e) ¿Qué porcentaje de los empleados clasificados como Malos éste año no lo serán dentro de dos

años? . f) Si el vector de probabilidades iniciales es v = (0,4 0,5 0,1) obtenga las probabilidades para

cada estado en el instante de tiempo 3 e interprete uno de los valores obtenidos. g) Obtenga las probabilidades de estado estable e interprete. TEORÍA DE JUEGOS 1) Indique cuales de las siguientes matrices representan juegos de suma cero. a)

b)

c)

d)

e)

−− 2112

−)2,3()0,0()1,1()2,2(

−1001

1222

−−−

)2,2()1,1()1,1()0,0(

Page 33: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

33

f)

−−4422

11

2) Determine si los siguientes juegos tienen punto de silla de montar. a)

Jugador B B1 B2 B3

A1 0 -1 -2 A2 1 0 3

Jugador A

A3 2 -3 0

b) Empresa Y

I II Empresa X

I II

10 -5 -4 0

C) Jugador Y

Jugador X

X1 X2 X3

Y1 Y2 Y3

-1 0 2 -3 1 4 -2 -3 1

3) Encuentre la solución de los juegos anteriores y el valor del juego en cada caso. 4) Para las siguientes situaciones de conflicto entre dos jugadores escriba la matriz de pagos, encuentra la solución del juego y determine el valor del juego. a) Dos jugadores muestran simultáneamente uno o dos dedos. Si muestran el mismo número de dedos, el jugador 1 paga al jugador 2 100 pesos; si el número de dedos que muestran es distinto el jugador 2 paga al jugador 1 150 pesos. b) Dos empresas de buses: A y B , realizan el recorrido entre dos ciudades y compiten diariamente por una mayor parte del mercado. Cada empresa utilizará cada vez una de 2 estrategias : 1: Servir bebidas durante el viaje 2: Realizar una rebaja al valor del pasaje.

Page 34: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

34

Si ambas empresas rebajan el pasaje la empresa A gana un 10% del mercado. Si la empresa A rebaja el pasaje y la B sirve bebidas, A gana un 5% del mercado. Si ambas empresas sirven bebidas durante el viaje la empresa B gana un 1% del mercado. Si la empresa A sirve bebidas y la empresa B rebaja el pasaje entonces esta última gana 10% del mercado. c) Realice el ejercicio anterior considerando ahora la siguiente matriz de pagos :

Emp. B

Reb. Pasajes Sirve Bebidas Emp. A

Reb. Pasajes Sirve Bebidas

-10 -7 8 -5

VII. BIBLIOGRAFÍA GALLAGHER, CHARLES A (1982). Métodos cuantitativos para la toma de decisiones en Administración. Primera edición. McGraw-Hill / Interamericana de México, S.A. de C.V. México. DEGROOT, MORRIS H (1988). Probabilidad y Estadística. Segunda edición. Addison-Wesley Iberoamericana, S.A. Delaware, E.U.A.

Page 35: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

35

RESPUESTA A LOS EJERCICIOS DE AUTOEVALUACIÓN CADENAS DE MARKOV 1) Solo A 2) Para 2 pasos :

A : Marca A Otra marca

Marca A 0,70 0,30 De : Otra marca 0,45 0,55

Para 3 pasos :

A : Marca A Otra marca

Marca A 0,650 0,350 De : Otra marca 0,525 0,475

3) a) 3 estados b) 0,110 0,274 0,616 P2 : 0,220 0,340 0,440 0,083 0,287 0,630 0,116 0,295 0,589 P3 : 0,157 0,309 0,534 0,115 0,299 0,586 c) Para el instante de tiempo 2 : V*P = ( 0,120 0,273 0,608 ) Para el instante de tiempo 3 : V*P2 = ( 0,117 0,295 0,588 ) 4) a)

A : Suave Otra De : Suave 0,6 0,4

Otra 0,3 0,7

Page 36: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

36

b) La probabilidad de que una persona compre seda dental Suave en la subsiguiente compra es 0,48 c) La participación de mercado en el largo plazo de la seda dental Suave será del 43% 5) a) El valor de p13 es 0,05 b) p12 = 0,2 Indica que si un empleado es clasificado como Bueno en un año determinado, la probabilidad de que sea clasificado como Regular al año siguiente es 0,2 p31 = 0,15 Significa que la probabilidad de que un empleado sea clasificado como Bueno en un año, dado que el año anterior fue clasificado como Malo es 0,15. c) P3 :

A : Bueno Regular Malo Bueno 0,568 0,296 0,136 De : Regular 0,450 0,346 0,204 Malo 0,383 0,363 0,254

p12 3 : Indica que si un empleado es clasificado como Bueno en un año determinado, la probabilidad de que sea clasificado como Regular al tercer año después es 0,296 d) La probabilidad es 0,3 (obtenida a partir de la matriz P) e) El porcentaje de los empleados clasificados como Malos éste año y que no lo serán dentro de dos años es 29,3% + 38% = 67,3%. f) V*P2 = 0,484 0,335 0,1813 Si al inicio del proceso(tiempo 1) la probabilidad de que un empleado sea clasificado como Malo es de 0,10, entonces al segundo año posterior (instante de tiempo 3) esta probabilidad será de 0,1813. g)

P(B) = 0,497

P(R) = 0,324

P(M) = 0,179

Page 37: UNIDAD III: OTROS MODELOS MATEMÁTICOS IMPORTANTES I ...elearning.ulagosvirtual.cl/libros/septimo_semestre/MCA/3.pdf · El estudio de las cadenas de Markov se restringe a los casos

37

En el largo plazo la probabilidad de que un empleado sea clasificado como Regular en su desempeño es de 0,324. TEORÍA DE JUEGOS 1) Representan juegos de suma cero : a, c, d, e, f 2) Los juegos planteados en a) y c) tienen punto de silla de montar 3) a) El jugador A debe jugar siempre la estrategia A2 y el jugador B la estrategia B2. El valor del juego para ambos es 0. b) La empresa X deberá usar su estrategia I el 21% de las veces y su estartegia II el 79%. La empresa Y deberá jugar su estrategia I el 26% de las veces y la estrategia II el 74%. Para ambas empresas la selección de la estrategia en cada entrada del juego deberá ser al azar. El valor del juego para la empresa X es –1,05 y para la empresa Y 1,05 c) El jugador X deberá siempre jugar X1 y el jugador Y deberá elegir siempre Y1. El valor del juego para el jugador X es –1 y para el jugador Y es 1. 4) a) El jugador 1 debe mostrar un dedo el 50% de las veces y debe mostrar dos dedos el otro 50% de las veces, seleccionando en forma aleatoria cuantos dedos mostrará en cada jugada. El jugador 2 debe mostrar un dedo el 50% de las veces y debe mostrar dos dedos el otro 50% de las veces, seleccionando en forma aleatoria cuantos dedos mostrará en cada jugada. El valor del juego es 25 para el jugador 1 y –25 para el jugador 2 b) La solución del juego consiste en que la empresa A siempre ofrezca Rebaja de pasajes y la empresa B ofrezca siempre servir Bebidas durante el viaje. El valor del juego para la empresa A es 5 , lo cual quiere decir que en promedio esta empresa ganará 5% del mercado en cada entrada del juego, los mismos que perderá la empresa B. c) La solución del juego consiste en que la empresa A siempre ofrezca servir Bebidas durante el viaje y la empresa B ofrezca siempre servir Bebidas durante el viaje. El valor del juego para la empresa A es -5 , lo cual quiere decir que en promedio esta empresa perderá 5% del mercado en cada entrada del juego.