1.5 Dist. Normal
-
Upload
mike-rivera-yahoo-07-y-2010 -
Category
Documents
-
view
125 -
download
3
description
Transcript of 1.5 Dist. Normal
1.5 Distribución Normal
1.5.1 Modelo de Probabilidades
Una característica de una variable aleatoria es que sólo toma valores
separados, distintos o contables, cuando una variable aleatoria x es
discreta, se puede asignar una probabilidad a cada valor que puede tomar
x y obtener la distribución de probabilidad para x. la suma de todas las
probabilidades asociadas con los valores diferentes de x es 1. Sin embargo
no todos los experimentos producen variables aleatorias que son discretas.
Por ejemplo, medir el tiempo de llegada a la escuela. Los valores pueden
ser 30 o 31 minutos, o cualquier número entre 30 y 31 minutos, tal como
30.26 minutos. Además, en este intervalo hay un número infinito de
valores. De modo que los resultados no son contables y se conocen como
una variable aleatoria continua.
Una Variable Aleatoria Continua (VAC) puede tomar cualquier valor
de un número infinito de valores en la recta real, sus valores posibles
forman un intervalo continuo y las probabilidades de las variables
aleatorias continuas se asocian sólo con intervalos de observaciones, no
con valores individuales, como ocurre en el caso de la variable aleatoria
discreta.
La distribución de probabilidad se crea al distribuir una unidad de
probabilidad a lo largo de la recta, así como se podría distribuir un puño
de arena.
La probabilidad “granos de arena o
mediciones, se acumulará en ciertos lugares,”
y el resultado es la distribución de
probabilidad que se muestra en la figura 3. La
profundidad o densidad de la probabilidad,
que varía con x, se puede describir mediante
la expresión matemática )(xf , llamada
distribución de probabilidad o función de
densidad de probabilidad para la variable
aleatoria x.
Figura 3. La profundidad o densidad
Una de las propiedades de la distribución de probabilidad continua es que
la suma de frecuencias relativas es igual a uno y la probabilidad de que x
se encuentre en un cierto intervalo se puede encontrar al sumar las
probabilidades en ese intervalo, considerando que la probabilidad de que
x, sea igual a algún valor particular; por ejemplo, puesto que no hay área
sobre un solo punto: x = a, en la distribución de probabilidad para una
variable aleatoria continua, implica que la probabilidad es cero.
1.5.2 Distribución Normal Estándar y sus propiedades.
Características de la distribución de probabilidad continúa.
Sea X una variable aleatoria continúa, entonces la función de probabilidad
)(xf x , asociada a X satisface las condiciones:
a) 0)( xf x (no negativa) para todo número real.
b) El área bajo la curva en la distribución de probabilidad continua es igual a 1.
c) La probabilidad de que x se encuentre en un intervalo particular; por ejemplo, de
a a b , es igual al área bajo la curva entre los dos puntos a y b. ésta es el área
sombreada Fig.3
d) P(x = a) = 0 Para variables aleatorias continuas.
La distribución normal es aquélla en la que xf x crece y decrece suave y
simétricamente a derecha e izquierda de la media. Su representación se
aproxima o es semejante a una campana como la de la figura 4, su función
de densidad xf x está representada geométricamente en la figura 4 y por
la expresión algebraica 1:
Expresión
2
2
1
2
1)(
x
exf
con y
X
Los símbolos e y son constantes matemáticas
cuyos valores aproximados son 2.7183 y 3.1416,
respectivamente; y 0 son los
parámetros que representan la media y la
desviación estándar de la población.
xf x
x
Fig.4 Distribución Normal Estándar
Propiedades de la distribución normal:
1. La curva se asemeja a una campana, de ahí que se denomine “Campana
de Gauss” o “curva Gaussiana”
2. Es simétrica con respecto a la media de la distribución
Distribución de probabilidad normal.
La variable aleatoria continua X está distribuida normalmente con
parámetros y 2 si y sólo si su función de probabilidades es:
Fig.4 Distribución Normal
Estándar
x xf x
3. La media, la mediana y la moda son iguales.
4. Se extiende de a +
5. La curva es asintótica con el eje X (La curva es simétrica respecto a la
recta perpendicular al eje X que corta a la curva en su punto máximo,
punto desde el cual cae simétricamente la curva en las dos direcciones y se
extiende sin llegar a tocar el eje X)
6. El área total bajo la curva normal y por encima del eje horizontal es
igual a 1
7. La distribución normal queda completamente determinada por los
parámetros y ; existe una distribución normal diferente para cada
combinación de media y desviación estándar.
8. El área bajo la curva entre dos puntos es la probabilidad de que una
variable distribuida normalmente asuma un valor entre ellos.
Diferentes densidades para la distribución de probabilidad normal.
Caso 1.
Diferentes valores de la medias , manteniendo constante el valor de ,
representa un desplazamiento horizontal de la distribución normal.
( 321 )
Figura 5. Distribuciones de probabilidad normales con valores de
diferentes.
Caso 2.
Diferentes valores de ()( 321
,
manteniendo constante .
Cuanto mayor sea el valor de la
desviación estándar, existe mayor
dispersión de los datos, los valores
grandes de reducen la altura de la curva
y aumentan su amplitud, los valores
pequeños aumentan la altura de la curva
y reducen su amplitud.
Figura 6. Distribuciones de probabilidad
normales con valores de diferentes.
Según la regla empírica, casi todos los valores de una variable aleatoria
continua se encuentran en el intervalo 3 . Mientras estos valores
sean positivos, la distribución normal proporciona un buen modelo para
describir los datos.
4.0
9.0
4.1
4.0
9.0
4.1
8
X
4 6
5.0 5.0 5.0
1.5.3 Área bajo la curva normal y manejo de tablas.
Como se menciono antes la probabilidad de que una variable continua
tome un valor determinado es cero, es decir P(X=x)= 0 cualquiera que sea
el valor de x. Por eso, las probabilidades en los modelos continuos se
calculan en intervalos, es decir P(a <X < b).Sólo que en el caso de la
distribución normal ello presenta grandes dificultades debido a que no se
conoce la función original con la cual pueda calcularse la integral que nos
da la función de distribución de normal F(x), la cual se expresa en la
forma:
xt
dtexXPxF
2
2
1
2
1
Expresión 2.
El único medio para conocer F(x) es el de usar laboriosos métodos
numéricos con el auxilio de la computadora. Los resultados están vaciados
en tablas para uso general.
El gran inconveniente de esto es que se tendrían que hacer o tener a la
mano una tabla distinta para cada valor de y para cada valor de 0 ,
puesto que hay una distribución diferente para cada uno de esos valores y
existe un número infinito de cada uno de los parámetros ( , ).
La solución fue construir una sola tabla, la del modelo estándar al cual
pueden ser trasladados todos los casos particulares de distribuciones
normales, modelo cuyos parámetros son 0 y 1 (que son el origen y
la unidad o escala de medida estándar). Este modelo es el La distribución
Normal Estándar, Para el cual el símbolo X de la variable se cambia por
el símbolo Z.
Z ~ N(0, 1) La distribución normal estándar es el método general para
calcular las probabilidades de eventos relativos a cualquier distribución
normal X ~ N( , ) o a la inversa , para encontrar eventos relativos a X ~
N( , ) que satisfacen probabilidades conocidas de antemano.
La estandarización de una distribución normal significa que cualquier
evento de una X ~ N ( , ) se traslada a un evento de la normal estándar Z
~ N (0, 1) que mantenga la misma probabilidad (las probabilidades de
ambos eventos deben corresponder a áreas iguales).
Una variable aleatoria normal x se estandariza al expresar su valor como
el número de desviaciones estándar ( ) a la izquierda o derecha de su
media ( ).
La variable aleatoria normal estandarizada, z , se define como:
La distribución de probabilidad para z que se muestra en la figura 10, se
llama distribución normal estandarizada porque su media es 0 y su
desviación estándar es 1.
El área bajo la curva normal
estándar entre la media 0Z y
un valor positivo de z .
Por ejemplo, 0z, es la probabilidad
).0( 0zZP
Esta área se toma de la tabla 3,
apéndice I, en la figura 9 se
muestra el área de la región la
cual es de 0.3413.
Figura 10. Distribución normal estandarizada.
La tabla 3 ha sido construida registrando el área de regiones como ésta;
para calcular dicha área hay que localizar el valor de 1Z ,
conjugándolo con la columna correspondiente a .00 ahí puede verse que el
xz
valor es precisamente el .3413, por lo tanto: .3413.0)10( ZP En
general, la tabla 3 proporciona la probabilidad de intervalos de la forma (0,
Z) para valores positivos de Z con dos cifras decimales.
Versión abreviada de Tabla 3, apéncice I
Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0.00000 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.02790 0.03188 0.03586
0.1 0.03983 0.04380 0.04776 0.05172 0.05567 0.05962 0.06356 0.06749 0.07142 0.07535
0.2 0.07926 0.08317 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409
0.3 0.11791 0.12172 0.12552 0.12930 0.13307 0.13683 0.14058 0.14431 0.14803 0.15173
0.4 0.15542 0.15910 0.16276 0.16640 0.17003 0.17364 0.17724 0.18082 0.18439 0.18793
0.5 0.19146 0.19497 0.19847 0.20194 0.20540 0.20884 0.21226 0.21566 0.21904 0.22240
0.6 0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175 0.25490
0.7 0.25804 0.26115 0.26424 0.26730 0.27035 0.27337 0.27637 0.27935 0.28230 0.28524
0.8 0.28814 0.29103 0.29389 0.29673 0.29955 0.30234 0.30511 0.30785 0.31057 0.31327
0.9 0.31594 0.31859 0.32121 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.33891
1.0 0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.36214
1.1 0.36433 0.36650 0.36864 0.37076 0.37286 0.37493 0.37698 0.37900 0.38100 0.38298
1.2 0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39617 0.39796 0.39973 0.40147
Para calcular una probabilidad de cualquier variable aleatoria de la forma
X ~ N ( , 2 ), solamente es necesario “estandarizar” o “normalizar” la
variable aleatoria correspondiente por medio de
xZ y
posteriormente consultar las tablas de distribución normal estándar Z ~ N
(0, 21 ).
Ejemplo 1.6
Encontrar P ( ).28.10 Z Esta probabilidad corresponde al área entre la
media ( 0z ) y un punto 28.1z desviación estándar a la derecha de la
media (Figura 11).
Solución.
El área es la parte sombreada en la
figura 11. Puesto que en la tabla 3,
del apéndice I, se encuentran las
áreas bajo la curva normal a la
derecha de la media, sólo necesita
encontrar el valor tabulado que
corresponde a 2.1z y luego cruzar
la parte superior de la tabla hasta la
columna marcada por .08 la
intersección de esta fila y columna
da el área 0.39973 por
consiguiente:
39973.0)28.10( ZP
Figura 11. Área bajo la curva normal estándar para
el ejemplo 25.
1.5.4 Problemas de aplicación.
Ejemplo 1.7
El tiempo que tarda el servicio medico de emergencia en llegar a un centro
deportivo ubicado afuera de la ciudad, tiene una distribución normal con
17 minutos y 3 minutos. Determinar la probabilidad de que el
tiempo de arribo es:
a) Entre 13 y 22 minutos.
b) Sea más de 22 minutos
0.39973
c) Esté entre 15.5 y 18.5 minutos.
Solución.
Sea la variable aleatoria X= El tiempo que tarda el servicio medico de
emergencia en llegar a un centro deportivo ubicado afuera de la ciudad.
Puesto que X ~ N (17, 23 ), Por lo tanto:
a) Para el primer caso se requiere que se calcule la probabilidad
2213 XP , es decir, los valores de la variable estandarizada y el
área representa la probabilidad que se pide encontrar, esto es calcular
los valores de Z para 13 y 22, o sea: 131 X y 222 X
66.13
1722
33.13
1713
22
11
XZ
XZ
33.11 z O
40824.01 A
66.12 z O
45254.02 A
86078.0
45254.040824.021
AAA
El signo menos únicamente índica que la
puntuación Z se encuentra a la izquierda de la
media.
Figura 15. Área bajo la curva normal estándar,
ejemplo 29, a).
8607.067.133.13
1722
3
1713)2213(
ZPZPXP
1A
2A
0.86078
La probabilidad de que el tiempo de arribo del servicio de emergencia en
llegar a un centro deportivo ubicado afuera de la ciudad, entre 13 y 22
minutos es de 0.8607, lo que equivale al 86.07%
b) La probabilidad )22( XP ,
Primero se calcula Z para 22, o sea: 221 X , 66.1
3
1722
Z
Para determinar esta área,
primero se calcula el área entre
0 y 1.66, es decir se busca el
valor de z = 1.66 en la tabla
1, anexo I.
encontrando: 45154.01 A
El área completa del lado
derecho es 0.5, por lo que a esta
área se le resta 1A
04846.045154.05.0 A
Figura 16. Área bajo la curva normal estándar, ejemplo
29, b).
)22( XP = 04846.066.13
1722
ZPZP
La probabilidad de que el tiempo de arribo del servicio de emergencia en
llegar a un centro deportivo ubicado afuera de la ciudad, sea más de 22
minutos es de 0.04846, lo que equivale al 4.84%.
c) La probabilidad )5.185.15( XP
Primero se calcula Z para 15.5 y 18.5, o sea: 5.151 X y 5.182 X
1A
0.04846
05.3
175.151
Z 5.0
3
175.182
Z
Donde el signo menos únicamente índica que la puntuación Z se encuentra
a la izquierda de la media.
El área 5.01 z se busca en la tabla 1, siendo: 19146.01 A
El área 5.02 z se busca en la tabla 1, siendo: 19146.02 A
Por lo que: 38292.019146.019146.021 AAA
38292.0)5.05.0(3
175.18
3
175.15)5.185.15(
ZPZPXP
La probabilidad de que el
tiempo de arribo del servicio
de emergencia en llegar a un
centro deportivo ubicado
afuera de la ciudad, entre
15.5 y 18.5 minutos es de
0.38292, lo que equivale al
38.29%.
Figura 17. Área bajo la curva normal estándar, ejemplo 29,
c).
Percentiles en una distribución normal
Para encontrar el p-enésimo percentil px en una distribución normal con
media y desviación estándar , primero se busca el percentil de una
1A
2A
0.38292
normal estándar pz y luego se relaciona con pp zx de modo que
se encuentra el percentil para px . Esta expresión convierte el percentil de
la normal estándar al percentil de una distribución normal con parámetros
y .
Ejemplo 1.8
Aun grupo de niños se les aplica una prueba de inteligencia, supóngase
que las puntuaciones se distribuyen en forma normal, la puntuación
promedio es 100 y la desviación estándar 15 . Si el 20% de los
niños están bajo este puntaje. ¿Cuál es este?
Solución.
Sea la variable aleatoria X= Las puntuaciones de la prueba de inteligencia
que se aplica a los niños. Puesto que X ~ N (100, 215 ), Por lo tanto:
Primero se localiza el percentil 0.20 aproximado a una normal con media
100 y desviación estándar 15 . Se averigua el valor de z que
corresponde a ese percentil, esto es: 20.0)15
100( 0
xZP esto es de la
tabla 1 se obtiene que 84.020 z
Si el 20% de los niños están bajo este puntaje, se ubica este porcentaje del
lado izquierdo de la curva, como lo muestra la figura 17. De ahí que en las
tabla 1, del anexo I, se busca el valor más cercano a 0.30, de adentro hacia
fuera. El cual se conforma por 84.020 z
Como se observa el área bajo la curva normal está entre 0 y 0.84, por lo
que X está a una distancia 84.0 de la media por lo que:
15
10084.0 0
x
, despejando 0x , se tiene: 4.8715)84.0(1000 x
Z .00 .01 .02 .03 .04 .05
0.
0
0.0000
0
0.0039
9
0.0079
8
0.0119
7
0.0159
5
0.0199
4
0.
1
0.0398
3
0.0438
0
0.0477
6
0.0517
2
0.0556
7
0.0596
2
0.
2
0.0792
6
0.0831
7
0.0870
6
0.0909
5
0.0948
3
0.0987
1
0.
3
0.1179
1
0.1217
2
0.1255
2
0.1293
0
0.1330
7
0.1368
3
0.
4
0.1554
2
0.1591
0
0.1627
6
0.1664
0
0.1700
3
0.1736
4
0.
5
0.1914
6
0.1949
7
0.1984
7
0.2019
4
0.2054
0
0.2088
4
0.
6
0.2257
5
0.2290
7
0.2323
7
0.2356
5
0.2389
1
0.2421
5
0.
7
0.2580
4
0.2611
5
0.2642
4
0.2673
0
0.2703
5
0.2733
7
0.
8
0.2881
4
0.2910
3
0.2938
9
0.2967
3
0.2995
5
0.3023
4
0.
9
0.3159
4
0.3185
9
0.3212
1
0.3238
1
0.3263
9
0.3289
4
Fig. 18. Área bajo la curva normal, ejemplo
30.
Sea 0x la puntuación buscada, ,20.0)( 0 xXP si estandarizamos
obtenemos:
20.015
1000
xZP , entonces 84.0
15
1000 x
y 874.870 x
Alrededor del 20% de los niños tienen un puntaje menor de 87.
Ejemplo 1.9
En una industria de dulces se envasan chocolates rellenos en frascos cuyos
pesos netos tienen distribución normal con desviación estándar de 6.50
gramos, Si el 5% de los frascos tiene un peso mayor que 160 gramos,
¿Cuál es el peso medio de ellos?
30%
50%
20%
Solución.
Dado que aproximadamente el 45% (se busca en la tablas 1, de adentro
hacia a fuera, el valor mas cercano a .45, es decir .44950, siendo
conformado por 64.10 Z ) de los frascos que pesan entre y 160 gramos,
como lo muestra la figura 18. El punto 160 se encuentra a una distancia de
1.64 de . Es decir: 50.6
16064.1
Por lo que hay que despejar a la .
34.149
66.10160
66.10160
66.10160
16066.10
16050.664.1
El peso promedio de los
frascos es de 149.34 gramos.
Fig. 19. Área bajo la curva normal, ejemplo 31.
Ejemplo 1.10
El tiempo que tardan los estudiantes del CCH Oriente, al hablar por
teléfono celular se distribuye normalmente.
a) Si al realizar una llamada, el 15% de los estudiantes excede de
30minutos hablando por celular y 6% de los estudiantes dura menos
de 5minunutos comunicándose por este medio. ¿Cuál es el valor
promedio y la desviación estándar, del tiempo que tardan hablando
por celular?
1.64
5%
160
64.1
45%
b) Si el tiempo promedio que tardan los estudiantes al hablar por
celular es de 18 minutos, considerando que estos se comunican
entre 14 y 22minutos, con una probabilidad del 95%, ¿Cuál es el
valor máximo de la desviación estándar?
Solución.
a) Dado que aproximadamente el 44% y el 35% de los estudiantes tardan
hablando por celular. Como lo muestra la figura 20.
(Se busca en la tablas 1, de adentro hacia a fuera, el valor mas cercano a
0.44 y 0.35, es decir 0.43943 y 0.34849 respectivamente, siendo
conformados por 55.11 Z , el signo menos índica que la puntuación Z se
encuentra a la izquierda de la media, 03.12 Z )
Por lo que:
3003.1
555.1
Fig. 20. Área bajo la curva normal, ejemplo 32
Tenemos un sistema de ecuaciones con las incógnitas y , el cual se
puede resolver por el método de sustitución, igualación, suma-resta o
determinantes. En este caso utilizaremos igualación.
6%
44%
30 03.1
5 55.1
1
2
35%
15%
55.1
5
555.1
03.1
30
3003.1
03.1
30
55.1
5
El valor promedio y la desviación estándar, del tiempo que tardan
hablando los estudiantes por celular es:
Minutos69.9
69.903.1
0193.2030
69.96898.955.1
0193.205
El valor promedio y la
desviación estándar, del
tiempo que tardan
hablando los estudiantes
por celular es
01.20 Minutos y
69.9 Minutos.
0193.20
58.2
65.51
58.265.51
55.103.15.4615.5
55.15.4603.115.5
)30(55.1)5(03.1
01.20 minutos y 69.9 minutos.
c) Como 95.0 z del área está dentro de 0z desviaciones estándar de
la
d) media. La mitad del área 4750.0
2
95.
quedara a la izquierda de la
media y la otra mitad hacia la derecha por que la distribución
normal es simétrica. Así, necesita el valor 0z a lo largo de las
abscisas que corresponde a un área igual a 0.4750 que corresponde a
96.10 z . Como lo muestra la figura 20.
Es decir:
181496.1
O bien:
182296.1
Fig. 21. Área bajo la curva normal, ejemplo 10.
En cual quiera de estos casos, hay que despejar la por lo que:
minutos
0408.2
96.1
1822
182296.1
minutos
Del tiempo que tardan hablando los estudiantes por celular, el valor de la
desviación estándar es 04.2 minutos.
95%
.4750
.4750
14
96.1
22
96.1
0408.2
96.1
1814
181496.1