Estadistica inferencial

Post on 07-Jul-2015

1.502 views 10 download

description

Conceptos relacionados con la Estadística inferencial.estimación de la media,estimación de la proporción y contrastes de hipótesis

Transcript of Estadistica inferencial

ESTADÍSTICA INFERENCIAL:

1)ESTIMACIÓN DE LA MEDIA. 2)ESTIMACIÓN DE LA PROPORCIÓN. 3)CONTRASTES DE HIPÓTESIS.

© Inmaculada Leiva Tapia IES Alborán

2

DISTRIBUCIÓN NORMAL: LA CAMPANA DE GAUSS

3

1 2 3 4 5 60

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0,16

0,18

1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 60

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0,16

0,18

11,33

1,672

2,332,67

33,33

3,674

4,334,67

55,33

5,676

0,0000

0,0200

0,0400

0,0600

0,0800

0,1000

0,1200

0,1400

11,25

1,51,75

22,25

2,52,75

33,25

3,53,75

44,25

4,54,75

55,25

5,55,75

6

0,0000

0,0050

0,0100

0,0150

0,0200

0,0250

0,0300

0,0350

0,0400

0,0450

0,0500

Las distribuciones de probabilidad correspondientes al promedio en el lanzamiento de 1,2,3 y 4 dados son,respectivamente:

Se observa que,cuantos más dados intervienen,más se parece la distribución de los promedios a la curva normal.Todas las distribuciones tienen la misma media (µ = 3,5).Cuantos más dados intervienen,menor desviación típica tiene la distribución (σ = 1,71/√n? )

1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 60

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0,16

0,18

4

El calificativo de “normal” para esta distribución se debe a la enorme frecuencia con que aparece en las situaciones más variadas. Entre las muchas variables que se distribuyen normalmente podemos citar:

Caracteres morfológicos: tallas,pesos,...Caracteres fisiológicos:efectos de una

misma dosis de un fármaco,niveles de glucemia,de colesterol,...Caracteres sociológicos: consumo de

ciertos productos por individuos de un mismo grupoCaracteres físicos: resistencia a la rotura

de piezas aparentemente idénticas,errores al medir reiteradamente una magnitud,....

Y,en general, cualquier característica que se obtenga como suma de muchos factores.

Por su forma acampanada,se denomina campana de Gauss (ya que fue descrita por el matemático alemán Carl Friedrich Gauss), curva de Gauss o curva normal.

DISTRIBUCIÓN NORMAL: LA CAMPANA DE GAUSS

5

N(µ,σ) Su media,mediana y moda coinciden en µGráfica simétrica respecto de la recta vertical x=µ Valor máximo en la media x=µTiene al eje OX como asíntota horizontalTiene inflexiones en los puntos de abscisas µ-σ

y µ+σ .El área bajo la curva vale 1.

Para la función de distribución (acumulativa) de unavariable aleatoria que sigue una N(0,1),se tiene que Φ(k) es el área encerrada por la gráfica de la normal y el eje OX, desde -∞ hasta k :

Φ(k) = P(z ≤ k) = área bajo la curva normal,a la izquierda de k.

Para cada valor de µ (media) y cada valor de σ (desviación típica) hay una curva normal que se representa por N(µ,σ). La campana de Gauss o curva normal, es una función de probabilidad continua,simétrica cuyo máximo coincide con la media µ

Características de la N(µ,σ):

6

Sin embargo,el reparto de probabilidades en las curvas normales es idéntico,y sólo depende de los parámetros µ y σ.

Mayor desviación típica σ (mayor dispersión) → curva más aplanada.Menor desviación típica σ (menor dispersión) → curva más alargada.

COMPARANDO DISTRIBUCIONES NORMALES

7

Tienen especial interés los siguientes intervalos:

El 99,8 % de los valores de la poblaciónse desvían de la media en menos de 3 veces la desviación típica σ.

El 96 % de los valores de la poblaciónse desvían de la media en menos de2 veces la desviación típica σ.

El 68 % de los valores de la poblaciónse desvían de la media en menos de 1 vez la desviación típica σ.

El 99,99 % de los valores de la poblaciónse desvían de la media en menos de 4 veces la desviación típica σ.

8

PracticaVeamos el reparto de probabilidades en las curvas normales,yalgunos intervalos más usuales .

PROBABILIDADES EN DISTRIBUCIONES NORMALES

9

En conclusión todas las distribuciones normales son similares,y por ello se puede utilizar una de ellas como modelo.Esta será la distribución normal estándar N(0,1), es decir,aquellaque tiene media 0 y desviación típica 1.Las probabilidades asociadas a la normal estándar,están tabuladaspara valores positivos y menores de 4.

10

PROBABILIDADES EN LA

NORMAL ESTÁNDAR N(0,1)

11

z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,53590,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,57530,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,61410,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,65170,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,68790,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,72240,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,75490,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,78520,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,81330,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,83891,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,86211,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,88301,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,90151,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,91771,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,93191,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,94411,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,95451,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,96331,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,97061,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,97672,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,98172,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,98572,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,98902,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,99162,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,99362,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,99522,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,99642,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,99742,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,99812,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,99863,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,99903,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,99933,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,99953,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,99973,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,99983,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,99983,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

TABLA DE LA NORMAL ESTÁNDAR

Para la función de distribución (acumulativa) de unavariable aleatoria que sigue una N(0,1),se tiene que Φ(k) es el área encerrada por la gráfica de la normal y el eje OX, desde -∞ hasta k :

Φ(k) = P(z ≤ k) = área bajo la curva normal,a la izquierda de k.

En la tabla sólo aparecen las probabilidades P(z ≤ k) para valores de k entre 0 y 4, pudiendo variar k de centésima en centésima,y aproximando dichas probabilidades hasta las diezmilésimas. La tabla tiene un doble uso: directo( dado k, hallar la probabilidad P) e inverso (dada la probabilidad P, hallar k)

Φ(k)=

12

z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,53590,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,57530,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,61410,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,65170,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,68790,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,72240,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,75490,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,78520,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,81330,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,83891,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,86211,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,88301,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,90151,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,91771,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,93191,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,94411,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,95451,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,96331,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,97061,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,97672,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,98172,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,98572,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,98902,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,99162,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,99362,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,99522,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,99642,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,99742,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,99812,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,99863,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,99903,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,99933,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,99953,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,99973,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,99983,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,99983,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

k = 0.26 Φ(0.26) = P(z < 0.26) = ?Φ(0.26) = P(z < 0.26 ) = 0.6026

13

z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,53590,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,57530,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,61410,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,65170,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,68790,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,72240,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,75490,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,78520,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,81330,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,83891,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,86211,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,88301,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,90151,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,91771,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,93191,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,94411,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,95451,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,96331,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,97061,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,97672,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,98172,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,98572,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,98902,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,99162,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,99362,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,99522,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,99642,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,99742,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,99812,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,99863,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,99903,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,99933,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,99953,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,99973,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,99983,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,99983,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

Φ(k) = P(z < k ) = 0.9875k = 2.24 Φ(2.24) = P(z < 2.24) = 0.9875

14

Por ser una función de probabilidad,el área total bajo la curva es 1.

ɸ(3) = P(z < 3) = 0,9987ɸ(3,5) = P(z < 3,5) = 0,9998ɸ(3,9) = P(z < 3,9) = 1,0000

Observa en la tabla:

P(-∞ < z <+∞) = 1

1) Área total bajo la curva

Pero en la normal no seránecesario recurrir a valores tan alejados de la media.

Un valor cualquiera z está en el intervalo ( -∞,+∞) en el 100% de los casos.

15

Por ser simétrica la curva respecto del eje OY, el área a la izquierda de 0 y el área a la derecha de 0, tienen el mismo valor, que será la mitad del área total 1.

2) Áreas a izquierda y derecha del origen

16

Si k es positivo , P(z < k) representa el área que queda a la izquierda de k, comprendida entre la curva normal estándar y el eje de abscisas.

ɸ(k) = P(z < k) = [ área bajo la curva normal,a la izquierda de k ]

Se busca directamente en la tabla: ɸ(0,92) = P(z < 0,92) = 0,8212

3) Área a la izquierda de abscisas positivas

Practica

17

Si k es positivo, P(z > k) representa el área que queda a la derecha de k, comprendida entre la curva normal estándar y el eje de abscisas.

P(z > 0,69) = 1 – P(z < 0,69) = 1 – ɸ(0,69) = 1 – 0,7549 = 0,2451

P(z > k) = 1 - P(z < k) = 1 - ɸ(k) = [ área bajo la curva normal,a la derecha de k ]

4) Área a la derecha de abscisas positivas

Practica

18

Pero el área a la derecha esP(z > k) = 1 – ɸ(k)

P(z < -0,42) = P(z > 0,42) = 1 – P(z < 0,42) = 1 – ɸ(0,42) = 1 – 0,6628 = 0,3372

Si k es positivo,el área a la izquierda de la abscisa negativa P(z < -k) es,por simetría,igual que el área a la derecha de la abscisa opuesta positiva P(z > k)

5) Área a la izquierda de abscisas negativas

19

P(z < -0,42) = P(z > 0,42)

Si k es positivo, el área a la izquierda P(z < -k) espor simetría igual que el área a la derecha P(z > k)

Lo repetimos de nuevo,paso a paso:

5) Área a la izquierda de abscisas negativas Paso 1

20

Pero el área a la derecha esP(z > k) = 1 – ɸ(k)

P(z > 0,42) = 1 – P(z < 0,42)

5) Área a la izquierda de abscisas negativas Paso 2

21Buscamos en la tabla P(z < 0,42) = 0,66276

5) Área a la izquierda de abscisas negativas Paso 3

221 – P(z < 0,42) = 1 – ɸ(0,42) = 1 – 0,6628 = 0,3372

5) Área a la izquierda de abscisas negativas Paso 4

23

Si k es positivo, el área a la izquierda P(z < -k) es,por simetría, igual que el área a la derecha P(z > k).Por tanto,

P(z < -k) = P(z > k) = 1 – ɸ(k)

P(z < -0,42) = P(z > 0,42) = 1 – P(z < 0,42) = 1 – ɸ(0,42) = 1 – 0,6628 = 0,3372

Paso 55) Área a la izquierda de abscisas negativas

24P(z < 0,42) = ɸ(0,42) = 0,6628

6) Área a la derecha de abscisas negativas

Si k es positivo, el área a la derecha P(z > -k) es,por simetría,igual al área a la izquierda de k.Por tanto,

P(z > -k) = P(z < k) = ɸ(k)

P(z > -0.42) = P(z < 0,42) = ɸ(0,42) = 0,6628

25

7) Área en un intervalo

P(0,25 < z < 1,61) = P(1,61) - P(0,25) = 0,9463 – 0,5987 = 0,3476

Practica

El área comprendida en un intervalo [a,b],se calcula como diferencia entre el área a la izquierda de b (extremo superior) y el área a la izquierda de a (extremo inferior): P(a < z < b) = P(z < b) – P(z < a)

26

PROBABILIDADES EN UNA NORMAL GENERALIZADA N(µ,σ)

27

Tipificación de la variable

Practica

Medimos en cuántas desviaciones típicas se separaun valor x de la variable normal,de su media:

28

Intervalos característicos asociados a una probabilidad en N(0,1)

29

Intervalos característicos asociados a una probabilidad en N(μ,σ)

El área dentro del intervalo es p = 1 - α.El área fuera del intervalo,corresponde a dos colas simétricas;el valor de cada una es α/2.

30

Intervalos característicos asociados a una probabilidad Paso 1

31

Intervalos característicos asociados a una probabilidad Paso 2

32

Intervalos característicos asociados a una probabilidad Paso 3

33

Intervalos característicos asociados a una probabilidad Paso 4

Practica

34

Intervalos característicos asociados a una probabilidad Paso 5

Practica

35

DISTRIBUCIÓN DE LAS MEDIAS MUESTRALES. TEOREMA CENTRAL DEL LÍMITE.APLICACIONES.

36Practica

37

1 2 3 4 5 60

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0,16

0,18

1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 60

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0,16

0,18

11,33

1,672

2,332,67

33,33

3,674

4,334,67

55,33

5,676

0,0000

0,0200

0,0400

0,0600

0,0800

0,1000

0,1200

0,1400

11,25

1,51,75

22,25

2,52,75

33,25

3,53,75

44,25

4,54,75

55,25

5,55,75

6

0,0000

0,0050

0,0100

0,0150

0,0200

0,0250

0,0300

0,0350

0,0400

0,0450

0,0500

Las distribuciones de probabilidad correspondientes al promedio en el lanzamiento de 1,2,3 y 4 dados son,respectivamente:

Se observa que,cuantos más dados intervienen,más se parece la distribución de los promedios a la curva normal.Todas las distribuciones tienen la misma media (µ = 3,5).Cuantos más dados intervienen,menor desviación típica tiene la distribución (σ = 1,71/√n? )

1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 60

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0,16

0,18

38

Teorema central del límite

Practica

39

El teorema es válido cualquiera que sea la distribución de partida,tanto si es discreta como si es continua.

Si la población de partida es normal,entonces también lo será la distribución de las medias muestrales,independientemente del tamaño n de la muestra.

Aunque la población de partida no sea normal,la distribución de medias muestrales puede ser a veces muy similar a la normal,incluso para valores pequeños de n (por ejemplo,al promediar el resultado obtenido al lanzar varios dados).

Para n ≥30 (“muestras grandes”) es seguro que se consigue una gran aproximación a la normal,cualquiera que sea la distribución de partida.

Observaciones sobre el TCL

40

Consecuencias del TCL

41

Control de las medias muestrales

42

Control de la suma de todos los individuos de la muestra

Practica

43

ESTADÍSTICA INFERENCIAL:

1)ESTIMACIÓN DE LA MEDIA. 2)ESTIMACIÓN DE LA PROPORCIÓN. 3)CONTRASTES DE HIPÓTESIS.

44

La Estadística inferencial tiene dos grandes ramas:

La Estadística inductiva:

su objeto es la estimación de parámetros de la población,conociendo el valor del correspondiente parámetro en una muestra.

La Estadística hipotético-deductiva:

su objeto es el contraste de hipótesis que consiste en decidir si aceptar o rechazar hipótesis realizadas sobre parámetros de una población,contrastándolas con el valor obtenido de dicho parámetro en una muestra concreta,extraída aleatoriamente de la población (y que se obtiene después de realizado el test de hipótesis). A esta rama de la Estadística se le llama también teoría de la decisión.

Estadística inferencial

La Estadística inferencial es una parte de la estadística que comprende los métodos y procedimientos para deducir propiedades de una población estadística, a partir del conocimiento de una pequeña parte de la misma (muestra). Los resultados así obtenidos siempre tienen cierto grado de incertidumbre, que se mide en términos de probabilidad (y, a veces, de porcentaje).

45

ESTIMACIÓN POR INTERVALOS

46

A partir de una muestra aleatoria de tamaño n, podemos estimar el valor de un parámetro de la población del siguiente modo: Dando un intervalo dentro del cual confiamos que esté el parámetro: intervalo de confianza. Hallando la probabilidad de que tal cosa ocurra: nivel de confianza.

La eficacia de una estimación se mide de dos formas: Con el tamaño del intervalo de confianza ( intervalo más pequeño → mayor precisión) Con el nivel de confianza ( mayor nivel de confianza → más seguridad )

Estimación mediante intervalos

Las tres variables que intervienen en los problemas de estimación son: n = tamaño de la muestra E = error máximo admisible (siempre se fijan dos de ellas y se halla la tercera) (1 – α) = nivel de confianza

Haremos estimaciones de la media y de la proporción de una población.

47

ESTIMACIÓN DE LA MEDIA

48

Intervalo de confianza para estimación de la media

Se desea estimar la media μ de una población x con desviación típica σ conocida. Se toma una muestra aleatoria de tamaño n, de la que se obtiene la media muestral x .

Si la población x es N(μ σ), o bien si n ≥ 30, el intervalo de confianza para la estimación de μ,con un nivel de confianza de (1 – α) ·100% es el intervalo simétrico centrado en x ( x – E, x + E) = ( x - zα/2 ·σ/√n , x + zα/2 ·σ/√n ) en el que P( x – E < μ < x + E ) = 1 – α.

E = zα/2 ·σ/√n se llama error máximo admisible ( semiamplitud o radio del intervalo de confianza). Depende de (1 – α) y de n del siguiente modo:

cuanto mayor es n (aumenta tamaño de la muestra), menor es E (intervalo más pequeño) → estimación más precisa

cuanto mayor sea (1 – α), (aumenta la seguridad), mayor es E (intervalo más grande) → estimación menos precisa

49

Relación entre nivel de confianza,error y tamaño de la muestra

La fórmula E = zα/2 ·σ/√n relaciona las tres variables. Siempre se fijan dos de ellas,y se calcula la tercera; por ello hay tres tipos de ejercicios:

Conocidos (1 – α) , n ==> E ?

Conocidos (1 – α) , E ==> n ? Conocidos E , n ==> (1 – α) ?

50

Intervalo de confianza para estimación de la media:1) Hallar el error máximo admisible E

51

Intervalo de confianza para estimación de la media:2) Hallar el tamaño n de la muestra

52Practica

Intervalo de confianza para estimación de la media:3) Hallar el nivel de confianza (1 - α)

53

DISTRIBUCIÓN BINOMIAL

54

Si en una experiencia aleatoria,nos interesa únicamente un suceso A,y aceptamos como únicos resultados que ocurra A o que no ocurra A(con lo cual ocurre su contrario A'), diremos que la experiencia es dicotómica.

Al suceso A se le llama éxito y a su probabilidad P(A) = p Para el suceso contrario A',su probabilidad es P(A') = q = 1 – p

Se repite n veces una experiencia dicotómica. Sea x el número de éxitos (nº veces que ocurre A).Entonces x es una variable discreta que toma los valores 1,2,3,.....,n. La distribución de probabilidad de x se llama distribución binomial B(n,p). La probabilidad de que x tome el valor k viene dada por

P x=k = nk pk · qn−k

Los parámetros de esta distribución son: media μ = np ; desviación típica σ = √npq

Distribución binomial

55

Aproximación de la binomial a la normal

Si np ≥ 5 y nq ≥ 5, entonces la binomial se aproxima de forma casi perfecta a una curva normal con la misma media y desviación típica que la binomial de partida:

np ≥ 5 y nq ≥ 5 ==> B(n,p) ≈ N(np ,√npq)

56

DISTRIBUCIÓN DE LAS PROPORCIONES MUESTRALES

57

Sea una población donde p es la proporción de individuos que posee una determinada característica C.Tomamos muestras del mismo tamaño n.En cada una de esas muestras habrá una proporción pr de individuos con C.¿Cómo se distribuye la variable pr?

Distribución de las proporciones muestrales

Demostración: Si x = nº individuos en cada muestra de tamaño n con la característica C, x es B(n,p). Si además np ≥ 5 y nq ≥ 5,entonces: x es B(n,p) ≈ N(np ,√npq). Si pr = proporción de individuos de la muestra con la característica C,entonces pr = x/n y,por tanto,la distribución de pr es como la de x,pero con los parámetros media y desv. típica divididos por n: pr es N(np/n ,√npq/n) = N(p ,√pq/n)

PROPOSICIÓN:si np ≥ 5 y nq ≥ 5, entonces la proporción pr de individuos con la característica C en las muestras de tamaño n,es una variable estadística que sigue una distribución normal de media p y de desviación típica √pq/n: np ≥ 5 y nq ≥ 5 ==> pr es N(p ,√pq/n )

58

Control de las proporciones muestrales

59

ESTIMACIÓN DE LA PROPORCIÓN

60

Intervalo de confianza para estimación de la proporción

Se desea estimar la proporción p de individuos de una población con una característica C. Se toma una muestra aleatoria de tamaño n,y se obtiene en ella la proporción muestral pr.

Si n·p ≥ 5 y n·q ≥ 5,y además la muestra es grande (n ≥ 30), entonces el intervalo de confianza para la estimación de la proporción p en la población,con un nivel de confianza de (1 – α) ·100% , es el intervalo simétrico centrado en pr:

( pr – E, pr + E) = ( pr - zα/2 ·√pr·(1-pr)/n , pr + zα/2 ·√pr·(1-pr)/n )

en el que se cumple que P( pr – E < p < pr + E ) = 1 – α.

La fórmula E = zα/2 ·√pr·(1-pr)/n relaciona las tres variables. Siempre se fijan dos de ellas,y se calcula la tercera;por ello hay tres tipos de ejercicios:

Conocidos (1 – α) , n ==> E ?

Conocidos (1 – α) , E ==> n ? Conocidos E , n ==> (1 – α) ?

61

Intervalo de confianza para estimación de la proporción: 1) Hallar el error máximo admisible E

62

Intervalo de confianza para estimación de la proporción:2) Hallar el tamaño n de la muestra

63

Intervalo de confianza para estimación de la proporción:3) Hallar el nivel de confianza (1 - α)

Practica

64

CONTRASTES DE HIPÓTESIS

65

Enunciación: de las hipótesis nula H0 y alternativa H1.

Deducción de conclusiones: suponiendo cierta la hipótesis nula H0 , el parámetromuestral (media x o proporción pr ,de las muestras),se distribuye mediante una normal con parámetros conocidos.Entonces,se elige un nivel de significación α y se construye la zona de aceptación,que es el intervalo (o semirrecta) fuera del cual sólo se encuentran el α·100% de los casos“raros” de la población.

Verificación: se extrae ahora una muestra de tamaño n, y en ella se calcula el parámetromuestral.

Decisión: si el valor del parámetro muestral obtenido cae dentro de la zona de aceptación, se acepta la hipótesis nula con un nivel de significación α. En caso contrario,se rechaza la hipótesis nula y se acepta la alternativa.

Hay dos tipos de contrastes: bilateral y unilateral.

Pasos para efectuar un contraste de hipótesis:

66

Contrastes de hipótesis para la media (bilateral)

67

Contrastes de hipótesis para la media (unilateral,a la izquierda)

68

Contrastes de hipótesis para la media (unilateral,a la derecha)

69

Contrastes de hipótesis para la proporción (bilateral)

70

Contrastes de hipótesis para la proporción(unilateral,a la izquierda)

71

Contrastes de hipótesis para la proporción(unilateral,a la derecha)

72© Inmaculada Leiva Tapia IES Alborán

FIN