Unidad 7. Estadistica Inferencial

download Unidad 7. Estadistica Inferencial

of 45

description

inferencia

Transcript of Unidad 7. Estadistica Inferencial

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 1

    UNIDAD 7: ESTADSTICA INFERENCIAL

    NDICE DE LA UNIDAD

    1.- INTRODUCCIN. .......................................................................................... 1 2.- VARIABLES ESTADSTICAS. PARMETROS ............................................ 2 3.- DISTRIBUCIONES DE PROBABILIDAD ...................................................... 3 3.1.- Distribucin Binomial .......................................................................... 4 3.2.- Distribucin Normal ............................................................................. 6 3.3.- Aproximacin de la Binomial por la Normal ...................................... 8 4.- MUESTREO ................................................................................................... 9 5.- DISTRIBUCIONES MUESTRALES ............................................................... 11 5.1.- Distribucin muestral de medias ........................................................ 11 5.2.- Distribucin muestral de proporciones ............................................. 13 6.- ESTIMACIN DE PARMETROS ................................................................ 14 6.1.- Estimacin puntual .............................................................................. 14 6.2.- Estimacin por intervalos de confianza ............................................. 14 7.- CONTRASTES DE HIPTESIS .................................................................... 18 8.- ACTIVIDADES ............................................................................................... 25 9.- SOLUCIONES A LAS ACTIVIDADES ..................................................... 39

    1.- INTRODUCCIN.

    Durante buena parte de la historia de las Matemticas, la Estadstica se ha dedicado fundamentalmente al desarrollo de la Estadstica Descriptiva, cuya principal tarea ha sido recopilar datos, clasificarlos, tabularlos y relacionarlos. Esta concepcin tan limitada de la Estadstica ha venido cambiando radicalmente a partir de los aos 30 del siglo XX con el nacimiento de la estadstica inductiva o Estadstica Inferencial, con la que se buscan mtodos que permitan obtener conclusiones vlidas para toda la poblacin a partir del estudio de muestras. Esta inferencia o induccin necesita de una rama tan importante y compleja como la Probabilidad para sostener los clculos y conclusiones, lo que establece una conexin clara entre la estadstica tradicional y el clculo de probabilidades dando lugar al complejo campo de la Inferencia Estadstica.

    Durante esta unidad, repasaremos contenidos sobre estadstica descriptiva y distribuciones de probabilidad muy utilizadas como la Normal y la Binomial trabajados en cursos anteriores, para conectar despus con los contenidos propios de 2 curso de Bachillerato: Tcnicas de Muestreo, Inferencia Estadstica y Contraste de Hiptesis.

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 2

    2.- VARIABLES ESTADSTICAS. PARMETROS.

    En este punto de la unidad no pretendemos, en absoluto, desarrollar todo el contenido sobre variables estadsticas y parmetros, ya que estos se han venido trabajando durante toda la ESO y el primer curso de Bachillerato. nicamente vamos a pasar a describir de manera breve y concisa los aspectos necesarios que hay que recordar para afrontar la presente unidad. Fundamentalmente vamos a recordar las variables estadsticas y los parmetros: media, varianza y desviacin tpica de un conjunto de datos sin agrupar en intervalos.

    Definicin 1: Llamamos variable estadstica a cualquier caracterstica que se observa y estudia en un estudio de tipo estadstico. Al conjunto total objeto del estudio estadstico se le llama poblacin. Llamaremos muestra de dicha poblacin a cualquier subconjunto de la poblacin. Atendiendo al tipo de variable, se llama:

    Variable cualitativa a toda variable estadstica que no se puede medir con un nmero.

    Cuantitativa discreta cuando se puede medir con un nmero y toma valores puntuales, es decir, entre dos valores consecutivos de la variable no hay otro valor.

    Cuantitativa continua, cuando se puede medir con un nmero y puede tomar infinitos valores de un intervalo.

    Ejemplo 1: Veamos algunos ejemplos de variables estadsticas:

    a) El color del pelo de una persona, su sexo o el partido poltico al que ha votado son variables cualitativas porque no se pueden medir con un nmeros, ya que describen una cualidad no una cantidad. b) El nmero de hijos de una persona o el nmero materias suspensas, por ejemplo, son variables cuantitativas discretas, ya que toman valores a saltos: 0, 1, 2, 3. c) El tiempo que emplea un atleta en correr los 100 metros lisos o la estatura de una persona son variables cuantitativas continuas ya que entre dos valores de la variable, hay infinitos otros que puede tomar.

    Definicin 2: Sea X una variable estadstica cuantitativa que toma los valores 1 2, ,..... nX X X con frecuencias absolutas respectivas(n de veces que se repite)

    1 2, ,.... nf f f . Definimos:

    a) La media aritmtica como: 1 1 1 2 2

    1

    ....

    n

    i ii n n

    n

    ii

    X f X f X f X fXNf

    =

    =

    + + + = =

    b) La varianza como: ( )2 2 2 2 22 22 1 1 1 1 2 2

    1

    ....

    n n

    i i i ii i n n

    x n

    ii

    X X f X f X f X f X fS X XN Nf

    = =

    =

    + + + = = =

    c) La desviacin tpica como: 2x xS S= +

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 3

    c) El coeficiente de variacin como: xx SCV X= . Frecuentemente se expresa en porcentajes. Para ello, basta multiplicar el resultado por 100.

    Ejemplo 2: Consideremos que las calificaciones en Matemticas de los 20 alumnos/as de un curso de 2 de Bachillerato son: 0, 0, 1, 2, 2, 2, 3, 4, 4, 4, 5, 5, 5, 5, 6, 6, 8, 9, 9, 9 a) La nota media sera: 0 2 1 1 2 3 3 1 4 3 5 4 6 2 8 1 9 3 89 4,45

    20 20X + + + + + + + + = = =

    b) Con una varianza de:

    2 2 2 2 2 2 2 2 22 2 20 2 1 1 2 3 3 1 4 3 5 4 6 2 8 1 9 3 5494,45 4,45 7,6475

    20 20xS + + + + + + + + = = =

    c) La desviacin tpica sera: 7,6475 2,77xS = d) El coeficiente de variacin: 2,77 0,6225

    4,45xCV = . Expresado en porcentajes, sera de

    un 62,25%.

    Se propone la actividad 1.

    3.- DISTRIBUCIONES DE PROBABILIDAD.

    Definicin 3: Sea X una variable aleatoria discreta. Llamamos funcin de probabilidad a la funcin: ( ) ( )i if x P X x= =

    Definicin 4: Sea X una variable aleatoria continua. Llamamos funcin de densidad a la funcin ( )f x que permite hallar mediante el clculo de reas las probabilidades de las distribuciones continuas.

    Definicin 5: Sea X una variable aleatoria. Llamamos funcin de distribucin a la funcin ( ) ( )F x P X x= , tanto para el caso discreto como para el caso continuo.

    Proposicin 1: Sea X una variable aleatoria y F su funcin de distribucin. Entonces: ( ) ( ) ( )P a X b F b F a< =

    Nota 1: Los conceptos y propiedad anterior se pueden desarrollar mucho ms para su completa comprensin. No obstante, como se aleja de los objetivos de la presente unidad, nos limitaremos a ver brevemente, y sin entrar en detalles, aquello que necesitamos para los objetivos de la unidad. Si conviene observar que mientras que en el caso discreto, la probabilidad de la proposicin 1 corresponde a una suma de probabilidades, en el caso continuo corresponde al rea encerrada por la curva de la funcin de densidad entre dos valores. Por ello, estas reas las calcularemos utilizando una tabla asociada.

    Definicin 6: Sea X una variable aleatoria discreta. Se definen:

    a) La esperanza matemtica o media de la variable como: ( ) 1 1 2 2

    1...

    n

    x i i n ni

    E X x p x p x p x p=

    = = = + + + , siendo ( ) ( )i i ip f x P X x= = = .

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 4

    b) La varianza de la variable como: ( ) ( )22 2 2 2 2 2 21 1 2 2

    1 1( ) ...

    n n

    x i x i i i x n n xi i

    Var X x p x p x p x p x p = =

    = = = = + + +

    c) La desviacin tpica de la variable como: 2x x = +

    Nota 2: Cuando no haya confusin con otra variable, se puede omitir el subndice y escribir simplemente o .

    Ejemplo 3: Consideremos la variable aleatoria discreta correspondiente a la puntuacin en el lanzamiento de un dado.

    a) Su funcin de probabilidad f ser: ( ) ( ) ( ) ( ) ( ) ( )1 1 11 1 , 2 2 ,..., 6 66 6 6f P X f P X f P X= = = = = = = = = b) Un ejemplo de un valor de su funcin de distribucin es: ( ) ( ) 3 13.5 3.5 6 2F P X= = = c) Su media ser: 1 1 1 71 2 ... 6 3,5

    6 6 6 2 = + + + = =

    d) Su varianza: 2

    2 2 2 21 1 1 7 91 49 351 2 .... 6 2,926 6 6 2 6 4 12

    = + + + = =

    e) Su desviacin tpica ser: 35 1,7112

    =

    La interpretacin de la media es que corresponde con el valor esperado al lanzar un dado. Sera el valor al que se aproximan las medias de las puntuaciones que se obtienen a medida que aumentamos el nmero de lanzamiento. La desviacin tpica sera el valor al que se acercan las desviaciones entre las puntuaciones obtenidas y el valor central de la media.

    Nota 3: En el caso de las variables continuas tambin existen los conceptos de media, varianza y desviacin tpica. No vamos a ver sus expresiones porque necesitamos del clculo integral y se escapa de los contenidos de la unidad.

    3.1.- Distribucin Binomial.

    Definicin 7: Llamamos experimento de Bernouilli a todo experimento en el que se pueden dar nicamente dos resultados, uno de ellos es considerado como xito, con probabilidad p y otro como fracaso, con probabilidad q = 1-p.

    Ejemplo 4: Dos experimentos de Bernouilli son los siguientes:

    a) Lanzar un dado y ver si sale un 2. En este caso la probabilidad de xito 1/ 6p = y la de fracaso 5 / 6q = b) En una clase de 20 alumnos/as en la que hay 12 chicas, elegir al azar a una persona y ver si es chica. En este caso la probabilidad de xito 12 3

    20 5p = = y la de fracaso 8 2

    20 5q = =

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 5

    Definicin 8: Se dice que una variable estadstica X sigue una distribucin binomial de parmetros n y p si X mide el nmero de xitos que se obtienen al realizar n veces un experimento de Bernouilli con probabilidad de xito p. Se expresa: ( ),X Bi n p

    Proposicin 2: Sea una variable Binomial ( ),X Bi n p . Entonces, la probabilidad de obtener k xitos (funcin de probabilidad) viene dada por: ( ) k n knP X k p qk

    = =

    .

    Siendo nk

    el nmero combinatorio ( )!

    ! !n n

    k k n k

    =

    Proposicin 3: Sea una variable Binomial ( ),X Bi n p . Entonces:

    a) n p= b) n p q=

    Ejemplo 5: Si retomamos el ejemplo 3, apartado b y consideramos la variable X que mide el nmero de chicas que se obtienen al elegir al azar 5 personas de la clase, es evidente

    que X sigue una distribucin binomial. Concretamente: 35,5

    X Bi

    , ya que el

    experimento se realiza 5n = veces y si consideramos como xito elegir a una chica, hemos visto ya en el ejemplo 3b que su probabilidad es 3

    5p = . Calculemos algunas

    probabilidades asociadas a esta distribucin:

    a) La probabilidad de elegir 1 chica sera: ( )1 45 3 2 5! 3 16 481

    1 5 5 1! 4! 5 625 625P X = = = =

    b) La probabilidad de elegir 3 chicas sera: ( )3 25 3 2 5! 27 4 2163

    3 5 5 3! 2! 125 25 625P X = = = =

    c) La media y la desviacin tpica sern: 35 35

    = = , mientras que:

    3 2 305 1,105 5 5

    = = que significa que el nmero medio de chicas que se espera

    escoger son 3 con una desviacin de algo ms de una chica.

    Nota 4: Como es evidente, el clculo de probabilidades con la frmula de la proposicin 1 que acabamos de llevar a cabo, se hace bastante ardua en el caso de valores de n mayores. Por ello, existen tablas que nos permiten calcular las probabilidades anteriores con bastante precisin e incluso, muchas calculadoras actuales son capaces de hacer el clculo muy rpidamente y con mucha precisin. De todas formas, para valores grandes (se considerarn grandes para 30n ), la aproximaremos por otra distribucin llamada distribucin normal y que veremos a continuacin.

    Se proponen la actividades 2 y 3.

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 6

    3.2.- Distribucin Normal.

    Ejemplo 6: Se dice que una variable aleatoria continua sigue una distribucin normal de parmetros y cuando su funcin de densidad viene dada por la expresin:

    ( )( )2

    222

    12

    x

    f x e

    =

    .

    Su grfica se llama campana de Gauss:

    Abreviadamente lo expresaremos: ( ),X N

    Proposicin 4: La funcin de densidad de una distribucin normal cumple las siguientes propiedades:

    a) La media, varianza y desviacin tpica de una variable normal son 2, y .

    b) El rea encerrada bajo la campana de Gauss es 1.

    c) La campana de Gauss es simtrica respecto de la recta vertical x = , con lo que el rea encerrada a izquierda y derecha de la media es igual a 0,5.

    d) Al tratarse de una variable continua, la probabilidad de que la una variable normal tome un valor puntual es siempre 0.

    Nota 5: Las distribuciones normales son las distribuciones ms importantes, con diferencia, de toda la estadstica debido a que la mayora de los fenmenos que se estudian, son o se acercan, al modelo de distribucin normal. Variables como la edad, estatura, peso,.. se comportan normalmente de ah su nombre.

    Nota 6: Como ya hemos visto antes, la probabilidad de que el valor de una variable normal est entre dos corresponde con la diferencia de la funcin de distribucin en dichos valores. Para este clculo se suelen utilizar tablas en lugar de clculo integral. Como es evidente, para cada valor de la media y la desviacin tpica, la funcin de densidad y, por tanto, la tabla tendra que se distinta. Como en la prctica esto es inviable, vamos a ver una propiedad que permite reducir todos los casos a uno.

    Proposicin 5: (Tipificacin de una distribucin normal) Sea X una variable aleatoria normal ( ),X N . Entonces, la variable X Z

    = cumple que ( )0,1Z N . En

    resumen, el cambio de variable del recuadro, transforma cualquier variable normal de cualquier media y desviacin tpica en una con media 0 y desviacin tpica 1. Esto permite que todos los clculos los podamos llevar a cabo con una nica tabla. A esta variable se le llama distribucin normal estndar o tipificada.

    Ejemplo 7: Veamos en el siguiente ejemplo, el manejo de la tipificacin y de la tabla normal. Supongamos que una variable X, que describe la nota media de 2 de Bachillerato del alumnado de un instituto sigue una distribucin normal de media 6.4 aos con desviacin tpica 2. Abreviadamente ( )6.4,2X N . Elegido un alumno al azar, calculemos las probabilidades siguientes:

  • Matemticas II CCSS. 2 de Bachillerato B

    a) Tenga una nota media de un 7Evidentemente ( )7 0P X = = es continua.

    b) Tenga una nota media de menos de ( ) 6.4 7.2 6.47.2 0.4 0.65542 2

    Tipificando XP X P P Z = = =

    c) Tenga ms de un 7.75 de nota media( )( ) ( )

    6.4 7.75 6.47.752 2

    0.675 1 0.675 1 0.7517 0.2483

    Tipificando XP X P

    P Z P Z

    = =

    == = =

    d) Sabiendo que hay 76 alumnos en toalumnos/as habr con menos de un 5 de nota media?

    ( ) 6.4 5 6.45 0.72 2

    Tipificando XP X P P Z = = =

    ( ) ( )0,7 1 0.7 1 0.7580 0.242.TablaP Z P Z= = = = =Por lo tanto, habr 0.242 76 18.392 18 alum =

    e) Tenga ms de un 4 de nota media.( )

    ( )

    14.5 4 6.44 1.22 2

    1.2 0.8849

    Tipificando

    Tabla

    XP X P P Z

    P Z

    = = =

    = =

    f) Tenga un notable (entre 7 y 9)( )( ) ( )

    7 6.4 6.4 9 6.47 92 2 2

    0.3 1.3 1.3 0.30.9032 0.6179 0.2853

    XP X P

    P Z P Z P Z

    = =

    = =

    = =

    g) Tenga entre un 2.38 y un 3.7( )( ) (( ) ( )

    2.28 6.4 6.4 3.72 6.42.28 3.722 2 2

    2.06 1.34 2.06 1.34

    2.06 1.34 0.9803 0.9099 0.0704

    Simetra

    Tabla

    P X P

    P Z P Z

    P Z P Z

    = =

    = =

    = =

    UNIDAD 7: ESTADSTICA INFERENCIAL

    CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez

    una nota media de un 7. 7 0

    ya que se trata de un valor puntual y la distribucin normal

    menos de 7.2.

    ( )6.4 7.2 6.47.2 0.4 0.65542 2Tabla

    P X P P Z = = =

    de nota media.

    )

    6.4 7.75 6.42 2

    0.675 1 0.675 1 0.7517 0.2483Tabla

    = =

    == = =

    Sabiendo que hay 76 alumnos en total, Cuantos/as alumnos/as habr con menos de un 5 de nota media?

    ( )6.4 5 6.45 0.72 2

    SimetraP X P P Z = = =

    0,7 1 0.7 1 0.7580 0.242.Tabla

    = = = = = Por lo tanto, habr 0.242 76 18.392 18 alumnos/as =

    un 4 de nota media.

    ( )14.5 4 6.44 1.22 2Simetra

    P X P P Z = = =

    un notable (entre 7 y 9)

    ( )

    7 6.4 6.4 9 6.42 2 2

    0.3 1.3 1.3 0.3Tabla

    X

    P Z P Z P Z

    = =

    = =

    ) Tenga entre un 2.38 y un 3.72.

    )

    2.28 6.4 6.4 3.72 6.42 2 2

    2.06 1.34 2.06 1.34

    2.06 1.34 0.9803 0.9099 0.0704Tabla

    X

    P Z P Z

    = =

    = =

    = =

    ESTADSTICA INFERENCIAL

    Pgina 7

    ya que se trata de un valor puntual y la distribucin normal

  • Matemticas II CCSS. 2 de Bachillerato B

    h) Tenga un suficiente o un bien (entre un 5 y un 7)( )( ) (

    ( ) ( )

    5 6.4 6.4 7 6.45 72 2 2

    0.7 0.3 0.3 0.7

    0.3 0.7 0.3 1 0.7

    0.6179 1 0.7580 0.3759

    Simetra

    Tabla

    XP X P

    P Z P Z P Z

    P Z P Z P Z P Z

    = =

    = =

    = = =

    = + =

    i) Se sabe que slo un 5% del alumnado puede obtener una matrcula de honor. Halla la nota media que debe alcanzar un alumno/a para que se le conceda.cumpla:

    ( ) ( )0.05 0.95 0.956.4 6.40.95 1.645 2 1.645 6.4 9.69

    2 2Tabla

    P X k P X k P

    k kP Z k

    = = =

    = = = + =

    Los dos enlaces siguientecasustica que nos podemos encontrarIncluyen representaciones grficas i

    a) http://www.geogebra.org/en/upload/files/spanish/PepeTarraga/DistribucionNormal.htmlb) http://www.slideshare.net/jefedo61/normalgeogebra

    Se proponen las actividades 4

    3.3.- Aproximacin de la Binomial por la Normal

    Como ya se coment en el punto de la distribucin binomial, al aumentarse el parmetro n de la binomial, los clculos utilizando la funcin de probabilidad se complican sustancialmente. Para evitar este problema, vamos a proporcionar una herramienta que permite aproximar los valores de la distribucin binomial por la normal en determinados casos. La siguiente proposicin es consecuencia directa de un teorema ms general llamado Teorema Central del distribucin binomial utilizando la distribucin normal estndar.

    Proposicin 6: (Aproximacin de la binomial por la nor30 ; 5 5n np y nq . Entonces la variable X se puede aproximar por una distribucin

    normal ( )' ,X N np npq .

    Nota 7: Como es lgico, el hecho de aproximar una variable discreta como la binomial, por una continua como la normal, da lugar a un problema. El problema es que mientras s existe la probabilidad de que una binomial tome un valor concreto, en el caso de la normal, esta probabilidad es cero. Para resolver este problema, se introducen las

    UNIDAD 7: ESTADSTICA INFERENCIAL

    CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez

    ) Tenga un suficiente o un bien (entre un 5 y un 7)

    ) ( )( ) ( )( )

    5 6.4 6.4 7 6.42 2 2

    0.7 0.3 0.3 0.7

    0.3 0.7 0.3 1 0.7

    0.6179 1 0.7580 0.3759

    X

    P Z P Z P Z

    P Z P Z P Z P Z

    = =

    = =

    = = =

    % del alumnado puede obtener una matrcula de honor. Halla la nota media que debe alcanzar un

    onceda. Buscamos una nota k que

    6.4 6.40.05 0.95 0.952 2

    6.4 6.40.95 1.645 2 1.645 6.4 9.692 2

    Tipificando X kP X k P X k P

    P Z k

    = = =

    = = = + =

    Los dos enlaces siguientes pueden ser de gran ayuda para entender toda la casustica que nos podemos encontrar, adems de las expuestas en este ejemploIncluyen representaciones grficas interactivas.

    http://www.geogebra.org/en/upload/files/spanish/PepeTarraga/DistribucionNormal.htmlhttp://www.slideshare.net/jefedo61/normalgeogebra

    actividades 4, 5 y 6.

    proximacin de la Binomial por la Normal.

    Como ya se coment en el punto de la distribucin binomial, al aumentarse el os clculos utilizando la funcin de probabilidad se complican

    sustancialmente. Para evitar este problema, vamos a proporcionar una herramienta que permite aproximar los valores de la distribucin binomial por la normal en determinados

    proposicin es consecuencia directa de un teorema ms general Teorema Central del Lmite. Esto nos permitir determinar probabilidades de la

    distribucin binomial utilizando la distribucin normal estndar.

    (Aproximacin de la binomial por la normal). Sea X Bi n p. Entonces la variable X se puede aproximar por una distribucin

    Como es lgico, el hecho de aproximar una variable discreta como la binomial, a continua como la normal, da lugar a un problema. El problema es que mientras s

    existe la probabilidad de que una binomial tome un valor concreto, en el caso de la normal, esta probabilidad es cero. Para resolver este problema, se introducen las

    ESTADSTICA INFERENCIAL

    Pgina 8

    pueden ser de gran ayuda para entender toda la , adems de las expuestas en este ejemplo.

    http://www.geogebra.org/en/upload/files/spanish/PepeTarraga/DistribucionNormal.html

    Como ya se coment en el punto de la distribucin binomial, al aumentarse el os clculos utilizando la funcin de probabilidad se complican

    sustancialmente. Para evitar este problema, vamos a proporcionar una herramienta que permite aproximar los valores de la distribucin binomial por la normal en determinados

    proposicin es consecuencia directa de un teorema ms general nos permitir determinar probabilidades de la

    ( ),X Bi n p tal que . Entonces la variable X se puede aproximar por una distribucin

    Como es lgico, el hecho de aproximar una variable discreta como la binomial, a continua como la normal, da lugar a un problema. El problema es que mientras s

    existe la probabilidad de que una binomial tome un valor concreto, en el caso de la normal, esta probabilidad es cero. Para resolver este problema, se introducen las

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 9

    llamadas correcciones de Yates, que consiste en considerar los valores de la variable discreta X como marcas de clase de intervalos de la forma siguiente:

    Si ( ),X Bi n p , con 30 ; 5 5n np y nq , entonces ( )' ,X N np npq . Las correcciones de Yates consisten en tomar: ( ) ( )0.5 ' 0.5P X k P k X k= +

    Ejemplo 8: Se sabe que la probabilidad de que un piloto de Frmula 1 sufra un reventn en un circuito es de 0.04. Si en una carrera participan 200 conductores, calcula:

    a) La probabilidad de que se registren entre 12 y 18 reventones.

    Si consideramos como xito el que sufra un reventn, es evidente que la variable ( )200,0.04X Bi . Evidentemente, calcular esta probabilidad con la funcin de

    distribucin o la de probabilidad de la binomial es una tarea bastante larga. Vemos si cumple las hiptesis para aproximarla por una normal: 200 30 ; 200 0.04 8 5n np= = = y 200 0.96 192 5nq = = . As pues, podemos aproximar la variable X por la normal

    ( ) ( )' 200 0.04, 200 0.04 0.96 8,2.77X Bi Bi . As pues, la probabilidad pedida ser, aproximadamente:

    ( ) ( ) ( )( ) ( )

    11.5 8 ' 8 18.5 812 18 11.5 ' 18.5 1.26 3.792.77 2.77 2.77

    3.79 1.26 0.99992 0.8962 0.10372

    Yates XP X P X P P Z

    P Z P Z

    = = =

    = =

    Si lo calculamos con Geogebra, el valor utilizando la binomial sale 0.107, que es bastante aproximado.

    b) La probabilidad de que se registren exactamente 5 reventones.

    ( ) ( ) ( ) ( ) ( )( )

    5 4.5 ' 5.5 1.26 0.90 1.26 0.90 1.260.90 0.8962 0.8159 0.0803

    TipificandoYatesP X P X P Z P Z P Z

    P Z= = = =

    = =

    Aunque este clculo s se podra hacer fcilmente con la calculadora:

    ( ) 5 1952005 0.04 0.96 0.09065P X

    = =

    .

    Se proponen las actividades 7 y 8.

    4.- MUESTREO.

    A partir de este punto, vamos a comenzar a trabajar especficamente los contenidos ms relevantes de la unidad relativos a la Inferencia Estadstica, comenzando por el muestreo. Ya definimos al comienzo de la unidad los conceptos de poblacin y muestra. La primera pregunta a la que nos enfrentamos es la de cmo elegir una muestra de la poblacin y de qu tamao debe tomarse. A estas preguntas iremos respondiendo a lo largo de los siguientes puntos y vamos a comenzar describiendo las principales tcnicas de muestreo. Hay muchas maneras de elegir una muestra de una poblacin y lo que debemos tratar siempre es que la muestra sea lo ms representativa posible de toda

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 10

    la poblacin y con un nmero de elementos con el que se pueda trabajar de manera cmoda y fiable. Para que una muestra sea representativa, es imprescindible que el muestreo sea aleatorio, es decir, que los individuos de la poblacin, en la medida de lo posible, tengan las mismas posibilidades de ser elegidos. Por ello, nos centraremos en los llamados muestreos probabilsticos, en los que la persona que realiza el estudio, elige al azar a los individuos que conformarn la muestra. En lo que sigue, designaremos por N al tamao de la poblacin y por n al tamao de la muestra.

    Definicin 9: Un muestreo se llama:

    a) Aleatorio simple, cuando cada individuo de la poblacin tiene la misma probabilidad de ser elegido.

    b) Sistemtico, cuando se elige al azar a un individuo de la poblacin y, a partir de este, se eligen los dems a intervalos constantes.

    c) Estratificado, cuando se divide a la poblacin en clases o estratos y se escogen aleatoriamente un nmero de individuos de cada estrato mediante muestreo aleatorio simple o sistemtico. Puede ser:

    Con afijacin igual si se toma el mismo nmero de individuos de cada estrato sin tener en cuenta su tamao.

    Con afijacin proporcional, si se toma el nmero de individuos de cada estrato proporcionalmente al tamao del mismo.

    d) Por conglomerados, si se divide la poblacin en conjuntos o conglomerados, se eligen al azar algunos de estos conglomerados y se escoge una muestra nicamente de estos conglomerados por muestreo aleatorio simple.

    Nota 8: No se debe confundir estrato con conglomerado. Mientras que un estrato es homogneo (sus individuos tienen caractersticas del estudio comunes), el conglomerado es heterogneo (sus individuos no tienen porqu tener caractersticas del estudio comunes para que representen bien a la poblacin)

    Ejemplo 9: Supongamos que de los 600 alumnos/as de ESO de un instituto, queremos escoger una muestra de 30 para hacer un estudio sobre la edad.

    a) Un muestreo aleatorio simple se podra hacer utilizando un censo del alumnado (en el que aparece ordenando alfabticamente) y escoger al azar 30 nmeros del 1 al 600.

    b) Un muestreo aleatorio sistemtico se podra hacer eligiendo al azar un nmero del 1 al 600 y tomar a los 29 restantes separados por intervalos de 600 20

    30= en 20. Si, por

    ejemplo, sale en el sorteo el 457, elegiramos a los/as alumnos/ que tengan los nmeros 477, 497, 517, 537, 557, 577, 597, 17, 37, 57, 77, 97, 117,, 417, 437.

    c) Uno estratificado sera, por ejemplo, considerar los estratos: 1 ESO (en el que hay 192), 2 ESO (en el que hay 173), 3 ESO (en el que hay 149) y 4 ESO (en el que hay 86).

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 11

    Con afijacin igual, escogeramos a 30 7.54

    = de cada nivel. Como esto es imposible,

    tendramos que elegir entre 7 u 8 alumnos/as de cada nivel. Como hay ms en 1 y 2, lo lgico sera escoge 8 de 1, 8 de 2, 7 de 3 y 7 de 4 mediante muestreo aleatorio simple o sistemtico.

    Con afijacin proporcional, escogeramos un nmero de alumnos/as en cada muestra proporcional al nmero de alumnos que tiene el estrato. Para ello, basta con hacer una regla de tres para cada estrato:

    11

    1

    Total Muestra600 30 192 30600 30 9.6 10 alumnos/as de 1 ESO192 600

    192

    nn

    n

    = = =

    Anlogamente, tomaramos 9 de 2 ESO, 7 de 3 y 4 de 4 ESO.

    d) Uno por conglomerados sera escoger, por ejemplo, los conglomerados de chicas y chicos y escoger uno de ellos al azar, por ejemplo el de las chicas. Despus, se toman 30 chicas mediante muestreo aleatorio simple. Es algo similar a lo hecho en el apartado a pero slo con las chicas.

    Nota 9: Adems de esto, hemos de tener en cuenta que todo muestreo se puede llevar a cabo con reemplazamiento (cuando un mismo individuo puede aparecer varias veces en la muestra. En este sentido, una poblacin finita puede ser considerada como infinita) o sin reemplazamiento (cuando no puede aparecer ms que una vez). Siguiendo las directrices de las PAU, nos centraremos siempre en muestreos con reemplazamiento y nicamente estudiaremos muestreos aleatorios simples o estratificados, en la inmensa mayora de los casos, con afijacin proporcional.

    Se propone la actividad 9

    5.- DISTRIBUCIONES MUESTRALES.

    Una vez vistas las principales tcnicas de muestreo, el siguiente paso en un estudio de inferencia estadstica es realizar inferencias sobre ciertos parmetros poblacionales a partir de datos muestrales. Los parmetros muestrales habituales (media, desviacin tpica y proporcin habitualmente) nos van a permitir decidir sobre la aproximacin ms conveniente de los correspondientes parmetros poblacionales. Por ello es necesario que estudiemos, como primer paso, las distribuciones que siguen estos parmetros. En esta unidad, nos centraremos en estudiar los parmetros media y proporcin asociados a las dos distribuciones habituales: la normal y la binomial.

    5.1.- Distribucin muestral de medias.

    Si consideramos todas las posibles muestras de tamao n que se pueden extraer de una poblacin, podemos considerar como una variable aleatoria a la media X cuyo valor sera la media aritmtica de cada muestra.

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 12

    Definicin 10: Llamamos distribucin muestral de medias a la distribucin de la variable X descrita anteriormente.

    Proposicin 7: (Propiedades de la distribucin muestral de medias) La distribucin muestral de medias definida anteriormente verifica:

    a) La media o esperanza de X coincide con la media poblacional , es decir, XX = b) La desviacin tpica de X coincide con X

    n, es decir, XX

    n=

    (siempre que la muestra sea con reemplazamiento) c) Si ( ),X N , entonces , X N

    n

    Para salvar el inconveniente de clculos en poblaciones que no se distribuyan normalmente, es de enorme importancia el siguiente teorema, que es una consecuencia del llamado Teorema Central del Lmite.

    Proposicin 8: Sea X una variable estadstica y consideramos la distribucin muestral de medias con n suficientemente grande ( 30n ), entonces la distribucin muestral de medias se aproxima a una distribucin normal y podemos considerar en la prctica que

    ,X N n

    .

    Nota 10: En las actividades de este curso consideraremos siempre distribuciones normales o no normales con tamao muestral 30n , por lo que siempre podremos considerar la distribucin muestral de medias como una normal por el teorema anterior.

    Nota 11: En algunos casos prcticos, la desviacin tpica poblacional X es desconocida. En estos casos, si el tamao de la muestra es suficientemente grande, normalmente

    100n , podemos tomar como aproximacin la desviacin tpica de la muestra XS .

    Ejemplo 10: Las estaturas de 1200 estudiantes de un centro de enseanza se distribuyen normalmente con una media de 1,72 m y desviacin tpica 0,09. Si se toma al azar una muestra de 36 estudiantes. Hallemos:

    a) La probabilidad de que la media sea inferior a 1,75 m Como hemos visto, la distribucin muestral de medias sigue una distribucin normal:

    ( ) ( ) ( )0.09 1.72 1.75 1.721.72, 1.72,0.015 1.75 2 0.97720.015 0.01536XX N N P X P P Z = = = =

    b) La probabilidad de que la media est entre 1,68 m y 1,73 m.

    ( ) ( )( ) ( ) ( ) ( ) ( ) ( )( )

    1.68 1.72 1.72 1.73 1.721,68 1.73 2.67 0.670.015 0.015 0.015

    0.67 2.67 0.67 2.67 0.67 1 2.670.7486 1 0.9962 0.7448

    XP X P P Z

    P Z P Z P Z P Z P Z P Z

    = = =

    = = = =

    = + =

    Se proponen las actividades 10, 11 y 12.

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 13

    5.2.- Distribucin muestral de proporciones.

    De manera anloga a lo hecho con las medias, podemos considerar todas las posibles muestras de tamao n de una poblacin con una distribucin binomial de probabilidad de xito p y considerar las proporciones muestrales p como una variable aleatoria.

    Definicin 11: Llamamos distribucin muestral de proporciones a la distribucin de la variable p descrita anteriormente.

    Proposicin 9: (Propiedades de la distribucin muestral de proporciones) La distribucin muestral de proporciones definida anteriormente verifica:

    a) La media o esperanza de p coincide con la media poblacional p, es decir, p p= b) La desviacin tpica de p coincide con p q

    n

    , es decir, pp q

    n

    = (siempre que la muestra sea con reemplazamiento)

    Proposicin 10: Sea X una variable binomial y consideramos la distribucin muestral de proporciones con n suficientemente grande ( 30n ), siendo adems 5 5n p y n q Entonces la distribucin muestral de proporciones se aproxima a una distribucin normal y

    podemos considerar en la prctica que , p qp N pn

    .

    Nota 12: Aunque es poco habitual, si en algn caso prctico, es desconocido el parmetro p, lo aproximaremos por la proporcin muestral siempre que el tamao sea suficientemente grande, normalmente 100n .

    Ejemplo 11: Una mquina fabrica piezas de precisin. En su produccin habitual, fabrica un 3% de piezas defectuosas. Un cliente recibe una caja de 500 piezas procedentes de la fbrica. Calculemos la probabilidad de que:

    a) Haya ms de un 5% de piezas defectuosas en la caja. De acuerdo con lo visto anteriormente, la distribucin muestral de proporciones sigue una

    distribucin normal ( )0.03 0.97 0.03, 0.03,0.0076500p N N

    =

    . As pues, la

    probabilidad pedida ser:

    ( ) ( ) ( ) 0.03 0.05 0.03 0.05 2.63 1 2.63 1 0.9957 0.00430.0076 0.0076pP p P P Z P Z > = > = > = = =

    b) Haya menos de 10 piezas defectuosas en la caja. Como 10 piezas constituyen el 2% de las piezas (a saber: 10 0.02

    500= ), la probabilidad

    pedida es: ( ) ( ) ( ) 0.03 0.02 0.03 0.01 1.32 1.320.0076 0.0076pP p P P Z P Z < = < = < = > =

    ( )1 1.32 1 0.9066 0.0934P Z= = = .

    Se proponen las actividades 13 y 14.

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 14

    6.- ESTIMACIN DE PARMETROS.

    Ya hemos estudiado la base de la Estadstica Inferencial, que son la teora de muestreo y las distribuciones muestrales. El principal problema de las distribuciones muestrales es que lo normal es que no se tengan datos exactos de los parmetros poblacionales. Para ello, se utiliza la estimacin de parmetros, tanto puntual como por intervalos, que vamos a abordar a continuacin, y el contraste de hiptesis que veremos al final de la unidad.

    6.1.- Estimacin puntual.

    Definicin 12: Llamamos estadstico a toda funcin de los datos muestrales que asigna a cada muestra de tamao n un valor numrico.

    Definicin 13: Un estimador para un parmetro poblacional desconocido es un estadstico que nos proporciona una aproximacin de dicho parmetro poblacional.

    Ejemplo 12: Un estimador para la media poblacional es la media muestral X .

    6.2.- Estimacin por intervalos de confianza.

    Evidentemente, en la mayora de las ocasiones, no tiene mucho sentido llevar a cabo una estimacin puntual sino ms bien una estimacin de entre qu dos valores se puede encontrar un cierto parmetro con una probabilidad prefijada. A esto nos dedicaremos en este punto en el que abordaremos la estimacin mediante intervalos de confianza.

    Definicin 14: Llamamos intervalo de confianza para un parmetro poblacional al intervalo que contiene a dicho parmetro con una probabilidad, tambin llamada nivel de confianza 1cN = . Al valor de se le llama nivel de significacin.

    Nota 13: En este curso nicamente abordaremos los intervalos de confianza para la media y la proporcin p de distribuciones normales (o con tamao suficientemente grande para aproximarlas a una normal) y binomiales (que tambin la aproximamos a la normal).

    Nota 14: Obsrvese que el intervalo de confianza no es ms que un intervalo en el que se encontrara el parmetro poblacional con una probabilidad o confianza de 1cN = . Adems, como es lgico, no tiene mucho sentido hallar intervalos de confianza con poca confianza ya que no aportaran mucha informacin precisa. Por ello, los valores ms comunes del nivel de confianza son 90%, 95% y 99%, que corresponden a los valores 0.90, 0.95 y 0.99 de 1cN = .

    Como es lgico tambin, en virtud de los resultados consecuentes del Teorema Central del Lmite usados para describir las distribuciones muestrales, hemos de pensar que dichos intervalos van a estar asociados a una distribucin Normal. Por ello, el primer paso lgico es determinar el valor /2z de la tabla de la Normal asociado a cada nivel de confianza y que debe cumplir: ( )/2 /2 1 P z Z z = , ya que es lgico que est centrado en la media.

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 15

    Ahora bien, como pretendemos determinar un intervalo de confianza para la media poblacional a partir de la media muestral y sabemos por el punto anterior que la distribucin de medias muestrales sigue una distribucin normal

    ,X N n

    . Entonces, la expresin es equivalente a:

    /2 /2 /2 /21 1Simetra

    X P z z P z X z n nn

    = =

    /2 /2 /2 /21 1 P z X z P X z X z n n n n

    = + =

    As pues, el intervalo de confianza para la media poblacional con un nivel de confianza

    1cN = , viene dado por la frmula: /2 /2,c I X z X zn n

    = +

    que ser la que

    usemos directamente en las actividades.

    Nota 15: Como es evidente, el valor /2z , al que llamamos valor crtico asociado al nivel

    de confianza 1 verifica que ( )/2 11 2 2 cNP Z z + = = . No hay ms que usar la tabla

    de la Normal para determinar el valor crtico /2z que necesitamos para determinar el intervalo de confianza.

    Nota 16: Segn hemos visto en la construccin del intervalo de confianza, la diferencia

    mxima entre la media muestral y la poblacional, es /2E zn

    =

    y se le llama error

    mximo admisible y es la mitad de la amplitud del intervalo /22A zn

    = . De la

    expresin del error, podemos despejar el tamao muestral 2

    /2znE

    =

    Ejemplo 13: Una muestra aleatoria de 100 alumnos/as que se presenta a las PAU revela que la media de edad es de 18,1 aos. Halla un intervalo de confianza del 90% para la media de edad de todos los estudiantes, sabiendo que la desviacin tpica de la poblacin es de 0,4

    Evidentemente, los datos son: 100 ; 18.1 ; 1 0.9 ; 0.4cn X N= = = = = , as pues, el nico dato que necesitamos para aplicar la frmula del intervalo de confianza es el valor crtico /2z que cumplir en este caso que: ( )/2 /20.95 1.645

    TablaP Z z z = = . As pues, el

    intervalo de confianza ser ( )0.4 0.418.1 1.645 ,18.1 1.645 18.0342 , 18.1658100 100c

    I = + =

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 16

    cuyo significado es que la media de la edad de todo el alumnado de la poblacin se encuentra entre 18.0342 y 18.1658 con una probabilidad de 0.9, correspondiente al 90%.

    Ejemplo 14: Se sabe que la dedicacin media de los jvenes al ocio sigue una distribucin normal de desviacin tpica 63 minutos. Hallemos la media muestral y el tamao mnimo de la muestra de jvenes que garantiza con una probabilidad de 0.95 que el tiempo medio de ocio est entre 382 y 418 minutos.

    Los datos son ( )63 ; 0.95 ; 382 , 418c cN I = = = . Como la media es el punto medio del intervalo de confianza, tenemos que 382 418 400

    2X += = . Por otra parte, el error mximo

    admisible ser: 418 382 182

    E = = . Adems, el valor crtico correspondiente a un 0.95 de

    nivel de confianza viene dado por: ( )/2 /20.975 1.96Tabla

    P Z z z = = . As pues, de la

    expresin del error mximo admisible, obtenemos la igualdad: 6318 1.96n

    = . Sin ms

    que despejar n, obtenemos: 2

    21.96 63 6.86 47.059618

    n

    = = =

    . As pues, el tamao

    muestral mnimo es de 48 jvenes.

    Se proponen las actividades 15 y 16.

    Vamos a ver ahora cmo se construye el intervalo de confianza para la proporcin en el caso de una Binomial.

    El punto de partida, como en el caso de la Normal, es que los valores crticos han de cumplir la igualdad ( )/2 /2 1 P z Z z = . Ahora bien, hemos visto durante la unidad que, para poblaciones grandes ( )30n , la distribucin muestral de proporciones sigue una normal , p qp N p

    n

    . Como no disponemos de p, se estima puntualmente por la

    proporcin muestral p . Entonces, la expresin es equivalente a:

    /2 /2 /2 /2

    1 1

    Simetra

    p p p q p qP z z P z p p z n np q

    n

    = =

    /2 /2 /2 /2

    1 1

    p q p q p q p qP z p p z P p z p p z n n n n

    = + =

    As pues, el intervalo de confianza para la proporcin con un nivel de confianza 1cN = ,

    viene dado por la frmula: /2 /2

    ,c

    p q p qI p z p zn n

    = +

    que ser la que usemos

    directamente en las actividades.

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 17

    Nota 17: Como es evidente, el valor crtico /2z , asociado al nivel de confianza 1

    verifica que ( )/2 11 2 2 cNP Z z + = = . No hay ms que usar la tabla de la Normal para

    determinar el valor crtico /2z que necesitamos para determinar el intervalo de confianza.

    Nota 18: Segn hemos visto en la construccin del intervalo de confianza, la diferencia mxima entre la proporcin muestral y la poblacional, al que ya antes hemos llamado

    error mximo admisible, es /2 p qE zn

    = y es la mitad de la amplitud del intervalo

    /2

    2 p qA zn

    = . De la expresin del error, podemos despejar el tamao muestral 2

    /22

    z p qn

    E

    =

    Nota 19:

    Conviene tener en cuenta que, tanto en el caso de la normal, como en el de la binomial:

    a) Manteniendo el mismo nivel de confianza y tamao muestral, a medida que aumenta la desviacin tpica (en el caso normal) o el producto p q (en el caso binomial), aumenta el error mximo admisible y la amplitud del intervalo de confianza; y viceversa. b) Manteniendo la misma desviacin tpica (en el caso normal) o el producto p q (en el caso binomial) y tamao muestral, a medida que aumenta el nivel de confianza, aumenta el error mximo admisible y la amplitud del intervalo de confianza; y viceversa. c) Manteniendo el mismo nivel de confianza y desviacin tpica (en el caso normal) o el producto p q (en el caso binomial), a medida que aumenta el tamao muestral, disminuye el error mximo admisible y la amplitud del intervalo de confianza; y viceversa.

    Si lo pensamos detenidamente es lgico y natural lo que hemos expresado, ya que:

    a) Si aumenta la desviacin, la muestra es ms dispersa y, al estar menos concentrada en torno a la media, es lgico que nos equivoquemos ms al hacer inferencia sobre el comportamiento de la poblacin. Lo contrario ocurre si disminuye, ya que al estar ms concentrada, se comete menos error.

    b) Si aumenta el nivel de confianza lo que hacemos es aumentar la seguridad con que queremos que est el parmetro en un intervalo. Eso hace que dicho intervalo sea menos preciso y por tanto, con mayor error de equivocarnos. Lo contrario ocurre si se disminuye la confianza ya que lo volvemos ms exigente y, por tanto, con menos error.

    c) Si aumenta el tamao, la muestra se parecer ms a la poblacin y, por tanto, es lgico que se cometa menor error. Lo contrario ocurre al disminuir el tamao muestral, ya que, al ser menos representativa de la poblacin, aumenta el error.

    Ejemplo 15: Se selecciona una muestra de 500 alumnos/as de ESO y se les pregunta si tienen smartphone con conexin de datos, contestando afirmativamente 225. Veamos cul es el intervalo de confianza para la proporcin de alumnos/as que tienen smartphone con conexin de datos con un nivel de confianza del 95%

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 18

    Evidentemente, los datos son: 225500 ; 0.45 ; 1 0.95500 c

    n p N= = = = = , as pues, el

    nico dato que necesitamos para aplicar la frmula del intervalo de confianza es el valor crtico /2z que cumplir en este caso que: ( )/2 /20.95 1.645

    TablaP Z z z = = . As pues, el

    intervalo de confianza ser

    ( )0.45 0.55 0.45 0.550.45 1.96 ,0.45 1.96 0.4064 , 0.4936500 500cI

    = + =

    , cuyo significado

    es que la proporcin de todo el alumnado de la poblacin que tiene smartphone con datos se encuentra entre 0.4064 y 0.4936 con una probabilidad de 0.95, correspondiente al 95%, o dicho de otra manera que hay entre un 40.64% y un 49.36% de alumnado que tiene smartphone con datos con una probabilidad del 95%.

    Ejemplo 16: Deseamos conocer el nmero de nios que hay que incluir, como mnimo, en una encuesta sobre la adecuada alimentacin en el desayuno, sabiendo que, con un nivel de confianza del 99.73%, ha resultado el intervalo de confianza para la proporcin de nios que lleva a cabo una adecuada alimentacin en el desayuno el siguiente: ( )0.42 , 0.50

    Los datos son ( )0.9973 ; 0.42 , 0.50c cN I= = . Como la proporcin muestral es el punto medio del intervalo de confianza, tenemos que 0.42 0.50 0.46

    2X += = . Por otra parte, el

    error mximo admisible ser: 0.50 0.42 0.042

    E = = . Adems, el valor crtico

    correspondiente a un 0.9973 de nivel de confianza viene dado por:

    ( )/2 /20.9973 3Tabla

    P Z z z = = . As pues, de la expresin del error mximo admisible,

    obtenemos la igualdad: 0.46 0.540.04 3n

    = . Sin ms que despejar n, obtenemos: 2

    23 0.46 0.54 1397.25

    0.04n

    = = . As pues, el tamao muestral mnimo es de 1398 nios.

    Se proponen las actividades 17 y 18.

    7.- CONTRASTES DE HIPTESIS.

    El ltimo paso en el estudio de la Inferencia Estadstica que vamos a abordar es el llamado Contraste de Hiptesis, cuyo principal objetivo es tomar decisiones sobre si determinadas hiptesis o supuestos a partir de muestras, pueden extrapolarse a la poblacin con un determinado nivel de confianza.

    Definicin 15: Un contraste o test de hiptesis es el procedimiento estadstico mediante el cual se investiga la veracidad o falsedad de una hiptesis acerca de algn parmetro poblacional. Llamaremos hiptesis nula 0H a la hiptesis que se formula y que se desea contrastar, y llamaremos hiptesis alternativa 1H a cualquiera otra situacin que sea contraria a la hiptesis nula.

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 19

    Definicin 16: Se llaman pruebas de hiptesis a los procedimientos que permiten decidir si una hiptesis se acepta o rechaza o determinar si las muestras observadas difieren significativamente de los resultados esperados.

    Nota 20: Hemos de tener en cuenta algunas consideraciones que tendremos para esta unidad.

    a) En esta unidad nos centraremos en hiptesis sobre los parmetros habituales con los que hemos trabajado en la unidad: parar la media poblacional de variables normales o aproximables por una normal y p para la proporcin poblacional en el caso binomial..

    b) Abordaremos dos tipos de contrastes de hiptesis: el contraste unilateral, que implica una desigualdad en la hiptesis nula y el bilateral, que implica una igualdad. Ambos lo veremos detalladamente en lo que sigue.

    c) Como en todo estudio, podemos cometer errores debidos a que la informacin muestral nos da a pensar en algo distinto a las hiptesis debido a que la muestra, por el motivo que sea, no es lo ms representativa que debe ser de la poblacin estudiada. Estos errores los podemos clasificar en:

    H0 es verdadera H0 es falsa Se acepta H0 Acierto ERROR DE TIPO II

    Se rechaza H0 ERROR DE TIPO I Acierto

    En la siguiente nota, vamos a ver la parte ms importante en la prctica de este punto de la unidad, ya que vamos a describir paso a paso, las etapas en las pruebas de hiptesis.

    Nota 21: (Etapas en las pruebas de hiptesis)

    ETAPA 1: FORMULAR LAS HIPTESIS

    En este paso, que habitualmente nos vendr dado en las actividades, se deben formular las hiptesis nula y alternativa que sern objeto del contraste. Ambas hiptesis, que como hemos visto deben ser excluyentes, pueden ser enunciadas para un contraste unilateral y bilateral. Los casos que abordaremos en esta unidad son:

    Contraste bilateral Contraste unilateral Derecho Izquierdo

    Media ( ) 0 01 0

    :

    :

    H H

    =

    0 0

    1 0

    :

    :

    H H

    >

    0 0

    1 0

    :

    :

    H H

    0 0

    1 0

    :

    :

    H p pH p p

    0 0

    1 0

    :

    :

    H H

    0 0

    1 0

    :

    :

    H p pH p p

    El nivel de significacin es 0.05 = .

    Como se trata de un contraste unilateral derecho, hemos de hallar el valor

    z tal que

    ( ) 0.95P Z z = . Este valor corresponde, segn la tabla de la normal, a /2 1.645z = .

    As pues, la regin de aceptacin correspondiente a Z sera ( ), 1.645 .

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 23

    Como se trata de una distribucin normal, el estadstico de contraste sera: 0X Z

    n

    = .

    En nuestro caso: 6 64 0.564

    X XZ = =

    Sustituyendo en el estadstico de contraste: 05 6 20.5

    z

    = = que es un valor dentro de la

    regin de aceptacin, ya que: ( )2 , 1.645 , por tanto, se acepta la hiptesis nula 0H y podemos aceptar, a un 95% que el tiempo medio de empleo de la poblacin est por debajo de 6 aos.

    2 FORMA:

    La otra forma de enfocar el contraste es utilizando las regiones de aceptacin ya destipificadas expresadas en la variable del problema. En nuestro caso (ver nota 21) sera: ( )0 4, , 6 1.645 , 6.822564

    z

    n

    + = + =

    Como el valor de la media muestral calculado: ( )5 , 6.8225 , se acepta la hiptesis nula 0H y podemos aceptar, a un 95% que el tiempo medio de empleo de la poblacin est por debajo de 6 aos.

    Ejemplo 19: (Contraste bilateral en una distribucin Binomial) Al lanzar 5000 veces una moneda al aire salieron 3000 caras. Se puede aceptar, con un nivel de significacin del 0.04, que la moneda no est trucada?

    1 FORMA:

    Como la moneda no trucada tiene probabilidad de salir cara 0.5, es evidente que el

    contraste de hiptesis sera: 01

    : 0.5: 0.5

    H pH p

    =

    El nivel de significacin es 0.04 = . Como se trata de un contraste bilateral, hemos de hallar el valor /2z tal que ( ) ( )/2 /2 /20.96 0.98 P z Z z P Z z = = . Este valor corresponde, segn la tabla de la normal, a /2 2.05z = . As pues, la regin de aceptacin correspondiente a Z sera ( )2.05 , 2.05 . Como se trata de una distribucin binomial, el estadstico de contraste sera: 0

    0 0

    p pZp q

    n

    =

    .

    En nuestro caso: 0.5 0.5

    0.00710.5 0.55000

    p pZ =

    Si determinamos el valor de la proporcin muestral: 3000 0.65000

    p = = .

  • UNIDAD 7: ESTADSTICA INFERENCIAL

    Matemticas II CCSS. 2 de Bachillerato B. Prof.: Santiago Martn Fernndez Pgina 24

    Sustituyendo en el estadstico de contraste: 00.6 0.5 140.0071

    z

    = que es un valor fuera de la

    regin de aceptacin, ya que: ( )14 2.05 , 2.05 , por tanto, se rechaza la hiptesis nula 0H y podemos aceptar, a un 96% que la moneda est trucada.

    2 FORMA:

    La otra forma de enfocar el contraste es utilizando las regiones de aceptacin ya destipificadas expresadas en la variable del problema. En nuestro caso (ver nota 21) es:

    ( )0 0 0 00 /2 0 /2 0.5 0.5 0.5 0.5, 0.5 2.05 , 0.5 2.05 0.4855, 0.51455000 5000 p q p qp z p z

    n n

    + = + =

    Como el valor de la proporcin muestral calculado: ( )0.6 0.4855 , 0.5145 , se rechaza la hiptesis nula 0H y podemos aceptar, a un 96% que la moneda est trucada.

    Ejemplo 20: (Contraste unilateral en una distribucin Binomial) Un experto, basado en los anteriores comicios, sostiene que si se celebran elecciones generales en este momento, tan solo acudira a votar el 48% de la poblacin. No obstante, en un sondeo electoral realizado recientemente, entre 1500 personas, 800 de ellas tienen intencin de votar. Supone esto, con un nivel de confianza del 99%, que el experto se equivoca y la intencin de voto es mayor?

    1 FORMA:

    Como la proporcin muestral es: 800 0.53331500

    p = , parece lgico pensar que el

    supuesto del experto sea cierta, por ello planteamos el contraste: 01

    : 0.48: 0.48

    H pH p