Estadística inferencial

download Estadística inferencial

of 160

description

bnvb

Transcript of Estadística inferencial

  • EPE

    TTULO : Material de enseanza FECHA : Abril del 2015

    CURSO : Estadstica Inferencial CODIGO : MA148, CE29 REA : Ciencias CICLO : 2015 - 01

  • 2

    INDICE 0. INTRODUCCION: CONCEPTOS PRELIMINARES

    3

    1. PRUEBA DE HIPTESIS PARA UN PARMETRO

    9

    1.1 Conceptos generales 10 1.2 1.3

    Pruebas de Hiptesis para Una Media Poblacional Pruebas de Hiptesis para Una Proporcin Poblacional

    13 18

    2. PRUEBA DE HIPTESIS PARA DOS PARMETROS

    23

    2.1 Pruebas de Hiptesis para Dos varianzas Poblacionales 24 2.2 2.3

    Pruebas de Hiptesis para Dos Medias Poblacionales: muestras independientes Caso 1: Varianzas Homogneas Caso 2: Varianzas Heterogneas Pruebas de Hiptesis para Dos Medias Poblacionales: muestras relacionadas

    29 29 35 43

    2.4 Pruebas de Hiptesis para Dos Proporciones Poblacionales 46 3. PRUEBAS DE HIPTESIS USANDO LA DISTRIBUCION CHI-CUADRADO

    52

    3.1 Prueba de Independencia 53 3.2 Prueba de Homogeneidad de proporciones 59 3.3 Pruebas de Bondad de Ajuste 62

    4. ANLISIS DE VARIANZA DE UN FACTOR

    69

    4.1 Conceptos Bsicos 70 4.2 Diseos Completamente Aleatorizado 72 4.3 Pruebas de comparacin: Prueba DMS 74 5. ANLISIS DE REGRESIN

    78

    5.1 Regresin lineal simple 79 5.2 Anlisis de regresin no lineal 90 5.3 Regresin lineal mltiple 94

  • 3

    Introduccin.

    La Estadstica estudia los mtodos cientficos para recoger, organizar, resumir y analizar datos,

    as como para sacar conclusiones vlidas y tomar decisiones razonables basadas en el anlisis.

    La Estadstica es una ciencia que estudia la recoleccin, anlisis e interpretacin de datos, ya

    sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de

    algn fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional.

    IMPORTANCIA DE LA ESTADISTICA EN LA ADMINISTRACION

    La Estadstica es de gran importancia en las diferentes empresas, enfocadas desde cualquier

    rea profesional ya que:

    Ayuda a lograr una adecuada planeacin y control apoyados en los estudios de

    pronsticos, presupuestos etc.

    Incrementan la participacin de los diferentes niveles de la organizacin, cuando existe

    motivacin adecuada.

    Obliga a mantener un archivo de datos histricos controlables.

    Facilita a la administracin la utilizacin ptima de los diferentes insumos.

    Facilita la coparticipacin e integracin de las diferentes reas de la compaa.

    Obliga a realizar un auto anlisis peridico.

    Facilita el control administrativo.

    Ayuda a lograr una mayor efectividad y eficiencia en las operaciones.

    A travs de los pronsticos, se pueden prever las perdidas en los resultados de los

    estados financieros futuros, y de esta manera se pueden tomar decisiones bien sea la

    reduccin de costos y gastos, planear estrategias que ayuden al mejoramiento de la

    empresa, y que se cumpla con el objetivo de toda empresa que es obtener utilidades

    Por ltimo nos ayuda a tomar decisiones objetivas como:

    Qu clientes les generan los mayores beneficios?

    Qu zonas o regiones son las que generan mayores ventas?

    Cul es el nivel de satisfaccin de sus clientes?

    Cul es el nivel de rotacin o permanencia de clientes?

    Las estadsticas son fundamentales tanto para la administracin financiera, como para la

    administracin de operaciones, las ventas, el marketing, las cobranzas, la logstica y la gestin

    de personal entre otras reas y actividades de toda corporacin.

    Definiciones

    Poblacin: Es el conjunto de todos los elementos que se desean analizar y que presentan

    una o varias caractersticas en comn. Dependiendo del nmero de elementos que lo

    conforman, una poblacin puede ser finita o infinita.

  • 4

    Muestra: Es un subconjunto representativo de elementos provenientes de una poblacin.

    La muestra es seleccionada de acuerdo a un plan de muestreo, con el fin de que la muestra

    represente adecuadamente a la poblacin.

    Unidad Elemental: Es cada una de las personas, animales u objetos de las que se requiere

    informacin. Estos elementos estn afectados por las caractersticas que se desea estudiar.

    Constituye la unidad ms pequea de la poblacin y de las muestra.

    Variable: Es todo factor o caracterstica que se desea evaluar de las unidades elementales.

    Las variables pueden ser cualitativas (nominal jerrquicas) cuantitativas (discreta

    continua).

    Por ejemplo: Si nuestra poblacin est conformada por todos los clientes de una gran

    tienda comercial que realizan cambios devoluciones de algn producto, la muestra sera

    un nmero determinado de clientes elegidos bajo algn esquema de muestreo. Las variables

    a estudiar pueden ser las que se muestran parcialmente en la siguiente base de datos:

    Par

    Variable

    cuantitativa

    continua

    Variable

    cuantitativa

    continua

    Variable cualitativa

    nominal

    Variable cualitativa

    nominal

    Variable

    cualitativa

    nominal

    Variable

    cuantitativa

    discreta

    Medidas

    de

    resumen

    Edad promedio

    de los clientes de la tienda.

    Monto promedio

    de la devolucin.

    Proporcin

    de clientes que son del

    Sur

    Proporcin de

    clientes que son del sexo

    femenino.

    Proporcin de

    devoluciones que son por defecto

    de fbrica.

    Nmero promedio de

    das hasta la devolucin.

  • 5

    Pmetro: Es una medida que resume la informacin de la(s) caracterstica(s) de inters de

    la poblacin.

    Caractersticas:

    Es un valor nico.

    Generalmente desconocido.

    Para hallar su valor se necesita de todos los elementos de la poblacin.

    Estadgrafo: Es una medida que resume la informacin de la(s) caracterstica(s) de inters

    de la muestra..

    Caractersticas:

    No es un valor nico si no variable. Su valor cambia de muestra a muestra.

    Para hallar su valor se necesita slo de los elementos de la muestra.

    Tambin se le conoce como estimador puesto que estima al parmetro poblaiconal.

    Las notaciones utilizadas para un parmetro y su respectivo estimador puntual son las

    siguientes:

    Parmetro Estimador puntual

    x

    2 s2

    p p

    Nota: Tanto el parmetro como el estadgrafo son medidas de resumen, la diferencia radica

    en que el parmetro usa los datos de todos los elementos de la poblacin mientras que el

    estadgrafo usa los datos de una muestra.

    Ramas de Estadstica:

    Estadstica Descriptiva

    Es la rama de Estadstica que se ocupa de la recoleccin, clasificacin y simplificacin de

    la informacin. La informacin recolectada se resume en cuadros (tablas) y grficos los

    cuales deben describir en forma apropiada el comportamiento de la informacin

    recolectada.

  • 6

    Estadstica Inferencial

    Es la rama de Estadstica que se ocupa de los procesos de estimacin (puntual y por

    intervalos), anlisis y pruebas hiptesis. La finalidad de la estadstica inferencial es llegar

    a conclusiones que brinden una adecuada base cientfica para la toma de decisiones,

    considerando la informacin muestral recolectada.

    En otras palabras la estadstica inferencial se ocupa del anlisis, interpretacin de los

    resultados y de las conclusiones a las que se puede llegar a partir de la informacin obtenida

    de una muestra con el fin de extender sus resultados a la poblacin bajo estudio. La

    generalizacin de las conclusiones obtenidas en una muestra a toda la poblacin esta sujeta

    a riesgo por cuanto los elementos de la muestra son obtenidos mediante un muestreo

    probabilstico.

    La estadstica inferencial provee los procedimientos para efectuar la inferencia inductiva y

    medir la incertidumbre de las conclusiones que se van a generalizar. Los problemas ms

    importantes en este proceso son:

    Estimacin Puntual: Es la estimacin del valor del parmetro por medio de un nico

    valor obtenido mediante el clculo o evaluacin de un estimador para una muestra

    especfica.

    Por ejemplo: Si se quiere determinar en cul de las ciudades, Lima o Arequipa, el

    sueldo semanal promedio de un empleado es mayor

  • 7

    Estimacin por intervalos: Es la estimacin del valor de un parmetro mediante un

    conjunto de valores contenidos en un intervalo. Para la obtencin de intervalos de

    confianza se debe considerar el coeficiente de confianza que es la probabilidad de que

    el intervalo contenga al parmetro poblacional.

    Prueba de Hiptesis: Es el procedimiento estadstico de comprobacin de una

    afirmacin y se realiza a travs de las observaciones de una muestra aleatoria.

    El objetivo de la inferencia estadstica es realizar inferencias acerca de los parmetros de

    una poblacin basada en la informacin contenida en una muestra. Ahora considerando que

    las poblaciones estn caracterizadas por medidas descriptivas numricas llamadas

    parmetros, a la inferencia estadstica le corresponde inferir sobre los parmetros

    poblacionales.

    A continuacin se muestra la notacin de dos parmetros con sus respectivos estimadores

    puntuales.

    Parmetro Estimador puntual

    21 21 xx 21 xx estima puntualmente a 21

    2

    2

    2

    1 / 222

    1 / ss 2

    2

    2

    1 / ss estima puntualmente a 2

    2

    2

    1 /

    p1 - p2 21 pp 21 pp estima puntualmente a p1 - p2

  • 8

    CAPTULO I

    PRUEBA DE HIPTESIS

    PARA UN PARMETRO

  • 9

    La planificacin de una investigacin estadstica usualmente tiene por propsito

    verificar si los supuestos que se tienen sobre la poblacin en estudio se pueden aceptar

    como vlidos o deben ser considerados falsos.

    Esta seccin tiene como finalidad presentar los conceptos y aplicaciones de las

    principales pruebas de hiptesis.

    1.1 Conceptos generales

    Hiptesis estadstica: Es cualquier afirmacin o conjetura que se hace acerca de la

    distribucin de una o ms poblaciones. Por ejemplo: la longitud media de un tipo de

    objeto es de 20 centmetros, es decir, = 20; afirmar que el porcentaje de objetos defectuosos producidos por cierto proceso sea menor al 4%, es decir, 0,04p .

    Hiptesis nula (Ho): A partir de la informacin proporcionada por la muestra se

    verificar la suposicin sobre el parmetro estudiado. La hiptesis que se contrasta se

    llama hiptesis nula

    Hiptesis alterna (H1): Es la hiptesis que debe ser aceptada si se rechaza la hiptesis

    nula. Es la conclusin a la que se llegara si hubiera sufuciente evidencia en la

    informacin de la muestra para decidir que es improbable que la hiptesis nula sea

    verdadera. El hecho de no rechazar la hiptesis nula no implica que sta sea cierta,

    significa simplemente que los datos de la muestra son insuficientes para inducir un

    rechazo de la hiptesis nula.

    Tipos de errores: Cuando usamos los datos de una muestra para tomar decisiones

    acerca de un parmetro existe el riesgo de llegar a una conclusin incorrecta. De hecho

    se pueden presentar dos tipos diferentes de error cuando se aplica la metodologa de la

    prueba de hiptesis.

    Decisin estadstica

    Condicin de la poblacin No rechazar H0 Rechazar H0

    H0 verdadera Decisin correcta Error de tipo I

    H0 falsa Error de tipo II Decisin correcta

    = P(Error de tipo I) = P(Error de tipo II)

  • 10

    Ejemplo:

    Un investigador cree haber descubierto una vacuna contra el SIDA. Para verificar su

    hallazgo har una investigacin de laboratorio. De acuerdo con el resultado, se decidir

    lanzar o no la vacuna al mercado. La hiptesis nula que propone es: La vacuna no es efectiva

    a) Segn el enunciado propuesto, redacte en qu consiste el error de tipo I y tipo II.

    Ocurre cuando se rechaza una hiptesis H0 que es verdadera. La probabilidad de error tipo I viene a ser la probabilidad de rechazar H0 cuando sta es cierta. Se denota por .

    El valor es fijado por la persona que realiza la investigacin , por lo general es 5% y vara entre 1% a 10%

    Error Tipo I

    Ocurre cuando no se rechaza una hiptesis H0 que es falsa, la probabilidad de error tipo II es la probabilidad de aceptar H0cuando sta es falsa.

    Debido a que el valor real del parmetro es desconocido este error no puede ser fijado.

    Error Tipo II

  • 11

    b) Cul sera el error ms grave de cometer? Sustente su respuesta.

    Pasos a seguir en una Prueba de Hiptesis

    Paso 1 Plantear lashiptesis

    Paso 2 Fijar el nivel de significacin

    Paso 3Calcular el

    estadstico de la prueba

    Paso 4 Graficar las regiones crticas

    Paso 5Aplicar los

    criterios de decisin

    Paso 6 Concluir

  • 12

    Supuestos para las pruebas de hiptesis:

    Para las diferentes pruebas de hiptesis se deben cumplir los siguientes supuestos:

    Para pruebas de hiptesis para una media poblacional ( )

    La muestra es aleatoria. La muestra proviene de una distribucin normal o el tamao de muestra es grande.

    Prueba de hiptesis para una proporcin ( p ) La muestra es aleatoria. El tamao de muestra es grande.

    Para pruebas de hiptesis para la diferencia de medias poblacionales 1 2 y razn

    de variancias poblacionales 2

    2

    2

    1

    Las muestras son aleatorias. Las muestras provienen de distribuciones normales. Las poblaciones son independientes

    Prueba de hiptesis para la diferencia de proporciones ( p1 p2 ) Las muestras son aleatorias. Los tamaos de muestras son grandes. Las poblaciones son independientes

    Prueba de hiptesis para datos pareados muestras relacionadas La muestra es aleatoria. La diferencia de las primeras observaciones con respecto a las segundas

    observaciones (o viceversa) provienen de una distribucin normal.

  • 13

    1.2 Prueba de hiptesis para una media poblacional ()

    Cuando la muestra proviene de una poblacin normal y la varianza poblacional (2) es desconocida

    Procedimiento para realizar la prueba de hiptesis:

    1. Plantear las hiptesis

    01

    00

    01

    00

    01

    00

    :

    :

    :

    :

    :

    :

    H

    H

    H

    H

    H

    H

    2. Fijar el nivel de significacin:

    3. Calcular el valor del estadstico de prueba:

    nS

    oxt

    4. Graficar las regiones crticas

    Bilateral

    Unilateral

    Izquierda

    Unilateral

    Derecha

    H1: < 0

    H1: > 0

    H1: 0

    El estadstico tiene una distribucin

    t con (n1) grados de libertad.

  • 14

    5. Aplicar los criterios de decisin: Rechazar Ho o No rechazar Ho.

    6. Concluir.

    Sobre el estadstico de prueba

    x Es la media muestral.

    0 Es el valor supuesto de la media poblacional en la hiptesis nula.

    S Es la desviacin estndar de la muestra.

    N Es el tamao de la muestra.

    t(n-1) Denota la distribucin t de Student con n 1 grados de libertad.

    es el nivel de significacin de la prueba

    El VALOR CRTICO divide la grfica en zona de rechazo y no rechazo. Para hallar su valor en EXCEL, usaremos la siguiente funcin:

    INV.T(rea a la izquierda, grados de libertad)

    INV.T(0.05,15) INV.T(0.95,15)

  • 15

    Ejemplo 1

    Una empresa que embotella yogurt cuenta con una mquina programada para llenar botellas de

    1180 ml. Sin embargo, debido a variacin natural y desgaste, el volumen medio por botella

    puede cambiar en cualquier momento, razn por la cual se implementa el siguiente sistema de

    control: Seleccionar una muestra de 20 botellas, obtener de dicha informacin el volumen

    medio y la desviacin estndar, luego, parar la produccin y revisar la mquina si se encuentra

    evidencia en la muestra de que el volumen medio de llenado es inferior a 998 ml. Con los datos

    que se muestran a continuacin, y con un nivel de significacin de 2%, cul ser su decisin?

    Asuma que el contenido de las botellas se distribuye normalmente.

    Solucin:

    X: Volumen de llenado

    1. Hiptesis

    H0: 998

    H1: < 998

    2. Nivel de significacin: = 0.02

    3. Clculo del valor del estadstico de prueba: Procesando la informacin con Excel:

    Media 999.4465

    Error tpico 15.44193147

    Mediana 984.275

    Moda 938.74

    Desviacin estndar 69.05841694

    Varianza de la muestra 4769.06495

    Cuenta 20

    0937.020/0584.69

    9984465.999

    Ct (Este valor se ubica en la zona de no rechazo)

    4. Regin crtica:

    1074.27 938.74 979.68 938.74 986.9 966.59 1010.9 934.64 1096.88 1160.43

    953.17 1040.01 940.42 931.83 998.72 981.65 1038.48 1109.49 897.59 1009.8

    -2,2047

    0,02

  • 16

    5. Decisin: No se rechaza Ho

    6. Conclusin: No existe suficiente evidencia estadstica, con un nivel de significacin del 2%, para afirmar que el volumen medio de llenado es inferior a 998 ml. Con este resultado, no

    se proceder a parar la mquina para revisin.

    Ejemplo 2

    Star Amrica es una lnea area de capital compartido (peruano-americano) que tiene ms de

    10 aos laborando en el Per. El gerente de marketing desea realizar un estudio considerando

    como segmentos de inters a los pasajeros nacionales y extranjeros. Para realizar dicho estudio

    se seleccionaron al azar muestras aleatorias e independientes de los registros de pasajeros

    peruanos y extranjeros. Algunas de las caractersticas que desea analizar el gerente son las

    siguientes:

    Origen del pasajero: peruano o extranjero.

    Gnero: masculino o femenino.

    Opinin sobre el servicio de la aerolnea en el ltimo viaje: Psima, Mala, Regular, Buena o Muy Buena.

    Edad del pasajero (en aos)

    Peso del equipaje en el ltimo viaje (en kg).

    Parte de la informacin se presenta a continuacin:

    Origen Gnero Opinin Edad Peso

    Extranjero Mujer Regular 17 18.1

    Extranjero Hombre Regular 62 17.9

    Extranjero Hombre Regular 50 21.2

    Extranjero Mujer Regular 48 19.1

    Extranjero Mujer Regular 39 19.7

    Extranjero Hombre Mala 44 21.3

    Extranjero Mujer Regular 40 19.3

    Extranjero Mujer Mala 37 18.8

    Extranjero Mujer Muy buena 25 17.8

    Extranjero Hombre Muy buena 7 16.3

    Extranjero Hombre Regular 7 22.5

    Peruano Mujer Mala 29 24

    Peruano Hombre Buena 56 16.2

    Peruano Hombre Muy buena 44 19.4

    Peruano Hombre Buena 7 20.6

    Peruano Hombre Regular 51 22.2

  • 17

    a) Usando la base de datos completa y un nivel de significacin del 7%, es posible afirmar que el peso promedio del equipaje es menor de 21 Kg?

    Solucin

    Sea X: ...

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

    4. Regiones crticas:

    5. Decisin:

  • 18

    6. Conclusin:

    b) Usando la base de datos completa y un nivel de significacin del 6%, se puede afirmar que el peso promedio de los equipajes de los turistas de origen extranjero es mayor a los 19 Kg?

    Solucin

    Sea X: ...

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

    4. Regiones crticas:

    5. Decisin:

  • 19

    6. Conclusin:

    Ejercicio

    A&C Comunicaciones es una empresa que presta servicios de Internet a hogares de Lima

    Metropolitana. El gerente est preocupado por el reciente incremento del nmero de quejas de

    sus usuarios y ha decidido realizar un estudio cuyo objetivo principal es disminuir la cantidad

    de reclamos. Una de las variables registradas en el estudio fue el tiempo en dar respuesta a un

    reclamo. Si el tiempo supera las seis horas en promedio, se tomar la decisin, en primera

    instancia, de capacitar al personal tcnico que atiende las quejas. Una muestra aleatoria de 12

    reclamos present los siguientes resultados, en horas:

    6,8 5,5 7,3 8,5 8,4 9,1 4,4 6,7 8,3 5,7 6,2 5,2

    Con un nivel de significacin del 4% el gerente tomar la decisin, en primera instancia, de

    capacitar al personal tcnico?

    Solucin

    Sea X: ...

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

  • 20

    4. Regiones crticas:

    5. Decisin:

    6. Conclusin:

  • 21

    1.3 Pruebas de hiptesis para una proporcin poblacional (p)

    Esta prueba se realiza para verificar una suposicin que se hace sobre una proporcin

    poblacional. En este caso se utilizar la distribucin Z para realizar la inferencia.

    1. Planteamiento de las hiptesis

    01

    00

    01

    00

    01

    00

    :

    :

    :

    :

    :

    :

    ppH

    ppH

    ppH

    ppH

    ppH

    ppH

    2. Fijar el nivel de significacin:

    3. Calcular el valor del estadstico de prueba

    n

    pp

    ppZ

    oo

    o

    )1(

    4. Graficar las regiones crticas

    5. Aplicar los criterios de decisin: Rechazar Ho o No rechazar Ho.

    6. Concluir.

    Bilateral

    Unilateral

    Izquierda

    Unilateral

    Derecha

    H1 : p < p0

    H1 : p > p0

    H1 : p p0

  • 22

    Sobre el estadstico de prueba

    P Es la proporcin muestral.

    0p Es el valor supuesto de la proporcin poblacional en la hiptesis nula.

    S Es la desviacin estndar de la muestra.

    N Es el tamao de la muestra.

    Z Denota la distribucin normal estndar.

    es el nivel de significacin de la prueba

    El VALOR CRTICO divide la grfica en zona de rechazo y no rechazo. Para hallar su valor en EXCEL, usaremos la siguiente funcin:

    INV.NORM.ESTAND(rea a la izquierda)

    INV.NORM.ESTAND(0.03) INV.NORM.ESTAND(0.99)

  • 23

    Ejemplo 1

    1. Un programa que se transmite en cable encontr el ao pasado que el 40% de las denuncias que reciban sus investigadores por correo electrnico eran por estafa. En el presente ao se

    realiz un estudio similar, en el que al seleccionar una muestra de 420 mensajes electrnicos

    se encontr que en 188 de ellos eran denuncias por estafas. A un nivel de significacin del

    5%, usted afirmara que aument la proporcin de denuncias por estafa?

    Solucin

    1. Hiptesis

    40,0:

    40,0:

    1

    0

    pH

    pH

    2. Nivel de significacin: = 0.05

    3. Clculo del valor del estadstico de prueba:

    9913,1

    420

    )60,0(40,0

    40,04476,0

    Z

    4. Regiones crticas

    5. Decisin: Se rechaza Ho

    6. Conclusin: Con 5% de nivel de significacin se puede afirmar que ms del 40% de los

    investigadores reciben denuncias por estafa va correo electrnico; por lo tanto, la

    afirmacin es verdadera.

  • 24

    Ejemplo 2

    Star Amrica es una lnea area de capital compartido (peruano-americano) que tiene ms de

    10 aos laborando en el Per. El gerente de marketing desea realizar un estudio considerando

    como segmentos de inters a los pasajeros nacionales y extranjeros. Para realizar dicho estudio

    se seleccionaron al azar muestras aleatorias e independientes de los registros de pasajeros

    peruanos y extranjeros. Algunas de las caractersticas que desea analizar el gerente son las

    siguientes:

    Origen del pasajero: peruano o extranjero.

    Gnero: masculino o femenino.

    Opinin sobre el servicio de la aerolnea en el ltimo viaje: Psima, Mala, Regular, Buena o Muy Buena.

    Edad del pasajero (en aos)

    Peso del equipaje en el ltimo viaje (en kg).

    Parte de la informacin se presenta a continuacin:

    Origen Gnero Opinin Edad Peso

    Extranjero Mujer Regular 17 18.1

    Extranjero Hombre Regular 62 17.9

    Extranjero Hombre Regular 50 21.2

    Extranjero Mujer Regular 48 19.1

    Extranjero Mujer Regular 39 19.7

    Extranjero Hombre Mala 44 21.3

    Extranjero Mujer Regular 40 19.3

    Extranjero Mujer Mala 37 18.8

    Extranjero Mujer Muy buena 25 17.8

    Extranjero Hombre Muy buena 7 16.3

    Extranjero Hombre Regular 7 22.5

    Peruano Mujer Mala 29 24

    Peruano Hombre Buena 56 16.2

    Peruano Hombre Muy buena 44 19.4

    Peruano Hombre Buena 7 20.6

    Peruano Hombre Regular 51 22.2

    a) Usando la base de datos completa y un nivel de significacin del 2% la proporcin de pasajeros que consideran el servicio muy bueno, es inferior al 27%?

    Solucin

    Sea X: ...

  • 25

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

    4. Regiones crticas:

    5. Decisin:

    6. Conclusin:

  • 26

    b) Con la informacin muestral y usando un nivel de significancia del 4%, es posible afirmar que la proporcin de pasajeros de origen nacional y que consideran el servicio de la aerolnea

    como muy bueno es menor al 15%?

    Solucin

    Sea X: ...

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

    4. Regiones crticas:

    5. Decisin:

  • 27

    6. Conclusin:

    Ejercicios

    1. A&C Comunicaciones es una empresa que presta servicios de Internet a hogares de Lima Metropolitana. El gerente est preocupado por el reciente incremento del nmero de quejas

    de sus usuarios y ha decidido realizar un estudio cuyo objetivo principal es disminuir la

    cantidad de reclamos. Una de las variables registrada en el estudio fue el tiempo en dar

    respuesta a un reclamo. Si el porcentaje de quejas, con un tiempo de atencin mayor a seis

    horas, supera el 40%, se tomar la decisin, en primera instancia, de capacitar al personal de

    atencin al cliente. Una muestra aleatoria de 150 quejas arroj que 64 de ellas tenan un

    tiempo de atencin mayor a seis horas. Con un nivel de significacin del 8%, A&C

    Comunicaciones tomar la decisin, en primera instancia, de capacitar al personal de

    atencin al cliente?

    Solucin

    Sea X: ...

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

  • 28

    4. Regiones crticas:

    5. Decisin:

    6. Conclusin:

    2. Con el propsito de identificar los hbitos de compra de un Centro Comercial recientemente inaugurado en la ciudad de Trujillo, una empresa de investigacin de mercado llev a cabo

    un estudio en enero del presente ao. Algunas caractersticas de inters fueron:

    Edad: Edad del cliente

    Forma de pago: Tarjeta de crdito, Tarjeta de dbito, Efectivo.

    Monto de compra (en nuevos soles).

    Opinin sobre el servicio: Psimo, Regular, Bueno o Muy Bueno.

    Al seleccionar una muestra aleatoria de clientes que realizaron compras en una visita al

    centro comercial se obtuvieron los siguientes resultados:

    Forma de pago Total

    Efectivo 28

    Tarjeta Crdito 33

    Tarjeta. Dbito 34

    Total 95

  • 29

    De comprobarse que el porcentaje de clientes que pagan en efectivo supera el 25%, el centro

    comercial promocionar una tarjeta especial de bonificacin para millas de viaje. Se llevar

    a cabo dicha promocin? Use un nivel de significacin de 0,05

    Solucin

    Sea X: ...

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

    4. Regiones crticas:

    5. Decisin:

  • 30

    6. Conclusin:

    Ejercicios de Aplicacin.

    TEMA: Prueba de Hiptesis para un parmetro.

    1. La directora de mercadotecnia de A&B Cola est preocupada porque el producto no atrae a suficientes consumidores jvenes. Para probar su hiptesis, encuesta aleatoriamente a 100

    consumidores de A&B Cola. Se obtuvo como resultado una media de 35 aos con una

    desviacin estndar de 10 aos. Al nivel de significacin del 5%, estos hechos son

    suficientes para concluir que los consumidores de A&B Cola posen una edad promedio

    mayor a 32 aos?

    Respt: Prueba unilateral derecha, Tcal = 3.00, Tcrit = 1.6604, Decisin: RHo

    2. Star Amrica es una lnea area de capital compartido (peruano-americano) que tiene ms de 10 aos laborando en el Per. El gerente de marketing de aerolneas Star Amrica desea

    realizar un estudio considerando como segmentos de inters a los pasajeros nacionales y

    extranjeros. Para realizar dicho estudio se seleccionan al azar muestras aleatorias e

    independientes de los registros de pasajeros peruanos y extranjeros. Algunas de las

    caractersticas que desea analizar el gerente son las que se muestran en la siguiente tabla:

    Origen del pasajero: peruano o extranjero.

    Gnero: masculino o femenino.

    Opinin sobre el servicio de la aerolnea en el ltimo viaje: Psima, Mala, Regular, Buena o Muy Buena.

    Edad del pasajero (en aos)

    Peso del equipaje en el ltimo viaje (en kg).

  • 31

    Con la informacin presentada y usando un nivel de significacin del 5% responda lo

    siguiente:

    a) La edad promedio del pasajero extranjero es superior a 32 aos? b) La proporcin de equipajes que pesan menos de 17 kg , excede al 12%?

    3. El fabricante de la motocicleta Ososki anuncia en una propaganda de televisin que su vehculo posee un rendimiento promedio de 87 millas por galn en viajes largos. Los

    millajes (recorrido en millas) observados en ocho viajes prolongados fueron: 88, 82, 81, 87,

    80, 78, 79, y 89. Al nivel de significacin del 5% el millaje medio es menor que el

    anunciado?

    Respt: Prueba unilateral izquierda, Tcal = -2.61, Tcrit = -1.895, Decisin: RHo

    4. En una encuesta aleatoria de 1000 hogares realizada en Lima, se encontr que 90 de los hogares tenan al menos un miembro de familia con educacin superior. Este resultado

    refuta la aseveracin de que en los hogares de Lima esta proporcin es al menos 12%? Use

    un nivel de significacin del 5%.

    Respt: Prueba unilateral izquierda, Zcal = -2.919, Zcrit = -1.6449, Decisin: RHo

    Origen Genero Opinion Edad Peso

    extranjero mujer regular 17 18.1

    extranjero hombre regular 62 17.9

    extranjero hombre regular 50 21.2

    extranjero mujer regular 48 19.1

    extranjero mujer regular 39 19.7

    extranjero hombre mala 44 21.3

    extranjero mujer regular 40 19.3

    extranjero mujer mala 37 18.8

    extranjero mujer muy buena 25 17.8

    extranjero hombre muy buena 7 16.3

    extranjero hombre regular 7 22.5

    peruano mujer mala 29 24.0

    peruano hombre buena 56 16.2

    peruano hombre muy buena 44 19.4

    peruano hombre buena 7 20.6

    peruano hombre regular 51 22.2

    peruano hombre mala 41 18.0

    peruano hombre regular 46 20.6

    peruano hombre buena 41 19.0

    peruano mujer regular 30 18.0

    peruano hombre buena 45 23.5

    peruano mujer regular 46 21.7

    peruano hombre regular 22 17.2

    peruano mujer muy buena 8 20.7

    peruano hombre regular 64 19.4

    peruano mujer mala 16 17.9

    peruano hombre muy buena 41 16.4

    peruano mujer buena 43 21.3

    peruano hombre buena 12 22.5

  • 32

    5. Se realiz una investigacin de mercadotecnia para estimar la proporcin de amas de casa que pueden reconocer la marca de un producto de limpieza con base a la forma y color del

    recipiente. De las 1400 amas de casa, 420 fueron capaces de identificar la marca del

    producto. Se puede afirmar, a un nivel de significacin del 5%, que la proporcin de amas

    de casa que reconocen la marca del producto, es superior al 25%?

    Respt: Prueba unilateral derecha, Zcal = 4.32, Zcrit = 1.64485, Decisin: RHo

  • 33

    CAPTULO II

    PRUEBA DE HIPTESIS DE

    DOS PARMETROS

    PRUEBA DE HIPTESIS PARA DOS VARIANZAS

    PRUEBA DE HIPTESIS PARA DOS PROMEDIOS

    PRUEBA DE HIPTESIS PARA DOS

    PROPORCIONES

  • 34

    2.1 Prueba de hiptesis para dos varianzas

    Para esta prueba de hiptesis solo desarrollaremos el caso bilateral debido a que esta

    prueba indicar si dos muestras independientes provienen de poblaciones con varianzas

    homogneas o heterogneas lo que ser necesario saber al realizar prueba de hiptesis

    para dos promedios.

    Procedimiento para realizar la prueba de hiptesis:

    1. Plantear las hiptesis:

    2

    2

    2

    10 :H

    2

    2

    2

    11 :H

    2. Fijat el nivel de significacin:

    3. Calcular el valor del estadstico de prueba:

    2

    2

    2

    1calculado

    S

    SF

    4. Graficar las regiones crticas y valores crticos:

    5. Decidir: Se Rechaza Ho si el valor calculado del estadstico de prueba cae en la zona de

    rechazo, de lo contrario, No se rechaza Ho

    6. Concluir.

    Sobre el estadstico de prueba:

    2

    1S Es la varianza de la muestra de la poblacin 1

    2

    2S Es la varianza de la muestra de la poblacin 2

    1,1 21 nnF Representa la distribucin F con n1 1 y n2 1 grados de libertad

    n1: Es el tamao de la muestra proveniente de la poblacin 1

    El estadstico tiene distribucin F de Fisher

    con grados de libertad: (n1-1) y (n2-1)

  • 35

    n2 Es el tamao de la muestra proveniente de la poblacin 2.

    Es el nivel de significacin de la prueba

    El VALOR CRTICO divide la grfica en zona de rechazo y no rechazo. Para hallar su valor en EXCEL, usaremos la siguiente funcin:

    INV.F.CD(rea a la derecha, grados de libertad 1, grados de libertad 2)

    Ejemplo:

    Se est realizando un estudio comparativo sobre tiempo de atencin en dos restaurantes. Se han

    registrado los tiempos que demora en ser atendidos algunos pedidos, los cuales se muestran:

    Se puede afirmar que los tiempos de atencin en ambos restaurants no tienen la misma

    variabilidad? Use un nivel de significacin del 6%.

    Solucin

    1. Hiptesis

    2

    2

    2

    11

    2

    2

    2

    10

    :H

    :H

    2. Nivel de significacin: = 0.06

    3. Clculo del valor del estadstico de prueba:

    4866.12882.0

    4284.02

    2

    2

    1 S

    SF

    4. Regiones crticas:

    A (1) 6,15 5,63 5,58 6,91 4,63 5,53 5,05 5,45 5,03 6,09

    B (2) 4,96 5,04 4,75 4,61 4,47 5,02 5,35 3,6 5,26 5,41 5,42

  • 36

    0.2677

    0.03

    3.570

    0.03

    Valor crtico inferior: INV.F.CD(0.96; 9, 10) = 0.2677

    Valor crtico superior: INV.F.CD(0.04; 9, 10) = 3.570

    5. El valor calculado del estadstico de prueba cae en la zona de No Rechazo Decisin: No se rechaza Ho

    6. Conclusin: Con un nivel de significacin del 6%, puede afirmar que los tiempos

    de atencin en ambos restaurants no tienen la misma variabilidad.

    Resultados en Excel: Datos, Anlisis de datos, Prueba F para varianzas de dos muestras.

    Obtenemos:

    Prueba F para varianzas de dos muestras

    A (1) B (2)

    Media 5.6050 4.8991

    Varianza 0.4284 0.2882

    Observaciones 10 11

    Grados de libertad 9 10

    F 1.4866

    P(F

  • 37

    Solucin

    1. Hiptesis

    2

    2

    2

    11

    2

    2

    2

    10

    :H

    :H

    2. Nivel de significacin: = 0.08

    3. Clculo del valor del estadstico de prueba: 0806.25625.7

    7343.152

    2

    2

    1 S

    SF

    4. Regiones crticas:

    0.3925

    0.04

    2.548

    0.04

    Valor crtico inferior: INV.F.CD(0.96; 15, 15) = 0.3925

    Valor crtico superior: INV.F.CD(0.04; 15, 15) = 2.5477

    5. El valor calculado del estadstico de prueba cae en la zona de No Rechazo Decisin: No se rechaza Ho

    6. Conclusin: No existe suficiente evidencia estadstica, con un nivel de significacin del

    8%, para concluir que las varianzas son diferentes.

    Por lo tanto, se puede afirmar que las varianzas son homogneas.

    Resultados en Excel:

    Datos, Anlisis de datos, Prueba F para varianzas de dos muestras:

  • 38

    Prueba F para varianzas de dos muestras

    COBRE PLOMO

    Media 68.33125 24.2125

    Varianza 15.7342917 7.5625

    Observaciones 16 16

    Grados de libertad 15 15

    F 2.08056749

    P(F

  • 39

    2

    2

    2

    10 :H 2

    2

    2

    11 :H

    2. Nivel de significacin: 06.0

    3. Clculo del valor del estadstico de prueba: 4066.17.2

    2.32

    2

    2

    2

    2

    1calculado

    S

    SF

    4. Regiones crticas:

    Valor crtico inferior: INV.F.CD(0.97; 16, 12) = 0.3925

    Valor crtico superior: INV.F.CD(0.04; 16, 12) = 2.5477

    5. Decisin: No se Rechaza Ho

    6. Conclusin: No existe suficiente evidencia estadstica, con un nivel de significacin del 5%, para afirmar que las varianzas son diferentes. Es decir, existe homogeneidad

    de varianzas.

    Ejercicios 1. Una empresa fabrica polos deportivos y compra los hilos de dos proveedores (Proveedor 1

    y 2). Para verificar la conveniencia de comprar a uno de ellos, compara la resistencia

    promedio de los hilos adquiridos de estos proveedores. Se toma muestras de piezas de cada

    clase de hilo y se registra la resistencia en condiciones similares. Los datos en kilogramos,

    se muestran en la siguiente tabla.

    Usando un nivel de significacin del 4%, se puede afirmar que no existe homogeneidad entre las varianzas?

    Proveedor 1 Proveedor 2

    59 84

    75 83

    82 86

    74 79

    64 83

    58 87

    69 86

    70 85

    0,3618

    0,030,03

    3,0010

    0.025

  • 40

    Solucin

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

    4. Regiones crticas:

    5. Decisin:

    6. Conclusin:

  • 41

    Ejercicio:

    Una empresa grande de corretaje de acciones desea determinar qu tanto xito han tenido sus

    nuevos ejecutivos de cuenta en la consecucin de clientes. Despus de haber terminado su

    entrenamiento, los nuevos ejecutivos pasan varias semanas haciendo llamadas a posibles

    clientes, tratando de conseguir prospectos para abrir cuentas con las empresas. Los datos

    siguientes dan el nmero de cuentas nuevas que fueron abiertas durante las primeras dos

    semanas por diez ejecutivas y ocho ejecutivos de cuenta escogidos aleatoriamente.

    Ejecutivas 12 11 14 13 13 14 13 12 14 12

    Ejecutivos 13 10 11 12 13 12 10 12

    A un nivel del 5%, Se puede afirmar que la variabilidad en el nmero de cuentas nuevas

    abiertas durante las primeras emanas difieren?

    Solucin

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

    4. Regiones crticas:

  • 42

    5. Decisin:

    6. Conclusin:

  • 43

    2.2 Pruebas de hiptesis para la diferencia de dos medias poblacionales

    (1-2): muestras independientes

    Cuando las muestras provienen de poblaciones Normales, las varianzas poblacionales 21 , 2

    2

    son desconocidas y adems:

    Caso 1: Varianzas Iguales ( 21 = 2

    2 )

    1. Hiptesis:

    210 :H 210 :H 210 :H

    211 :H 211 :H 211 :H

    2. Fijar el nivel de significacin:

    3. Calcular el valor del estadstico de prueba:

    21

    2

    21c

    11

    nnS

    XXT

    p

    4. Regin de Rechazo: representada por la zona sombreada

    Prueba Unilateral de extremo

    izquierdo

    Prueba Bilateral Prueba Unilateral de extremo

    derecho

    5. Decidir: Se Rechaza Ho si el valor calculado del estadstico de prueba cae en la zona de rechazo.

    6. Concluir.

    Sobre el estadstico de prueba:

    211

    21

    2

    22

    2

    112

    nn

    SnSnS p

    1X , 2X media de la muestra 1 y 2 respectivamente

    2

    1S , 2

    2S : varianza de la muestra 1 y 2 respectivamente

    2

    pS Es la varianza muestral ponderada

    n1, n2 Es el tamao de la muestra 1 y 2 respectivamente

    221 nnt Es el valor de la distribucin t de Student con n1 + n2 2 g de l.

  • 44

    es el nivel de significacin de la prueba

    NOTA: Si la hiptesis nula propone alguna diferencia especfica entre los promedios poblacionales sometidos a prueba, y denotamos esta diferencia por k, entonces el

    estadstico de prueba ser:

    21

    2

    21c

    11

    nnS

    kXXT

    p

    El VALOR CRTICO y el VALOR CALCULADO del estadstico de prueba los hallaremos usando EXCEL con la siguiente funcin:

    DATOS, ANLSIS DE DATOS; Prueba t para dos muestras suponiendo varianzas iguales

    Ejemplo:

    Se est realizando un estudio comparativo sobre tiempo de atencin en dos restaurantes, A y

    B. Se ha registrado, aleatoriamente, los tiempos que demora en ser atendidos algunos pedidos,

    los cuales se muestran:

    A (1) 6.15 5.63 5.58 6.91 4.63 5.53 5.05 5.45 5.03 6.09

    B (2) 4.96 5.04 4.75 4.61 4.47 5.02 5.35 3.6 5.26 5.41 5.42

    Asumiendo homogeneidad de las varianzas, se puede afirmar que el restaurante A es ms

    eficiente que el restaurante B? Use un nivel de significacin del 6%.

    Solucin

    1. Hiptesis

    BA1

    BA0

    :H

    :H

    2. Nivel de significacin: = 0.06

  • 45

    3. Clculo del valor del estadstico de prueba: T = 2.7132

    4. Regiones crticas:

    -1.628

    0.06

    5. Decisin: No se rechaza Ho

    6. Conclusin: Con un nivel de significacin del 6%, puede afirmar que los tiempos de

    atencin en ambos restaurants no tienen la misma variabilidad.

    Resultados en Excel:

    Datos, Anlisis de datos, Prueba t para dos muestras suponiendo varianzas iguales

    A (1) B (2)

    Media 5.605 4.8990909

    Varianza 0.428383333 0.2881691

    Observaciones 10 11

    Varianza agrupada 0.354586364

    Diferencia hipottica de las medias 0

    Grados de libertad 19

    Estadstico t 2.713154062

    P(T

  • 46

    Se puede afirmar que el local 1 tiene ingresos promedio mayores que los del local 2. Asuma

    que el consumo mensual tiene distribucin normal. Use un nivel de significacin del 6%.

    Solucin:

    Sean X1: Ingreso mensual del local 1

    X2: Ingreso mensual del local 2

    Dado que las varianzas poblacionales son desconocidas, el primer paso consiste en

    realizar una prueba de hiptesis para determinar si las varianzas son homogneas o no.

    En Excel: Datos, Anlisis de datos, Prueba F para varianzas de dos muestras

    1. Hiptesis:

    22

    2

    10 :H 2

    2

    2

    11 :H

    2. Nivel de significaci: = 0.06

    3. Clculo del valor del estadstico de prueba: 4866.16909.2881

    8333.42832

    2

    2

    1calculado

    S

    SF

    4. Regin crtica y valores crticos:

    Valor crtico inferior: INV.F.CD(0.97; 9, 10) = 0.2677

    Valor crtico superior: INV.F.CD(0.03; 9, 10) = 3.5702

    5. Decisin: No se Rechaza Ho

    6. Conclusin: No existe suficiente evidencia estadstica, con un nivel de significacin del 6%,

    para afirmar que las varianzas son diferentes. Con este resultado afirmamos que existe

    homogeneidad de varianzas.

    Habiendo probado que las varianzas son homogneas, ahora pasamos a probar si el local

    1 tiene ingresos promedio mayores que los del local 2

    1. Hiptesis:

    210 :H

    211 :H

    0,2677

    0,03

    0,03

    3,5702

  • 47

    2. Nivel de significacin: 06.0

    3. Clculo del valor del estadstico de prueba: calculadoT = 2.7132

    4. Regin crtica y valor crtico:

    5. Decisin: Se Rechaza Ho

    6. Conclusin: Existe suficiente evidencia estadstica, con un nivel de significacin del 6%, para afirmar que el local 1 tiene en promedio, mayores ingresos mensuales que el local 2.

    Resultados en Excel:

    Herramientas, Anlisis de datos, Prueba t para dos muestras suponiendo varianzas iguales:

    Prueba F para varianzas de dos muestras

    LOCAL 1 LOCAL 2

    Media 260.5 189.909091

    Varianza 4283.83333 2881.69091

    Observaciones 10 11

    Grados de libertad 9 10

    F 1.48656933

    P(F

  • 48

    Prueba t para dos muestras suponiendo varianzas iguales

    LOCAL 1 LOCAL 2

    Media 260.5 189.909091

    Varianza 4283.83333 2881.69091

    Observaciones 10 11

    Varianza agrupada 3545.86364

    Diferencia hipottica de las medias 0

    Grados de libertad 19

    Estadstico t 2.71315406

    P(T

  • 49

    Caso 2: Varianzas Diferentes ( 21 2

    2 )

    1. Hiptesis:

    210 :H 210 :H 210 :H

    211 :H 211 :H 211 :H

    2. Clculo del valor del estadstico de prueba:

    2

    2

    2

    1

    2

    1

    21c

    n

    S

    n

    S

    XXT

    3. Regin de Rechazo: representada por la zona sombreada:

    Prueba Unilateral de extremo

    izquierdo

    Prueba Bilateral Prueba Unilateral de extremo

    derecho

    4. Decidir: Se rechaza Ho si el valor calculado del estadstico de prueba cae en la zona de rechazo.

    5. Concluir:

    Sobre el estadstico de prueba,

    11 2

    2

    2

    2

    2

    1

    2

    1

    2

    1

    2

    2

    2

    2

    1

    2

    1

    n

    n

    S

    n

    n

    S

    n

    S

    n

    S

    v

    1X , 2X media de la muestra 1 y 2 respectivamente

    2

    1S , 2

    2S : varianza de la muestra 1 y 2 respectivamente

    n1, n2 Es el tamao de la muestra 1 y 2 respectivamente

    vt Es la distribucin t de Student con v grados de libertad

    es el nivel de significacin de la prueba

  • 50

    NOTA: Si la hiptesis nula propone alguna diferencia especfica entre los promedios poblacionales sometidos a prueba, y denotamos esta diferencia por k, entonces el

    estadstico de prueba ser:

    2

    2

    2

    1

    2

    1

    21c

    n

    S

    n

    S

    kXXT

    El VALOR CRTICO y el VALOR CALCULADO del estadstico de prueba los hallaremos usando EXCEL con la

    siguiente funcin: DATOS, ANLSIS DE DATOS; Prueba t para dos muestras suponiendo varianzas desiguales

    Ejemplo:

    Una empresa fabrica polos deportivos y compra los hilos de dos proveedores (Proveedor 1

    y 2). Para verificar la conveniencia de comprar a uno de ellos, compara la resistencia

    promedio de los hilos adquiridos de estos proveedores. Se toma muestras de piezas de cada

    clase de hilo y se registra la resistencia en condiciones similares. Los datos en kilogramos,

    se muestran en la siguiente tabla.

    Usando un nivel de significacin del 4% y asumiendo heterogeneidad en las varianzas, se

    puede decidir por el proveedor 2?

    Proveedor 1 Proveedor 2

    59 84

    75 83

    82 86

    74 79

    64 83

    58 87

    69 86

    70 85

    Solucin:

  • 51

    1. Hiptesis:

    210 :H

    211 :H

    2. Nivel de significacin: 06.0

    3. Clculo del valor del estadstico de prueba, calculadoT = 2.7132

    4. Regin crtica y valor crtico

    5. El valor calculado del estadstico de prueba cae en la zona de rechazo. Decisin: Se Rechaza Ho

    6. Conclusin: Existe suficiente evidencia estadstica, con un nivel de significacin del 6%, para afirmar que el local 1 tiene en promedio, mayores ingresos mensuales que el local 2.

    Ejemplo

    Una empresa fabrica, en sus dos plantas situadas en Atlanta y Dallas, impresoras y faxes. Con

    el fin de medir los conocimientos que tienen los empleados de estas plantas acerca de la calidad

    de los productos producidos, se toma una muestra aleatoria de empleados de cada fbrica y se

    les aplica una evaluacin de calidad. Los resultados se muestran en el siguiente cuadro. Se

    puede afirmar que la puntuacin promedio obtenida en el examen de calidad no es la misma

    para las dos fbricas? Use =0.05

    Atlanta 78,0 75,0 80,0 76,0 74,0 82,0 80,0 76,0 74,0

    Dallas 91,0 95,0 73,0 74,0 73,0 82,0 73,0 74,0 73,0 76,0

    Solucin:

    Sean X1: puntaje obtenido por los trabajadores en la primera planta.

    X2: puntaje obtenido por los trabajadores en la segunda planta.

    Dado que las varianzas poblacionales son desconocidas, el primer paso consiste en

    realizar una prueba de hiptesis para determinar si las varianzas son homogneas o no:

    Resultados hallados con Excel:

    0,06

    1,6280

  • 52

    1. Hiptesis:

    22

    2

    10 :H 2

    2

    2

    11 :H

    2. Nivel de significacin: 05.0

    3. Clculo del valor del estadstico de prueba: 2

    2

    2

    1calculado

    S

    SF

    Reemplazando datos: 6.67

    4444.8calculado F = 0.1249

    4. Regin crtica y valores crticos:

    Valor crtico inferior:

    INV.F.CD(0.975; 8, 9) = 0.2295

    Valor crtico superior:

    INV.F.CD(0.025; 8, 9) = 4.1020

    5. Decisin: Se Rechaza Ho 6. Conclusin: Existe suficiente evidencia estadstica, con un nivel de significacin del 5%,

    para afirmar que las varianzas son heterogneas.

    Habiendo probado que las varianzas no son iguales, ahora pasamos a probar si la puntuacin

    promedio es la misma:

    1. Hiptesis:

    210 :H

    211 :H

    2. Nivel de significacin: 05.0

    3. Clculo del valor del estadstico de prueba es calculadoT = -0.4245

    4. Regin crtica y valores crticos

    Atlanta Dallas

    Media 77,2222222 Media 78,4

    Desviacin estndar 2,90593263 Desviacin estndar 8,22192192

    Varianza de la muestra 8,44444444 Varianza de la muestra 67,6

    Curtosis -1,24720518 Curtosis 0,69896971

    Cuenta 9 Cuenta 10

    0,025

    4,1020

    0,025

    0,2295

    0.025

  • 53

    5. Decisin: No se Rechaza Ho 6. Conclusin: No existe suficiente evidencia estadstica, con un nivel de significacin del 5%,

    para afirmar que los promedios son diferentes. Es decir, el puntaje promedio es el mismo.

    Resultados en Excel:

    NOTAS:

    -2,2001

    0,025

    2,2001

    0,025

    Prueba t para dos muestras suponiendo varianzas desiguales

    Atlanta Dallas

    Media 77,22222222 78,4

    Varianza 8,444444444 67,6

    Observaciones 9 10

    Diferencia hipottica de las medias 0

    Grados de libertad 11

    Estadstico t -0,424489294

    P(T

  • 54

  • 55

    Ejercicio Una empresa grande de corretaje de acciones desea determinar qu tanto xito han tenido sus

    nuevos ejecutivos de cuenta en la consecucin de clientes. Despus de haber terminado su

    entrenamiento, los nuevos ejecutivos pasan varias semanas haciendo llamadas a posibles

    clientes, tratando de conseguir prospectos para abrir cuentas con las empresas. Los datos

    siguientes dan el nmero de cuentas nuevas que fueron abiertas durante las primeras dos

    semanas por diez ejecutivas y ocho ejecutivos de cuenta escogidos aleatoriamente.

    Ejecutivas 12 11 14 13 13 14 13 12 14 12

    Ejecutivos 13 10 11 12 13 12 10 12

    A un nivel del 5%, Parece que las mujeres son ms efectivas que los hombres para conseguir

    nuevas cuentas?

    PRUEBA DE HIPTESIS PARA DETERMINAR SI EXISTE HOMOGENEIDAD EN

    LAS VARIANZAS

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

    4. Regiones crticas

  • 56

    5. Decisin

    6. Conclusin:

    PRUEBA DE HIPTESIS DE LA DIFERENCIA DE MEDIAS

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

    4. Regiones crticas:

  • 57

    5. Decisin

    6. Conclusin:

  • 58

    2.3 Pruebas de hiptesis para la diferencia de dos medias poblacionales (D): muestras relacionadas

    Considere dos poblaciones relacionadas con medias y variancias desconocidas desde las

    cuales se extrae una muestra aleatoria bivariada de tamao n 1 1,X Y , 2 2,X Y , ,

    , .n nX Y Defina la variable i i iD X Y . Entonces esta prueba se reduce a la prueba para una media considerando a la variable D.

    1. Hiptesis: H0: d 0 H0: d = 0 H0: d 0 H1: d < 0 H1: d 0 H1: d > 0

    2. Fijar el nivel de significacin

    3. Clculo del valr del estadstico de prueba: nS

    dT

    d /c

    4. Regin de Rechazo: Representada por la zona sombreada

    Prueba Unilateral de extremo

    izquierdo

    Prueba Bilateral Prueba Unilateral de extremo

    derecho

    5. Decidir: Se Rechaza Ho si el valor calculado del estadstico de prueba cae en la zona de

    echazo

    6. Conlcuir.

    Sobre es estadstico de prueba:

    D Es la media muestral de las diferencias

    SD Es la desviacin estndar muestral de las diferencias

    n Es el tamao de la muestra

    t(n-1):

    Es la distribucin t de Student con n 1 grados de libertad

    es el nivel de significacin de la prueba

  • 59

    NOTA: Si la hiptesis nula propone alguna diferencia especfica entre las proporciones poblacionales sometidas a prueba, y denotamos esta diferencia por k, entonces el

    estadstico de prueba ser:

    nS

    kdT

    d /c

    Ejemplo

    El gerente de un gimnasio afirma que un nuevo programa de ejercicio reducir la medida de la

    cintura de una persona en un perodo de cinco das. Las medidas de cinturas de seis hombres

    que participaron en este programa de ejercicios se registraron antes y despus del perodo de

    cinco das en la siguiente tabla:

    Hombres

    1 2 3 4 5 6

    Medida de cintura antes 90,4 95,5 98,7 115,9 104,0 85,6

    Medida de cintura despus 91,7 93,9 97,4 112,8 101,3 84,0

    La afirmacin del gimnasio es vlida al nivel de significacin de 5%? Suponga que la

    distribucin de las diferencias de medidas de cintura antes y despus del programa es

    aproximadamente normal.

    Solucin:

    Sea X1: Medida de cintura antes (cm.), X2: Medida de cintura despus (cm.)

    d = antes despus

    1. Hiptesis: H0: d 0 H1: d > 0

    2. Nivel de significacin: = 0.05

    3. Clculo del valor del estadstico de prueba: nS

    dT

    d /c = 2.3817

    4. Regin crtica y valor crtico: + 2.015

    5. El valor del estadstico de prueba cae en la zona de rechazo.

  • 60

    Decisin: Se Rechaza Ho

    6. Conclusin: Existe suficiente evidencia estadstica, con un nivel de significacin del 5%,

    para afirmar es cierto lo que afirma el gerente del gimnasio.

    Resultados en Excel:

    Prueba t para medias de dos muestras emparejadas

    Medida antes

    Medida despus

    Media 98.35 96.85

    Varianza 114.787 94.971

    Observaciones 6 6 Coeficiente de correlacin de Pearson 0.993095074

    Diferencia hipottica de las medias 0

    Grados de libertad 5

    Estadstico t 2.381652558

    P(T

  • 61

    2.4 Prueba de hiptesis para la diferencia de dos proporciones poblacionales (p1-p2).

    1. Hiptesis:

    0 1 2H : p p 0 1 2H : p p 0 1 2H : p p

    1 1 2H : p p 1 1 2H : p p 1 1 2H : p p

    2. Fijar el nivel de significacin:

    3. Calcular el valor del estadstico de prueba:

    21

    21

    11)1(

    nnPP

    PPZC

    4. Zona de rechazo: Representada por la zona sombreada:

    Prueba Unilateral de extremo

    izquierdo Prueba Bilateral

    Prueba Unilateral de extremo

    derecho

    5. Decidir: Se rechaza Ho si el valor calculado del estadstico de prueba cae en la zona de

    rechazo. 6. Concluir-

    Sobre es estadstico de prueba, 1 1 2 2

    1 2

    n P n PP

    n n

    , adems:

    1P Es la proporcin de la muestra 1

    2P Es la proporcin de la muestra 2

    n1 Es el tamao de la muestra 1

    n2

    Es el tamao de la muestra 2

    NOTA: Si la hiptesis nula propone alguna diferencia especfica entre las proporciones

    poblacionales sometidas a prueba, y denotamos esta diferencia por k, entonces el estadstico de

    prueba ser:

    2

    22

    1

    11

    21

    n

    qp

    n

    qp

    K)pp(z

  • 62

    Ejemplo

    Un patrocinador de un programa especial de televisin afirma que el programa representa un atractivo mayor para los televidentes hombres que para las mujeres. Si una muestra aleatoria de 300 hombres y otra de 400 mujeres revel que 120 hombres y 120 mujeres estaban viendo el programa especial de televisin. Al nivel de significacin del 5%, se podra decir que el patrocinador tiene la razn?

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

    4. Regiones crticas:

    5. Decisin:

    6. Conclusin:

  • 63

    Ejemplo

    En una prueba de preferencia de dos comerciales de televisin se pas cada uno en un rea de

    prueba seis veces, durante un perodo de una semana. La semana siguiente se llev a cabo una

    encuesta telefnica para identificar a quines haban visto esos comerciales. A las personas que

    los vieron se les pidi definieran el principal mensaje en ellos. Se obtuvieron los siguientes

    resultados:

    Comercial Personas que lo vieron Personas que recordaron el mensaje principal

    A

    B

    150

    200

    63

    60

    Use = 0.06 para probar la hiptesis de que no hay diferencia en las proporciones que recuerdan los dos comerciales.

    Solucin:

    Sean

    p1: Proporcin de personas que recordaron el mensaje principal del comercial A.

    p2: Proporcin de personas que recordaron el mensaje principal del comercial B.

    1. Hiptesis: H0: P1 = P2

    H1: P1 P2 2. Fijar el nivel de significacin: 06.0

    3. Clculo del valor del estadstico de prueba:

    21

    21

    11)1(

    nnPP

    PPZC

    Reemplazando datos: 3514.0,30.0200

    60,42.0

    150

    63

    21 Ppp

    3271.2

    200

    1

    150

    1*)3514.01(*3514.0

    30.042.0

    CZ

    4. Regin crtica y valores crticos:

    0.025

  • 64

    5. Decisin: Se Rechaza Ho

    6. Conclusin: Existe suficiente evidencia estadstica, con un nivel de significacin del 5%, para afirmar que las proporciones de recordacin son diferentes.

    Ejercicio

    Una empresa realiza un estudio para determinar si el ausentismo de los trabajadores en el turno

    de da es diferente al de los trabajadores en el turno nocturno. Se realiza una comparacin de

    100 trabajadores de cada turno. Los resultados muestran que 27 trabajadores diurnos han

    faltado por lo menos cinco veces durante el ao anterior, mientras que 49 trabajadores

    nocturnos han faltado por lo menos cinco veces.

    Con un nivel de significacin del 2%, existen diferencias significativas entre las proporciones

    de trabajadores de los turnos que faltaron cinco veces o ms al ao?

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

    4. Regiones crticas:

    -1,8808

    0,03 0,03

    1,8808

  • 65

    5. Decisin:

    6. Conclusin:

    Respuestas: Prueba bilateral, Zcal = - 3.2051, Zcrit = 2.3263, Decisin: R Ho

    Ejercicios Propuestos.

    1. Se llev a cabo una encuesta entre los miembros del Club del libro del mes, para determinar si pasan ms tiempo viendo televisin que leyendo. Suponga que en una muestra de 12

    encuestados se obtuvieron las horas semanales que se dedican a ver televisin y las que se

    dedican a la lectura. Con un nivel de significacin del 5%, se puede llegar a la conclusin

    de que los miembros del Club del libro del mes pasan ms tiempo, en promedio, viendo

    televisin que leyendo? Asuma Normalidad de las variables en estudio.

    Encuestado 1 2 3 4 5 6 7 8 9 10 11 12

    Televisin 11 19 8 5 16 8 4 12 10 14 15 18

    Leyendo 6 10 3 10 5 8 7 14 14 8 10 10

    Respt: Prueba unilateral derecha, Tcal = 1.847, Tcrit = 1.79588, Decisin: RHo

    2. Star Amrica es una lnea area de capital compartido (peruano-americano) que tiene ms de 10 aos laborando en el Per.

    El gerente de marketing de aerolneas Star Amrica desea realizar un estudio considerando

    como segmentos de inters a los pasajeros nacionales y extranjeros.

  • 66

    Para realizar dicho estudio se seleccionan al azar muestras aleatorias e independientes

    de los registros de pasajeros peruanos y extranjeros. Algunas de las caractersticas que

    desea analizar el gerente son las siguientes:

    Origen del pasajero: peruano o extranjero.

    Gnero: masculino o femenino. Opinin sobre el servicio de la aerolnea en el ltimo viaje: Psima, Mala, Regular,

    Buena o Muy Buena.

    Edad del pasajero (en aos)

    Peso del equipaje en el ltimo viaje (en kg).

    Con la informacin que se muestra y usando un nivel de significacin del 6% responda lo

    siguiente:

    a. Verifique el supuesto de homogeneidad de varianzas en la edad para las personas de gnero femenino y masculino.

    Respt: Prueba bilateral, Fcal = 0.4494, Fcrit = 0.3185 y 2.8052, Decisin: No RHo

    Origen Genero Opinion Edad Peso

    extranjero mujer regular 17 18.1

    extranjero hombre regular 62 17.9

    extranjero hombre regular 50 21.2

    extranjero mujer regular 48 19.1

    extranjero mujer regular 39 19.7

    extranjero hombre mala 44 21.3

    extranjero mujer regular 40 19.3

    extranjero mujer mala 37 18.8

    extranjero mujer muy buena 25 17.8

    extranjero hombre muy buena 7 16.3

    extranjero hombre regular 7 22.5

    peruano mujer mala 29 24.0

    peruano hombre buena 56 16.2

    peruano hombre muy buena 44 19.4

    peruano hombre buena 7 20.6

    peruano hombre regular 51 22.2

    peruano hombre mala 41 18.0

    peruano hombre regular 46 20.6

    peruano hombre buena 41 19.0

    peruano mujer regular 30 18.0

    peruano hombre buena 45 23.5

    peruano mujer regular 46 21.7

    peruano hombre regular 22 17.2

    peruano mujer muy buena 8 20.7

    peruano hombre regular 64 19.4

    peruano mujer mala 16 17.9

    peruano hombre muy buena 41 16.4

    peruano mujer buena 43 21.3

    peruano hombre buena 12 22.5

  • 67

    b. Existen diferencias significativas entre los pesos promedio de los equipajes de ambas gneros?

    Respt: Prueba bilateral, Fcal = 0.4494, Fcrit = 0.3185 y 2.8052, Decisin: No RHo

    c. Se puede afirmar, que el porcentaje de viajeros de gnero femenino que opinan que el servicio es malo es diferente al porcentaje de viajeros de gnero masculino

    con tal opinin?

    3. Se realiza un estudio en la North Central University para medir el efecto del cambio ambiental en estudiantes extranjeros. Uno de los aspectos del estudio es una comparacin

    del peso de los alumnos al ingresar a esa universidad, un ao despus se midi el peso de

    los estudiantes. Se sospecha que los alimentos estadounidenses ms nutritivos provocan

    aumento de peso. Los datos para una muestra de estudiantes se dan a continuacin.

    Nombre Peso al inicio Peso un ao despus

    Nassar 124 142

    OToole 157 157

    Oble 98 96

    Silverman 190 212

    Kim 103 116

    Gross 135 134

    Con 1% de nivel de significacin, los alimentos estadounidenses ms nutritivos

    provocan aumento de peso?

  • 68

    CAPTULO III

    PRUEBAS NO

    PARAMTRICAS: PRUEBAS

    JI-CUADRADO

    PRUEBA DE INDEPENDENCIA DE VARIABLES

    PRUEBA DE HOMOGENEIDAD DE PROPORCIONES

    PRUEBA DE BONDAD DE AJUSTE

  • 69

    Introduccin

    Como se ha visto en la seccin anterior uno de los supuestos en el que se basa muchas de las

    pruebas estadsticas (conocidas como pruebas paramtricas) es el supuesto de normalidad.

    Una parte de esta seccin contempla el desarrollo de una prueba para verificar la normalidad

    de un conjunto de datos que se encuentra agrupado en una tabla de frecuencia.

    Las pruebas a desarrollar son conocidas como pruebas no paramtricas. Estn desarrolladas

    sobre la base de un estadgrafo que no hace referencia a ningn parmetro poblacional.

    Este tipo de tcnicas no utiliza directamente la informacin muestral recogida sobre la variable

    objeto de estudio, sino ms bien la frecuencia con que aparecen dichos valores en la muestra.

    Las pruebas a estudiar en esta seccin son:

    Prueba de Independencia

    Prueba de Homogeneidad de proporciones.

    Tabla de Contingencia

    Es una tabla de frecuencia simple de dos vas (bidireccional). Sus r filas y columnas se

    usan para resumir y anotar los resultados de datos recolectados y jerarquizados de dos

    variables.

    Variable 2

    Columna 1 Columna 2 . . . Columna c

    V

    ari

    ab

    le 1

    Fila 1 f11 f12 f1c

    Fila 2 f11 f11 f11 .

    .

    .

    Fila r fr1 fr1 frc

    3.1 Prueba de independencia

    Una de las pruebas donde se utiliza la distribucin Ji Cuadrada es cuando se desea

    probar que dos variables categricas son independientes entre s. Estas variables

    categricas reciben el nombre de factores. El factor 1 o factor fila tiene r categoras y el factor 2 o factor que se muestra en la columna tiene c categoras. En la prueba de independencia se prueba la hiptesis nula de que la variable fila y la

    variable de columna de una tabla de contingencia no estn relacionadas. (La hiptesis

    nula es la proposicin de que las variables de filas y de columna son independientes)

  • 70

    Por ejemplo, para determinar si existe una relacin entre el aprovechamiento de un empleado

    en el programa de capacitacin y su rendimiento real en el trabajo, se tom una muestra de

    400 registros y se obtuvo las frecuencias observadas que se presentan en la siguiente tabla

    de contingencia:

    Rendimiento

    (calificacin del

    empleador)

    Aprovechamiento en el programa de capacitacin

    Debajo del

    promedio Promedio

    Sobre el

    promedio Total

    Deficiente 23 60 29 112

    Promedio 28 79 60 167

    Muy bueno 9 49 63 121

    Total: 60 188 152 400

    Las variables involucradas en el anlisis son:

    Variable 1: Calificacin del rendimiento real en el trabajo, con 3 categoras:

    Deficiente, promedio y muy bueno.

    Variable 2: Calificacin en el programa de entrenamiento, con 3 categoras: Debajo

    del promedio, promedio o sobre el promedio.

    La prueba de Independencia compara las frecuencias observadas, frente a otras llamadas

    frecuencias esperadas.

    Para calcular las frecuencias esperadas se utiliza la siguiente frmula:

    totalGran

    rengln)del(Totalcolumna)lade(Total

    esperada

    Frecuencia

    La siguiente tabla muestra: frecuencias observadas y esperadas (entre parntesis) para la

    informacin presentada en el ejemplo propuesto.

    Rendimiento en el trabajo (calificacin del

    empleador)

    Aprovechamiento en el programa de capacitacin

    Debajo del promedio

    Promedio Sobre el promedio

    Total

    Deficiente 23

    (16,80) 60

    (52,64) 29

    (42,56) 112

    Promedio 28

    (25,05) 79

    (78,49) 60

    (63,46) 167

    Muy bueno 9

    (18,15) 49

    (56,87) 63

    (45,98) 121

    Total: 68 188 152 400

  • 71

    Pasos para realizar la prueba de Independencia de variables

    1. Formular las hiptesis Ho: Existe independencia entre las variables

    H1: No existe independencia entre las variables

    2. Fijar el nivel de significacin 3. Calcular el valor del estadstico de prueba:

    r

    i

    c

    j ij

    ijij

    ce

    eO

    1 1

    2

    2)(

    4. Graficar la regin crtica:

    REGIN DE RECHAZO

    5. Aplicar los criterios de decisin: Rechazar Ho si el valor calculado del estadstico de prueba cae en la zona de rechazo.

    6. Concluir.

    Sobre el estadstico de prueba:

    2 Representa la distribucin Chi-cuadrado

    Oij Representa las frecuencias observadas

    eij Representa las frecuencias esperadas

    2

    c El valor crtico se calcula con )1)(1( cr grados de libertad, donde r esl el nmero

    de filas y c el nmero de columnas.

    NOTA: El tamao de muestra n total general debe ser suficientemente grande para asegurar

    que las frecuencias esperadas eij sean mayores o iguales a 5. Esto Asegura que la aproximacin

    en la prueba sea buena.

    Ejemplo:

    Para determinar si existe una relacin entre el aprovechamiento de un empleado en el programa

    de capacitacin y su rendimiento real en el trabajo, se tom una muestra de 400 registros y se

    obtuvo las frecuencias observadas que se presentan en la siguiente tabla de contingencia:

    Aprovechamiento en el programa de capacitacin

  • 72

    Rendimiento

    (calificacin del

    empleador)

    Debajo del

    promedio Promedio

    Sobre el

    promedio Total

    Deficiente 23 60 29 112

    Promedio 28 79 60 167

    Muy bueno 9 49 63 121

    Total: 60 188 152 400

    Con el nivel de significacin 0,01, La calificacin del rendimiento del trabajador est

    asociada con la calificacin en aprovechamiento del programa de capacitacin?

    Solucin

    1. Planteamiento de hiptesis: H0: La calificacin del rendimiento real de un empleado en el trabajo es independiente

    del aprovechamiento en el programa de capacitacin.

    H1: La calificacin del rendimiento real de un empleado en el trabajo no es

    independiente del aprovechamiento en el programa de capacitacin.

    2. Nivel de significacin: = 0,01 3. Clculo del valor del estadstico de prueba:

    4(gl)1)-1)(3-(3con ~)(

    2

    01,0

    1 1

    2

    2

    r

    i

    c

    j ij

    ijij

    ce

    eO

    18,2098,45

    )98,4563(...

    5,25

    )05,2528(

    80,16

    )80,1623( 2222

    c

    4. Regin crtica:

    5. Decisin:

    Como el valor calculado2 > 13,277, se rechaza H0

    6. Conclusin: Con nivel de significacin 0,01 existe evidencia estadstica para afirmar que la

    calificacin del rendimiento real de un empleado en el trabajo no es independiente de la

    calificacin en el programa de entrenamiento.

    Nota:

    En Excel se puede hacer uso de la funcin PRUEBA.CHICUAD donde se debe ingresar las frecuencias observadas y las frecuencias esperadas. El resultado de la

    13.277

    0.01

  • 73

    aplicacin de esta funcion es el p-valor el cual es comparado directamente con el nivel

    de significacin para dar las conclusiones.

    (Correccin de Yates)

    Cuando la muestra es menor de 50, o cuando algunas o todas las frecuencias esperadas

    son menores que 5, o cuando el grado de libertad es igual a 1, es recomendable aplicar

    la correccin de Yates; entonces el estadstico de prueba es el siguiente:

    c

    j

    cr

    i

    iir

    i e

    eo

    1

    2

    ),1)(1(

    2

    1

    25.0

    Ejemplo:

    El jefe de una planta industrial desea determinar si existe relacin entre el rendimiento en el

    trabajo y turno laboral del empleado. Se tom una muestra aleatoria de 382 empleados y se

    obtuvo las frecuencias observadas que se presentan en la siguiente tabla de contigencia:

    Rendimiento en el Trabajo

    Turno laboral

    Total Maana Tarde Noche

    Deficiente 21 58 27 106

    Promedio 26 77 58 161

    Muy bueno 7 47 61 115

    Total 54 182 146 382

    Con un nivel de significacin del 0.01, la calificacin del rendimiento del trabajador est

    asociada con el turno en el que labora el empleado?

    Solucin

    1. Hiptesis: Ho: El rendimiento en el trabajo, es independiente del turno laboral del trabajador.

    H1: El rendimiento en el trabajo, no es independiente del turno laboral del trabajador.

    2. Nivel de significacin: = 0,01 3. Clculo del valor del estadstico de prueba:

    4(gl)1)-(3).13(libertaddeGrados

    691.21)(

    1 1

    2

    2

    r

    i

    c

    j ij

    ijij

    ce

    eO

    4. Regin crtica:

  • 74

    5. Decisin:

    Como el valor calculado 21.691 > 13,277, se rechaza H0

    6. Conclusin: Con nivel de significacin 0,01 existe evidencia estadstica para afirmar que el rendimiento

    en el trabajo no es independiente del turno laboral.

    Clculos en Excel

    13.277

    0.01

  • 75

    El valor crtico (13,277), puede calcularse con la funcin INV.CHICUAD e ingresar (1-)

    o con la funcin INV.CHICUAD.CD, e ingresar ().

    Ejemplo:

    De acuerdo con una encuesta de participacin en los deportes de la Asociacin Nacional del

    Deporte de Estados Unidos, publicada en American Demographics, las actividades deportivas en las que participa la gente est relacionada con el gnero. La siguiente tabla

    proporciona los resultados de una encuesta que inclua a 767 personas, clasificados por

    actividad deportiva (que practican con regular frecuencia) y por sexo. La evidencia que

    proporcionan estos datos es suficiente para inferir que el sexo y la actividad deportiva estn

    relacionados? Use =0,05

    Actividad deportiva

    Sexo Ciclismo Aerbicos Caminata Natacin

  • 76

    Hombres 85 28 60 179

    Mujeres 81 138 106 90

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

    4. Regin crtica:

    5. Decisin:

    6. Conclusin:

  • 77

    Ejemplo

    Un estudio de usuarios y no usuarios de cinturn de seguridad produjo los datos de muestra

    aleatoria que se resumen en la tabla adjunta. Pruebe la aseveracin de que la cantidad de

    cigarrillos fumados es independiente del uso de cinturn de seguridad. Una teora verosmil es

    que las personas que fuman ms se preocupa menos por su salud y seguridad y, por tanto, tiene

    una menor inclinacin a usar cinturn de seguridad.Los datos de muestra apoyan esta teora?

    Nmero de cigarrillos fumados al da

    0 1-14 15-34 35 o ms

    Usan cinturn de seguridad 175 20 42 6

    No usan cinturn de seguridad 149 17 41 9

    a) Realice la prueba respectiva, con un nivel de significacin del 5%, usando el enfoque clsico

    b) Realice la prueba respectiva, con un nivel de significacin del 5%, usando el enfoque del valor p.

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

    4. Regin crtica:

  • 78

    5. Decisin:

    6. Conclusin:

    3.2 Prueba de homogeneidad de proporciones (o subpoblaciones)

    Es una prueba estadstica aproximada que se usa para determinar si las frecuencias

    esperadas en una fila son proporcionales a las frecuencias esperadas de cada uno de las

    otras filas de la tabla de contingencia o si las frecuencias en una columna son

    proporcionales a las frecuencias esperadas de las otras columnas de la tabla de

    contingencia.

    Una caracterstica de esta aplicacin es que se requiere la seleccin de una muestra por

    cada grupo de anlisis.

    Ejemplo:

    La enfermera de un colegio llev a cabo un experimento para determinar el grado de alivio

    proporcionado por tres remedios para la tos. Cada remedio se suministr a 50 estudiantes y se

    registraron los siguientes datos:

    Efecto Remedio para la tos

    NyQuil Robitussin Triaminic

    Sin alivio 11 13 9

    Cierto alivio 32 28 27

    Alivio total 7 9 14

    Pruebe la hiptesis, con un nivel de significacin del 5%, que los tres remedios para la tos son

    igualmente efectivos.

  • 79

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

    4. Regin crtica:

    5. Decisin:

    6. Conclusin:

    Ejemplo

  • 80

    Muestras de tres tipos de materiales, sujetos a cambios extremos de temperatura, produjeron

    los resultados que se muestran en la siguiente tabla:

    Material A Material B Material C Total

    Desintegrados 41 27 22 90

    Permanecieron intactos 79 53 78 210

    Total 120 80 100 300

    Use un nivel de significancia de 0.05 para probar si, en las condiciones establecidas, la

    probabilidad de desintegracin es la misma para los tres tipos de materiales.

    Solucin

    1. Hiptesis:

    H0: La probabilidad de desintegracin es la misma para los tres tipos de materiales.

    H1: La probabilidad de desintegracin no es la misma para los tres tipos de materiales.

    2. Nivel de significacin: 0,05

    3. Estadstico de prueba

    (gl)21)-1)(3-(2 :libettaddeGrados,)( 2

    2

    ij

    ijij

    ce

    eO

    575,470

    )7078(...

    84

    )8479(

    36

    )3641( 2222

    c

    4. Regin crtica:

    5. Decisin: Como el valor calculado 4.575 < 5.991, No se rechaza Ho

    6. Conclusin: Con nivel de significacin 0,05 no existe evidencia estadstica para afirmar que la

    probabilidad de desintegracin no es la misma para los tres tipos de materiales.

    Clculos de valores esperados:

    Material A Material B Material C Total

    Desintegrados 41 (36) 27 (24) 22 (30) 90

    5.991

    0.05

  • 81

    Permanecieron intactos 79 (84) 53 (56) 78 (70) 210

    Total 120 80 100 300

    Nota:

    En Excel existe la funcin PRUEBA.CHICUAD que permite obtener el p-valor de la

    prueba estadstica. Solo se requiere de la tabla de valores observados y valores

    esperados.

    Ejercicio:

    Se realiz una encuesta para saber si existe una brecha de gnero en la confianza que la gente tiene en la polica. Los resultados de muestra se listan en la tabla adjunta. Use un nivel de

    significacin del 0,05 para probar la afirmacin de que s existe una relacin entre el gnero y

    la confianza en la polica.

    Gnero Confianza en la polica

    Mucha Regular Muy poca o ninguna

    Hombres 115 56 29

    Mujeres 175 94 31

    195,22 c

    1. Hiptesis

    ........................ :

    ........................ :

    1

    0

    H

    H

    2. Nivel de significacin: = .

    3. Clculo del valor del estadstico de prueba:

    4. Regin crtica:

  • 82

    5. Decisin:

    6. Conclusin:

    Ejercicios Propuestos:

    1. En un estudio de los sistemas lectores de cajas registradoras, se usaron muestras de compras para comparar los precios ledos con los precios anunciados. En la tabla adjunta se resumen

    los resultados para una muestra de 819 artculos. Cuando las tiendas usan lectores para

    registrar las compras, las tasas de error son las mismas para los artculos a precio normal

    y los artculos en oferta?Cmo podra cambiar la conducta de los consumidores si creen

    que ocurre un nmero desproporcionado de cobros de ms con los artculos en oferta? Use

    un nivel de significacin del 6%

    Artculos normales Artculos en oferta

    Cobro de menos 20 7

    Cobro de ms 15 29

    Precio correcto 384 364

    004,0ValorP;814,102 c

    2. Se realiza un estudio para determinar la relacin entre el tipo de crimen y siel criminal es un extrao o no. La tabla adjunta lista los resultados de una encuesta practicada a una

    muestra aleatoria de vctimas de diversos crmenes. Con un nivel de significacin de 0,05,

    pruebe la Hiptesis respectiva.

    Homicidio Asalto Agresin

  • 83

    El criminal era un extrao 12 379 727

    El criminal era un conocido o pariente 39 106 642

    0000,0ValorP;330.1192 c

    3. Un estudio de accidentes automovilsticos seleccionados al azar y conductores que usan telfonos celulares proporcion los datos de muestra adjuntos. Se desea saber si existe

    alguna relacin entre la ocurrencia de accidentes y uso de telfonos celulares. Con base en

    estos resultados, realice la prueba correspondiente con un nivel de significacin del 5%.

    Tuvo accidente el

    ao pasado

    No tuvo accidente el ao

    pasado

    Usa telfono celular 23 282

    No usa telfono celular 46 407

    220,0ValorP;505,12 c

    4. La tabla adjunta lista datos de muestra que el estadstico Karl Pearson us en 1909. Cree usted que el tipo de delito est relacionado con el hecho de que el criminal beba o se

    abstenga? Hay delitos aparentemente asociados al hbito de beber?

    Incendio provocado Violacin Violencia Robo Falsificacin Fraude

    Bebedor 50 88 155 379 18 63

    Abstemio 43 62 110 300 14 144

    000,0ValorP;731,492 c

    5. Una de las preguntas de un estudio de suscriptores de 1996 de Bussiness Week fue: Durante los ltimos 12 meses, en viajes de negocios, qu tipo de boleto de avin compr con ms frecuencia? Las respuestas obtenidas se muestran en la siguiente tabla:

    Tipo de vuelo

    Nacional Internacional

    Tip

    o d

    e

    bole

    to Primera clase 29 22

    Clase de negocios o ejecutiva 95 121

    Clase econmica 518 135

    Usando nivel de significacin 0,05, pruebe la independencia del tipo de vuelo y tipo

    de boleto. 000,0ValorP;434,1002 c

    6. En el estudio de un taller, se obtuvo un conjunto de datos para determinar si la proporcin de artculos defectuosos producidos por los trabajadores era la misma durante el da, la tarde

    o la noche. Se encontraron los siguientes resultados:

    Condicin TURNO

    Da Tarde Noche

  • 84

    Defectuosos 45 55 70

    No defectuosos 905 890 870

    Utilice un nivel de significacin del 2,5% para determinar si la proporcin de artculos

    defectuosos es la misma para los tres turnos.

    044,0ValorP;234,62 c

    7. La enfermera de un colegio llev a cabo un experimento para determinar el grado de alivio proporcionado por tres remedios para la tos. Cada remedio se suministr a 50 estudiantes y

    se registraron los siguientes datos:

    Efecto Remedio para la tos

    NyQuil Robitussin Triaminic

    Sin alivio 11 13 9

    Cierto alivio 32 28 27

    Alivio total 7 9 14

    Pruebe la hiptesis, con un nivel de significacin del 5%, que los tres remedios para la

    tos son igualmente efectivos.

    432,0ValorP;810,32 c

    8. Durante las primeras 13 semanas de la temporada de televisin, se registraron las audiencias de sbado por la noche, de 8:00 p.m. a 9:00 pm. Como sigue: ABC 29%, CBS 28%, NBC

    25% y otros 18%. Dos semanas despus, una muestra de 300 hogares arroj los siguientes

    resultados de audiencia: ABC 95 hogares, CBS 70 hogares, NBC 89 hogares y otros 46

    hogares. Pruebe, con nivel de significacin 0,05, si han cambiado las proporciones de

    telespectadores.

    9. Suponga que los investigadores desean determinar si el patrn de distribucin del ingreso familiar en el Per, ha cambiado significativamente durante los ltimos cinco aos. Se sabe

    que hace cinco aos la distribucin del ingreso familiar para las distintas clases de ingreso

    era la siguiente:

    Clase de Ingreso ($) % de todas las familias en

    la clase

    (1) menos de 3000 9

    (2) de 3000 a menos de 5000 11

    (3) de 5000 a menos de 7000 12

    (4) de 7000 a menos de 10000 22

    (5) de 10000 a menos de 15000 27

    (6) de 15000 a menos de 25000 15

    (7) de 25000 a mas 4

    TOTAL 100

    Se elige una muestra aleatoria de 1000 familias y se obtiene la siguiente distribucin:

  • 85

    Clase de Ingreso ($) 1 2 3 4 5 6 7

    Nmero de familias 70 100 110 200 300 170 50

    Con = 0,05, el patrn actual de distribucin del ingreso familiar es significativamente distinto al de hace cinco aos?

  • 86

    3.3 Prueba de bondad de ajuste Caso 1: Poblacin multinomial

    El procedimiento de prueba para los experimentos multinomiales es bastante semejante al

    descrito para el caso de independencia y homogeneidad, el mayor cambio viene con el

    planteamiento de la hiptesis nula. Puede ser un planteamiento verbal.

    El valor critico es determinado por el nivel de significacin asignado () y el numero de grados de libertad es una unidad menos que el nmero de clases o categoras (k) en

    que se dividen los datos. (gl = k 1).

    Cada frecuencia esperada ei se determina al multiplicar el nmero total de ensayos n por la probabilidad correspondiente ei = n pi

    Poblacin multinomial: cuando cada elemento de una poblacin se asigna a una y slo una

    de varias categoras.

    La distribucin multinomial de probabilidad se puede concebir como una ampliacin de la

    distribucin binomial para el caso de tres o ms categoras de resultados.

    2)1(

    1

    2

    2 ~

    k

    k

    i i

    ii

    ce

    eo

    Donde:

    oi: frecuencia observada para la categora i.

    ei: frecuencia esperada para la categora i.

    k: Nmero de categoras.

    Nota: Las ei deben ser cinco o ms para todas las categoras.

    Ejemplo:

    A continuacin se presentan las prefer