5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 1/46
1
ESTADISTICA PARA INVESTIGACION EN
SALUD
MODULO 3 : PRUEBAS DE HIPOTESIS
FERNANDO QUEVEDO RICARDI
MARCELA BARRIA CONCHA
Facultad de Medicina. Universidad de ChileSeptiembre 2006
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 2/46
Objetivo del Módulo
Entregar los elementos que permitan al alumno realizar pruebas de hipótesis para comparar
el promedio de una muestra con el promedio del universo, el porcentaje de una muestra con
el porcentaje del universo, los porcentajes de dos muestras, los promedios de dos o másmuestras, y evaluar la asociación entre dos variables.
Contenidos Temáticos
Preámbulo
Capítulo I: Prueba de hipótesis para comparar una muestra con el universo▪ Promedio
▪ Porcentaje
Capítulo II: Prueba de hipótesis para comparar dos muestras▪ Promedio
▪ Porcentaje
Capítulo III: Prueba de Ji cuadrado
▪ Prueba de asociación▪ Prueba de bondad de ajuste
Capítulo IV:▪ Análisis de varianza: generalidades
▪ Regresión: generalidades
Aprendizajes Esperados
Al finalizar el módulo 3, usted estará en condiciones de lo siguiente:
▪ Formular hipótesis estadísticas correspondientes a un problema de investigación.
▪ Elegir el estadístico de prueba apropiado para la hipótesis planteada.
▪ Elegir el nivel de significación de la prueba.
▪ Buscar en la tabla el valor del estadístico de prueba asociado al nivel de
significación (valor crítico).
▪ Calcular el estadístico de prueba con los datos del problema.
2
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 3/46
▪ Tomar una decisión respecto de las hipótesis, en función del valor del estadístico de
prueba.▪ Sacar conclusiones fundamentadas en la decisión.
Preámbulo
Antes que Nada
Es frecuente, especialmente en el campo de la salud, que un profesional en ejercicio de su
actividad observe un fenómeno que lo hace pensar que el grupo al que está observandotiene un comportamiento especial respecto a una determinada variable.
Así, por ejemplo, un kinesiólogo puede pensar que los pacientes sometidos a una secuenciaespecial de ejercicios demoran menos en recuperar la función muscular que aquellostratados con el método tradicional. A un médico radicado en Punta Arenas le puede parecer
que los suicidios adolescentes son más frecuentes en su región. Un profesional de la
nutrición puede creer que los pacientes con problemas de absorción intestinal respondenmejor a una alimentación con verduras que con carnes. El director de salud de una
municipalidad puede pensar que su consultorio tiene mejor resolución de problemas
complejos que el consultorio del municipio vecino.
Detrás de todas estas situaciones se esconde una hipótesis que espera para ser verificada.
Definición de hipótesis
Una hipótesis se define como una afirmación transitoria que debe ser sometida a prueba. La
inferencia estadística propone un procedimiento para llevar a cabo la prueba de lashipótesis. Propone, primero, enunciarlas formalmente y luego contrastarlas con la evidencia
de los datos. Son los datos, entonces, con su coro de características, los que dirán si una
hipótesis es falsa o verdadera.
Este procedimiento se realiza considerando a los parámetros, que ya sabemos corresponden
al universo, como los objetos para los cuales se enuncian las hipótesis. Dicho de otro modo,
las hipótesis se enuncian para los parámetros.Por ejemplo, una hipótesis, al decir: “el promedio de días de recuperación de la enfermedad
X es 25”, está afirmando que, en el universo, los pacientes se demoran en promedio 25 díasen mejorar. Será tarea del investigador probar la veracidad o falsedad de dicha afirmación
contrastando el valor propuesto para el parámetro del universo (25), con los datos reales
provenientes de una muestra cualquiera. Si producto de esta comparación resulta que el promedio obtenido en la muestra es de 22 días, se le encarga a la estadística que resuelva el
dilema de si la diferencia entre el promedio muestral (22) y el poblacional (25) permite
3
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 4/46
aceptar como verdadera la hipótesis planteada. Será el método estadístico el que permita en
definitiva resolver este dilema, evaluando la significación de la diferencia entre 22 y 25.
¿Azar o no?
El método de las pruebas de hipótesis consiste fundamentalmente en establecer la
probabilidad de que sea consecuencia del azar la diferencia existente entre dos cantidades.
Se pueden distinguir dos situaciones:
a. Diferencia entre un valor muestral y el parámetro.b. b. Diferencia entre dos o mas valores muestrales.
En el caso a, se tratará de evaluar la diferencia entre un valor obtenido en la muestra(estadístico) y un valor correspondiente en el universo (parámetro), y en el caso b se
evaluará la diferencia entre dos valores provenientes de dos muestras (estadísticos). Los
valores que se comparen, ya sean de la muestra o del universo, pueden ser promedios,
porcentajes u otros. Nosotros nos ocuparemos sólo de promedios y porcentajes.
En general, lo que hace una prueba estadística es evaluar la diferencia entre dos omás valores (dos promedios, dos porcentajes). Respecto de esta diferencia seelabora una hipótesis previa y se plantea formalmente en términos estadísticos.
Luego, usando la distribución de probabilidad adecuada, se calcula la probabilidadde la diferencia entre los valores comparados. Si la probabilidad de obtener taldiferencia es pequeña, diremos que dicha diferencia es significativa.
Estadístico de Prueba
Para realizar tan delicada operación debemos utilizar el instrumento apropiado. A dicho
instrumento le llamaremos estadístico de prueba. Con los datos de nuestras muestras podremos calcular el estadístico de prueba. Luego buscaremos la probabilidad de
4
Creo que la media es 25 días...
Son
demasiados...
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 5/46
ocurrencia de dicho estadístico en la tabla correspondiente (Normal, t de student u otra) y a
la luz de la probabilidad obtenida tomaremos una decisión respecto de nuestra querida
hipótesis.
Esto, que hemos descrito en forma bastante general, lo iremos desarrollando aplicado a
problemas e hipótesis específicas en el transcurso del módulo 3, pero trataremos demantener para todas las situaciones un mismo esquema de trabajo. Ese esquema es el
siguiente:
1. Plantear la hipótesis en términos estadísticos.
Esta etapa consiste en representar el problema de investigación bajo la forma de dos
hipótesis excluyentes: la Hipótesis Nula y la Hipótesis Alternativa.
a) Hipótesis Nula. Esta hipótesis plantea que los valores comparados son iguales.Dependiendo del problema podrá presentarse como:
b) Hipótesis Alternativa. Esta hipótesis plantea que los valores comparados sondistintos y por lo tanto pertenecen a universos distintos. Dependiendo del
problema podrá presentarse como:
2. Elegir un nivel de significación.
El nivel de significación es la probabilidad de que la diferencia observada se deba al azar.
Interesa que esta probabilidad sea pequeña, por eso, en la práctica se utilizan valores
iguales o inferiores a 0,05. El valor más usado es 0,05 pero también puede ser 0,04; 0,02;0,01; etc. Al nivel de significación se le identifica con la letra griega alfa (α ). Al elegir un
5
Rechazo H0
Rechazo H0
No rechazo H0
Η 0: µ =25
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 6/46
valor de alfa concreto, estamos dejando la mitad de alfa en cada extremo de la distribución
de probabilidades ( 2/α ).
<br>
3. Calcular el estadístico de prueba a base de los datos muestrales.
El estadístico que se utilice para la prueba de la hipótesis dependerá de los elementos que
participan en él. Así, cuando se trate comparar 2 promedios usaremos el estadístico t deStudent; cuando necesitemos comparar dos porcentajes muestrales usaremos Z, etc. Pero ya
iremos viendo a cada uno de estos estadísticos actuar en terreno.
4. Buscar, en la tabla correspondiente.▪ La probabilidad de obtener un valor igual o mayor al estadístico calculado, cuando
éste sea positivo, o
▪ La probabilidad de obtener un valor menor o igual, cuando el estadístico sea
negativo.
▪ En resumen: )( 0 z z P ≥ cuando z0 sea positivo o )( 0 z z P ≤ cuando z0 sea
negativo.
5. Comparar la probabilidad obtenida en la tabla con el nivel de significaciónelegido en el punto 2 y tomar una decisión respecto de las hipótesisplanteadas.
Parece evidente que para tomar una buena decisión es conveniente disponer de criterios.
Debemos decidir si la hipótesis nula es verdadera o falsa. Entonces, de acuerdo a la
evidencia aportada por los datos de la muestra aceptaremos o rechazaremos la hipótesisnula según el siguiente criterio:
Se rechazará la hipótesis nula si la probabilidad encontrada en la tablaes inferior a la mitad del nivel de significación )2/(α .
6. Elaborar una conclusión derivada de la decisión.
Una vez tomada la decisión sobre las hipótesis debemos exponer lo que esto significa en elcontexto de nuestro problema particular.
6
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 7/46
7. Apoyar todo el proceso de análisis con un gráfico del problema.
A la hora de tomar la decisión es muy útil y orientador un buen gráfico donde se consigne
el nivel de significación, el valor del estadístico y la probabilidad asociada a él.
Capítulo I
Prueba de Hipótesis para Comparar una Muestra con el Universo
Para solucionar los problemas planteados en este capítulo haremos uso de dos estadísticos.
Usaremos uno u otro dependiendo de la situación problema.
A continuación se presenta el esquema de solución general que aplicaremos en cada una detres situaciones problema.
a) Se está comparando el promedio de la muestra con el promedio del universo yse conoce la desviación estándar del universo.
Estadístico a utilizar:n
x z
/
00
0
σ
µ −=
Donde:1. z0 tiene probabilidad de ocurrencia en la tabla de distribución
normal,
2. 0 x es el promedio de la muestra,
3. 0 µ es el promedio del universo,
4. σ es la deviación estándar del universo y
5. n es el tamaño de la muestra.
b) Se está comparando el promedio de la muestra con el promedio del universo y
NO se conoce la desviación estándar del universo.
Estadístico a utilizar:n s
xt
/
0
0
0µ −
=
Donde:
1. “t0” tiene probabilidad e de ocurrencia en la tabla de
distribución t de Student con n-1 grados de libertad.
7
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 8/46
2. 0 x es el promedio de la muestra,
3. 0 µ es el promedio del universo,
4. σ es la deviación estándar del universo y
5. n es el tamaño de la muestra.
c) Se está comparando el porcentaje de la muestra con el porcentaje del universo.
Estadístico a utilizar:nQ P
P p z
/)( 00
000
×
−=
Donde:
1. z0 tiene probabilidad de ocurrencia en la tabla de distribución normal,
2. 0 p es el porcentaje de la muestra,
3. 0
P
es el porcentaje del universo,4. 0
Q es el complemento P0 (100-P0) y
5. n es el tamaño de la muestra.
Comparación del Promedio de una Muestra con el Promedio delUniverso
El problema para el investigador es el siguiente: en una población determinada, el peso de
nacimiento promedio es 3,38 kilos y la desviación estándar 0,42 kilos. Se sospecha que los
hijos de madres adolescentes tienen un peso de nacimiento diferente, probablemente menor.
En una muestra de 25 recién nacidos de madres adolescentes se obtuvo un promedio de
peso al nacimiento de 2,85 kg, con una desviación estándar de 0,5 kg. ¿Se puede aceptar lahipótesis de que esta muestra pertenece a una población cuyo promedio y desviación
estándar son, respectivamente, 3,38kg y 0,42kg?
Identifiquemos los elementos del problema:
1. Promedio del universo 38,30 = µ
2. Promedio de la muestra 85,20= x
3. Desviación estándar del universo 42,0=σ
4. Desviación estándar de la muestra 5,0= s
5. Tamaño de muestra n=25
Una vez identificados los datos del problema, buscaremos la solución guiados por el
esquema básico.
1. Planteamiento de hipótesis en términos estadísticos.
8
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 9/46
38,3:0 = µ H
Esta hipótesis (hipótesis nula) plantea que la muestra, aunque tiene un promedio diferente, proviene de un universo cuyo promedio es 3,38 y que la diferencia entre promedio de la
muestra y promedio del universo está dentro del error de muestreo.
38,3:1
≠ µ H
Esta hipótesis (hipótesis alternativa) plantea que la muestra no proviene de este universo ya
que la diferencia entre promedio de muestra y promedio del universo es mayor que el error de muestreo (recuerde el error de los intervalos de confianza).
2. Elegir el nivel de significación.
Elegimos un nivel de significación 05,0=α . Este valor lo fija el investigador y debe ser
menor o igual a 0,05.
3. Calcular el estadístico de prueba.
Como se conoce la desviación estándar del universo )(σ el estadístico para someter a
prueba esta hipótesis será Z y su fórmula de cálculo es:
n
x z
/
0
σ
µ −=
Llevando los datos del problema a la fórmula del estadístico se obtiene:
=−
=
25/42,0
38,385,2 z -6,3
Entonces, el valor del estadístico de prueba es -6,3.
4. Buscar en la tabla normal la probabilidad de ocurrencia que tiene un valor de z igual o inferior a -6,3.
Vemos en la tabla que el máximo valor de z que aparece es -3,49 y que la probabilidad de
encontrar un valor igual o inferior a -3,49 es 0,0002 (probabilidad de la cola).
5. Comparar la probabilidad obtenida en la tabla con el nivel de significaciónelegido en el punto 2 y tomar una decisión respecto de las hipótesisplanteadas.
Dado que el valor de Z calculado (-6,3) está en un extremo de la curva, la probabilidad de
obtener un valor igual o inferior a él es menor que la mitad del nivel de significación
elegido ( 025,02/ =α ). El hecho de que la probabilidad asociada al estadístico de prueba
9
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 10/46
sea menor que la mitad del nivel de significación nos conduce a la decisión de rechazar la
hipótesis nula (según el criterio enunciado).
6. Elaborar una conclusión derivada de dicha decisión.
Ya que rechazamos la hipótesis nula, que plantea que la muestra observada pertenece a un
universo con promedio 3,38 kg, podemos afirmar lo contrario, es decir que: “la muestra de25 RN no pertenece al universo con promedio 3,38, pertenece a un universo cuyo promedio
es distinto de 3,38”. Esta afirmación se hace con un nivel de significación de 0,05.
7. Apoyar todo el proceso de análisis con un buen gráfico del problema.
Gráfico del problema.
Se observa en el gráfico que la probabilidad del estadístico de prueba es inferior a la mitad
del nivel de significación lo que indica que la diferencia entre la muestra y el universo es
significativa.
Supongamos ahora que el investigador no tiene información sobre la desviación estándar
del universo. En ese caso la única diferencia en la solución estará en el estadístico de
prueba, que en vez de usar “z” deberá usar “t”.
25/5,0
38,385,2
/
00 −=
−=
n s
xt
µ = - 5,3
Buscamos en la tabla “t”, con 24 grados de libertad, la probabilidad asociada a este valor.Mirando la tabla, en la fila de los 24 grados, se observa que el último valor a la derecha es
3,745. Subiendo desde este valor hasta la primera fila de la tabla encontramos que la
probabilidad asociada a los valores superiores a 3,745 es 0,0005.Como la curva es simétrica se supone que ambas colas tienen igual probabilidad, por lo
tanto podemos asociar también a - 3,745 una probabilidad de 0,0005.
Finalmente, como la probabilidad del estadístico de prueba (0,0005) es menor que la mitaddel nivel de significación (0,025), nuestra decisión de rechazo de la hipótesis nula se
mantiene y por consiguiente también se mantienen las conclusiones.
10
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 11/46
Comparación del Porcentaje de una Muestra con el Porcentaje delUniversoEl problema para el investigador es el siguiente: en una población determinada, 28,2% de
las personas presentan algún problema de salud mental. Producto de su experiencia en un
consultorio rural, un profesional de la salud sospecha que en la población asignada a eseconsultorio el porcentaje de personas con problemas de salud mental es superior al de la
población. Con el objeto de probar su hipótesis toma una muestra al azar, de 63 personas,
encontrando un 31% de ellas con problemas de salud mental.
A la luz de estos antecedentes, ¿se puede aceptar la hipótesis de que elporcentaje de problemas de salud mental en este consultorio es distinto de 28,2?
¿Cuáles son los datos que entrega el problema?
P0= 28,2 Porcentaje del universo con problemas de
salud mental
Q0= 71,8 Porcentaje del universo sin problemas desalud mental
p0= 31 Porcentaje de la muestra
n= 63 Tamaño de la muestra
1. Las hipótesis serán:2,28:0 = P H 2,28:
1≠ P H
2. Elegiremos un nivel de significación 04,0=α
3. El estadístico de prueba será:
49,063/)8,712,28(
2,2831
/)(00
00
0 =×
−=
×
−=
nQ P
P p z
4. Buscamos en la tabla normal la probabilidad asociada a un valor de z mayor de0,49. Como la tabla entrega la probabilidad de encontrar un valor de z inferior a
0,49 (0.6879), la probabilidad de valores de z mayores a 0.49 se obtiene por
diferencia: 1- 0,6879 = 0,3121.
11
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 12/46
5. Comparamos la probabilidad encontrada con la mitad del nivel de significación:02,02/ =α
6. Dado que el valor de z calculado (0,49) se encuentra más o menos al centro de la
curva, su probabilidad, según tabla es de 0,3121 que resulta mayor a la mitad delnivel de significación elegido ( )02,02/ =α .
Esto nos conduce a la decisión de aceptar la hipótesis nula (ver gráfico).
7. Aceptar la hipótesis nula significa aceptar que el porcentaje de problemas de salud
mental en la muestra no es significativamente distinto del porcentaje del universo.
Por lo tanto, el porcentaje de problemas de salud mental del consultorio estudiado
no es distinto al de la población.
12
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 13/46
Ejercicio, Capítulo I, Módulo 3
Problema 1
El porcentaje de complicaciones postoperatorias en los pacientes sometidos a unadeterminada intervención quirúrgica es de 12%. Se aplica una nueva técnica a una muestra
de 36 pacientes y se obtiene un 9% de pacientes con complicaciones.
¿Se puede aceptar la hipótesis de que el porcentaje de complicaciones con la nueva técnica
es distinto al tradicional? Use un nivel de significación de 0,04.
Si lo desea, puede usar tablas como las que se muestran para anotar sus datos y los pasos
del desarrollo en su archivo Word.
Elementos (datos) del
problema
Descripción del dato
P0=
Q0=
p0=
n=
Pasos del desarrollo del problema:
1.- Hipótesis
2.- Nivel de significación
3.- Estadístico de prueba
4.- Probabilidad
5.- Comparación de la
probabilidad encontrada conel nivel de significación y
decisión.
6.- Conclusión
13
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 14/46
No olvide dibujar su gráfico.
Problema 2
En una empresa con 62 empleados se observa un gasto medio en salud de 292 unidades
monetarias y una desviación estándar de 40 unidades. Con el antecedente de que el gastomedio en salud de la población del país es de 308 unidades monetarias ¿Se puede afirmar
que el gasto medio en salud de los empleados de la empresa es distinto al del país? Use alfa
de 0,05.
Elementos (datos) del
problema
Descripción del dato
Desarrollo del problema:
1.- Hipótesis
2.- Nivel de significación
3.- Estadístico de prueba
4.- Probabilidad
5.- Comparación de la probabilidad encontrada con
el nivel de significación y
decisión.
6.- Conclusión
No olvide dibujar su gráfico.
14
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 15/46
Para Tener Presente
Una hipótesis es una afirmación transitoria que debe ser sometida aprueba.
<br>
El método de las pruebas de hipótesis consiste fundamentalmente enestablecer la probabilidad de que la diferencia entre dos cantidades seaconsecuencia del azar.
<br>
Pasos para realizar una prueba de hipótesis:
1. Plantear la hipótesis en términos estadísticos:
Hipótesis Nula: los valores comparados son iguales.
00: µ µ = H o 00 : P P H =
210 : µ µ = H o 210 : P P H =
Hipótesis Alternativa: los valores comparados son distintos y por lo tanto pertenecen a universos distintos.
01 : µ µ ≠ H o 01 : P P H ≠
211 : µ µ ≠ H o 211 : P P H ≠
2. Elegir un nivel de significación o alfa (α ): Se utilizan valores iguales oinferiores a 0,05. El valor más usado es 0,05. Se deja la mitad de alfa en cada
extremo de la distribución de probabilidad ( 2/α ).
3. Calcular el estadístico de prueba con los datos muestrales: El estadístico que se
utilice dependerá de los elementos que participan en el problema.
4. Buscar, en la tabla correspondiente, la probabilidad de obtener un valor igual omayor al estadístico calculado, cuando éste sea positivo, y la probabilidad de
obtener un valor menor o igual, cuando el estadístico sea negativo.
5. Comparar la probabilidad obtenida en la tabla con el nivel de significación
elegido en el punto 2 y tomar una decisión respecto de las hipótesis planteadas:
se rechazará la hipótesis nula si la probabilidad es inferior a la mitad del nivelde significación.
6. Elaborar una conclusión derivada de la decisión
15
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 16/46
7. Apoyar el proceso de análisis con un gráfico del problema
Capítulo II
Prueba de Hipótesis para Comparar dos Muestras
Para desarrollar este tema seguiremos un esquema similar al del capítulo anterior.Estudiaremos tres situaciones problema que, sin ser las únicas, son las más frecuentes.
a) Comparación de la diferencia de promedios de dos muestras independientes.
b) Comparación de promedios de dos muestras pareadas.c) Comparación de porcentajes de dos muestras.
Consideraciones previas
Antes de analizar la diferencia entre los promedios muestrales debemos responder algunas
preguntas importantes que harán la diferencia en el procedimiento a seguir.
1.-¿Se trata de dos muestras independientes o pareadas?
Diremos que dos muestras son independientes cuando no se establece ninguna relación previa al análisis entre las unidades de una y otra muestra. Por ejemplo, sujetos de uno y
otro curso, enfermos de dos consultorios, hombres comparados con mujeres.
En cambio diremos que se trata de muestras pareadas si en forma previa al análisis, se
forman parejas entre los individuos de una muestra con los individuos de la otra muestra.
Por ejemplo, el caso con su control, distintas dietas pueden probarse en dos animales de lamisma camada, Sin embargo, cuando queda más clara esta situación es cuando se comparan
distintas medidas para los mismos individuos; por ejemplo, al medir antes y después del
tratamiento a un mismo grupo de individuos se obtienen resultados pareados ocorrelacionados.
2.-¿Son conocidos los valores de la varianza, o las varianzas de lossupuestos universos?
Como existe la posibilidad de que ambas muestras provengan de un mismo universo,
entonces en ese caso se trataría de una sola varianza del universo. ¿Se conoce dicha
varianza?
16
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 17/46
Pero también existe la posibilidad de que las muestras comparadas provengan de universos
distintos y en ese caso habría dos varianzas universales. ¿Son éstas conocidas?
3.-A la luz de las varianzas de las muestras, ¿podemos suponer que lasvarianzas son iguales?
Bueno, en esta parte y con todo derecho, podríamos reclamar en contra de lascomplicaciones de la estadística, pero seguramente el cumplimiento de estas exigencias nos
permitirá obtener resultados más confiables.
Cada posible respuesta a estas interrogantes nos conducirá a ocupar una fórmuladistinta para calcular el estadístico. Por ello veremos, en primer lugar, la forma deresponder a las preguntas planteadas.
Las Respuestas
La respuesta a la primera pregunta es fácil, porque se encuentra incorporadadentro del mismo problema de investigación: es una característica de los datos;forma parte del diseño de la investigación.
La segunda pregunta tampoco es tan complicada porque será cuestión de revisar los antecedentes de que dispone el investigador. Lo más frecuente es que estedato se desconozca y, por lo tanto, para efectos de este curso, nosotrosasumiremos que la o las varianzas del universo son desconocidas.
Para responder a la tercera pregunta se hace necesario realizar una prueba dehipótesis para probar la igualdad o diferencia de las varianzas. La realización de lamisma no es difícil y es frecuente que los programas computacionales de análisisestadístico la hagan en forma automática sin que sea necesario solicitarla, y laentreguen como parte de los resultados. Como lo más frecuente es que lasvarianzas de las muestras comparadas tengan varianzas similares, nosotros eneste curso haremos los análisis bajo este supuesto.
Hechas estas aclaraciones procederemos a describir en forma general los estadísticos que
participan en cada situación.
a) Comparar los promedios de dos muestras independientes (con varianzasdesconocidas y supuestas iguales)
Estadístico a utilizar:
+×
−=
21
2
21
0
11
nn
s
x xt
Donde:
17
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 18/46
1. “t0” tiene probabilidad e de ocurrencia en la tabla de distribución t de
Student con 221 −+ nn grados de libertad.
2.2
)1()1(
21
2
22
2
112
−+
−+−=
nn
sn sn s es la varianza común estimada.
3. t0 tiene probabilidad de ocurrencia en la tabla t.
4. 1 x es el promedio de la muestra 1 y 2 x es el promedio de la muestra 2.
5. n1 y n2 son los tamaños de las respectivas muestras.
b) Comparar los promedios de dos muestras pareadas.
Estadístico a utilizar:n s
Dt
D /
0
0=
Donde:6. “t0” tiene probabilidad e de ocurrencia en la tabla de
distribución t de Student con n-1 grados de libertad.
7. D es la diferencia promedio entre las parejas de datos.
8. D s es la desviación estándar de las diferencias entre las
parejas de datos.
9. n es el tamaño de la muestra (número de parejas de datos).
c) Comparar los porcentajes de dos muestras.
Estadístico a utilizar:
+××
−=
21
210
11
nnq p
p p z
Con21
2211
nn
pn pn p
+
×+×=
Donde: 6. z0 tiene probabilidad de ocurrencia en la tabla de distribución normal.
7. p es la estimación del porcentaje común.
8. q es el complemento de p (100-p).
9. n1 y n2 son los tamaños de las respectivas muestras.
18
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 19/46
Comparación de los Promedios de Dos Muestras Independientes(con Varianzas Desconocidas e Iguales)
El problema para el investigador es el siguiente: en una maternidad dela Región Metropolitana se sospecha que los hijos de madresadolescentes tienen un peso de nacimiento diferente, probablementemenor, al peso de los recién nacidos de madres mayores de 25 años.
Con el objeto de probar la hipótesis se tomó una muestra de 36 recién nacidos de madres
adolescentes obteniendo un promedio de peso al nacimiento de 2,85 kg, con una desviación
estándar de 0,5 kg, y una muestra de 28 recién nacidos de madres mayores de 25 añosobteniendo en promedio 3,05 kg y una desviación estándar de 0,42.
Identifiquemos los elementos del problema.
6. Promedios de las muestras 1 y 2 85,21 = x y 05,32 = x
7. Desviaciones estándar de las muestras 1 y 2 5,01= s y 42,0
2= s
8. Tamaños de las muestras n1=36 y n2=28
Una vez identificados los datos del problema, buscaremos la solución guiados por el
esquema básico que usted ya conoce del capítulo anterior.
1. Planteamiento de hipótesis en términos estadísticos.
210 : µ µ = H
Esta hipótesis (hipótesis nula) plantea que las muestras, aunque tienen promediosdiferentes, provienen de un mismo universo y que la diferencia observada se debe al azar.
211: µ µ ≠ H
Esta hipótesis (hipótesis alternativa) plantea que las muestras provienen de universos con promedios distintos.
2. Elegimos un nivel de significación 05,0=α .Calcular el estadístico de prueba:
21,022836
42,0)128(5,0)136(
2
)1()1(22
21
2
22
2
112 =−+
−+−=
−+
−+−=
nn
sn sn s
19
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 20/46
73,1
28
1
36
121,0
85,205,3
11
21
2
21
0 =
+×
−=
+×
−=
nn s
x xt
Nota: Se aconseja restar al mayor de los promedios, el menor, de tal modo que la diferencia
resulte positiva y facilite de este modo su búsqueda en la tabla. Entonces el estadístico de
prueba es t=1,73
3. Como los grados de libertad son 62 (n1 +n2-2), buscamos en la tabla “t”, con 60grados de libertad, la probabilidad de ocurrencia que tiene un valor de “t” igual osuperior a 1,73.
Vemos en la tabla que 1,73 se encuentra entre 1,671 y 2,021 por lo tanto la probabilidad deun valor superior a él es mayor que la mitad de alfa.(0,025)(probabilidad de la cola).
4. El hecho de que la probabilidad asociada al estadístico de prueba sea mayor que la mitad del nivel de significación nos conduce a la decisión de aceptar lahipótesis nula.
5. Aceptar la hipótesis nula significa aceptar que el peso promedio al nacimientoes igual en madres adolescentes y madres mayores de 25 años. Ambas muestrasprovienen de un mismo universo.
6. Gráfico del problema.
Se observa en el gráfico que la probabilidad del estadístico de prueba es superior a la mitad
del nivel de significación (0,025), lo que indica que la diferencia entre las muestras no essignificativa.
Comparación de Dos Muestras con Observaciones Pareadas
20
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 21/46
Con el objeto de evaluar el efecto de la instrucción en el conocimientode los alumnos, se tomó una muestra de 10 alumnos y se compararonlas notas obtenidas antes y después de la instrucción.
Los resultados fueron los siguientes.
Antes: 4,
4
3,
7
4,
7
2,8 4,2 4,3 3,5 3,7 3,1 1,9
Después: 4,
0
5,
2
5,
7
4,2 4,8 3,9 4,1 3,0 4,6 6,8
Como aquí lo que interesa es evaluar el cambio individual se hace necesario generar una
variable que exprese ese cambio. Proponemos entonces crear la variable “x” que exprese ladiferencia entre las mediciones individuales. De este modo la variable
x = Después - Antes
será nuestra variable de estudio y respecto de ella formularemos la hipótesis nula
0:0 = µ H plantea que el promedio real (del universo) de las diferencias individuales es
cero
y la hipótesis alternativa
0:1 ≠ µ H plantea que el promedio real de las diferencias es distinto de cero.
Para decidir entre las hipótesis será necesario calcular un estadístico de prueba en base alos valores de la variable “x”
Antes Despues x4,4 4 -0,4
3,7 5,2 1,5
4,7 5,7 1
2,8 4,2 1,4
4,2 4,8 0,6
4,3 3,9 -0,4
3,5 4,1 0,6
3,7 3 -0,7
3,1 4,6 1,5
1,9 6,8 4,9
El esquema de esta prueba de hipótesis corresponde al utilizado para “comparar un promedio muestral con el promedio del universo”, visto en el capítulo anterior.
21
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 22/46
Empezaremos calculando promedio y desviación estándar para la variable diferencia (x) y
a continuación someteremos a prueba la hipótesis de que el promedio de las diferenciasobservadas ( µ ) es igual a cero.
Promedio de la muestra1= x Desviación estándar 25,1= s
Estadístico de prueba será:
10/25,1
01
/
00 −=
−=
n s
xt
µ = 2,5
Buscamos ahora en la tabla “t”, con 9 (n-1) grados de libertad, la probabilidad asociada aeste valor. Mirando la tabla, en la fila de los 9 grados, se observa que el valor asociado a la
mitad de alfa (0,025) es 2,262. Como el valor 2,5 se encuentra hacia la derecha de 2,262
nos conduce al rechazo de la hipótesis nula.
Por lo tanto el promedio de las diferencias “antes – después” es significativo, lo que nos
permite concluír que, asociado a la intervención educativa, se observa un aumentosignificativo del puntaje en los alumnos estudiados.
Comparación de los Porcentajes de Dos Muestras
El problema para el investigador es el siguiente.
En un consultorio urbano, el 28,2% de una muestra de 47 personas presenta algún problema de salud mental. En una muestra de 63 personas de un consultorio rural, el 31% de las personas tiene algún problema de salud mental.
22
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 23/46
A la luz de estos antecedentes, ¿se puede aceptar la hipótesis de que el porcentaje de
problemás de salud mental en el consultorio rural es distinto al del consultorio urbano?
¿Cuáles son los datos que entrega el problema?
p1= 28,2 Porcentaje de problemás de salud mental en la muestra
urbana. p2= 31 Porcentaje de problemás de salud mental en la muestra rural.
n1= 47 Tamaño de la muestra urbana.
n2= 63 Tamaño de la muestra rural.
1. Las hipótesis serán:
210 : P P H = y 211 : P P H ≠
2. Elegiremos un nivel de significación 04,0=α
3. El estadístico de prueba será:
+××
−=
21
210
11
nnq p
p p z
Calcularemos primero el porcentaje común ( p)
8,296347
31632,2847
21
2211 =+
×+×=
+
×+×=
nn
pn pn p
Entonces p=29,8 y q=100-p=70,2.
Luego reemplazamos todos los valores en la formula de Z
31,0
63
1
47
12,708,29
312,280 −=
+××
−= z
4. Buscamos en la tabla normal la probabilidad asociada a un valor de z menor de-0,31.
23
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 24/46
Resulta 0,3783.
5. Comparamos la probabilidad encontrada con la mitad del nivel de significación.
02,02/ =α
6. Dado que el valor de z calculado (-0,31) se encuentra más o menos al centro dela curva, su probabilidad, según tabla es de 0,3783 que resulta mayor a la mitaddel nivel de significación elegido )02,02/ =α .
Esto nos conduce a la decisión de aceptar la hipótesis nula (ver gráfico).
7. Aceptar la hipótesis nula significa aceptar que el porcentaje de problemas desalud mental es similar en ambos consultorios.
Ejercicio, Capítulo II, Módulo 3
Problema 1
El porcentaje de complicaciones postoperatorias en 15 pacientes sometidos al procedimiento tradicional es de 12%. Se aplica una nueva técnica a una muestra de 22
pacientes y se obtiene un 9% de complicaciones.
¿Se puede aceptar la hipótesis de que el porcentaje de complicaciones con la nueva técnica
es distinto al tradicional? Use un nivel de significación de 0,01.
Si lo desea, puede usar tablas como las que se muestran a continuación para anotar susdatos y los pasos del desarrollo.
Elementos (datos) delproblema
Descripción del dato
p1 =
q1 =
24
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 25/46
p2 =
q2 =
n1 =
n2 =
Pasos del desarrollo del problema:
1.- Hipótesis
2.- Nivel de significación
3.- Estadístico de prueba
4.- Probabilidad
5.- Comparación de la
probabilidad encontrada con el
nivel de significación y decisión.
6.- Conclusión
No olvide dibujar su gráfico.
Problema 2
En una empresa pública de 62 empleados, se observa un gasto medio en salud de 282
unidades monetarias y una desviación estándar de 40 unidades. En una empresa privada,con 57 empleados, el gasto medio en salud es de 308 unidades monetarias con desviación
estándar de 25 unidades.
¿Se puede afirmar que el gasto medio en salud de los empleados de la empresa pública es
distinto al gasto medio en salud de los empleados de la empresa privada?
Use alfa de 0,05.
Elementos (datos) delproblema
Descripción del dato
25
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 26/46
Desarrollo del problema:
1.- Hipótesis
2.- Nivel de significación
3.- Estadístico de prueba
4.- Probabilidad
5.- Comparación de la probabilidad encontrada con elnivel de significación y decisión.
6.- Conclusión
No olvide dibujar su gráfico.
Problema 3
Se desea conocer el efecto de un anticonceptivo oral sobre el peso corporal de las usuarias.
Para ello se toma una muestra de 9 mujeres sanas y se mide su peso antes de iniciar el
tratamiento y tres meses después. Se obtienen los siguientes resultados:
Mujer Peso inicio Peso a los 3meses
1 53 54
2 62 65
3 57 62
4 66 64
5 59 62
6 62 63
7 53 55
8 62 62
9 57 58
26
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 27/46
Pruebe la hipótesis de que el peso de las mujeres a los 3 meses de tratamiento es distinto del
peso inicial.
Use un nivel de significación de 0,01.
Elementos (datos) delproblema Descripción del dato
Desarrollo del problema:
1.- Hipótesis
2.- Nivel de significación
3.- Estadístico de prueba
4.- Probabilidad
5.- Comparación de la probabilidad encontrada con elnivel de significación y decisión.
6.- Conclusión
No olvide dibujar su gráfico.
Solución de los ejercicios:
Para Tener Presente
Al estudiar diferencias entre dos muestras se identifican las siguientes situaciones
27
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 28/46
problema:1. Comparación de la diferencia de promedios de dos muestras independientes.2. Comparación de promedios de dos muestras pareadas.3. Comparación de porcentajes de dos muestras.
Muestras independientes son aquellas en las cuales los sujetos de una muestra notienen relación alguna con los de la otra muestra.
Muestras pareadas son aquellas en las cuales los individuos o las mediciones deuna muestra están de alguna manera ligados o pareados con los de otra muestra.El caso más típico es el de las mediciones repetidas en los mismos sujetos.
Situaciones problema y estadístico a usar
Situaciónproblema
Estadístico a usar Otras fórmulas
Comparación depromedios dedos muestrasindependientes(con varianzasdesconocidas ysupuestasiguales)
+×
−=
21
2
21
0
11
nn
s
x xt
Grados de libertad: n1+n2-2
1
)1()1(
21
2
22
2
112
−+
−+−=
nn
sn sn s
S2 varianza común estimada
Comparación depromedios dedos muestraspareadas
La variable de trabajo es ladiferencia entre cada par dedatos
n s
Dt
D /
0
0 =
Grados de libertad: n-1
Se debe calcular promedio ydesviación estándar de la variablediferencia
Comparación
entre losporcentajes dedos muestras
+××
−
=
21
210
11
nnq p
p p
z
21
2211
nn
pn pn p
+
×+×=
P: estimación del porcentaje común
28
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 29/46
Capítulo III
La Prueba de Ji-cuadrado
Introducción
Del mismo modo que los estadísticos “z”, con su distribución Normal y “t”, con sudistribución t de Student, nos han servido para someter a prueba hipótesis que involucran a
promedios y porcentajes, el estadístico ji-cuadrado, que tiene distribución de probabilidad
del mismo nombre, nos servirá para someter a prueba hipótesis referidas a distribuciones defrecuencias.
En primer lugar usaremos el estadístico ji-cuadrado para probar la asociaciónentre dos variables, y luego lo usaremos para evaluar en qué medida se ajusta ladistribución de frecuencias obtenida con los datos de una muestra, a unadistribución teórica o esperada.
En términos generales, esta prueba contrasta frecuencias observadas con las frecuenciasesperadas de acuerdo con la hipótesis nula. Al igual que en el caso de las pruebas
anteriormente estudiadas, ilustraremos con ejemplos.
Ji- cuadrado como Prueba de Asociación
Supongamos que un investigador está interesado en evaluar la asociación entre uso decinturón de seguridad en vehículos particulares y el nivel socioeconómico del conductor del
vehículo. Con este objeto se toma una muestra de conductores a quienes se clasifica en una
tabla de asociación encontrando los siguientes resultados:
Uso deCinturón Nivel socioec.bajo Nivel socioec.medio Nivel socioec.alto TOTAL
SI 8 15 28 51
NO 13 16 14 43
TOTAL 21 31 42 94
¿Permiten estos datos afirmar que el uso del cinturón de seguridad depende del nivel
socioeconómico? Usaremos un nivel de significación alfa = 0,05.
29
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 30/46
Los pasos del análisis estadístico en este caso son los siguientes:
1. En primer lugar debemos plantear las hipótesis que someteremos a prueba:
H 0 : “El uso de cinturón de seguridad es independiente del nivel socioeconómico”.H 1: “El uso del cinturón de seguridad depende del nivel socioeconómico”.
En esta prueba estadística siempre la hipótesis nula plantea que las variables analizadas son
independientes.
2. En segundo lugar debemos obtener (calcular) las frecuencias esperadas.
Estas son las frecuencias que debieran darse si las variables fueran independientes, es decir,
si fuera cierta la hipótesis nula.
Las frecuencias esperadas se obtendrán de la distribución de frecuencias del total de loscasos, 51 personas de un total de 94 usan el cinturón y 43 de 94 no lo usan. Esa misma
proporción se debería dar al interior de los tres grupos de nivel socioeconómico, de manera
que el cálculo responde al siguiente razonamiento: si de 94 personas 51 usan cinturón, de21 personas, ¿cuantas debieran usarlo?
La respuesta a esta pregunta se obtiene aplicando la “regla de tres” y es 11,4. Este
procedimiento debe repetirse con todas las frecuencias del interior de la tabla.
El detalle de los cálculos es el siguiente:
Nivel bajo: (21x51/94)=11,4 - (21x43/94) = 9,6
Nivel medio: (31x51/94)=16,8 - (31x43/94) = 14,2
Nivel alto: (42x51/94)=22,8 - (42x43/94) = 19,2
Estas son las frecuencias que debieran presentarse si la hipótesis nula fuera verdadera y, por
consiguiente, las variables fueran independientes.
Estos valores los anotamos en una tabla con las mismas celdas que la anterior; así
tendremos una tabla con los valores observados y una tabla con los valores esperados, que
anotaremos en cursiva, para identificarlos bien.
Uso de cinturón Nivel bajo Nivel medio Nivel alto TOTAL
SI 11,4 16,8 22,8 51
NO 9,6 14,2 19,2 43
TOTAL 21 31 42 94
30
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 31/46
3. Ahora debemos calcular el estadístico de prueba.
En este caso, el estadístico de prueba es Ji-cuadrado que, como dijimos al comienzo,compara las frecuencias que entregan los datos de la muestra (frecuencias observadas) con
las frecuencias esperadas, y tiene la siguiente fórmula cálculo:
∑ −=i
ii
eeo
2
2 )( χ
donde io representa a cada frecuencia observada y ie representa a cada frecuencia
esperada.
De este modo el valor del estadístico de prueba para este problema será:
23,52,19
)2,1914(8,22
)8,2228(2,14
)2,1416(8,16
)8,1615(6,9
)6,913(4,11
)4,118(
)(
222222
2
2
=−+−+−+−+−+−
=−
=∑i
ii
e
eo χ
Entonces 23,52= χ .
Este es el valor de nuestro estadístico de prueba que ahora, siguiendo el procedimiento de problemas anteriores (paso 4), debemos comparar con un valor de la tabla de
probabilidades para ji-cuadrado ( 2 χ ), que está en el anexo Tablas estadísticas. Esta tabla
es muy parecida a la tabla t de student, pero tiene sólo valores positivos porque ji-cuadradosólo da resultados positivos (véase grafico que muestra la forma de la curva, con valores
desde 0 hasta infinito).
Uso de tabla ji-cuadrado
La tabla de ji-cuadrado tiene en la primera columna los grados de libertad y en la primerafila la probabilidad asociada a valores mayores a un determinado valor del estadístico
(véase gráfico de la tabla).
Los grados de libertad dependen del número de celdas que tiene la tabla de asociación
donde están los datos del problema y su fórmula de cálculo es muy sencilla:
Grados de libertad (gl) = (nº de filas – 1) x (nº de columnas – 1)
31
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 32/46
Así, en nuestro ejemplo, en que hay 2 filas y 3 columnas, los grados de libertad serán:
gl = (2 - 1) x (3 - 1) = 2
Nótese que no se consideran la fila ni la columna de los totales.
Al comienzo elegimos un nivel de significación alfa = 0,05. Entonces un valor de tabla para2
χ asociado a 2 grados de libertad y alfa 0,05 es 5,99.
32
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 33/46
Por lo tanto, como en el gráfico dibujado más abajo, vemos que 5,23 se encuentra a la
izquierda de 5,99, la probabilidad asociada a valores superiores a 5,23 es mayor que alfa(0,05).
Según esto, debemos aceptar la hipótesis nula que plantea que las variables “uso decinturón de seguridad” y “nivel socioeconómico” son independientes.
Limitaciones y correcciones
▪ Cuando resulta alguna frecuencia esperada inferior a 5, se recomienda aplicar la
corrección de “Yates”. Esta consiste en restar del valor absoluto de cada
diferencia, el valor 0,5. De tal modo que la fórmula de ji-cuadrado corregida sería:
∑
−−=
i
ii
e
eo2
2)5,0(
χ
▪ Si alguna de las frecuencias esperadas resulta inferior a 1, se recomienda reagrupar
categorías tratando de aumentar las frecuencias pequeñas..
Ji-cuadrado como Prueba de Bondad de Ajuste
También se puede usar el estadístico ji-cuadrado para evaluar cuan buena puede resultar
una distribución teórica, cuando pretende representar la distribución real de los datos de unamuestra determinada.
A esto se le llama evaluar la bondad de un ajuste. Probar la bondad de un ajuste es ver enqué medida se ajustan los datos observados a una distribución teórica o esperada.
Tomemos como ejemplo la distribución esperada para los individuos de una población queson clasificados según grupo sanguíneo.
33
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 34/46
Según estudios realizados en población, se espera que dicha distribución, en porcentajes,
sea la siguiente:
Grupo Frecuencia esperadaAB 2%
A 30,5%B 9,3%
0 58,2%
En una muestra de 150 dadores de sangre se encontró la siguiente distribución:
Grupo Frecuencia observada
AB 4
A 48
B 15
0 83
1. Las hipótesis del problema son:
H 0 : los datos se ajustan a la distribución teórica.H 1: los datos no se ajustan a la distribución teórica.
2. Siguiendo el esquema general de solución propuesto para las pruebas dehipótesis, ahora corresponde elegir un nivel de significación.
Elijamos entonces alfa = 0,01.
El estadístico de prueba será ji-cuadrado, cuya fórmula ya conocemos:
∑−
=i
ii
e
eo2
2 )( χ
Debemos calcular las frecuencias esperadas en nuestro grupo. Si aplicamos los porcentajes
esperados a la muestra de 150 casos podemos obtener las siguientes frecuencias esperadas
(ei):
Grupo Frec. oi Frec. ei
AB 4 3,00
A 48 45,75
B 15 13,95
0 83 87,30
Total 150 150,00
34
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 35/46
Los grados de libertad de esta tabla se obtienen restando 1 al número de filas, en este caso:
gl = 4 -1 = 3.
Recordemos que la fila del total no se considera para los grados de libertad.
Si ya tenemos las frecuencias observadas y esperadas, podemos proceder a evaluar la
diferencia entre ellas utilizando el estadístico ji-cuadrado.
Si la diferencia entre frecuencias observadas y esperadas es grande, significará que la
hipótesis nula es falsa, o sea, esta distribución no se ajusta a la distribución teórica y si, en
cambio, resulta que la diferencia entre frecuencias observadas y esperadas no es muygrande, significará que la hipótesis nula es verdadera; por lo tanto, la distribución en la
muestra se ajusta a la distribución teórica y diremos que no hay significación estadística.
El valor del estadístico de prueba ( 2 χ ) es una medida de la diferencia entre frecuencias
observadas y esperadas; por lo tanto, mientras mayor resulte2
χ , más fácil será rechazar lahipótesis nula.
3. Calculemos entonces nuestro estadístico de prueba con los datos de nuestroejemplo:
4,03,87
)3,8783(
95,13
)95,1315(
75,45
)75,4548(
4
)44()(22222
2 =−
+−
+−
+−
=−
=∑i
ii
e
eo χ
4,02 = χ
4. Ahora debemos comparar este valor con el valor de ji-cuadrado de la tabla quebuscaremos con alfa=0,01 y 3 grados de libertad.
Según tabla ese valor es 11,34.
5. Al comparar el valor del estadístico de prueba (0,4) con el valor de tabla (11,34),vemos que 0,4 se encuentra a la izquierda de 11,34 desplazado hacia el centro dela curva y que, por lo tanto, la probabilidad de valores mayores a él es muysuperior al nivel de significación alfa = 0,01.
6. Conclusión
Dado que la probabilidad de 4,02≥ χ es mayor que alfa, se acepta la hipótesis nula. Esto
significa que los datos observados se ajustan a la distribución teórica, por lo tanto las
diferencias observadas no son estadísticamente significativas.
7. Gráfico
35
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 36/46
Ejercicio, Capítulo III, Módulo 3
Problema 1
Intentando determinar si el sexo influye en el número de licencias por enfermedad, en un
consultorio de atención primaria se tomó una muestra de pacientes en control y se les
clasificó según sexo y número de licencias por enfermedad obtenidas durante el año.
Los datos se clasificaron en una tabla de 4 filas y 2 columnas. Se obtuvo un valor de ji-
cuadrado de 8,31.
Con estos datos complete el siguiente cuadro y dibuje el gráfico correspondiente.
1.- Hipótesis
2.- Nivel de significación Alfa = 0,05
3.- Estadístico de prueba
4.- Probabilidad
5.- Comparación de la probabilidad encontrada con el
nivel de significación y decisión.
6.- Conclusión
Problema 2
El gerente de una planta industrial pretende determinar si el número de empleados que
asisten al consultorio médico de la planta se encuentra distribuido en forma equitativa,
36
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 37/46
durante los 5 días de trabajo de la semana. Durante un período de trabajo de un mes se
registró el siguiente número de consultas por día:
Lunes Martes Miércoles Jueves Viernes49 35 32 39 45
Usando 05,0=α , ¿existe alguna razón para creer que el número de empleados que asisten
al consultorio médico, no se encuentra distribuido en forma equitativa durante los días de
trabajo de la semana?
Con estos datos complete el siguiente cuadro y dibuje el gráfico correspondiente.
1.- Hipótesis
2.- Nivel de significación Alfa = 0,05
3.- Estadístico de prueba
4.- Probabilidad
5.- Comparación de la probabilidad encontrada con el
nivel de significación y decisión.
6.- Conclusión
Para Tener Presente
La prueba Ji cuadrado se usa para someter a prueba hipótesis referidas adistribuciones de frecuencias.
Esta prueba contrasta frecuencias observadas con frecuencias esperadas.
Sus usos son dos:- Prueba de asociación, en que se prueba la dependencia o independencia entredos variables.- Prueba de bondad de un ajuste, en que se prueba si una determinadadistribución de frecuencias se “ajusta” a un modelo teórico.
37
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 38/46
El valor de Ji cuadrado está determinado por los grados de libertad, que secalculan de la siguiente manera:- Prueba de asociación (filas – 1) x (columnas – 1)- Prueba de bondad de un ajuste: filas – 1
Capítulo IV
Generalidad de Análisis de Varianza (ANOVA) y Regresión
Introducción
Cuando trabajamos con variables cuantitativas continuas, por su misma naturaleza, las
posibilidades de análisis estadístico se extienden hasta el infinito. Así de inmensa es
también la riqueza de conclusiones que podremos extraer. Esto se ha desarrollado demanera explosiva gracias a los programas estadísticos a los que en la actualidad tenemos
acceso. Sin embargo, siempre se necesitará la interpretación de esos resultados que a veces
con un simple click tenemos en nuestras manos.
Ejemplos de lo anterior son el análisis de varianza, conocido como ANOVA y la regresión
lineal simple y múltiple, entre otros métodos, algunos muy complejos.
Análisis de Varianza
La técnica del análisis de varianza se aplica con distintos objetivos. Es frecuente su uso en
el análisis de resultados de estudios que utilizan diseños de asignación aleatorizada, en que
se comparan simultáneamente varias combinaciones experimentales. En este capítulo nos
38
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 39/46
limitaremos a hacer uso del análisis de varianza para la comparación de promedios de más
de dos muestras.
A diferencia de los capítulos anteriores, no entregaremos el detalle de los cálculos
necesarios para hacer el análisis, sino que, siguiendo el enfoque general de los problemas
de pruebas de hipótesis:▪ señalaremos la oportunidad de su aplicación,
▪ identificaremos los elementos que participan en el análisis,
▪ veremos la forma adecuada de plantear las hipótesis,
▪ identificaremos la distribución de probabilidad del estadístico de prueba,
▪ revisaremos los criterios de decisión,
▪ y orientaremos al estudiante en la elaboración de las conclusiones.
En todo este proceso supondremos que el valor del estadístico de prueba se obtiene con
cualquier programa estadístico de computación.
El método de análisis de varianza es apropiado para someter a prueba la hipótesisde que los promedios de tres o más muestras son iguales.
Para empezar debemos señalar que se trabaja con los valores individuales, que tienen
variabilidad dentro de cada grupo en estudio y también existe variabilidad entre los grupos.
La varianza total, entonces, se descompone en: varianza entre grupos y varianza dentro delos grupos.
El estadístico de prueba (f) es el cuociente entre estas dos varianzas. Si elresultado es igual a 1 significa que ambas varianzas son iguales y por lo tanto lavariación entre los grupos es equivalente a la variación dentro de los grupos. Si elestadístico “f” resulta ser suficientemente mayor que 1, diremos que la varianzaentre los grupos es mayor que la varianza dentro de los grupos y que, por lo tanto,los grupos difieren entre sí.
Las hipótesis serán:
3210 : µ µ µ == H …, los promedios son iguales
:1 H al menos 2 promedios son diferentes
El estadístico de prueba es2
1
V
V F = cuyos valores de probabilidad asociados se
encuentran en la tabla de Fisher que ocupa las páginas 5, 6 y 7 de las tablas estadísticas
(Véase Anexo 1: Tablas estadísticas).
39
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 40/46
En la fórmula de F, V1 representa la varianza entre los grupos y V2 representa la varianza
dentro de los grupos.
Para buscar los valores de F en la tabla se necesitan los grados de libertad; ahora veremos,
con un ejemplo, cómo se obtienen.
Consideremos el siguiente caso:
En un estudio para medir los niveles de actividad de la fosfatasaalcalina del suero en niños con problemas de crecimiento, se tomaron45 niños que fueron clasificados en 4 grupos, según el medicamentoque estaban recibiendo.
Se entregan, en una tabla, los resultados de los niveles de actividad de la fosfatasa alcalina
para los 45 niños, separados en cuatro grupos de acuerdo al medicamento. Se calcula el
estadístico de prueba resultando: F = 3,57.
¿Se puede afirmar que la actividad media de la fosfatasa alcalina es la mismapara los cuatro grupos?
Solución:
43210 : µ µ µ µ === H
H1: al menos 2 promedios son diferentes.
Elegimos alfa = 0,05.
Cálculo de grados de libertad:
Para F en la tabla de Ficher, necesitamos calcular 2 tipos de grados de libertad quellamaremos n1 y n2, tal como aparecen en la tabla, definidos como sigue:
n1 = número de grupos – 1
n2 = número de sujetos – número de
grupos
Del problema se desprende que son 45 sujetos y 4 grupos, por lo tanto los grados de
libertad serán:
n1 = 4-1 = 3
yn2 = 45-4 = 41
Ahora podemos buscar en la tabla de Fisher el valor correspondiente a n1 = 3 grados delibertad en la primera fila, y n2 = 41 grados de libertad en la primera columna. Como no
40
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 41/46
existe n2 = 41, tomamos 40, ubicado en la página 7. Podemos ver que donde se cruza la
columna de n1 = 3 con la fila de n2 = 40. Encontramos dos valores: 2,84 para alfa de 0,05 y
4,31 (en negrita) para alfa de 0,01.
Ya que el alfa elegido por nosotros es 0,05, usamos 2,84 para compararlo con el valor
calculado de F = 3,57 entregado como dato del problema.
Como 3,57 se encuentra a la derecha del valor de tabla f = 2,84, la probabilidad deencontrar un valor mayor que él es inferior al nivel de significación. Esto nos permite
rechazar la hipótesis nula (ver gráfico).
Podemos concluir, entonces, que el promedio de actividad de la fosfatasa alcalina no es el
mismo para todos los grupos.
LINK EPI
Seguramente en la práctica usted dispondrá de los resultados de su estudio en una planilla o
base de datos y pedirá al computador que haga un análisis de varianza (ANOVA) a susdatos. El computador obedientemente le entregará, como resultado, el valor del estadístico
de prueba (f) con una probabilidad asociada (p). Usted comparará ese valor de “p” con alfa:si p es menor que alfa, usted rechazará la hipótesis nula y concluirá que los promedios delas muestras no son iguales. Es muy probable que, aunque usted no haya realizado los
cálculos, si logra interpretar adecuadamente los resultados entregados por el computador,
sienta un mayor nivel de autonomía en el vuelo estadístico.
41
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 42/46
Regresión Lineal
A menudo, es necesario resolver en la práctica problemas que involucran a conjuntos de
variables que están relacionadas entre sí. En estas situaciones es posible identificar una
variable dependiente o respuesta y un conjunto de variables independientes o de regresión.
La variable respuesta depende de las variables de regresión.
Se concibe la regresión como el proceso de ajuste de un modelo o ecuaciónmatemática a la relación de un conjunto de variables.
En este capítulo haremos una revisión conceptual del modelo de regresión lineal simple,
con sólo una variable de regresión.
Supongamos, como ejemplo, que se quiere obtener un modelo de regresión lineal para la
relación entre las variables cantidad de lluvia caída y partículas de contaminación en el aire.
Se dispone de un listado con los datos correspondientes a 9 días de observación.
El modelo que se busca está representado por la ecuación de la recta
bxa y +=
Donde y
representa la estimación del valor de la variable dependiente (partículas decontaminación) para un valor cualquiera de la variable independiente x (lluvia).
▪ “a” representa el valor que tomará y
cuando x sea cero, es decir, la cantidad de partículas de contaminación que se estiman cuando no caiga lluvia.
▪ “b” es el incremento que experimentará la variable partículas de contaminación por cada unidad de lluvia caída, corresponde a la pendiente de la recta.
▪ “x” representa, en el modelo, la cantidad de lluvia caída.
En el siguiente cuadro se muestran los datos del problema y los calculos preliminares paraobtener los valores de “a” y “b” en el modelo de regresión que se ajuste mejor a los datos
del problema.
En las últimas filas del cuadro siguiente están los valores calculados de “a” y “b”.
42
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 43/46
x=lluviay=contaminación X2 Y2 xy
4,3 126 18,49 15876 541,8
4,5 121 20,25 14641 544,5
5,9 116 34,81 13456 684,4
5,6 118 31,36 13924 660,8
6,1 114 37,21 12996 695,4
5,2 118 27,04 13924 613,6
3,8 132 14,44 17424 501,6
2,1 141 4,41 19881 296,1
7,5 108 56,25 11664 810
45 1094 244,26 133786 5348,2
b =-6,3
a=153
En el gráfico se ha dibujado la nube de puntos que muestra los datos del problema y la rectarepresenta al modelo de regresión, que es la recta que mejor se ajusta a la relación entre las
variables.
A continuación procederemos a la interpretación de los valores calculados y al finalentregaremos las fórmulas utilizadas para su cálculo.
El modelo de regresión que mejor describe la relación entre las variables estudiadas es:
x y 3,6153 −=
Este modelo indica que cuando no llueve hay 153 partículas de contaminación y por cadaunidad de lluvia caída la contaminación disminuye en 6,3 partículas.
Usando el modelo obtenido es posible estimar el número de partículas de contaminaciónque debiera haber en un día con 8,5 unidades de lluvia.
43
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 44/46
5,83,6153 ×−= y
45,99= y
Por lo tanto se estima que en un día con 8,5 unidades de lluvia habrá 99,45 partículas de
contaminación.
Suponemos que los engorrosos cálculos que implica la obtención de resultados en estas
materias serán encargados a las computadoras pero de todos modos, por si alguien quisiera
revisar los cálculos de este ejemplo, entregaremos las fórmulas para obtener a y b en elmodelo de regresión.
[ ]∑ ∑∑ ∑ ∑
−
−=
22 x xn
y x xynb
xb ya −=
De la última fila de la tabla de cálculos se pueden extraer los siguientes elementos
45=∑ x ∑ =1094 y ∑ = 2,5348 xy 26,2442
=∑ x
La regresión es un tema muy amplio y lo que aquí hemos revisado es sóloun barniz de iniciación.
Se pueden construir intervalos de confianza para los valores de a y b, también se pueden
enunciar hipótesis respecto de ellos en la población.
Las estimaciones realizadas para valores de contaminación en determinados niveles de
lluvia podrían llevar asociados niveles de confianza.
Lo dejaremos hasta aquí, pero son temas que en el futuro podrían ser revisados con mayor
detención.
44
5/6/2018 Test de Hipotesis - slidepdf.com
http://slidepdf.com/reader/full/test-de-hipotesis 45/46
Finalización del Módulo 3
Resumen
En este módulo se entregaron los elementos para realizar las pruebas de hipótesismás corrientemente usadas.
En primer lugar se presentó una definición de hipótesis, señalando que estánreferidas a parámetros o valores en el universo.
Se presentó un esquema de trabajo común para todas las pruebas y que esel siguiente:
1. Plantear las hipótesis en términos estadísticos: Hipótesis Nula e HipótesisAlternativa.2. Elegir un nivel de significación o alfa (α ): Se utilizan valores iguales o inferioresa 0,05.3. Calcular el estadístico de prueba con los datos muestrales.4. Buscar, en la tabla correspondiente, la probabilidad asociada a ese valor delestadístico.5. Comparar la probabilidad obtenida en la tabla con el nivel de significación
elegido en el punto 2 y tomar una decisión respecto de las hipótesis.6. Elaborar una conclusión derivada de la decisión.Apoyar el proceso de análisis con un gráfico del problema.
Luego, ilustrando con un ejemplo y un ejercicio para cada caso, sedesarrollaron las pruebas de hipótesis para cada una de las siguientessituaciones:
1. Prueba de hipótesis para comparar una muestra con el universo.a) Comparación promedio de muestra versus promedio del universo,
conociendo la desviación estándar del universo.
b) Comparación de promedio de muestral con el promedio del universo SINconocer la desviación estándar del universo.
c) Comparación de porcentaje muestral con porcentaje del universo.2. Prueba de hipótesis para comparar dos muestras
a) Comparación de los promedios de dos muestras independientes (convarianzas desconocidas e iguales).
b) Comparación de dos muestras con observaciones pareadas.c) Comparación de los porcentajes de dos muestras.
3. Prueba de Ji cuadrado
45
Top Related