Post on 02-Mar-2016
description
EJERCICIOS DE SPSS PASO A PASO.
ELABORADO POR: DR. ELEAZAR PUENTE R.
I. RELACIN DE UNA VARIABLE CUALITATIVA CON UNA CUANTITATIVA.
VARIABLE INDEPENDIENTE: GNERO (CUALITATIVA)
VARIABLE DEPENDIENTE: TV (CUANTITATIVA)
OBJETIVO: Probar estadsticamente si el tiempo dedicado a ver la TV depende del sexo de
la persona.
HIPTESIS NULA: El sexo de la persona no influye en el tiempo dedicado a ver TV, o El
tiempo dedicado a ver TV es independiente del sexo de la persona.
PROCEDIMIENTO.
1. Seleccionar el procedimiento de prueba t para diferencia entre medias de dos
muestras independientes.
2. Seleccionar las variables, variable dependiente es tv la variable independiente es la
variable de agrupacin genero en este caso.
3. Identificar los grupos.
NOTA: EN ESTE PROCEDIMIENTO LA MUESTRA SE PUEDE DIVIDIR SOLAMENTE EN 2
GRUPOS, YA SEA CON 2 CLAVES ESPECFICAS, O LOS QUE QUEDEN ARRIBA Y DEBAJO
DE UN CIERTO LMITE.
En este caso los valores que toma la variable son solamente 1 o 2, por eso los grupos
se definen de acuerdo a esos valores.
La opcin de Punto de corte se selecciona cuando los grupos se definen dividiendo
la muestra a partir de un valor (punto de corte) y se separa entre los que son menores
o iguales que ese valor y los que son mayores, de manera que este procedimiento
siempre separa solamente en 2 grupos.
Si se tienen ms de 2 grupos se utilizar otro procedimiento (ANOVA).
4. Realizar el procedimiento. (Aceptar)
5. RESULTADOS.
INTERPRETACIN
Hay 342 respuestas de hombres y 367 de mujeres. El promedio de horas de TV de los
hombres es de 11.24 y de las mujeres 10.87. En primera instancia parece ser que los
hombres ven ms TV que las mujeres, as lo indican los resultados de la muestra. En
los resultados de la siguiente tabla veremos si la diferencia es estadsticamente
significativa.
En esta tabla se muestran dos renglones diferentes, uno suponiendo que los grupos tienen
varianzas iguales en esa variable (TV) y el otro suponiendo varianzas diferentes.
En este caso podemos suponer que las varianzas son iguales, porque la prueba de igualdad de
varianzas no rechaza la hiptesis nula (varianzas iguales), el valor de significancia es 0.835 (NO es
menor que el 0.05 necesario para rechazar la hiptesis nula).
Por lo tanto observaremos el primer rengln. Ah se puede leer el valor de la significancia
estadstica de la diferencia, es donde dice Sig. (bilateral) que ese en este caso 0.481, este valor
NO es menor que 0.05, por lo tanto se deduce que la diferencia entre las medias de las horas de
TV no es significativa. A pesar de que las medias son 11.24 y 10.87 la diferencia no es
estadsticamente significativa. Tambin se muestra un intervalo de confianza para la diferencia
entre las medias. En este ejemplo el intervalo para la diferencia va de -0.662 a 1.403, esto quiere
decir que con un 95% de confianza podramos decir que la diferencia se encuentra en ese rango.
Podemos observar que el intervalo de confianza incluye al cero, o sea, no se puede descartar que
la diferencia puede ser cero, esto confirma la conclusin de que no hay diferencia significativa
entre las medias.
Estadsticos de grupo
genero N Media Desviacin tp. Error tp. de la
media
tv Hombre 342 11.24 7.118 .385
Mujer 367 10.87 6.886 .359
II. RELACIN DE UNA VARIABLE CUALITATIVA CON UNA CUANTITATIVA.
VARIABLE INDEPENDIENTE: RELIGIN (CUALITATIVA)
VARIABLE DEPENDIENTE: HIJOS2 (CUANTITATIVA)
OBJETIVO: Probar estadsticamente si el nmero de hijos que una persona deseara tener
depende de sus creencias religiosas.
HIPTESIS NULA: Las creencias religiosas de las personas no influyen en el nmero de
hijos que desearan tener, o El nmero de hijos que desea tener una persona es
independiente de sus creencias religiosas.
Se utilizar el procedimiento ANOVA porque en este caso la variable religin tienen ms
de 2 valores por lo tanto se forman ms de 2 grupos.
El procedimiento ANOVA solamente es vlido cuando las varianzas son estadsticamente
iguales. Si las varianzas no son homogneas se tendra que dividir la muestra en solo 2
grupos (por ejemplo catlicos y no-catlicos) y hacer la prueba t para diferencia de
medias de 2 muestras independientes.
PROCEDIMIENTO.
1. Seleccionar el procedimiento ANOVA de un factor (ANOVA = Analysis Of Variance =
Anlisis de Varianza). Este procedimiento es til para probar diferencias entre medias
cuando la poblacin (y por lo tanto la muestra) se divide en ms de 2 grupos.
2. Seleccionar las variables. La variable dependiente es hijos2 que tiene la descripcin
Le gustara tener (hijos). La variable independiente es religin.
3. En Opciones seleccionar estadsticos Descriptivos y Prueba de homogeneidad de
las varianzas. Continuar.
4. Ejecutar el procedimiento. Aceptar.
5. Resultados.
INTERPRETACIN.
En esta tabla se observa que la media en el nmero de hijos que les gustara tener va desde 2.19
para quienes son indiferentes a la religin, 2.20 para los no creyentes hasta 2.56 para los catlicos.
Tambin se muestra la desviacin estndar tpica de cada grupo, y los intervalos de 95% de
confianza para la media del nmero deseado de hijos para cada grupo. Tambin en los intervalos
de confianza observamos que el grupo que le gustara tener mayor nmero de hijos son los
catlicos, y los que desean menos hijos son los no creyentes o indiferentes.
En las tablas posteriores tendremos elementos para probar estadsticamente si esas diferencias
observadas en las muestras son estadsticamente significativas y se pueden extrapolar a la
poblacin.
En la tabla de arriba se est probando si las varianzas de los diferentes grupos son iguales.
Concluimos que S son iguales, porque la hiptesis nula es que las varianzas son iguales, y con la
significancia de 0.096 no se alcanza a rechazar la hiptesis nula. Para rechazar la hiptesis de
varianzas iguales, la significancia tendra que ser menor que 0.05.
Con esta conclusin de varianzas iguales llegamos a la conclusin de que s es vlido interpretar los
resultados de ANOVA (analysis of variance).
De la tabla de ANOVA se concluye que las diferencias en las medias del nmero de hijos deseados
S son estadsticamente significativas. Esto lo sabemos porque el valor de la significancia es 0.025,
valor que es menor que 0.05.
La hiptesis nula es que no existe diferencia en las medias, como 0.025 < 0.05 se rechaza la
hiptesis nula y concluimos que el nmero de hijos que desea tener S depende de las creencias
religiosas de la persona.
NOTA. Este procedimiento tambin se puede hacer como:
pero no sale la prueba de igualdad de varianzas.
III. INTERVALO DE CONFIANZA PARA UNA MEDIA.
VARIABLE: Ingreso 3 (Aportaciones familiares).
Para hacer esta prueba es necesario que la variable sea cuantitativa y mtrica.
OBJETIVO. Estimar un intervalo de confianza del 95% para la media poblacional de una variable a
partir de los datos de una muestra.
PROCEDIMIENTO.
1. Seleccionar el procedimiento (prueba t para una muestra).
2. Seleccionar las variables:
3. Ejecutar el procedimiento (Aceptar).
4. Analizar resultados.
INTERPRETACIN.
Las tablas muestran que se analizaron 652 casos vlidos, obteniendo una media de aportaciones
de 19.02 en la muestra. Con un 95% de confianza podramos afirmar que la media poblacional se
encuentra entre 17.11 y 20.93.
NOTA. El procedimiento utilizado se aplica tambin para hacer la prueba de hiptesis de que la
media tenga un cierto valor, en este ejercicio como solamente nos interesa el intervalo de
confianza para la media poblacional dejamos el valor hipottico como cero.
IV. RELACIN DE UNA VARIABLE CUALITATIVA CON OTRA CUALITATIVA.
VARIABLE INDEPENDIENTE: GNERO (CUALITATIVA)
VARIABLE DEPENDIENTE: AMOR (CUALITATIVA)
OBJETIVO: Probar estadsticamente si la situacin afectiva actual depende del sexo de la
persona.
HIPTESIS NULA: El sexo de la persona no influye en su situacin afectiva actual, o La
situacin afectiva es independiente del sexo de la persona.
PROCEDIMIENTO. Para probar la relacin entre 2 variables cualitativas se utilizar el
mecanismo de tablas cruzadas o tablas de contingencia, con la prueba estadstica Chi-
cuadrada.
1. Seleccionar el procedimiento (tablas de contingencia).
(NOTA: En SPSS hay distintos caminos para llegar a una prueba Chi-cuadrada, este es uno
de ellos solamente)
2. Seleccionar las variables. Variable independiente genero, variable dependiente
amor.
3. En Estadsticos seleccionar Chi-cuadrada (continuar):
4. En Casillas seleccionar Esperado y Observado. Esto nos mostrar en cada celda
de la tabla las frecuencias esperadas y las observadas en la muestra. Las frecuencias
esperadas son las que cabra esperar si la hiptesis nula es vlida, es decir si no hay
dependencia entre las variables. Continuar.
5. Ejecutar el procedimiento con Aceptar. Ver los resultados.
Hay 649 casos en los que se tiene informacin vlida en ambas variables gnero y amor.
En la tabla se muestran las frecuencias esperadas (asumiendo que una variable NO influye en la
otra) y las frecuencias observadas. Por ejemplo hay en la muestra 126 hombres que tienen novia
formal, y se esperaran 141 si las variables fueran independientes. Tambin hay 37 mujeres en la
muestra que nunca han tenido una relacin afectiva especial, y se esperaban 35 en el caso de
independencia.
Observamos diferencias entre las frecuencias esperadas y las observadas, con la informacin de la
siguiente tabla podremos ver si estas diferencias son estadsticamente significativas.
En esta tabla nos interesa el valor de significancia de la Chi-cuadrada de Pearson. El valor de la
significancia es de 0.072, este valor NO es menor que 0.05 por lo que concluimos que NO podemos
rechazar la hiptesis nula (independencia de las variables), de esta manera nuestra conclusin es
que las variables genero y amor son independientes, lo que significa que el sexo de la persona
no est influyendo en lo que declaran con respecto a su situacin afectiva. Hombres y mujeres se
estn comportando igual en ese aspecto.
NOTA: Aunque el valor de 0.072 es muy cercano al valor de 0.05, la muestra es bastante grande y
es suficiente evidencia para NO rechazar la hiptesis de independencia.
V. RELACIN DE UNA VARIABLE CUALITATIVA CON OTRA CUALITATIVA. OTRO EJEMPLO.
VARIABLE INDEPENDIENTE: GNERO (CUALITATIVA)
VARIABLE DEPENDIENTE: OCIO (CUALITATIVA)
OBJETIVO: Probar estadsticamente si las actividades recreativas que llevan a cabo las
personas dependen del sexo de la persona.
HIPTESIS NULA: El sexo de la persona no influye en el tipo de actividades que realiza en
su tiempo de ocio, o El tipo de actividades recreativas que realiza es independiente del
sexo de la persona.
PROCEDIMIENTO. Para probar la relacin entre 2 variables cualitativas se utilizar el
mecanismo de tablas cruzadas o tablas de contingencia, con la prueba estadstica Chi-
cuadrada.
RESULTADOS.
CONCLUSIN. El valor de significancia estadstica que se muestra para el estadstico Chi-cuadrada
de Pearson es 0.000 y aunque no se muestran ms decimales es claro que el valor es mucho
menor que 0.05, por lo tanto sin duda rechazamos la hiptesis de independencia de las variables y
llegamos a la conclusin de que el sexo de la persona S influye en el tipo de actividades que
realiza en su tiempo de ocio, o sea, hombres y mujeres difieren en el tipo de actividades
recreativas que llevan a cabo.
VI. RELACIN DE UNA VARIABLE CUANTITATIVA CON OTRA CUANTITATIVA.
VARIABLE INDEPENDIENTE: SUMAINGR SUMA DE INGRESOS (CUANTITATIVA)
VARIABLE DEPENDIENTE: TV HORAS DE TV (CUANTITATIVA)
OBJETIVO: Probar estadsticamente si el nivel de ingreso familiar (suma de todos los
ingresos) influye significativamente en el nmero de horas dedicadas a la TV.
HIPTESIS NULA: El ingreso familiar no influye en el nmero de horas que se dedican a
ver TV, o El tiempo dedicado a ver TV es independiente del nivel de ingresos familiares.
PROCEDIMIENTO. Para probar la relacin entre 2 variables cuantitativas se utilizar el
procedimiento de correlacin lineal.
1. Seleccionar el procedimiento (correlaciones bivariadas).
2. Seleccionar las variables.
3. En Opciones seleccionar Medias y Desviaciones Tpicas (continuar).
4. Correr el procedimiento y ver los resultados.
5. CONCLUSIONES.
El coeficiente de correlacin es muy bajo -0.09. Recordemos que los valores cercanos
al 1 indican una muy fuerte correlacin positiva entre las variables, un valor cercano
al -1 indica una correlacin negativa muy fuerte, y los valores cercanos al cero, como
en este caso, indican una ausencia de correlacin entre las variables.
Para ver si estadsticamente la correlacin es significativa o no, analizamos el valor de
Significancia, en este caso el valor es 0.023, que es menor que 0.05 por lo que
concluimos que S se puede rechazar la hiptesis nula, y tenemos que decir que el
nivel de ingreso familiar S influye de manera significativa en el tiempo que le dedican
a ver la TV. A pesar de que el valor aparente de la correlacin es bajo, vemos que
estadsticamente es significativo. El signo negativo del coeficiente de correlacin nos
indica que hay una relacin negativa entre las variables, mientras ms elevado es el
nivel de ingresos, menos tiempo se le dedica a ver la TV.
VII. RELACIN DE UNA VARIABLE CUANTITATIVA CON OTRA CUANTITATIVA. OTRO
EJEMPLO.
VARIABLE INDEPENDIENTE: HORAS HORAS DE OCIO (CUANTITATIVA)
VARIABLE DEPENDIENTE: TV HORAS DE TV (CUANTITATIVA)
OBJETIVO: Probar estadsticamente si el nmero de horas libres de que dispone una
persona influye significativamente en el nmero de horas dedicadas a la TV.
HIPTESIS NULA: El nmero de horas de ocio de una persona no influye en el nmero de
horas que se dedican a ver TV, o El tiempo dedicado a ver TV es independiente del
nmero de horas libres que tenga la persona.
PROCEDIMIENTO. Para probar la relacin entre 2 variables cuantitativas se utilizar el
procedimiento de correlacin lineal. Analizar Correlaciones Bivariadas.
RESULTADOS.
El promedio de horas de TV es de 11.05 y el promedio de horas de tiempo libre es de
21.05, esto significa que en promedio la mitad del tiempo libre se dedica a ver TV.
En la tabla se observa que existe una correlacin moderada 0.228 entre las variables. El
valor de Sig. (bilateral) nos indica que la correlacin es estadsticamente significativa y
rechazamos la hiptesis nula. El valor de la significancia es 0.000 y aunque no muestra
ms decimales es claramente menor que 0.05, de manera que tenemos que rechazar la
hiptesis nula, y concluir que el nmero de horas libres que tiene una persona S influye
de manera significativa en el nmero de horas que dedica a ver TV.
VIII. RELACIN DE UNA VARIABLE CUALITATIVA CON UNA CUANTITATIVA. CON PUNTO DE
CORTE PARA AGRUPAR.
VARIABLE INDEPENDIENTE: ESCALA POSICIN POLTICA IZQ DER (CUALITATIVA)
VARIABLE DEPENDIENTE: INGRESOS1 INGRESO PERSONAL (CUANTITATIVA)
OBJETIVO: Probar estadsticamente si el nivel de ingresos de una persona depende de su
auto-clasificacin como de izquierda o de derecha en el mbito poltico.
HIPTESIS NULA: La posicin poltica de izquierda o derecha no contribuye a predecir el
nivel de ingreso de la persona, o El ingreso personal de un individuo es independiente
de su posicin poltica de izquierda o de derecha.
PROCEDIMIENTO.
1. Seleccionar el procedimiento de prueba t para diferencia entre medias de dos muestras
independientes. En este caso como se va a utilizar la prueba t (no ANOVA) la muestra
debe separarse en solamente 2 grupos. Vamos a utilizar la prueba t con los grupos
definidos con respecto a un punto de corte de los valores de la variable de agrupacin.
2. Seleccionar las variables (ingresos personales, escala posicin poltica).
3. En la variable escala hay que definir los grupos. Como los valores de escala (posicin
poltica) pueden ir desde 1 (extrema izquierda) hasta 10 (extrema derecha), vamos a
poner el punto de corte en 6, as los que hayan contestado 6 o ms se irn a un grupo que
consideraremos de derecha, los de 5 o menos se irn al otro que consideraremos de
izquierda. Esto se hace en el botn Definir Grupos. Continuar.
4. Correr el procedimiento. Aceptar. Ver resultados.
Se observa que hay muchas ms personas (411) que se auto clasifican como de izquierda que
como de derecha (156). Contrario a lo que nos indicara el sentido comn, las personas con
tendencia de derecha tienen en promedio menores ingresos personales (25.63) que quienes se
clasifican como de izquierda (31.02).
La prueba de igualdad de varianzas pasa marginalmente, ya que el valor de Significancia 0.053 est
apenas por encima del valor de 0.05, se pueden asumir varianzas iguales. La significancia de la
diferencia entre las medias es 0.282, que NO es menor que 0.05, por lo que no se puede rechazar
la hiptesis nula. Por lo tanto se concluye que la diferencia entre las medias no es significativa.
Aunque en la muestra existe una diferencia notable en el ingreso promedio, en favor de las
personas de izquierda, la diferencia no alcanza a ser significativa, y no podemos generalizar el
resultado de la muestra. Por eso concluimos que el ingreso promedio es estadsticamente igual
para los de derecha que para los de izquierda en la poblacin.