8/18/2019 Comprobacio 769 n de Supuestos SPSS
1/24
Comprobación de supuestos para estadísticamultivariada en SPSS
Felipe Ruiz
Carolina García Ayudantía Estadística IV 2015.
Aspectos previos:
Trabajaremos con el archivo “Ejemplo Supuestos (SPSS)” en formato S!"#
disponible para descar$ar desde %&Cursos Es una base de datos 'ue contiene
seis variables especialmente preparada para la sesión de audantía
Normalidad Univariante:
Para comprobar normalidad univariante podemos observar# en primer lu$ar# el
histo$rama de nuestras variables para ver de forma $r*ca como se comporta
la variable Para eso vamos a ir a “ Analizar ”# “Estadísticos Descriptios”#
!Frecuencias” e in$resar los tres índices 'ue utli+aremos para el anlisis
"amos a ,r*cos le pedimos "isto#ra$as $ostrar cura nor$al en el
%isto#ra$a
8/18/2019 Comprobacio 769 n de Supuestos SPSS
2/24
8/18/2019 Comprobacio 769 n de Supuestos SPSS
3/24
Tenemos una primera evidencia de la no normalidad de nuestras variables
!dems# e/isten dos tests estadístico para corroborar normalidad univariada
cuo uso es limitado se$0n el tama1o muestral.
• Shapiro&2il3s. para tama1os muestrales 'ue van entre 4 54 casos
8/18/2019 Comprobacio 769 n de Supuestos SPSS
4/24
• 6olmo$orov&Smirnov. para tama1os muestrales 'ue oscilan entre 54
7444 casos
Estos test nos dicen 'ue si el la si$ni*cación estadística (el valor p) es mayor
o igual a 0,05 (si estamos trabajando con tal límite)# la distribución muestral
de la curva teórica la distribución muestral de los datos observados seasemejan con una si$ni*cación estadística 'ue se encuentra dentro de los
mr$enes de error aceptables (er$o# la distribución de datos observada# puede
ser considerada como normal se$0n un mar$en de con*an+a)
Como tenemos 844 casos empleamos el test 6&S.
En el si$uiente cuadro de dilo$o in$resamos todas nuestras variables en
anlisis en el cuadro &ista Contrastar aria'les9 en Distri'uci(n de contraste
nos ase$uramos de 'ue est: marcada la opción )or$al.
En los resultados nos interesa el $r*co titulado *rue'a de +ol$oro,-$irno
para una $uestra9 nos muestra el valor del estadístico su si$ni*cación#
mediante la cual podemos determinar si la variable se distribue o no de
8/18/2019 Comprobacio 769 n de Supuestos SPSS
5/24
acuerdo a una distribución normal En este caso# la si$ni*cación estadísitica del
test# para cada variable# es menor a 4#45# por lo 'ue podemos asumir 'ue
nin$una se distribue normalmente
Prueba de Kolmogorov-Smirnov para una muestra
SAT CLAB CONFLIC
N 200 200 200
Parámetros normalesa,bMedia 3,121 2,221 2,!"0
#es$ia%i&n t'(i%a ,)1"* 1,00*+* 1,03213
#ieren%ias más e-tremas
Absol.ta ,203 ,1!0 ,1!1
Positi$a ,11) ,1!0 ,1!1
Ne/ati$a ,203 ,0)0 ,0)0
de olmo/oro$Smirno$ 2,")) 1,)) 2,001
Si/ asint&t 4bilateral5 ,000 ,001 ,001
!un'ue no es el caso# debido a nuestro tama1o muestral# e/plicaremos como
obtener el estadístico de Shapiro&2il3s# 'ue utili+aremos con muestras
pe'ue1as (54 o menos casos) cómo obtener los valores de si$etría curtosis
'ue nos servirn para el caso de muestras $randes (ms de 7444 casos) Estaopción nos entre$a tanto los valores de simetría curtosis# los valores de la
prueba 6olmo$orov&Smirnov como los valores de Shapiro&2il3s
En este caso# in$resaremos sólo una de nuestras variables de inter:s
8/18/2019 Comprobacio 769 n de Supuestos SPSS
6/24
En la opción Estadísticos# marcamos la opción Descriptios podemos tambi:n
establecer el intervalo de con*an+a deseado.
En la opción Gr/cos marcamos la opción Gr/cos con prue'as de nor$alidad
ojo 'ue a'uí no estamos solicitando los histo$ramas con la curva normal# sino
los test 6&S ; S&2 # des seleccionamos lo 'ue est: marcado en Descriptios dejamos el resto por defecto.
En los resultados nos interesan dos tablas.
8/18/2019 Comprobacio 769 n de Supuestos SPSS
7/24
En primer lu$ar a'uella titulada Descriptios# 'ue nos indica los valores de
si$etría curtosis.
Descriptivos
6stad'sti%o 6rror t'(
SAT
Media 3,121 ,0*0"
Inter$alo de %onian7a (ara la media al *8
L'mite inerior 3,020
L'mite s.(erior 3,221
Media re%ortada al *8 3,1!0
Mediana 3,100
9arian7a ,*1+
#es$ t'( ,)1"*
M'nimo 1,0
Má-imo *,0
:an/o !,0
Am(lit.d inter%.artil ,*
Asimetr'a ,*0+ ,1)2
C.rtosis 1,*+1 ,3!2
En este caso# el valor de la simetría es < 4#5= Empleando la si$uiente fórmula
podemos calcular el valor del > de simetría determinar si respecto a tal valor
la variable distribue o no normalmente ?a idea es 'ue si nos da entre el
intervalo de con*an+a especi*cado ( @& 7#A=)# la variable distribue
normalmente.
Zsimetría=Simetría
√6
n
8/18/2019 Comprobacio 769 n de Supuestos SPSS
8/24
−3,233=−0,56
√ 6
200
Tambi:n es posible calcular el > de curtosis empleando la si$uiente ecuación.
Zcurtosis=Curtosis
√24
n
En se$undo lu$ar# nos interesa la tabla *rue'as de nor$alidad# donde
podemos acceder a los valores del test 6olmo$orov&Smirnov Shapiro&2il3s (la
forma para interpretarlos est e/plicada ms arriba).
Pruebas de normalidad
olmo/oro$Smirno$a S;a(iro
8/18/2019 Comprobacio 769 n de Supuestos SPSS
9/24
%na ve+ marcada la opción dispersionBPuntos# nos va a abrir un cuadro de
dilo$o vamos a pedir una “ispersión Datricial”
%na ve+ abierta la ventana de la dispersión matricial# in$resamos los índices
como variables de la matri+# vamos a “-pciones” seleccionamos e/cluir casos
variables por variable
8/18/2019 Comprobacio 769 n de Supuestos SPSS
10/24
Continuamos obtenemos la sifuiente matri+.
8/18/2019 Comprobacio 769 n de Supuestos SPSS
11/24
Esta matri+ de colinealidad permite evidenciar a cierta linealidad en la
relación entre las variables9 siendo mu alta para el caso de la relación etre
condiciones laborales conictividad
Tambi:n podemos pedir una matri+ de correlación# empleando la correlación de
Pearson# para evaluar 'ue tan fuerte es la correlación entre las variables
Fecordar 'ue Pearson es un coe*ciente param:trico# por lo 'ue re'uiere 'ue
estemos trabajando con variables de num:ricas con distribución normal e
no cumplir con estos re'uisitos# esto debe ser evidenciado a la hora de
interpretar el estadístico
Para obtener el estadístico vamos a Analizar Correlaciones 3iariadas.
8/18/2019 Comprobacio 769 n de Supuestos SPSS
12/24
En el cuadro de dilo$o se in$resan todas las variables a anali+ar9 se marca la
opción *earson en el apartado Coe/cientes de correlaci(n El resto se deja por
defecto
En la matri+ de correlaciones obtenida# como era esperable dada la $r*ca
observada# podemos observar coe*cientes 'ue nos indican la presencia de un
alto $rado de correlación entre las variables (coe*cientes maores al valor
absoluto 4#5)
Correlaciones
S!T C?!G C-HI?JC
S!T Correlación de Pearson 7 KLAMM K45MM
Si$ (bilateral) #444 #444
8/18/2019 Comprobacio 769 n de Supuestos SPSS
13/24
H 844 844 844
C?!G
Correlación de Pearson KLAMM 7 #KALMM
Si$ (bilateral) #444 #444
H 844 844 844
C-HI?JC
Correlación de Pearson K45MM #KALMM 7
Si$ (bilateral) #444 #444
H 844 844 844
Multicolinealidad
Para evaluar la multicolinealidad# es decir# para evaluar la relación lineal entrelas variables en su dimensión multivariante# ocuparemos una re$resión lineal
En el cuadro de dilo$o in$resamos las variables Si no tenemos una variable
independiente# podemos in$resar cual'uier otra num:rica (aun'ue no forme
parte de nuestro anlisis) con la condición de 'ue sea independiente de
nuestro objeto de estudio (la variable folio incluida en la maor parte de los
estudios sirve para ello) Todas las variables de inter:s las in$resamos como
dependientes
8/18/2019 Comprobacio 769 n de Supuestos SPSS
14/24
En la opción “estadísticos4 # pedimos los dia#n(sticos de colinealidad# para
comprobar la independencia de las variables dependientes
Hos interesa la 0ltima tabla de los resultados# titulada Dia#n(sticos de
Colinealidad. Jnteresa el índice de condición en la 0ltima *la del modelo
Diagnósticos de colinealidada
Modelo #imensi&n A.to$alores >ndi%e de %ondi%i&n Pro(or%iones de la $arian7a
4Constante5 SAT CLAB CONFLIC
1 1 3,)"" 1,000 ,00 ,00 ,00 ,00
2 ,1+ !,32 ,00 ,0! ,02 ,02
8/18/2019 Comprobacio 769 n de Supuestos SPSS
15/24
3 ,012 1",0)+ ,00 ,01 ,+" ,!
! ,00! 31,+1! , ,+ ,30 ,0!
•
e 4 a 74 las variables multicolineada es baja• Entre 74 L4 tenemos una multicolineadad moderada
• Sobre L4 tenemos una multicolinealidad alta
En tal medida# los valores del índice de condición# para el $rupo de tres
variables estudiadas# indica 'ue e/iste una relación lineal alta entre las
variables en su dimensión multivariante
Homocedasticidad
?a homocedasticidad es un suepuesto de la estadística param:trica re*ere ala homo$eneidad de varian+as en las poblaciones estudiadas Para su anlisis#
se re'uire establecer relaciones de dependencia trabajar con variables
normales Como vimos anteriormente# nuestras variables no cumplen el
supuesto de normalidad# pero haremos i$ual el ejercicio para aprender como
funciona
Para ver la relación de las varian+as de dos variables m:tricas podemos ocupar
test $r*cos de i$ual dispersión de varian+as ?a aplicación de esta forma de
evaluación se produce en la re$resión m0ltiple# en relación con la dispersión de
la variable dependiente a lo lar$o de las variables independientes m:tricas
8/18/2019 Comprobacio 769 n de Supuestos SPSS
16/24
Seleccionamos re$resión lineal e in$resamos nuestras variables ?a variable
satisfacción entraría como la dependiente# las condiciones laborales la
conictividad como las independientes# de acuerdo a los antescedentes de la
investi$ación
8/18/2019 Comprobacio 769 n de Supuestos SPSS
17/24
"amos a la opción Gr/cos le pedimos #enerar todos los #r/cos parciales
Hos arrojar los si$uientes $r*cos.
8/18/2019 Comprobacio 769 n de Supuestos SPSS
18/24
?as
distribuciones esperadas de para una distribución homocedastica
heterocedastica son las si$uientes.
8/18/2019 Comprobacio 769 n de Supuestos SPSS
19/24
Podemos concluir preeliminarmente 'ue no ha homocedasticidad en ladispersión de nuestra variable dependiente a los lar$o de nuestras variables
independientes# lo 'ue puede e/plicarse en parte por la no normalidad de
nuestras variables
El test estadístico para ver la dispersión de la varian+a de una variables en
distintos $rupos es el test de &eene Este suele utili+arse para ver si las
varian+as de las variables m:tricas son i$uales o varin a lo lar$o de cual'uier
cantidad de $rupos
Para ello vamos a Analizar Co$parar $edias Anoa de una actor e
in$resaremos nuestros índices como variables dependientes la variable
6ra$os de Edad como factor (independiente) Esta variable $enerar los
$rupos 'ue sevirn para ver como se comporta la varian+a de cada una de
nuestras variables en los distintos $rupos :tareos9 es decir# veri*car si# en
relación a los tramos de edad# los $rupos poseen homocedasticidad (i$ualdad
de varian+a) o heterocedasticidad (la varian+a no es constante a lo la$o de los
$rupos)
8/18/2019 Comprobacio 769 n de Supuestos SPSS
20/24
En 7pciones marcarmos *rue'as de %o$o#eneidad de arianzas.
; obtenemos como resultado la si$uiente tabla.
8/18/2019 Comprobacio 769 n de Supuestos SPSS
21/24
ado 'ue nuestra hipótesis nula es 'ue las varian+as de los $rupos son i$uales#
si buscamos homocedasticidad# re'uerimos una valor de si$ni*cación maor a
4#45# a un nivel de con*an+a del A5N En este caso# de acuerdo a los
resultados obtenidos# sólo el Jndice de Conictividad $eneraría $rupos con
varian+as homo$eneas Sin embar$o# estos resultados no son vlidos por'ue
nuestras variables no poseen normalidad univariante
Si 'ueremos evaluar la homocedasticidad multivariable de nuestras variables
m:tricas utili+amos el estadísitico 8 de 3o9. En SPSS# la 0nica forma de
solicitar esta prueba es a trav:s del modelo de discriminante# el 'ue ser
revisado en detalle ms adelante
Detección multivariante de casos atípicos
Oaremos un m:todo de detección de casos atípicos utili+ando la 8 (distancia)
de Dahalanobis9 a tales valores se les aplica una prueba de si$ni*caciónestadística. si la si$ni*cación estadística es menor a 4#447 lo consideraremos
como un caso atípico7
Para obtener la distancia de Dahalanobis debemos reali+ar una re#resi(n
lineal. Para el modelo necesitamos a$re$ar una variable dependiente Se
a$re$a la variable I-?J- (no nos interesa la re$resión por sí misma# sino por la
8 de Dahalanobis) %tili+aremos esta variable para ejempli*car en este caso#
a 'ue Dahalanobis no re'uiere relaciones de dependencia
7 Fecordar 'ue en clase fue revisado el m:todo de anlisis de Fesiduos
estandari+ados para la detección de casos atípicos
8/18/2019 Comprobacio 769 n de Supuestos SPSS
22/24
En la opción $uardar# le pedimos solamente la distancia de Dahalanobis# todo
lo dems 'ueda sin marcar
Fespecto a esta operación# no nos interesan las salidas9 sólo interesa 'ue creó
una variable con la medición m:trica de las distancias por variable
! tal variable nueva# debemos aplicar una prueba de si$ni*cación estadística"amos a calcular aria'le aplicamos una si$ni*cación estadística chi
cuadrado# con L $rados de libertad8
En Grupo de Funciones pulsamos -i#ni/caci(n# en Funciones y aria'les
especiales hacemos doble clic sobre Si$Chis'# lo 'ue pone tal comando como
primer elemento en la E9presi(n )u$:rica. ?ue$o hacemos doble clic sobre la
variable 8a%alano'is Distance# la in$resamos al par:ntesis de la función9
inmediatamente lue$o de la variable < dentro del par:ntesis# a$re$amos una
coma un L (el n0mero de $rados de libertad) En Varia'le de destino
8 ?os $rados de libertad corresponden al n0mero de variables independientes con el'ue se calculó la distancia de Dahalanobis# en este caso eran tres variables
8/18/2019 Comprobacio 769 n de Supuestos SPSS
23/24
tipeamos -i#ni/caci(n8ala%a 'ue ser el nombre de la nueva variable creada
Pulsamos aceptarBpe$ar
Huevamente no nos interesan los resultados del anlisis# sino 'ue se creó una
nueva variable con la si$ni*cación estadística para cada distancia de
Dahalanobis
-rdenamos los casos de la variable reci:n creada de modo ascendente# para
evaluar cules cuantos casos 'uedan fuera
Fecordemos 'ue si la si$ni*cación estadística es menor a 0,00 el caso ser
considerado como un caso atípico En este ejemplo# podemos observar 'ue
solamente los tres primeros casos presentan una si$ni*cación menor a 4#447#
por lo 'ue solamente tres casos podrían ser considerados atípicos en la
dimensión multivariante
8/18/2019 Comprobacio 769 n de Supuestos SPSS
24/24
Para eliminarlos de la base# basta con mantener seleccionados los tres casos#
presionar el botón derecho oprimir 'orrar
Dar+o 8475