Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Estadística Descriptiva II: Relación entrevariables
Iniciación a la Investigación Ciencias de la Salud
Jesús Montanero Fernández
MUI Ciencias de la Salud, UEx
25 de octubre de 2010
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
¿De qué trata?
Descripción conjunto concreto de datos (sin generalizar)Clasificación Tablas de frecuenciaRepresentación GráficosResumen Valores típicos
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Tipos de variables ¿?
Según SPSSCualitativas (factores)
Nominales: Grupo sanguíneoOrdinales: Grado enfermedad
Cuantitativas o de escala : Temperatura, estatura, glucemia,no hijos...
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Problemas estadísticos: relación
Tipos de relacionesCualitativa (factor)↔ Cuantitativa (Comparación degrupos o tratamientos)Cuantitativa↔ Cuantitativa (Regresión)Cualitativa (factor)↔ Cuanlitativa (Tablas decontingencia)
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Relación entre dos variables cuantitativas
Peso-altura
X =peso(kg) 80 45 63 94 24 75 56 ...Y =altura(cm) 174 152 160 183 102 183 148 ...
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Gráfico
Diagrama de dispersión
-
6
X
Y
|10
|20
|30
|40
|50
|60
|70
|80
|90
|100
100−
110−
120−
130−
140−
150−
160−
170−
180−
190−
200−
qq q
q
q
qqqq
q
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Otro ejemplo
Longitud cabeza
9,0008,7008,4008,1007,800
An
ch
ura
ca
be
za
5,200
5,100
5,000
4,900
4,800
4,700
4,600
4,500
Página 1
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Estudiamos inicialmente relaciones lineales
Concentración de hormona paratiroidea (mug/ml)
5,004,003,002,001,000,00
Co
nc
en
tra
ció
n d
e c
alc
io (
mg
/10
0m
l)11,00
10,00
9,00
8,00
7,00
6,00
5,00
Página 1
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Valores típicos
Dos tiposDe las variables por separados.Referentes a la relación entre las variables
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Variables por separado
x, sx, y, sy, y, . . .
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Referentes a la relación entre las variables: Covarianza→ r
sxy =
∑ni=1(xi − x)(yi − y)
n− 1
− sx · sy ≤ sxy ≤ + sx · sy .
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Interpretación gráfica
−630,71 ≤ sxy ≤ +630,71 sxy = 577,86
Peso
10080604020
Alt
ura
200
175
150
125
100
Página 1
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Longitud cabeza
9,0008,7008,4008,1007,800
An
ch
ura
ca
be
za
5,200
5,100
5,000
4,900
4,800
4,700
4,600
4,500
Página 1
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Interpretación gráfica covarianza
-
6
X
Y
q q q q q q q
-
6
X
Y
q qq
qqqq
-
6
X
Y q q q q q q q
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Covarianza próxima a cero
x
8,006,004,002,00
y8,00
7,00
6,00
5,00
4,00
3,00
2,00
1,00
Página 1
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Covarianza negativa
Concentración de hormona paratiroidea (mug/ml)
5,004,003,002,001,000,00
Co
nc
en
tra
ció
n d
e c
alc
io (
mg
/10
0m
l)11,00
10,00
9,00
8,00
7,00
6,00
5,00
Página 1
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Coeficiente de correlación lineal r
Medida adimensional del grado de correlación
− sx · sy ≤ sxy ≤ + sx · sy .
r =sxy
sx · sy
−1 ≤ r ≤ 1
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
r = 0,91
-
6
X
Y
|10
|20
|30
|40
|50
|60
|70
|80
|90
|100
100−
110−
120−
130−
140−
150−
160−
170−
180−
190−
200−
qq q
q
q
qqqq
q
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
r = 0,625
an
ch
5,200
5,000
4,800
4,600
longt
9,0008,7008,4008,1007,800
Página 1
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
r = −0,97
Concentración de hormona paratiroidea (mug/ml)
5,004,003,002,001,000,00
Co
nc
en
tra
ció
n d
e c
alc
io (
mg
/10
0m
l)11,00
10,00
9,00
8,00
7,00
6,00
5,00
Página 1
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Recta de regresión lineal
y = a + b · x y = 89,11 + 1,10xPredicciones: x = 62kg→ y = 89,11 + 1,10 · 60 = 155,11cm
Peso
10080604020
Alt
ura
200
175
150
125
100
Página 1
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Regresión múltiple
¿Pueden introducirse más variables explicativas en la ecuación?
y = a + b1x1 + b2x2 + b3x3
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Varianza residual
Mide el error cometido por la recta de regresión
s2y←x =
1n−2
∑ni=1[yi − (a + bxi)]
2 = 1335,32/10
xi yi (a + bxi) [yi − (a + bxi)]2
80 174 176.80 7.8645 152 138.44 183.9463 160 158.17 3.3694 183 192.15 83.7024 102 115.42 180.0575 183 171.32 136.3756 148 150.50 6.2352 152 146.11 34.6961 166 155.98 100.4834 140 126.38 185.5121 98 112.12 199.6678 160 174.61 213.47
1335.32
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Coeficiciente de determinación r2
s2y←x
s2y
= 1− r2xy
1− r2xy indica la proporción de la variabilidad total de Y no
explicada por la regresión.r2
xy expresa lo contrario.
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
r2 = 0,82
Peso
10080604020
Alt
ura
200
175
150
125
100
Página 1
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
r2 ' 0
x
8,006,004,002,00
y
8,00
7,00
6,00
5,00
4,00
3,00
2,00
1,00
Página 1
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
r2 = 0,39
Longitud cabeza
9,0008,7008,4008,1007,800
An
ch
ura
ca
be
za
5,200
5,100
5,000
4,900
4,800
4,700
4,600
4,500
Página 1
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Regresión no lineal
Edad días-Peso embrión: Transformar variables
Edad embrión
16141210
Pe
so
Em
bri
ón
3.000
2.000
1.000
0
Página 1
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Relación entre variables cualitativas
nivel contaminación - salud árbolesCloroplastos
SO2
(3× 3) Alto Medio Bajo TotalAlto 3 4 13 20
Medio 5 10 5 20Bajo 7 11 2 20Total 15 25 20 60
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Vacunación-hepatitisVacunación
Hepatitis
(2× 2) Sí No TotalSí 11 70 81No 538 464 1002Total 549 534 1083
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Gráfico
Barras agrupadas
Nivel de SO2
SO2 bajoSO2 medioSO2 alto
Re
cu
en
to
12,5
10,0
7,5
5,0
2,5
0,0
Gráfico de barras
Cloroplatos bajo
Cloroplastos medio
Cloroplastos alto
Nivel de cloroplastos
Página 1
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Medidas del grado de dependencia
Observados vs Esperados independencia: distancia χ2
χ2exp =
∑i,j
(Oij − Eij)2
Eij
0 ≤ χ2exp ≤ +∞
Coeficiente de contingencia de Pearson C
C =
√χ2
exp
χ2exp + n
0 ≤ C ≤
√q− 1
q, q = min{no filas, no colunas}
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Ejemplo: cloropastosTabla 3× 3. Por lo tanto,
0 ≤ C ≤√
23= 0,816
En este caso concreto,
C = 0,444
Grado de asociación medio
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Independencia C = 0Cloroplastos
SO2
(3× 3) Alto Medio Bajo TotalAlto 5 8.3 6.7 20
Medio 5 8.3 6.7 20Bajo 5 8.3 6.7 20Total 15 25 20 60
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Máxima dependencia C = 0, 816Los valores observados deberían ser éstos:
Cloroplastos
SO2
(3× 3) Alto Medio Bajo TotalAlto 0 0 20 20
Medio 0 20 0 20Bajo 20 0 0 20Total 20 20 20 60
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Cualitativa→ cuantitativa
Grupo
Viven con otras personasViven solos
Pu
ntu
ació
n d
e an
sied
ad d
e H
amilt
on
20,00
18,00
16,00
14,00
12,00
10,00
8,00
5
Página 1
¿Influye el estilo de vida en la ansiedad?
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
¿Influye la acidosis en la glucemia?
Tipo de acidosis
Acidosis MixtaAcidosis MetabólicaAcidosis RespiratoriaControl
Niv
el d
e g
luce
mia
en
el c
ord
ón
um
bili
cal
100,000
90,000
80,000
70,000
60,000
50,000
40,000
Página 1
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables
Regresión-correlaciónTablas de contingencia
Comparación de grupos o tratamientos
Contrastes de hipótesis
H0 : µ1 = µ2 = µ3 = µ4
Parámetros poblacionalesµ denota la media poblacional de una variable cuantitativa
Parámetros muestralesNosotros sólo contamos con los valores típicos (x,s, etc) de unamuestra de cada población.
Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables