Análisis Descriptivo Bivariado

Post on 25-Jun-2015

777 views 2 download

Transcript of Análisis Descriptivo Bivariado

Análisis Descriptivo BivariadoSaúl Díaz Navarro

Análisis Descriptivo BivariadoPermite realizar un verdadero

“análisis” (división), que acompañado de las debidas comparaciones genera un escudriño exhaustivo de los datos.

Comparación de Porcentajes y de promedios para ciertos valores de otra variable.

EjemplosComparar el promedio de ventas de

cada uno de los asesores comerciales.Comparar el promedio de

calificaciones de los estudiantes diurnos con el de los estudiantes nocturnos.

Comparar el porcentaje de enfermos entre los que tienen un hábito y entre los que no lo tienen.

Comparar el nivel de calidad de la materia prima de dos proveedores.

Tablas de Contingencia

También llamadas:

Tablas de Doble EntradaCruces de Variables (cross tab)Tablas de 2*2Tablas de distribución de

frecuencia bivariadas

Tablas de Contingencia

Muestran la distribución de frecuencias de una variable, de manera diferenciada, para cada uno de los valores (o grupo de valores) de otra variable.

Tabaquismo y Cáncer de Pulmón

Cantidad de Personas Según Tabaquismo y Aparición de Cáncer

Tabaquismo

No Fuma 4 32 36

Fumador Moderado 21 45 66

Fumador no Moderado 75 22 97

Total 100 99 199

Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280

Cáncer No Cáncer Total

Porcentaje Columna

Cantidad de Personas Según Tabaquismo y Aparición de Cáncer

Tabaquismo

No Fuma 4 32 364% 32% 18%

Fumador Moderado 21 45 6621% 45% 33%

Fumador no Moderado 75 22 9775% 22% 49%

Total 100 99 199100% 100% 100%

Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280

Cáncer No Cáncer Total

Porcentaje FilaCantidad de Personas Según Tabaquismo y Aparición de Cáncer

Tabaquismo

No Fuma 4 11% 32 89% 36 100%

Fumador Moderado 21 32% 45 68% 66 100%

Fumador no Moderado 75 77% 22 23% 97 100%

Total 100 50% 99 50% 199 100%

Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280

Cáncer No Cáncer Total

Porcentaje Total

Cantidad de Personas Según Tabaquismo y Aparición de Cáncer

Tabaquismo

No Fuma 4 32 362% 16% 18%

Fumador Moderado 21 45 6611% 23% 33%

Fumador no Moderado 75 22 9738% 11% 49%

Total 100 99 19950% 50% 100%

Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280

Cáncer No Cáncer Total

Tabla CompletaCantidad de Personas Según Tabaquismo y Aparición de Cáncer

Tabaquismo

No Fuma 4 11% 32 89% 36 100%4% 2% 32% 16% 18% 18%

Fumador Moderado 21 32% 45 68% 66 100%21% 11% 45% 23% 33% 33%

Fumador no Moderado 75 77% 22 23% 97 100%75% 38% 22% 11% 49% 49%

Total 100 50% 99 50% 199 100%100% 50% 100% 50% 100% 100%

Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280

nij % fila% Col % Total

Cáncer No Cáncer Total

AnálisisCambia la distribución porcentual

de la condición “Cáncer” y “No Cáncer” según los distintos valores de tabaquismo?

Podemos decir que el Tabaquismo es la causa del Cáncer?

Podemos decir que el Cáncer es la causa del Tabaquismo?

Que podemos interpretar?

AnálisisPodemos decir que el

tabaquismo, no afecta la aparición del cáncer?

Aunque no podamos, con un tabla de contingencia, comprobar una relación causa efecto, si podemos encontrar evidencia de asociación o correlación estadística.

Análisis

Las comparación distribución de la aparición de cáncer (Variable respuesta) para entre cada uno de los niveles de tabaquismo (Factor) permite concluir que existe una asociación estadística entre el tabaquismo y la aparición de cáncer.

El tabaquismo es un factor de riesgo asociado a la aparición de cáncer.

Los Valores de Tabaquismo pueden tomar los nombre de X1, X2 y X3.

Los valores de Cáncer pueden tomar los valores Y1 y Y2.

Simbología

Cantidad de Personas Según Tabaquismo y Aparición de Cáncer

Tabaquismo

X1 n11 n12 n1*h11 h12 h1*

X2 n21 n22 n2*h21 h22 h2*

X3 n31 n32 n3*h31 h32 h3*

X* n*1 n*2 n**h*1 h*2 h*3

Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280

Y1 Y2 Y*

Simbologia

Cantidad de Personas Según Tabaquismo y Aparición de Cáncer

Tabaquismo

X1 n11 n12 n1*h11 h12 h1*

X2 n21 n22 n2*h21 h22 h2*

X3 n31 n32 n3*h31 h32 h3*

X* n*1 n*2 n**h*1 h*2 h*3

Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280

Y1 Y2 Y*

Frecuencias Relativas (Total tabla)

hij = 𝑛𝑖𝑗𝑛

Frecuencia condicional

Es la proporción equivalente al porcentaje columna.

ℎሺ𝑋𝑖 ȁ� 𝑌𝑗) = 𝑛𝑖𝑗𝑛 ∗𝑗

Estudiantes según plan de estudios y Genero Sexual.

GENERO SEXUAL

PLAN DE ESTUDIOS Administració

n Mercadeo Total

Hombre 42 14 56 Mujer 18 6 24 Total 60 20 80

Estudiantes según plan de estudios y Genero Sexual.

La proporción de género sexual cambia según el plan de estudios?

La proporción de plan de estudios, cambia en los distintos géneros sexuales?

Existe alguna asociación estadística entre las variables plan de estudios y género sexual?

Estudiantes según plan de estudios y Genero Sexual.

Distribución de Estudiantes Según Género Sexual y Plan de Estudios.Género Sexual

Administración (Y1) Mercadeo (Y2) Total n i*Masculino 42 70% 18 30% 60 100%

X1 75% 53% 75% 23% 75% 75%Femenino 14 70% 6 30% 20 100%

X2 25% 18% 25% 8% 25% 25%Total n*j 56 70% 24 30% 80 100%

100% 70% 100% 30% 100% 100%

nij % fila nij h(Yj|Xi)% Col % Total h(Xi|Yj) % Total

Plan de Estudios

Estudiantes según plan de estudios y Genero Sexual.

La proporción de género sexual NO cambia según el plan de estudios

La proporción de plan de estudios, NO cambia en los distintos géneros sexuales

NO Existe alguna asociación estadística entre las variables plan de estudios y género sexual. Hay Independencia estadística

Independencia Estadística

.h(Xi / Yj) = h(Xi) para todo i, j

.h(Xi ∩ Yj) = h(Xi) * h(Yj).h(Xi ∩ Yj) = (hi* ) * (h*j)Cuando no hay independencia, habrá

dependencia.

Distribución con Independencia Estadística (Sin dependencia)

Distribución de Estudiantes Según Género Sexual y Plan de Estudios.Género Sexual

Administración (Y1) Mercadeo (Y2) Total n i*Masculino 60

X1 75%Femenino 20

X2 25%Total n*j 56 70% 24 30% 80

nij % fila nij h(Yj|Xi)% Col % Total h(Xi|Yj) % Total

Plan de Estudios

Distribución con Independencia Estadística (Sin dependencia)

Distribución de Estudiantes Según Género Sexual y Plan de Estudios.Género Sexual

Administración (Y1) Mercadeo (Y2) Total n i*Masculino 60

X1 75% 75% 75%Femenino 20

X2 25% 25% 25%Total n*j 56 70% 24 30% 80

nij % fila nij h(Yj|Xi)% Col % Total h(Xi|Yj) % Total

Plan de Estudios

42 (0,7*0,75)= 0,525

Género Sexual Administración (Y1) Mercadeo (Y2) Total n i*

Masculino (0,525*80)X1 (0,7*0,75) 75%

FemeninoX2 25%

Total n*j 70% 30% 80

nij % fila nij h(Yj|Xi)% Col % Total h(Xi|Yj) % Total

Plan de Estudios

Coeficiente de Contigencia h2 de cramer.

Compara la distribución bivariada observada con la distribución bivariado que resultaría bajo la hipótesis de independencia estadística.

0 <= h2 <= 1

H2= 0 Total independencia. No hay dependencia. Caso de Estudiantes por genero y plan de estudios.

H2=1 Nula Independencia. Máximo grado de dependencia.