Post on 14-Jan-2016
description
TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS
NIVEL II AVANZADO
Titular: Agustín Salvia
MÓDULO 1 (complemento):
SEMINARIO DE INVESTIGACION
TÉCNICAS ESTADÍSTICAS PARA ANÁLISIS DESCRIPTIVOS Y MEDIDAS
DE ASOCIACIÓN
SEMINARIO DE INVESTIGACION
•LA ESTADÍSTICA DESCRIPTIVA TIENE COMO FUNCIÓN BRINDAR UN CONJUNTO DE MEDIDAS QUE SINTETICEN LA INFORMACIÓN RELEVADA POR LOS DATOS.
•ESTUDIA CARACTERES O ASPECTOS REFERIDOS A UN COLECTIVO DE PERSONAS, OBJETO O ELEMENTOS DE NATURALEZA ESPECÍFICA.
•LA ESTADÍSTICA DESCRIPTIVA DISPONE DE UNA SERIE VARIADA DE HERRAMIENTAS PARA RESUMIR INFORMACIÓN QUE CONTIENE UNA MUESTRA O POBLACIÓN: TABLAS, GRÁFICOS, MEDIDAS DE TENDENCIA CENTRAL, DE DISPERSIÓN, ETC.
•LA EXTRAPOLACIÓN DE DE LOS RESULTADOS DE UNA MUESTRA A LA POBLACIÓN ES EL CONTENIDO DE LA ESTADÍSTICA INFERENCIAL, CUYA FUNCIÓN ES INFERIR CONCLUSIONES Y BRINDAR MEDIDAS QUE PERMITAN CUANTIFICAR LA CONFIANZA DE TALES CONCLUSIONES.EL EMPLEO DE UN DETERMINADO TIPO Y/O HERRAMIENTA ESTADÍSTICA DEPENDE DEL TIPO DE PROBLEMA/OBJETO DE ESTUDIO Y DEL NIVEL DE MEDIÓN DE LOS VALORES DE LA VARIABLE A CONSIDERAR.
ESTADÍSTICA BÁSICA
HERRAMIENTAS BÁSICAS DE LA ESTADÍSTICA DESCRIPTIVA
Variable Descripción Estadísticos y gráficos
Cualitativa en escala nominal
Valores no numéricos con ausencia de orden entre ellos
Distribución de frecuencias
Moda
Diagrama de barras
Cualitativa en escala ordinal
Valores no numéricos con presencia de orden entre ellos
Mínimo
Máximo
Mediana
Cuartiles
Percentiles
Rango intercuartílico
Gráfico de caja y bigotes
Cuantitativa en escala de intervalo o razón
Cuantitativa discreta: únicamente puede tomar una cantidad finita o numerable de valores numéricos
Media
Rango
Varianza
Cuantitativa continua: puede tomar una cualquier valor numérico en un intervalo
Desviación típica
Coeficiente de variación
En escala de intervalo: únicamente tiene sentido la diferencia entre sus valores
Coeficiente de asimetría
Coeficiente de curtosis
En escala de razón: si además de la diferencia tiene sentido la razón ntre sus valores
Histograma
Gráfico de tallo y hojas
TEMPORARY .SELECT IF (h12>25 AND h12<45) .FREQUENCIES VARIABLES=cdea /STATISTICS=MODE /BARCHART FREQ /ORDER ANALYSIS .
Statistics
PEA5907235
0
1,00
Valid
Missing
N
Mode
PEA
4699861 79,6 79,6 79,6
1207374 20,4 20,4 100,0
5907235 100,0 100,0
Activo
Inactivo
Total
ValidFrequency Percent
ValidPercent
Cumulative Percent
PEA
Cases weighted by PONDERA
PEA
InactivoActivo
Fre
quen
cy
5000000
4000000
3000000
2000000
1000000
0
ESTADÍSTICA DESCRIPTIVA
VARIABLE CUALITATIVA EN ESCALA NOMINAL
VARIABLE CUALITATIVA EN ESCALA ORDINAL
Grupos de edad
4077127 16,8 16,8 16,8
4506457 18,6 18,6 35,4
4023557 16,6 16,6 52,0
3053744 12,6 12,6 64,5
2917893 12,0 12,0 76,6
2326358 9,6 9,6 86,1
3361616 13,9 13,9 100,0
24266752 100,0 100,0
0.- 9 años y menos
1.- de 10 a 19 años
2.- de 20 a 29 años
3.- de 30 a 39 años
4.- de 40 a 49 años
5.- de 50 a 59 años
6.- 60 años y más
Total
ValidFrequency Percent
ValidPercent
Cumulative Percent
Grupos de edad
6,05,04,03,02,01,00,0
Grupos de edad
Cases weighted by PONDERA
Fre
quen
cy
5000000
4000000
3000000
2000000
1000000
0
Std. Dev = 2,02
Mean = 2,7
N = 24266752,0
FREQUENCIES VARIABLES=xgedad /NTILES= 4 /PERCENTILES= 20 80 /STATISTICS=RANGE MINIMUM MAXIMUM MEDIAN /BARCHART FREQ /ORDER ANALYSIS .
Statistics
Grupos de edad24266752
0
2,0000
6,00
,00
6,00
1,0000
1,0000
2,0000
4,0000
5,0000
Valid
Missing
N
Median
Range
Minimum
Maximum
20
25
50
75
80
Percentiles
ESTADÍSTICA DESCRIPTIVA
FREQUENCIES VARIABLES=xh12 /FORMAT=NOTABLE /NTILES= 4 /PERCENTILES= 10 90 /STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM SEMEAN MEAN MEDIAN MODE SUM SKEWNESS SESKEW KURTOSIS SEKURT /HISTOGRAM NORMAL /ORDER ANALYSIS .
Statistics
Edad24.266.752
0
32,15
,00
28
21
22,03
485,49
,53
,00
-,64
,00
99
0
99
780.121.228
6
14
28
48
65
Valid
Missing
N
Mean
Std. Error of Mean
Median
Mode
Std. Deviation
Variance
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Range
Minimum
Maximum
Sum
10
25
50
75
90
Percentiles
Edad
100,090,0
80,070,0
60,050,0
40,030,0
20,010,0
0,0
Edad
Cases weighted by PONDERA
Fre
quen
cy
3000000
2000000
1000000
0
Std. Dev = 22,03
Mean = 32,1
N = 24266756,0
ESTADÍSTICA DESCRIPTIVA
VARIABLE CUANTITATIVA EN ESCALA METRICA
TECNICAS AVANZADAS DE INVESTIGACIÓN Y ANÁLISIS MULTIVARIADO DE DATOS
NIVEL II AVANZADO
SEMINARIO DE INVESTIGACION
Clasificación de los métodos
multivariados
Problemas de interdependencia o creación de índices (análisis factorial, cluster y escalamiento).
Problemas de causalidad o asociación (análisis de varianza, regresión y discriminante).
La investigación EMPÍRICA se ocupa de fenómenos multidimensionales
Métodos multivariados
Su clasificación
Métodos de interdependencia
Descripción de Dimensiones: posibilitan la identificación de dimensiones o conceptos complejos subyacentes (Análisis Factorial, Componentes Múltiples, etc.).
Clasificación de unidades o variables: permiten clasificar unidades individuales o colectivas o variables con el fin de crear tipologías, cluster o clases de individuos (Cluster, Escalamiento, etc.).
Métodos multivariados
Utilidad de este tipo de métodos:
Evalúan correlaciones y sintetiza información
Muestran la estructura de los datos según criterio
Establecen clasificaciones y/o genera valores índices
Técnicas de Análisis ANÁLISIS FACTORIAL ANÁLISIS DE CORRESPONDENCIAS ANÁLISIS DE CLUSTER
Métodos de interdependencia
Métodos multivariados
Diferencian entre variables (a) explicativas, independientes o predictivas, (b) variables a explicar o dependientes, y (c) variables control o intervinientes.
La distinción entre variables dependientes e independientes debe efectuarse con arreglo a fundamentos teóricos, por conocimiento o experiencia y estudios anteriores.
Métodos de tipo:
EXPLICATIVOS /PREDICTIVOS
Métodos multivariados
Problemas de causalidad
Utilidad de este tipo de métodos
Mide la fuerza y sentido de relaciones parciales Predice valores a partir de una serie de variables Explica el comportamiento de una o más variables Evalúa la bondad de ajuste de un modelo teórico a los datos
MÉTODOS ANÁLISIS DE VARIANZA (ANOVA) ANÁLISIS DE REGRESIÓN ANÁLISIS DISCRIMINANTE REGRESIÓN LOGÍSTICA
Problemas de causalidad
Métodos multivariados