TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

24
TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I) El proceso de definir y medir las variables es crucial. Si se realiza una definición incorrecta o se mide mal: todos los análisis posteriores, así como las conclusiones a las que se llegue, serán incorrectas. Variable: característica de cada sujeto (cada caso) de una base de datos. Se denomina “variable” precisamente porque “varía” de sujeto a sujeto. Cada sujeto tiene un valor para cada variable. I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. El tipo de variable afecta al tipo de análisis que se puede realizar. Los métodos estadísticos utilizados dependen del tipo de variable. VARIABLES

description

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I). I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos. VARIABLES. Variable: característica de cada sujeto (cada caso) de una base de datos. - PowerPoint PPT Presentation

Transcript of TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

Page 1: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

El proceso de definir y medir las variables es crucial.

Si se realiza una definición incorrecta o se mide mal: todos los análisis posteriores, así como las conclusiones a las que se llegue, serán incorrectas.

Variable: característica de cada sujeto (cada caso) de una base de datos.

Se denomina “variable” precisamente porque “varía” de sujeto a sujeto.

Cada sujeto tiene un valor para cada variable.

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

El tipo de variable afecta al tipo de análisis que se puede realizar.

Los métodos estadísticos utilizados dependen del tipo de variable.

– VARIABLES

Page 2: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– TIPOLOGÍA

• VARIABLES CONTINUAS Y DISCRETAS

• VARIABLE TEMPORAL, TRANSVERSAL Y DATOS DE PANEL

• VARIBLE CUALITATIVA Y CUANTITATIVA

– ESCALAS DE MEDIDA

• NOMINAL

• ORDINAL

• INTERVALO

• RAZÓN

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– VARIABLES

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 3: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– TIPOLOGÍA

• VARIABLES CONTINUAS Y DISCRETAS

• VARIABLE TEMPORAL, TRANSVERSAL Y DATOS DE PANEL

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

Discretas: el número de valores posibles entre dos valores dados es finito (se cuenta).

Continua: el número de valores posibles entre dos valores dados es infinito (se mide).

Temporal: valores a lo largo del tiempo referidos a un sujeto.

Transversal: valores en un momento del tiempo referido a varios sujetos.

Datos de Panel: Valores referidos a varios sujetos a lo largo del tiempo.

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 4: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– TIPOLOGÍA

• VARIBLE CUALITATIVA Y CUANTITATIVA

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

Cualitativa (no paramétrica):

Los valores son “categorías”. Las categorías son valores diferentes por una cualidad, no por una cantidad.

Cuantitativa (paramétrica):

Los valores de la variable son “números” . Cada valor posible es menor o mayor que otro valor.

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 5: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– ESCALAS DE MEDIDA

La escala nominal identifica la pertenencia de un elemento a un grupo o a otro.

Sólo se puede saber sobre I y J, si xi = xj o xi xj.

Ej.: Variable Sexo. 0:Hombre, 1:Mujer

En la escala ordinal los números asignados a la variable sirven para establecer un determinado orden entre personas u objetos.

Además de la información de la escala nominal, se conoce si xi > xj o xi < xj.

Ej.: Variable Preferencias. 1:Nada, 2: Poco, 3: Algo, 4:Mucho

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)I. Importación y organización de diversas bases de datos en Excel.

Variables, Escala de Medición y Problemas con los Datos.

Page 6: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– ESCALAS DE MEDIDA

En la escala de intervalo asigna números que permiten establecer la diferencia entre los distintos objetos.

Además de lo anterior podemos saber que si I es mayor que J, I es x i - xj más grande que J.

Ej.: Variable Temperatura. 0º: No indica ausencia de temperatura. 30º no implica el doble de calor que 15º.

Con la escala de razón es posible hablar del número de veces que un objeto o persona es mayor que otra.

Además de lo anterior se puede saber que si I es mayor que J, I es x i / xj veces superior a J.

Ej.: Variable Ingresos. 0 € indica ausencia de ingresos. 1.000 € es el doble de salario que 500 €.

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)I. Importación y organización de diversas bases de datos en Excel.

Variables, Escala de Medición y Problemas con los Datos.

Page 7: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

Definición Medidas de Tendencia

Central

Medidas de Dispersión

Gráficos

Nominal Categorías NO ordenadas

Moda Ninguna Sectores o barras

Ordinal Categorías ordenadas

Moda y Mediana

Mín / Máx / Rango Amplitud Intercuartil

Sectores o barras

Escala(Intervalo, Razón)

Valores numéricos o magnitud métrica

Moda, Mediana y Media

Mín / Máx / Rango Amplitud IntercuartilDesviación típica / Varianza

Histogramas, Gráficos de Cajas, etc.

– ESCALAS DE MEDIDA

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 8: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– IMPORTACIÓN DE DATOS A EXCEL

http://www.ine.es

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Inebase / Sociedad / Mercado Laboral / ETCL. Encuesta Trimestral de Coste Laboral

Resultados detalladosPrincipales series desde trimestre 1T/2000

Tabla 1.2 Principales series de ETCL por comunidad autónoma, periodo, componentes del coste y unidad de medida.

Filas Columnas

Componente del Coste PeriodoComunidades Autónomas Unidad de medida

Selección:Componente del Coste (Coste total por trabajador, Coste total por hora)Comunidades Autónomas (Total, todas las CC.AA.)Periodo (Todos)Unidad de medida (Euro)

Page 9: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– IMPORTACIÓN DE DATOS A EXCEL

http://www.anuarieco.lacaixa.comunicacions.com

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 10: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– IMPORTACIÓN DE DATOS A EXCEL

http://www.meh.es

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Estadísticas e Informes / Presupuestos y Cuentas Públicas / Sector Público Español / Base de datos económicos del sector público español (BADESPE)

Base de datos económicos del sector público español (BADESPE)Financiación AutonómicaCuadros ResúmenesPor Comunidades y Ciudades Autónomas

FINANCIACIÓN AUTONÓMICA (Excel)

Page 11: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– IMPORTACIÓN DE DATOS A EXCEL

http://biblioteca.uam.es/cdestadistica/informacionbibliografica.html

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

SABI/

Nombre de Empresa /

Exportar (Excel)

Page 12: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– PROBLEMAS CON LOS DATOS

I. Valores Perdidos o Ausentes: cuando para una variable no se dispone de todos los datos para cada sujeto.

Soluciones a Datos Perdidos:

A. Eliminar todos los casos con valores perdidos.

B. Imputar un valor estimado.

B.1. Imputación de los valores medios: Se sustituyen los valores ausentes por los valores medios de la variable.

B.2. Imputación mediante regresión: Se realiza una regresión siendo la variable dependiente la que posee valores perdidos y como independientes el resto de variables que posean todos los datos. Los datos imputados son las predicciones calculadas en la regresión.

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 13: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– PROBLEMAS CON LOS DATOS

II. Valores Atípicos - Outliers: Aquellos casos que alguna variable toma valores extremos que difieren del comportamiento del resto de la muestra.

Consecuencias:

- Distorsionan los resultados- Suelen afectar a la normalidad.

Causas:

- Errores en los datos (recogida e introducción).- Errores intencionados por parte del encuestado.- Errores de muestreo (introducir en la muestra un individuo que no pertenece a la población)- Outliers verdaderos: casos que pertenecen a la población objeto de estudio y que realmente difieren del resto por la variabilidad inherente

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 14: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– PROBLEMAS CON LOS DATOS

II. Valores Atípicos - Outliers

Detección de valores atípicos

- Considerar atípicos aquellos casos cuyos valores estandarizados (media = 0 y desviación típica = 1) superen el siguiente umbral (k):

- N<80: k=2,5- N>80: k > 3

- Si la variable sigue una distribución normal k=3

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 15: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– PROBLEMAS CON LOS DATOS

II. Valores Atípicos - Outliers

Si es un outlier verdadero o no se puede descartar que no lo sea:

-Algunos autores consideran correcto su eliminación para que los análisis reflejen la tendencia mayoritaria de la población.

- Otros consideran que la eliminación no se debe realizar:

- Suavizar su influencia con transformaciones.

- Utilizar contrastes no paramétricos.

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 16: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– DATOS AUSENTES

http://www.ine.es

Inebase / Sociedad / Educación / Avance de la Enseñanza Universitaria

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 17: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– DATOS AUSENTES

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 18: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– FILTROS

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 19: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– FILTROS

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 20: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– FILTROS

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 21: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– FILTROS

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 22: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– FILTROS

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 23: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– FILTROS

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.

Page 24: TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

TEMA 3: TRATAMIENTO DE DATOS EN MS. EXCEL (I)

– FILTROS

I. Importación y organización de diversas bases de datos en Excel. Variables, Escala de Medición y Problemas con los Datos.