ESTADISTICAPARA LA INVESTIGACIÓN
PSICOPEDAGÓGICA IIJosé Luis Morón
Octubre - 2011Sesión 1
Programa Académico de Maestría en Educación para Docentes de la Región Callao
Diapositiva 2
IntroducciónIntroducción
Análisis descriptivo e inferencial y en el cual se proporciona una serie de procedimientos para evaluar estadísticamente la conformidad de la información empírica
1-2
Diapositiva 3
CompetenciaCompetenciaConoce y usa procedimientos estadísticos para la realización de pruebas estadísticas paramétricas y no paramétricas y análisis multivariados.
Gestiona con SPSS información, contrastada y establece conclusiones en base al análisis de los datos
1-2
Diapositiva 4
Definición de EstadísticaDefinición de Estadística
• Estadística es la ciencia de recolectar, organizar, presentar, analizar e interpretar datos con el propósito de ayudar a una toma de decisiones más efectiva.
1-2
Diapositiva 5
Estadística DescriptivaEstadística Descriptiva
• Estadística Descriptiva: Conjunto de métodos y procedimientos gráficos y numéricos que organizan, resumen y presentan datos
• Es usada para transformar datos en información.
Diapositiva 6
Estadística DescriptivaEstadística Descriptiva• Recolectar Datos
– Instrumentos, Encuestas
• Presentar Datos– Tablas y Gráficos
• Resumir Datos– Media muestral
iX
n
Diapositiva 7
Estadística InferencialEstadística Inferencial
• Estadística Inferencial: Conjunto de métodos utilizados para saber “algo” acerca de una población basándose en una muestra.
• Es usada para transformar información en conocimiento.
Diapositiva 8
Estadística InferencialEstadística Inferencial• Estimación
– Estimar el peso promedio de la población usando el peso promedio de la muestra.
• Prueba de Hipótesis– Probar que el peso promedio
de la población es 65 kg.
Extraer conclusiones y/o tomar decisiones concernientes a una población basándose en
los resultados de una muestra.
Diapositiva 9
Población y MuestraPoblación y Muestra
Población
• TODOS los posibles•Individuos, objetos, mediciones y conteos
• Un PARÁMETRO describe a una Población.
Muestra
• PARTE “representativa” de la Población.• Un ESTADÍSTICO describe a una Muestra.
VariableVariable
1-7
X=edadNúmeros
Se pueden definir muchas variables
Diapositiva 11
Resumen de Resumen de Tipos de VariablesTipos de Variables
1-11
Cualitativos o de atributos
Discretos(Conteo)
Continuos(Medición)
Cuantitativos o numéricos
DATOS
1-11
CualitativasSi se expresan con las
escalas nominal u ordinal
CuantitativasSi se expresan con las
escalas intervalar y de razón
Tipos de variables
Tipo de variable
Diapositiva 13
Distribución en CategoríasDistribución en Categorías• Mutuamente excluyente: un individuo,
objeto o artículo, al ser incluido en una categoría, debe excluirse de las demás.
• Completamente incluyente: cada individuo, objeto o artículo debe clasificarse en al menos una categoría.
1-14
Diapositiva 14
Ordenamiento de DatosOrdenamiento de Datos
Datos Numéricos
Arreglo de Datos
Distribución de FrecuenciasDistribución Acumulada
Histograma
Polígono
Ojiva
Tablas
Diapositiva 15
Distribución de FrecuenciasDistribución de Frecuencias• Ordenamiento de los datos en clases.• Indica el número de observaciones (datos)
que caen en cada clase.• Clase
– Grupo de valores que describe una característica de los datos.
• Tipos de Clases– Cualitativas – Cuantitativas
• Discretas• Continuas
Diapositiva 16
Pasos para construir una Distribución de Frecuencias
• 1. Calcule el alcance o rango – (Dato mayor - Dato menor).
• 2. Determine el número de clases.– Usualmente entre 6 y 15. (Ley Sturges)
• 3. Calcule el intervalo de clase.– Divida el alcance entre el número de clases
• 4. Determine los límites de cada clase.– Límite Superior y Límite Inferior
• 6. Asigne las observaciones a cada clase y efectúe el conteo.
Diapositiva 17
Frec. RelativaClase Frecuencia Frec. Relativa Acumulada 48.8-49.2 2 0.07 0.0749.3-49.7 5 0.16 0.2349.8-50.2 11 0.37 0.6050.3-50.7 6 0.20 0.8050.8-51.2 3 0.10 0.9051.3-51.7 3 0.10 1.00
30 1.00
Distribución de FrecuenciasDistribución de Frecuencias
Distribuciónde
FrecuenciasRelativas
Acumuladas
Organización de los datosOrganización de los datos
Variable
Tablas de frecuencias
Discreta
Gráficos
Continua
Tablas de frecuencias
Gráfico de barras
Barras
Sectores Circulares
Tabla de frecuencias por intervalos de clase
Histogramas
Cualitativa
Cuantitativa
Diapositiva 19
Ordenamiento de DatosOrdenamiento de Datos
Datos Numéricos
Arreglo de Datos
Distribución de FrecuenciasDistribución Acumulada
Histograma
Polígono
Ojiva
Tablas
Diapositiva 20
HistogramaHistograma
0
2
4
6
8
10
48.8 49.3 49.8 50.3 50.8 51.3 49.2 49.7 50.2 50.7 51.2 51.7
Clase Frecuencia
12
Fre
cuen
cia
48.8-49.2 249.3-49.7 549.8-50.2 1150.3-50.7 650.8-51.2 351.3-51.7 3
Diapositiva 21
Polígono de FrecuenciasPolígono de Frecuencias
48.5 49.0 49.5 50.0 50.5 51.0 51.5 52.0
Clase Marca Frecuencia
Fre
cuen
cia
0
2
4
6
8
10
1248.8-49.2 49.0 249.3-49.7 49.5 549.8-50.2 50.0 1150.3-50.7 50.5 650.8-51.2 51.0 351.3-51.7 51.5 3
Diapositiva 22
OjivaOjiva
Clase Frec. Menor Frec. Abs. que Acum.
Fre
cuen
cia
Acu
mu
lad
a R
elat
iva
0 48.8 49.3 49.8 50.3 50.8 51.3 51.8
3027
24
18
7
2
48.8-49.2 2 48.8 049.3-49.7 5 49.3 249.8-50.2 11 49.8 7 50.3-50.7 6 50.3 1850.8-51.2 3 50.8 2451.3-51.7 3 51.3 27
51.8 30
Diapositiva 23
68
1255578899
1145566677778999
000122345678999
11667
12
1
2
3
4
5
6
Diagrama de Tallo y Hoja
Diapositiva 24
Características de los DatosCaracterísticas de los Datos
1-2
Resúmenesnuméricos
Medidas de Tendencia central
Medidas de Simetría y apuntamiento
Medidas dedispersión
Moda
Mediana
Media
Rango Varianza, desv.Estándar,Rango intercuartil
Indice de simetría
Diapositiva 26
Características Características de los Datosde los Datos
Tendencia Central Tendencia Central (Posición)(Posición)
DispersiónDispersión(Variación)(Variación)
SesgoSesgo
Diapositiva 27
Tendencia Central
MediaAritmética
Mediana ModaMediaPonderada
MediaGeométrica
Diapositiva 28
Media de una Muestra• Para datos no agrupados, la media de
una muestra es la suma de todos los valores divididos entre el número total de los mismos:
– donde denota la media muestral– n es el número total de valores en la
muestra.
3-4
nxx /
x
Diapositiva 29
Propiedades de la Propiedades de la Media AritméticaMedia Aritmética
• Todo conjunto de datos tiene un valor medio.• Al evaluar la media se incluyen todos los
valores.• Un conjunto de valores sólo tiene una media.
• Desventaja– Es afectada por los valores extremos.
3-6
Diapositiva 30
Media AritméticaMedia Aritmética
• Es la medida más común de tendencia central.
• Es afectada por valores extremos.
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Media = 5 Media = 6
Diapositiva 31
MedianaMediana
• Mediana: es el punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor. La misma cantidad de valores se encuentra por arriba de la mediana que por debajo de ella.
• Nota: para un conjunto con un número par de números, la mediana será el promedio aritmético de los dos números medios.
3-10
Diapositiva 32
MedianaMediana
• No es afectada por los valores extremos.
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Mediana = 5 Mediana = 5
21nMediana
Diapositiva 33
Propiedades de la mediana
• La mediana es única para cada conjunto de datos.
• No se ve afectada por valores muy grandes o muy pequeños.
3-12
Diapositiva 34
Moda
• Valor que ocurre más a menudo.
• No es afectada por valores extremos.
• Puede no existir una moda.
• Pueden haber varias modas.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Moda = 9
0 1 2 3 4 5 6
Sin Moda
Diapositiva 35
Medidas de DispersiónMedidas de Dispersión
1-2
Diapositiva 36
Dispersión
Varianza Desviación Estándar Coeficiente de Variación
Varianza dela Población
Varianza de la Muestra
Desviación Estándar de la Población
Alcance
Alcance Intercuartil
Desviación Estándar de la Muestra
Diapositiva 37
Alcance o Rango
Diapositiva 38
Alcance
• Diferencia entre la mayor y la menor de las observacionesAlcance = xmayor – xmenor
• No toma en cuenta la forma en que están distribuidos los datos.
7 8 9 10 11 12
Alcance: 12 - 7 = 5
7 8 9 10 11 12
Alcance: 12 - 7 = 5
Diapositiva 39
Cuartiles
• Los datos se ordenan de menor a mayor.
• El alcance intercuartil es la distancia entre el tercer cuartil Q3 y el primer cuartil Q1.
25% 25% 25% 25%
1Q 2Q 3QObservación
MenorObservación
Mayor
Diapositiva 40
Desviación de la Media
Diapositiva 41
Promedio de desviación de cada dato
0 1 2 3 4 5
-1
-2
1
2
0)( x
Diapositiva 42
• Desviación cuadrática promedio con relación a la media de la Población
Varianza de la Población
Nx 2
2 )(
22
2 Nx
Diapositiva 43
• Raíz Cuadrada de la Varianza de la Población
Desviación Estándarde la Población
22
2 Nx
Nx 2
2 )(
Diapositiva 44
• Desviación cuadrática promedio (n-1) con relación a la media de la Muestra
Varianza de la Muestra
1)( 2
2
nxx
s
11
222
nxn
nx
s
Diapositiva 45
• Raíz Cuadrada de la Varianza de la Muestra
Desviación Estándarde la Muestra
1)( 2
2
nxx
ss
11
222
nxn
nx
ss
Diapositiva 46
Varianza de la PoblaciónDatos Agrupados
Nxf 2
2 )(
22
2 Nfx
clase de marcax
Diapositiva 47
Desviación Estándarde la Población
Datos Agrupados
22
2 Nfx
Nxf 2
2 )(
clase de marcax
Diapositiva 48
Varianza de la MuestraDatos agrupados
1)( 2
2
nxxf
s
11
222
nxn
nfx
s
clase de marcax
Diapositiva 49
Desviación Estándarde la Muestra
Datos Agrupados
1)( 2
2
nxxf
ss
11
222
nxn
nfx
ss
clase de marcax
Diapositiva 50
Comparación de Desviaciones Estándar
Media = 15.5
s = 3.338 11 12 13 14 15 16 17 18 19 20 21
11 12 13 14 15 16 17 18 19 20 21
Datos B
Datos A
Media = 15.5
s = .9258
11 12 13 14 15 16 17 18 19 20 21
Media = 15.5
s = 4.57
Datos C
Diapositiva 51
Interpretación y usos de la Desviación Estándar
• Teorema de Chebyshev: para cualquier conjunto de observaciones, la proporción mínima de valores que está dentro de k desviaciones estándar desde la media es al menos 1 - 1/k2 , donde k es una constante mayor que 1.
4-14
Diapositiva 52
Interpretación y usos de la Desviación Estándar
• Regla empírica: para una distribución de frecuencias simétrica de campana:– Cerca de 68% de las observaciones estará dentro
de ±1σ de la media (μ); – Cerca de 95% de las observaciones estará dentro
de ±2σ de la media (μ); – Casi todas (alrededor de 99.7%) las observaciones
estarán dentro de ±3σ de la media (μ).
4-15
Diapositiva 53
Curva de Distribución Normal
-3σ -2σ -1σ +1σ +2σ +3σμ
Diapositiva 54
-3σ -2 σ -1σ +1σ +2σ +3σμ
34.13%34.13%
13.60%13.60%
2.135%2.135%
0.135%0.135%
68.26%
95.46%
99.73%
Diapositiva 55
-3σ -2σ -1σ +1σ +2σ +3σμ
xRe
Resultado Estándar
Diapositiva 56
-3σ -2σ -1σ +1σ +2σ +3σμ
120
10080Re
Re?¿
160
20
100
x
Re?¿
80
20
100
x
320
100160Re
100 16080
Diapositiva 57
Dispersión Relativa
• El coeficiente de variación es la razón de la desviación estándar a la media aritmética, expresada como porcentaje:
%)100(xs
CV
4-17
Como medida de curtosis se usa el coeficiente de curtosis, que indica la forma de la distribución de los datos con respecto a una distribución normal. Un valor cero indica que la curva es mesocúrtica (curva normal), si es positivo indica que la curva es leptocúrtica (apuntada) y si es negativo platocúrtica (achatada).
Medida de Curtosis
El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución.Se definen 3 tipos de distribuciones según su grado de curtosis:Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable.Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.
Sesión 4
Medida de Curtosis
Medidas de forma: Medidas de forma: CurtosisCurtosis
Leptocúrtica
Mesocúrtica
Platicúrtica
El Coeficiente de Curtosis arroja los siguientes resultados:
og2 = 0 (distribución mesocúrtica). og2 > 0 (distribución leptocúrtica).og2 < 0 (distribución platicúrtica).
Sesión 4
Medida de Curtosis
Ejemplo de Dispersión Relativa
2
10x
Aón Distribuci
s 5
100x
Bón Distribuci
s
¿Cuál de las dos tiene menor dispersión?
%20100102
Aón Distribuci
CV %5100100
5
Bón Distribuci
CV
La distribución B tiene menor dispersión
Ejemplo de Dispersión Relativa
El concepto de asimetría se refiere a si la curva que forman los valores de la serie presenta la misma forma a izquierda y derecha de un valor central (media aritmética)
Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de Fisher.Los resultados pueden ser los siguientes:g1 = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media) g1 > 0 (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su izquierda)g1 < 0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha)
Medidas de Asimetría
Sesgo de una distribuciónSesgo de una distribución
Media = Mediana = Moda Media < Mediana < Moda Moda < Mediana < Media
Positivamente SesgadaSimétricaNegativamente
Sesgada