Post on 11-Jan-2015
1
Capítulo 4Otras medidas descriptivas Objetivos: Al terminar este capítulo podrá:
1. Calcular e interpretar la amplitud, la desviación media, la varianza y la desviación estándar de datos no agrupados.
2. Calcular e interpretar la amplitud de variación, la varianza y la desviación estándar de datos agrupados.
3. Explicar las características, usos, ventajas y desventajas de cada medida.
2
Capítulo 4 (Continuación)
4. Entender el teorema de Chebyshev y la regla normal o empírica, con relación a un conjunto de observaciones.
5. Calcular e interpretar los cuartiles y la amplitud cuartílica o intercuartílica.
6. Elaborar e interpretar los diagramas de caja.
7. Calcular y entender el coeficiente de asimetría y el coeficiente de variación.
3
Amplitud de variación
La amplitud de variación es la diferencia entre el valor más grande y el valor más pequeño.
Sólo dos valores son utilizados en su cálculo. Está influido por un valor extremo. Es fácil calcularlo y entenderlo.
4
Desviación media La desviación media (MD) es el promedio aritmético de
los valores absolutos de las desviaciones con respecto a la media aritmética.
Todos los valores son utilizados en el cálculo. No está influido excesivamente por valores muy grandes
o valores muy pequeños. Los valores absolutos son difíciles de manipular.
5
Desviación media
La fórmula para la desviación media es:
n
XXMD
6
Ejemplo 1
Los pesos de una muestra de canastas conteniendo libros para una librería (en libras) son:
103, 97, 101, 106, 103
Encuentre la amplitud y la desviación media.
Amplitud = 106 – 97 = 9
7
Ejemplo 1 (Continuación)
El primer paso es encontrar la media:
La desviación media es:
1025
510
n
XX
4.25
541515
102103...102103
n
XXMD
8
Varianza de la población
La varianza de la población es la media aritmética de las desviaciones al cuadrado de la media poblacional.
Todos los valores son utilizados en el cálculo. No está influido por valores extremos. Las unidades están desproporcionadas, son los
cuadrados de la unidad original.
9
Varianza
La fórmula para la varianza poblacional es:
La fórmula para la varianza muestral es:
NX 2
2 )(
1)( 2
2
nXX
s
10
Ejemplo 2
Las edades de la familia González son:
2, 18, 34, 42
¿Cuál es la varianza poblacional?
244
96
n
X
2364
9444
2442...242)( 2222
N
X
11
La desviación estándar poblacional
La desviación estándar poblacional ( ) es la raíz cuadrada de la varianza poblacional.
Para el Ejemplo 2, la desviación estándar es 15.36, calculada así:
36.152362
12
Ejemplo 3
Los ingresos ganados por hora en una muestra de cinco estudiantes son:
$7, $5, $11, $8, $6.
Encuentre la varianza.
40.75
37
n
XX
30.515
2.2115
4.76...4.77
1
2222
n
XXs
13
Desviación estándar muestral
La desviación estándar muestral es la raíz cuadrada de la varianza muestral.
En el Ejemplo 3, la desviación estándar muestral es 2.30
30.229.52 ss
14
Varianza muestral para datos agrupados
La fórmula para la varianza muestral para datos agrupados es:
donde f es la frecuencia de clase y X es la marca de clase.
1
)( 22
2
n
n
fXfX
s
15
Interpretación y usos de la desviación estándar
Teorema de Chebyshev: Para un conjunto cualquiera de observaciones, la proporción mínima de los valores que se encuentran dentro de k desviaciones estándar desde la media es por lo menos.
2
11k
donde k2 es una constante mayor que 1.
16
Interpretación y usos de la desviación estándar
Regla empírica: En una distribución de frecuencias simétrica, con forma de campana:
Aproximadamente 68% de las observaciones estarán entre más una y menos una s desde la media;
Aproximadamente 95% de las observaciones se encontrarán entre más dos y menos dos s desde la media;
Prácticamente todas las observaciones se hallarán entre más tres y menos tres s a partir del valor medio.
17
µ µ +1s µ+2s µ+3sµ-1sµ-2sµ-3s
18
Dispersión relativa
El coeficiente de variación es la razón (cociente) de la desviación estándar y la media aritmética, expresada como un porcentaje.
CVs
X (100%)
19
Coeficiente de asimetría
La asimetría es la medida de la carencia de simetría en una distribución.
El coeficiente de asimetría puede variar desde -3 hasta 3. Un valor cero indica una distribución simétrica. Es calculado como sigue: CA = 3(Media – Mediana)/s
20
Rango intercuartílico
El rango intercuartílico es la distancia entre el tercer cuartil Q3 y el primer cuartil Q1.
Esta distancia incluirá la mitad de las observaciones.
Rango intercuartílico = Q3 – Q1
21
Ejemplo 5
Para un conjunto de observaciones el tercer cuartil es 24 y el primer cuartil es 10.
¿Cuál es la desviación intercuartílica?
El rango intercuartílico es 24 – 10 = 14. 50% de las observaciones ocurrirán entre 10 y 24.
22
Diagrama de caja y bigotes
Una gráfica de caja y bigotes es una gráfica basada en cuartiles, que ayudan a retratar un conjunto de datos.
Cinco tipos de datos son necesarios para construir una gráfica de caja y bigotes: el valor mínimo, el primer cuartil, la mediana, el tercer cuartil, y el valor máximo.
23
Ejemplo 6
Basado en una muestra de 20 pedidos entregados, Pizza Hot registró la siguiente información. El tiempo mínimo de entrega fue 13 minutos, y el máximo, 30 minutos. El primer cuartil fue 15 minutos, la mediana 18 minutos, y el tercer cuartil 22 minutos. Elabore un diagrama de caja y bigotes para los tiempos de entrega.
24
Ejemplo 6 (Continuación)
mín
Q1 Q2 Q3
máx
12 14 16 18 3020 22 24 26 28