Medidas de tendencia central con casos

63
Medidas de Tendencia Central Oswaldo Quiroz Marín Marín 1

Transcript of Medidas de tendencia central con casos

Page 1: Medidas de tendencia central con casos

Medidas de Tendencia Central

Oswaldo Quiroz Marín Marín

1

Page 2: Medidas de tendencia central con casos

La Estadística Sumaria

2

Después de construir tablas y gráficos, a partir de una colección de datos, se requieren medidas más exactas.

La estadística sumaria o de resumen, proporciona medidas para describir un conjunto de datos.

Existen tres tipos de medidas de resumen:• De tendencia central.• De dispersión.• De la forma de la distribución.

Page 3: Medidas de tendencia central con casos

(A) Las medidas de tendencia central

3

Se refieren al punto medio de una distribuciónSe conocen como medidas de posiciónEjemplo: A partir del gráfico siguiente, se observa que la

posición central de la curva B está a la derecha de la posición central de las curvas A y C. Obsérvese que la posición central de la curva A es la misma que la curva C.

Page 4: Medidas de tendencia central con casos

(B) Las medidas de dispersión

4

Se refieren a la extensión o amplitud de los datos de una distribución

Representan el grado de variabilidad de los datos.Ejemplo: Observe que la curva A en el siguiente gráfico tiene una

mayor dispersión que la curva B, a pesar que la posición central es la misma.

Page 5: Medidas de tendencia central con casos

(C) Las medidas de la forma de la curva

5

Las curvas que representan a un conjunto de datos, pueden ser analizadas de acuerdo a su:

a)Simetría b) Curtosis Las curvas simétricas, tienen una forma tal que con

una línea vertical que pase por el punto más alto de la curva, dividirá el área de esta en dos partes iguales.

Page 6: Medidas de tendencia central con casos

6

Las curvas sesgadas son aquellas cuyos valores están concentrados en el extremo inferior o superior de la escala de medición del eje horizontal. La “cola” indica el tipo de sesgo.

Page 7: Medidas de tendencia central con casos

7

Cuando medimos la curtosis nos referimos al grado de agudeza. Pueden ser: leptocúrtica (concentración al centro) mesocúrtica (distribuidos simétricamente) platicúrtica (aplanada).

Page 8: Medidas de tendencia central con casos

3.3 Las medidas de tendencia central

Oswaldo Quiroz Marín 8

En general se denominan promedios. Los más importantes son la media, la mediana y la

moda.Aritmética

Media GeométricaMedidas de Mediana Armónicatendencia central Moda

También es útil conocer los percentiles (o fráctiles).

Page 9: Medidas de tendencia central con casos

3.3.1 La Media

Oswaldo Quiroz Marín 9

(A) La media aritmética ( )a) Obtención: Se obtiene sumando los valores

registrados y dividiéndolos entre el número de datos.

Ejemplo: La siguiente tabla muestra el número de reclamos y

quejas presentadas por vecinos por la demora en la construcción de carreteras . Calcule e interprete la media.

Día/Semana Lun Mar Mier Jue Vier SabReclamos/día 8 10 5 12 10 15

x

Page 10: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 10

Media aritmética =

= 10 reclamosb) Interpretación: Si elige al azar un día de la semana,

se espera que los clientes de esta tienda realicen 10 reclamos por día.

c) Simbología: Tamaño Media aritmética

Muestra n (equis barra)Población N (mu)

10

60

6

1510125108

x

x

Page 11: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 11

d) Cálculos a partir de datos no agrupados, se utilizan las siguientes formulas.Para una muestra

donde: : media muestral

: suma de todos lo datos

: número de datos

(muestra)

n

n

iix

1

X

para una población

donde: : media poblacional : suma de todos los

datos N : número de datos

(población)

:i

Xx

n

iX

N

N

ii

1X

Page 12: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 12

e) Cálculo a partir de datos agrupados. Se utiliza la formula siguiente

donde: : media muestral : frecuencia absoluta

de la clase i : marca de la clase i

nf

nf

i

i

i

ii

x

1

1X

xif

iX

Page 13: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 13

Ejemplo: La distribución de frecuencias siguiente, representa los puntajes obtenidos en una evaluación del desempeño, aplicado al personal técnico de una empresa. El puntaje máximo en la prueba es 50. Calcule e interprete en media.

Desempeño Número de

(puntos) técnicos

12 - 16 4

17 - 21 8

22 - 26 15

27 - 31 23

32 - 36 10

TOTAL 60

Page 14: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 14

Primero se calcularán las marcas de clase ( ); es decir, el valor intermedio de cada clase

Marca de Frecuencia

clase ( ) absoluta(fi)12 - 16 14 417 - 21 19 822 - 26 24 1527 - 31 29 2332 - 36 34 10

Total 60

14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10)

4+8+15+23+10

iX

ix

x

x x

clase

1575 60 26.25

Page 15: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 15

Interpretación : Si se elige al azar a un técnico, se espera que tenga un puntaje de 26,25 en su evaluación de desempeño.

f) La media aritmética ponderada ( )

donde:

= factor de ponderación

= datos

n

ii

n

iii

w

w

px

1

1

X

px

iw

iX

Page 16: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 16

Ejemplo: Una empresa comercializadora de teléfonos celulares dispone de 3 vendedores, cada uno de los cuales cobra diferente comisión por teléfono vendido, y realiza diferente número de ventas. Calcule e interprete el valor medio de la comisión

Nº de teléfonos ComisiónVendedor vendidos por venta $

Pedro 30 30Juan 25 40Pablo 20 50

iw iX

Page 17: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 17

Interpretación:Si se elige al azar un vendedor se espera que cobre una comisión de $38.67 por teléfono vendido.

67.38$75

2900

202530

)50(20)40(25)30(30

px

Page 18: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 18

g)Ventajas y desventajas de la media aritméticaVentajas: Concepto familiar para muchas personas Es única para cada conjunto de datos Es posible comparar medias de diferentes muestras

Desventajas Se ve afectada por los datos extremos Si la muestra es grande y los datos no están agrupados, su cálculo es tedioso Si los datos están agrupados en clases con extremos abiertos, no es posible calcular la media.

Page 19: Medidas de tendencia central con casos

(B) La media geométrica ( )

Oswaldo Quiroz Marín 19

Se utiliza para calcular tasas medias de variación, como la tasa media de crecimiento poblacional, la tasa media de inflación mensual, la tasa media de mortalidad, entre otros.

a) Obtención Se obtiene extrayendo la raíz enésima del producto de los n valores de una serie.

gx

ng nx XXXX .........

321

Page 20: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 20

Ejemplo:La siguiente tabla muestra la tasa de aumento en las ventas durante los últimos meses. Calcule e interprete la tasa media mensual.

Meses Enero Febrero Marzo Abril MayoAumento de

Ventas2.6% 5.4% 3.8% 0.5% 1.4%

La tasa 2.6% también se puede expresar como 0.026 y, ya que como se refiere a un aumento a partir de 100%, el factor de variación será 1.026. Para los otros datos se opera igual.

Page 21: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 21

Por lo tanto, la media geométrica se calcula:

5 )014.1)(005.1( )038.1( )054.1( )026.1(

)( 0272540,1 medioocrecimientdeFactor

5 143903377.1

= (1,0272540 - 1) x 100 = 2.72%

100)1 ( Tasa mediade variación=

b) Cálculos

n xxxxx g ,......,, 321

gx

gx

gx

gx

Page 22: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 22

c) InterpretaciónSi se selecciona al azar un mes entre enero y mayo, se espera que las ventas se hayan incrementado 2.72% con respecto al mes anterior.

Page 23: Medidas de tendencia central con casos

(C) La media armónica ( )

Oswaldo Quiroz Marín 23

Se utiliza para calcular el tiempo medio, velocidad y aceleración media, como el tiempo medio para realizar un proceso productivo.

a)Obtención: se obtiene calculando el inverso de la media aritmética de los inversos de una serie.

hx

n

n

i i

hx

1X1

1

Page 24: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 24

Ejemplo: Los siguientes datos registran el tiempo que utilizan cuatro clientes al realizar una compra de un artefacto doméstico. Calcule e interprete el tiempo medio.

Cliente A B C DTiempo

(minutos)45 38 52 40

Page 25: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 25

b) Interpretación:Si se selecciona al azar a uno de los cuatro clientes, se espera que realice la compra de un artefacto en 43 minutos aproximadamente.

889202223171023401976

4

401

521

381

451

4

hx

minutos 117953.438249889204

hx

segundos 7 minutos 43hx

Page 26: Medidas de tendencia central con casos

3.3.2 La Mediana

Oswaldo Quiroz Marín 26

Es la medida que divide en dos subconjuntos iguales a datos, de tal manera que 50% de los datos es menor a la mediana y el otro 50% es mayor a la mediana.

a)Obtención: Se obtiene ordenando la serie de datos (en forma ascendente o descendente) y ubicando el dato central.

Page 27: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 27

Ejemplo:Los siguientes datos se refieren al número de clientes atendidos durante los últimos 11 días en una tienda de artefactos. Calcule e interprete la mediana.

12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16

Primero se ordenan lo datos:5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17

5 datos menores 5 datos mayores

mediana

Page 28: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 28

b) Interpretación: Durante 5 días se atendieron a menos de 11 clientes, y durante 5 días se atendieron a más de 11 clientes.

c) Reglas1º Si la serie es impar, la mediana ocupa el lugar

central de la serie previamente ordenada.

Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24

Page 29: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 29

Ejemplo: 8, 10, 14, 18, 23, 24, 32, 34

3º Sea la serie par o impar, la mediana ocupa el lugar , de la serie previamente ordenada.

2

1n

5.202

2318

mediana

2º Si la serie es par, la mediana se obtiene de la semisuma de los dos valores centrales de la serie previamente ordenada.

Page 30: Medidas de tendencia central con casos

donde:: mediana: limite real (o frontera) inferior de la clase medial (o mediana).: número total de datos.: suma de todas las frecuencias hasta, pero sin incluir, la clase mediana.: frecuencia de la clase medial: amplitud de clase

Oswaldo Quiroz Marín 30

d) Cálculo a partir de datos agrupados.

c

Mdf

Fn

Md i

1

21

L

Md

iLnF

Mdfc

Page 31: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 31

Ejemplo: La tabla siguiente muestra la experiencia profesional (años) del personal técnico que labora en una empresa. Calcule e interprete la mediana.

Experiencia Número deprofesional trabajadores

(años) técnicos 0 - 3 4 4 - 7 12

Clase Medial

8 - 11 24

12 - 15 16 16 - 19 10 20 - 23 3

69

Lugar de la mediana:

424

)17(2

169

8

dM

424

17358

Mediana = 11 años

o352

1692

1 n

Page 32: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 32

Interpretación:

La mitad de los profesionales técnicos que laboran en esta empresa tienen una experiencia laboral igual o menor a 11 años. La otra mitad de los profesionales tienen una experiencia laboral igual o menor a 10 años y 6 meses.

Page 33: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 33

e) Ventajas y desventajas de la mediana

Ventajas:Los valores extremos no afectan a la mediana como en el caso de

la media aritmética.Es fácil de calcular, interpretar y entender.Se puede determinar para datos cualitativos.

Desventajas:Como valor central, se debe ordenar primero la serie de datos.Para una serie amplia de datos no agrupados, el proceso de

ordenamiento de los datos demanda tiempo y usualmente provoca equivocaciones.

Page 34: Medidas de tendencia central con casos

3.3.3 La Moda

Oswaldo Quiroz Marín 34

La moda es el valor que más se repite dentro de un conjunto de datos.a) Obtención: se obtiene organizando la serie de datos y seleccionando el o los datos que más se repiten.

4, 5, 7, 8, 8 , 10, 12, 15

4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

7, 12, 15, 18, 25, 30, 31, 38

Ejemplo:

Page 35: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 35

b) Cálculo a partir de datos agrupados

donde:: moda: limite real (o frontera) inferior de la clase modal (la de mayor frecuencia): frecuencia de la clase modal menos la frecuencia de la clase anterior: frecuencia de la clase modal menos la frecuencia de la clase siguiente: amplitud de clase

ci

21

1LoM

oM

iL

1

2

c

Page 36: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 36

La clase medial pueden coincidir pero conceptualmente son diferentes.Ejemplo: La tabla siguiente muestra los errores de facturación durante un mes, en una empresa comercializadora.

Calcule e interprete la moda.Errores defacturación Días

0 - 3 6

4 - 7 12Clase Modal

8 - 11 8

12 - 15 3

16 - 19 1

Total 30

Clase moda : (4 - 7)

Mo = 6.4

61

42 4

466

4 Mo

Interpretación: Durante un mes, el número más frecuente de errores de facturación en esta empresa comercializadora es 6.

Page 37: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 37

e) Ventajas y desventajas de la moda.Ventajas:

Se puede utilizar tanto para datos cualitativos como cuantitativos.No se ve afectada por los valores externosSe puede calcular, a pesar de que existan una o más clases abiertas.

Desventajas:No tiene un uso tan frecuente como la media.Muchas veces no existe moda (distribución amodal).En otros casos la distribución tiene varias modas, lo que dificulta su

interpretación.

Page 38: Medidas de tendencia central con casos

3.3.4 Los Percentiles

Oswaldo Quiroz Marín 38

Son los valores que dividen en 100 partes iguales a un conjunto de datos

a) Cálculo: para datos agrupados.

c

f

n

iK

KP

1F100

K

LP

Page 39: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 39

donde:

: percentil

: el percentil

: número de datos

: frecuencia acumulativa hasta la clase

anterior a la clase donde se ubica el percentil

K

: frecuencia absoluta de la clase donde se ubica

el

percentil K

: amplitud de clase

KP

c

K

n

F

K

fP

Page 40: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 40

Ejemplo:

La tabla muestra la experiencia (en años) de los trabajadores de una gran compañía textil.

Experiencia Trabajadores(años)

0 - 3 18 4 - 7 42

8 - 11 68 12 - 15 120 16 - 19 40 20 - 23 34 24 - 27 12

Total 334

Page 41: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 41

¿Sobre qué edad se ubica el 25% de los trabajadores de mayor experiencia?

Para saber en qué clase se halla este dato, se calculó la frecuencia acumulativa.

Menor

Experiencia

Mayor

Experiencia

75 % 25 %

P75

K = 75

)ordenados números los de( 5.250100

)334(75100K

P delLugar o75 n

Page 42: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 42

Experiencia Nº Trabajadores Frec. Acumulada(años) 0 - 3 18 18 4 - 7 42 60

8 - 11 68 128 12 - 15 120 248 16 - 19 40 28820 - 23 34 32224 - 27 12 334

334

Interpretación: Para que un trabajador esté comprendido en el 25% de mayor experiencia laboral debe tener al menos 16 años, 1 mesesy 24 días.

4

40

1248100

75(334)

1675

P

años 15.16

75P

iFif

En esta clasese ordenan del249º - 288º

F=248

Page 43: Medidas de tendencia central con casos

3.4 Las medidas de dispersión

Oswaldo Quiroz Marín 43

Llamadas también medidas de variabilidadSon útiles porque:Permiten juzgar la confiabilidad de la medida de

tendencia central. Los datos demasiados dispersos tienen un

comportamiento especial.Es posible comparar dispersión de diversas

muestras.

Page 44: Medidas de tendencia central con casos

3.4.1 El rango (R)

Oswaldo Quiroz Marín 44

Llamado también amplitud o alcance.

a) Obtención: se obtiene de la influencia entre el dato mayor y el dato menor más una unidad significativa, a fin de incluir ambos valores extremos.

Page 45: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 45

Ejemplo:

Los siguientes datos representan el peso de 10 niños al nacer, (en kgs). Calcule e interprete el rango.

2,860 3,150 3,450 2,950 3,7804,170 3,920 3,280 4,050 3,120

Rango = (4,170 - 2,860) + 0.001Rango = 1,311 Kgs

Page 46: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 46

b) InterpretaciónLa diferencia entre el bebe de mayor peso y el bebe menor peso es 1,311 Kgs.

c) Cálculo a partir de datos agrupadosSe utiliza la siguiente formula:

donde:R = (Ls - Li ) + 1 : Limite superior de la

última clase : Limite inferior de la primera clase

sL

iL

Page 47: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 47

Ejemplo: La distribución de frecuencias siguiente representa el tiempo que demora un cliente en un banco. Calcule e interprete el rango

Rango = (36-12) + 1

R = 25 minutos

Tiempo Nº de Clientes(minutos) (por día)

12 - 16 4 17 - 21 8 22 - 26 15 27 - 31 23 32 - 36 10Total 60

Interpretación: la diferencia de tiempo entre el cliente que más demora y el que menos demoró es 25 minutos.

Page 48: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 48

f) Ventajas y desventajas del rango

Ventajasfácil de calcularfácil de entender e interpretar

Desventajassólo considera los valores extremosno toma en cuenta ni el número de datos ni el valor de

estosno es posible calcular en tablas con extremos abiertos.

Page 49: Medidas de tendencia central con casos

3.4.2 El rango intercuartil

Oswaldo Quiroz Marín 49

Permite ubicar el 50% de los datos que se encuentran en el centro de la distribución, es decir, el 25% de los datos son menores al primer cuartil y también 25% de los datos son mayores al tercer cuartil.

Page 50: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 50

Ejemplo: La tabla muestra la experiencia (en años) de los trabajadores de una gran compañía textil.

Experiencia (años)

Trabajadores

0 - 3 18 4 - 7 42 8 - 11 68

12 - 15 120 16 - 19 4020 - 23 3424 - 27 12Total 334

A)¿En qué valores se encuentra el 50% intermedio de estos datos?

B)¿Cuál es el rango intercuartílico?

Page 51: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 51

Rango Intercuartílico

50 %25 %

Q3

clase 3ra laen ubica se 5.83100

)334(25PQLugar 251

o

25 %

Q1

4

68

160100

25(334)

5.7Q1

años 82.8Q

1

Page 52: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 52

clase 5ta laen ubica se 5.250100

)334(75PQLugar 753

o

4

40

1248100

75(334)

5.153

Q

A)Es 50% de los trabajadores con experiencia intermedia se encuentran entre 8.82 y 15.65

B) El rango intercuartílico es 6 años 10 meses aproximadamente

años 65.153

Q

Page 53: Medidas de tendencia central con casos

3.4.3 La varianza

Oswaldo Quiroz Marín 53

Es una medida de desviación promedio con respecto a la media aritmética

a) Cálculos a partir de datos no agrupados.

para una muestra

para un población1

1

2

)X(2

n

n

ii

xS

N

N

ii

1

2

)X(2

Page 54: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 54

8 8 - 10 = 2 4

10 10 - 10 = 0 0

5 5 - 10 = 5 25

12 12 - 10 = 2 4

10 10 - 10 = 0 0

15 15 - 10 = 5 25

Ejemplo:

La siguiente información se refiere al número de artículos vendidos durante una semana.

Calcule la varianza. 8, 10, 5, 12, 10, 15

Elaboramos un cuadro de la forma siguiente

x X xi 2X xi

60X 0X xi

10

6

60

x

x

58X 2xi

Page 55: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 55

58X 2xi

1

)(X2

2

n

iS

x

6.1116

582

S

Page 56: Medidas de tendencia central con casos

3.4.4 La desviación estándar

Oswaldo Quiroz Marín 56

Es la raíz cuadrada de la varianza, sea poblacional o muestral.a) Cálculos a partir de datos no agrupados

para la muestra

para la población

1

)X(S 1

2

2

s

n

n

i

xi

N

N

ii

1

2

2)X(

Page 57: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 57

Ejemplo:

La siguiente información se refiere al número de artículos vendidos durante una semana. Calcule la desviación estándar.

8, 10, 5, 12, 10, 15

Ya sabemos por el ejemplo anterior que S2 = 11.6 Entonces

s2

S

articulos 3,4 S

6,11S

Page 58: Medidas de tendencia central con casos

3.4.5 El coeficiente de variación

Oswaldo Quiroz Marín 58

Es una medida relativa de variabilidad de los datos, permite comparar la variabilidad de dos o más conjuntos de datos expresados en unidades diferentes (peso; kgs y libras).

a) Calcular a partir de datos no agrupados

para la muestra:

para la población: 100xs

CV

100

CV

Page 59: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 59

Ejemplo:

A continuación se presentan las ventas (en unidades monetarias) logradas durante una semana por dos tiendas de artículos electrodomésticas. La tienda I vende en soles y la tienda II en dólares ¿Cuál de ellos tiene un desempeño más estable, en cuanto a nivel de ventas?.

Tienda I (soles) Tienda II (dólares)40,70,60,48,52,65,58 70,35,150,140,82,110,140,120

Calculamos la media y desviación estándar por cada una de las tiendas

Page 60: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 60

Tienda I

40 -16.14 260.50

70 13.86 192.10

60 3.86 14.90

48 -8.14 66.26

52 -4.14 17.14

65 8.86 78.50

58 1.86 3.46

x X xi 2X xi

14.567

393X1

ni

n

ix

393X 0X xi 86,632X 2xi

Page 61: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 61

86.632X Si 2xi

27.101786.632

1

)X(S 1

2

n

n

ixi

100S

x

CV

29.1810056.1410.27 CV

Page 62: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 62

Tienda II

70 -35.87 1286.6569

35 -70.87 5022.5569

150 44.13 1947.4569

140 34.13 1164.8569

82 -23.87 569.7769

110 4.13 17.0569

140 34.13 1164.8569

120 14.13 199.6569

x X xi 2X xi

87.1058

8471X

n

i

n

ix

847X 04,0X xi 88,11372X 2xi

Page 63: Medidas de tendencia central con casos

Oswaldo Quiroz Marín 63

88.11372X Si1

2

n

i i x

30.401888,11372

1

XS 1

2)(

n

n

ixi

100S

x

CV 06,30100105,8740,30 CV

La tienda II presenta una mayor variabilidad en el volúmen de ventas.