MEDIDAS DE DISPERSION Lic. Oscar Noé López Cordón.

Post on 21-Feb-2015

31 views 8 download

Transcript of MEDIDAS DE DISPERSION Lic. Oscar Noé López Cordón.

MEDIDAS DE DISPERSION

Lic. Oscar Noé López Cordón

DefiniciónEs el grado en el que los valores se

sitúan alrededor de una medida de tendencia central. Es importante mencionar que: Concentración y dispersión son dos aspectos del mismo fenómeno.

 A B C15 13 115 20 115 12 4345 45 45

X1 = 15 X2 = 15 X3 = 15

X1 = No Hay dispersión. Representa mejor la XX2 = Hay dispersiónX3 = Hay dispersión. Tiene mayor dispersión

“A MAYOR DISPERSIÓN MENOR CONFIABILIDAD DE LA MEDIDA DE TENDENCIA CENTRAL".

Ejemplo Numérico

Tipos de Medidas de Dispersión:

ABSOLUTAS:Son las que están expresadas en la misma unidad de medida de la variable. Se estudiarán:1.)             Rango o Recorrido de Variación2.)             Desviación Media3.)             Varianza4.)             Desviación Estándar RELATIVAS:Son las que están expresadas en porcentajes. Se estudiará únicamente:El Coeficiente de Variación.

RECORRIDO, RANGO, OSCILACIÓN O CAMPO DE VARIACIÓN: (Símbolo “R”)

Es igual al valor máximo menos el valor mínimo mas uno. También se dice que es desde donde empiezan los datos hasta donde terminan.

R = Valor Máximo - Valor Mínimo + 1

Del Ejemplo numérico anterior:A = (15 - 15) + 1 = 1 Menor DispersiónB = (20 - 12) + 1 = 9 C = (43 - 1 ) + 1 = 43 Mayor Dispersión.

PARA DATOS AGRUPADOS: Valor Máx (76) (-) Valor Mín (35) más (+) uno (1) = 42

 "DEBIDO A QUE EL RECORRIDO NO TOMA EN CUENTA A TODOS LOS VALORES, SI NO SOLO LOS EXTREMOS DEBEN USARSE OTRAS MEDIDAS.“

DESVIACIÓN ABSOLUTA MEDIA O DESVIACIÓN MEDIA (Símbolo DM)

 Es la media aritmética de las diferencias tomadas en su valor absoluto de cada uno de los valores con respecto a su media aritmética.

 Propiedades:Cuando es una distribución normal, es simétrica o forma una

Campana de Gauss  X ± DM = Agrupa aproximadamente el 58% de los casos.

 Fórmulas: a. Datos sin agrupar: DM = / x - X /

N b. Datos Agrupados: DM = ƒ / x - X / NDonde: / / = Valor absoluto de las desviaciones de la

variable con respecto a la Media o bien no tomar en cuenta el signo.

Ejemplo Serie Simple:

B x - X 13 2 ( 13 - 15) 20 5 ( 20 - 15)12 3 ( 12 - 15)45 10

X = 45 = 15 3

DM = / x - X / = 10 = 3.33N 3

 C x - X 1 14 1 1443 28 45 56 DM = 56 = 18.67 Tiene Mayor Dispersión

3

CALCULO DE LA DM, Serie Agrupada en Clases

DM = ƒ / x - X / = 337.80 = 7.34 Miles Q. N 46INTERPRETACION: Los valores (ISR Pagado) se desvían de su media aritmética en 7.34 como promedio considerando las diferencias en valores absolutos.

Clases f x fx /x-X/ f/x-X/

35 - 40 4 37.5 150 17.35 69.40

41 - 46 5 43.5 217.5 11.35 56.75

47 - 52 8 49.5 396 5.35 42.80

53 - 58 14 55.5 777 0.65 9.10

59 - 64 8 61.5 492 6.65 53.20

65 - 70 4 67.5 270 12.65 50.60

71 - 76 3 73.5 220.5 18.65 55.95

xxxxxxxxx N = 46 xxxx 2523 337.80

VARIANZA O VARIANCIA: (S²)Es una medida estadística que mide el grado de dispersión y se

define como la media aritmética de las desviaciones o diferencias cuadráticas de los valores con su respeto a su media aritmética.

  Fórmulas:Datos sin Agrupar S² = ( x - X ) ² NEjemplo Serie Simple:

B ( x - X ) ( x - X ) ² C ( x - X ) ( x - X ) ² 13 -2 4 1 -14

19620 5 25 1 -14 19612 -3 9 43 28 78445 0 38 45 0

1176   S² = 38 = 12.67 S² = 1176 = 392

3 3

Datos Agrupados S² = ƒ ( x - X ) ² N CALCULO DE VARIANZA:

S² = ƒ ( x - X ) ² = 4120.32 = 89.57 N 46INTERPRETACIÓN: El ISR pagado promedio de las diferencias cuadráticas de los

valores respecto a la media aritmética es igual a 89.57 miles de quetzales al cuadrado.

Clases f x fx (x – X) (x – X) ² f(x – X) ²35 - 40 4 37.5 150 -17.35 301.02 1204.08

41 - 46 5 43.5 217.5 -11.35 128.82 644.10

47 - 52 8 49.5 396 -5.35 28.62 228.96

53 - 58 14 55.5 777 0.65 0.42 5.88

59 - 64 8 61.5 492 6.65 44.22 353.76

65 - 70 4 67.5 270 12.65 160.02 640.08

71 - 76 3 73.5 220.5 18.65 347.82 1043.46

xxxxxxxxx N = 46 xxxx 2523 xxxx 4120.32

DESVIACIÓN ESTÁNDAR Ó TÍPICA: (S)Es la raíz cuadrada de la varianza. a.  Datos sin Agrupar:   S = ( x - X ) ² N

b. Datos Agrupados: S = ƒ ( x - X ) ²

NO bien = S = S ²

CALCULO DE LA =DESVIACION ESTANDARD O DESVIACION TIPICA: Usamos el cálculo de la Varianza

S = 4120.32 = 89.57 = 9.46 46

INTERPRETACIÓN: El el valor del ISR pagado de los contribuyentes se desvía de su Media Aritmética en Q 9.46 Miles como promedio.

 

 

Características de la Desviación Estándar:

1.) Es siempre mayor o igual a cero.

2.) Cuando la distribución es normal, es decir que se forma la campana de GAUSS, entonces:

X ± S = Agrupa aprox. al 68.26% de los casos.

X ± 2S = Agrupa aprox. al 95.46% de los casos.

X ± 3S = Agrupa aprox. al 99.72% de los casos.

 3.) El Recorrido de la distribución es igual a 6 desviaciones estándar: Recorrido = 6S

4.) Cuando a cada valor de los datos originales se le aumenta o disminuye un valor constante la "S" no cambia.

 5.) Cuando a cada valor de los datos originales se multiplica por un valor constante la "S" cambia quedando multiplicada por la constante.

 

La Desviación Típica y la Desviación Media en una Distribución Normal:

Para distribuciones en forma de campana, la DM es aproximadamente el 80% de la "S" ( 79.79 %) en el caso de la curva normal.  PREGUNTAS:1.) Encontrar el intervalo o los valores que están comprendidos el 68.26% central del ISR pagado por las empresas: X ± S Agrupa aproximadamente al 68.26% de los casos. 54.85 - 9.46 = 45.39 54.85 + 9.46 = 64.31 RESPUESTA: El 68.26% central del ISR pagado por las empresas está comprendido entre Q 45.39 y Q 64.31.

2.)Al analizar una distribución de frecuencias sobre el ISR pagado por las empresas se encontró que el 68.26% de los casos está comprendido entre Q 45.39 y Q 64.31. Encontrar el promedio del ISR pagado:45.39 + 64.31 = 54.85 R/ 2

3.) Conociendo el ISR promedio (X = 54.85) y que el ISR Límite inferior Li = 45.39 del intervalo donde aproximadamente se encuentra el 68.26% de los datos. Encontrar la Desviación Estandar del ISR pagado por las empresas.

  X +- S = 68.26%

Datos: X = 54.85 y Li = 45.39 54.85 - S = 45.39

  54.85 - 45.39 = S S = 9.46

 4.) La información estadística es la siguiente: S = Q 9.46 y límite superior 64.31 del intervalo donde aproximadamente se encuentra el 68.26% de los casos. Calcular la Media Aritmética (X):

X +, - S = 68.26% Ls = 64.31 S = 9.46 X + 9.46 = 64.31X = 64.31 - 9.46 = X = 54.85

5.) Cual es la desviación promedio del ISR pagado.   DM = 7.34 6.) Encontrar la medida estadística que sumándole o

restándole la X en una distribución normal queda aproximadamente el 58% de los casos.

  RESPUESTA: D.M. 7.) Encontrar los limites del intervalo en los cuales está

agrupado aproximadamente el 58% del ISR pagado por las empresas.

X +- D.M. = 58% 54.85 - 7.34 = 47.51 Li 54.85 + 7.34 = 62.19 Ls

DISPERSION RELATIVA 

EL COEFICIENTE DE VARIACIÓN (CV):  Es una medida de dispersión relativa que representa en % las distancias entre la X y los valores de la variable. Es el % de dispersión de los valores con respecto a su X. El CV mide la dispersión en términos relativos, si el resultado se multiplica * 100 se expresa en %. Es útil para comparar la dispersión de grupos distintos. Sirve para comparar distancias de frecuencias que tiene diferentes unidades de medida. Fórmula: C.V. = S * 100 X

Ejemplo #1:Una empresa tiene X de ventas mensuales de Q.200.00 y S = 50Otra empresa tiene X de ventas mensuales de Q.500.00 y S = 50Cual de las 2 empresas tiene menor dispersión relativa?  “A” = C.V. = S * 100 = 50 * 100 = 25%. X 200  “B” = C.V. = S * 100 = 50 * 100 = 10% X 500Respuesta: La empresa “B"

Ejemplo #2: Un fabricante de bombillas tiene 2 tipos de bombillas: Bombilla “A” Bombilla “B” Xa = 1,495 horas Xb = 1,875 horas S = 280 horas S = 310 horas  1. Cuál de los dos tipos de bombilla tiene la mayor dispersión absoluta?  La “A”  2.       Cual de los dos tipos de bombilla tiene la mayor dispersión relativa.  CVa = 280 * 100 = 18.73% CVb = 310 * 100 = 16.63% 1495 1875 Respuesta: La “A” = 18.73 y de comprar se compraría la “B”.

CALCULAR EL COEFICIENTE DE VARIACIÓN DE LA DIST.

CV = 9.46 x 100 = 17.24%54.85

ASIMETRIA O SESGO

Lic. Oscar Noé López Cordón

DEFINICION Muestra la dirección de los datos, ya sea asimetría

negativa, positiva ó bien Simétrica. Cuando una distribución no es simétrica alrededor del valor de la Media (X), se dice que es Asimétrica. Si la distribución de frecuencias tiene una larga cola a la derecha de su concentración (Moda = Mo) se dice que es Asimétrica Positiva. Por el contrario si la cola esta ubicada a la izquierda del punto de concentración, decimos que es Asimétrica Negativa.

Para determinar la clase de asimetría que tiene una distribución, existen varios coeficientes. Utilizaremos el Coeficiente de Sesgo o Coeficiente de Asimetría (b1). Existen tres formas de calcular dicho Sesgo o Asimetría. Si el resultado es cero (0) la distribución es Simétrica y luego dependiendo del signo puede ser: Asimetría Positiva o Negativa.

FORMULAS:

PRIMER COEFICIENTE DE PEARSON:

  b1 = X - Mo S

SEGUNDO COEFICIENTE DE PEARSON:

  b1 = 3 (X - Md) S

TERCER COEFICIENTE EN BASE AL MOMENTO CENTRAL DE TERCER ORDEN:

b1 = M³ S³

Donde: M³ = ƒ( x - X )³ N

Momentos: El primer MomentoEl primer momento es igual a cero (0). Recordar propiedad de la Media (X ): (x - X ) = 0  ƒ( x - X ) = 0 NEl segundo MomentoEs igual a la Varianza (M² = S²)

S² = ƒ (x - X) ² N

CALCULO DE LOS COEFICIENTES DE ASIMETRIA DATOS: X = 54.85 Mo = 55.50Md = 55.07S = 9.46  Primer Coeficiente de Pearson:

  b1 = X – Mo b1 = 54.85 - 55.50 = -0.069 S 9.46  b1 = ( -) => b1 < 0  La Distribución es Asimétrica Negativa.  Segundo Coeficiente de Pearson:

b1 = 3( X - Md ) b1 = 3(54.85 - 55.07) = -0.070 S 9.46  IGUAL AL COEFICIENTE ANTERIOR

Momento General de Tercer Orden: b1 = M³ = S³

  ƒ(x-X)³ 487.51O bien: b1 = ___N_____ = 46 = 10.60 = 0.0125

S³ (9.46) ³ 846.59

 INTERPRETACION: Por ser el Coeficiente de Asimetría mayor que cero la distribución tiene Asimetría positiva

Clases f x fx (x – X) (x – X) ³ f(x – X) ³

35 - 40 4 37.5 150 -17.35 -5222.74 -20890.96

41 - 46 5 43.5 217.5 -11.35 -1462.14 -7310.70

47 - 52 8 49.5 396 -5.35 -153.13 -1225.04

53 - 58 14 55.5 777 0.65 0.27 3.78

59 - 64 8 61.5 492 6.65 294.08 2352.64

65 - 70 4 67.5 270 12.65 2024.28 8097.12

71 - 76 3 73.5 220.5 18.65 6486.89 19460.67

xxxxxxxxx N = 46 xxxx 2523 xxxx 487.51

MEDIDAS DE APUNTAMIENTO O

KURTOSIS

Lic. Oscar Noé López Cordón

CURTOSIS O KURTOSIS (b2) Si la representación gráfica de una distribución de frecuencias es una curva achatada se dice dice que es una Curva Platicurtica, si por el contrario la curva es picuda será de forma Leptocurtica y si la curva es normal su forma será Mesocurtica. Para determinar la forma de la curva se usa el Coeficiente de Kurtosis (b2) el cual toma como representación el número tres.Así tenemos:

b2 menor que tres = Platicurtica

b2 mayor que tres = Leptocurtica

b2 igual a tres = Mesocurtica

COEFICIENTE DE KURTOSIS CON BASE EN EL MOMENTO DE ORDEN CUATRO:

b2 = M4S4

M4 = ƒ(x-X)4 = .... N.......

S4 CALCULO DEL COEFICIENTE DE KURTOSIS:

Clases f x fx (x – X) (x – X) 4 f(x – X)4

35 - 40 4 37.5 150 -17.35 90614.54 362458.16

41 - 46 5 43.5 217.5 -11.35 16595.23 82976.15

47 - 52 8 49.5 396 -5.35 819.25 6554.00

53 - 58 14 55.5 777 0.65 0.18 2.52

59 - 64 8 61.5 492 6.65 1955.63 15645.04

65 - 70 4 67.5 270 12.65 25607.20 102428.80

71 - 76 3 73.5 220.5 18.65 120980.49 362941.47

xxxxxxxxx N = 46 xxxx 2523 xxxx 933006.14

M4 = ƒ(x-X)4 = 933006.14 = 20,282.74 = 2.53 N 46 8008.75

S4 (9.46)4

POR SER EL COEFICIENTE DE KURTOSIS 2.53 MENOR QUE 3 LA CURVA ES DE FORMA ACHATADA O PLATICURTICA.