Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del dia... · 2015-09-15 ·...

Post on 18-Apr-2020

5 views 0 download

Transcript of Universidad de Sonoramat.uson.mx/~ftapia/Documentos de Clase/Clases del dia... · 2015-09-15 ·...

Materia: Estadística I

Maestro: Dr. Francisco Javier Tapia Moreno

Semestre: 2015-2

Universidad de SonoraDepartamento de Matemáticas

Área Económico Administrativa

Hermosillo, Sonora, a 15 de septiembre de 2015.

En la clase anterior calculamos las medidas de

dispersión para datos a granel o no agrupados. En

esta clase se calculan también las medidas de

dispersión pero para datos resumidos y para datos

agrupados en intervalos de clase.

Usaremos dos ejemplos prácticos, primero uno de

datos resumidos y después uno de datos agrupados en

intervalos, los cálculos en ambos casos son muy

similares. Utilizaremos las técnicas más sencillas para

llevar a cabo los cálculos.

Introducción

Ejemplo 1. Se ha tomado una muestra de 48 personas y se les ha

preguntado el número de revistas que leen al mes. Los resultados

son los siguientes:

Número de

revistas

Número de

personas

1 1

2 20

3 12

4 10

5 3

6 2

Total 48

Calcular las medidas de

dispersión siguientes:

a) Rango

b) Rango intercuartílico

c) Varianza

d) Desviación estándar

e) Coeficiente de variación.

Ejemplo con datos resumidos.

a) Para calcular el rango, se resta el dato menor del dato mayor. Esto es,

Rango = Dato mayor – dato menor = 6 – 1 = 5 revistas.

b) Para calcular el rango intercuartílico, se calculan los cuartiles 1 y 3, y se restan. Es decir,

Rango Intercuertílico = Cuartil 3 – cuartil 1

La ubicación del cuartil 1 se encuentra entre el dato 12 y 13. El dato 12 es igual a 2 y el dato 13 también es igual a 2, así que el cuartil 1 es igual a 2.

La ubicación del cuartil 3 se encuentra entre el dato 36 y 37. El dato 36 es igual a 4 y el dato 37 también es igual a 4, así que el cuartil 3 es igual a 4.

Concluimos que el Rango intercuartilítico = 4 – 2 = 2 revistas.

Resolución.

c) La relación para calcular la varianza de una muestra en datos

resumidos o agrupados en intervalos es:

Si se trata de una población la relación es:

Como se trata de una muestra de 64 personas, usamos la primera

relación para elaborar la tabla para calcular la varianza.

n

i

ii

n

XXfS

1

22

1

)(*

n

i

ii

N

Xf

1

22 )(*

c) Para calcular la varianza construimos la tabla siguiente:

La media aritmética es 144

48 = 3 revistas.

La Varianza es 64

48−1 = 1.36170213 revistas al cuadrado.

Número de

Revistas

𝑿𝒊

Número de

Personas.

𝒇𝒊

𝒇𝒊 ∗ 𝑿𝒊

𝒇𝒊*(𝑿𝒊 − 𝑿 )

𝒇𝒊* 𝑿𝒊 − 𝑿 𝟐

1 1 1 1*(1-3)= -2 𝟏 ∗ (𝟏 − 𝟑)𝟐 =4

2 20 40 20*(2-3)= -20 20∗ 𝟐 − 𝟑 𝟐 = 𝟐𝟎

3 12 36 12*(3-3)= 0 𝟏𝟐 ∗ (𝟑 − 𝟑)𝟐= 0

4 10 40 10*(4-3)= 10 𝟏𝟎 ∗ (𝟒 − 𝟑)𝟐=10

5 3 15 3*(5-3)= 6 𝟑 ∗ (𝟓 − 𝟑)𝟐=12

6 2 12 2*(6-3)= 6 𝟐 ∗ (𝟔 − 𝟑)𝟐=18

Totales 48 144 0 64

d) La desviación estándar para una distribución de datos

resumidos o agrupados en intervalos de una muestra se calcula

mediante la relación,

La desviación estándar para una distribución de datos no

agrupados de una población se calcula mediante la relación,

1

)(*1

2

2

n

XXf

SS

n

i

ii

N

Xfn

i

ii

1

2

2

)(*

La desviación estándar es la raíz cuadrada de la varianza. Por

lo tanto,

Revistas.

e) El coeficiente de variación se calcula mediante la relación

𝑉𝑚 =𝑆

𝑋 * 100%

Así que 𝑉𝑚 = 1.167

3* 100% =38.897%

Concluimos que los datos recabados en la encuesta son muy

heterogéneos. Es decir, están muy separados unos de otros.

167.116691993.136170213.12

SS

Ejemplo 2. La utilidad anual de 38 empresas hermosillenses es

mostrada en la tabla siguiente:

Utilidad

(millones de pesos)

Número de

empresas

45 − 50 5

50 − 65 7

65 − 80 14

80 − 95 9

95 − 110 3

Total 38

Calcular las medidas de

dispersión siguientes:

a) Rango

b) Rango intercuartílico

c) Varianza

d) Desviación estándar

e) Coeficiente de variación.

Ejemplo con datos agrupados en intervalos.

a) Para calcular el rango, se resta el dato menor del dato mayor. Esto es,

Rango = Dato mayor – dato menor = 110 – 50 = 60 mdp.

b) Para calcular el rango intercuartílico, se calculan los cuartiles 1 y 3, y se restan. Es decir,

Rango Intercuertílico = Cuartil 3 – cuartil 1

El cuartil 1 se ubica en la tercera clase ya que 1∗(38+1)

4 =19.5.

Por lo tanto, 𝑄1 = 65 + 15 ∗19.5−(7+5)

14 = 73.0357 mdp.

El cuartil 3 se ubica en la cuarta clase ya que 3∗(38+1)

4 =29.25 .

Por lo tanto, 𝑄3 = 80 + 15 ∗29.25−(14+7+5)

14 = 82.08333 mdp.

Concluimos que el Rango intercuartilítico = 82.08333 – 73.0357 = 9.04763 mdp.

Resolución.

c) La relación para calcular la varianza de una muestra en datos

resumidos o agrupados en intervalos es:

Si se trata de una población la relación es:

Como se trata de una muestra de 64 personas, usamos la primera

relación para elaborar la tabla para calcular la varianza.

n

i

ii

n

XXfS

1

22

1

)(*

n

i

ii

N

Xf

1

22 )(*

c) Para calcular la varianza construimos la tabla siguiente:

La media aritmética es 2750

38 = 72.3684211 mdp.

La Varianza es 9424.34211

38−1 = 254.711949 mpd al cuadrado.

Marcas de

clase

𝑿𝒊

Número de

empresas.

𝒇𝒊

𝒇𝒊 ∗ 𝑿𝒊

𝒇𝒊*(𝑿𝒊 − 𝑿 )

𝒇𝒊* 𝑿𝒊 − 𝑿 𝟐

47.5 5 273.5 -124.342105 3092.19183

57.5 7 402.5 -104.078947 1547.48961

72.5 14 1015 1.84210526 0.24238227

87.5 9 787.5 136.184211 2060.68213

102.5 3 307.5 90.3947368 2723.73615

Totales 38 2750 0 9424.34211

d) La desviación estándar para una distribución de datos

resumidos o agrupados en intervalos de una muestra se calcula

mediante la relación,

La desviación estándar para una distribución de datos no

agrupados de una población se calcula mediante la relación,

1

)(*1

2

2

n

XXf

SS

n

i

ii

N

Xfn

i

ii

1

2

2

)(*

La desviación estándar es la raíz cuadrada de la varianza. Por lo tanto,

mdp.

d) El coeficiente de variación se calcula mediante la relación

𝑉𝑚 =𝑆

𝑋 * 100%

Así que 𝑉𝑚 = 15.711949

72.3684211* 100% =22.053%

Concluimos que los datos recabados en la encuesta son heterogéneos. Es decir, están separados unos montos de otros.

96.159596977.15711949.2542

SS