Clase de Estadística

33
Introducción a la Estadística Matemática I – Logística – UTU/IFSUL 2016

Transcript of Clase de Estadística

Introducción

a la Estadística

Matemática I – Logística – UTU/IFSUL

2016

Métodos de Ordenación de Datos

Tablas de frecuencias

Tablas de frecuencias

para datos cuantitativos

• Se pregunta a los alumnos de una clase las notas que obtuvieron en el último

examen de Matemática.

• Las respuestas fueron:

9 4 8 5 5 7 2 2 3 9

10 8 2 1 6 10 10 8 8 4

5 10 6 7 2 3 5 3 6 8

1 4 6 5 5 4 6 7 6 5

¿De qué tipo de variable se trata?

¿Qué valores toma la variable?

• 𝑥𝑖 : valores de la variable; i = 1, 2, …

• Ejemplos: 𝑥1=1, 𝑥2 = 2, …, 𝑥10 = 10

𝒙𝒊 Registro Frecuencia

1

2

3

4

5

6

7

8

9

10

11

Valores que toma la variable𝒙𝒊

Registro Frecuencia Absoluta

𝒇𝒊

1 2

2 4

3 3

4 4

5 - 7

6 - 6

7 3

8 5

9 2

10 4

Valores que toma la variable

𝒙𝒊

Frecuencia Absoluta

𝒇𝒊

Frecuencia

Relativa

𝒇𝒓𝒊

1 2 2

40= 0,05 = 5%

2 4 10,0%

3 3 7,5%

4 4 10,0%

5 7 17,5%

6 6 15,0%

7 3 7,5%

8 5 12,5%

9 2 5,0%

10 4 10,0%

40 100%

Valores que toma la variable

𝒙𝒊

Frecuencia

Absoluta

𝒇𝒊

Frecuencia

Relativa

𝒇𝒓𝒊

Frecuencia

Acumulada

Frecuencia

Relativa

Acumulada

1 2 5% 2 5%

2 4 10% 6 15%

3 3 7,5% 9 22,5%

4 4 10% 13 32,5%

5 7 17,5% 20 50%

6 6 15% 26 65%

7 3 7,5% 29 72,5%

8 5 12,5% 34 85%

9 2 5% 36 90%

10 4 10% 40 100%

Valores que toma la variable

𝒙𝒊

Frecuencia

Absoluta

𝒇𝒊

Frecuencia

Relativa

𝒇𝒓𝒊

Frecuencia

Acumulada

Frecuencia

Relativa

Acumulada

1 2 5% 2 5%

2 4 10% 6 15%

3 3 7,5% 9 22,5%

4 4 10% 13 32,5%

5 7 17,5% 20 50%

6 6 15% 26 65%

7 3 7,5% 29 72,5%

8 5 12,5% 34 85%

9 2 5% 36 90%

10 4 10% 40 100%

¿Cuántos alumnos

obtuvieron nota 6?

Valores que toma la variable

𝒙𝒊

Frecuencia

Absoluta

𝒇𝒊

Frecuencia

Relativa

𝒇𝒓𝒊

Frecuencia

Acumulada

Frecuencia

Relativa

Acumulada

1 2 5% 2 5%

2 4 10% 6 15%

3 3 7,5% 9 22,5%

4 4 10% 13 32,5%

5 7 17,5% 20 50%

6 6 15% 26 65%

7 3 7,5% 29 72,5%

8 5 12,5% 34 85%

9 2 5% 36 90%

10 4 10% 40 100%

¿Cuántos alumnos

obtuvieron notas

insuficientes (1-6)?

Valores que toma la variable

𝒙𝒊

Frecuencia

Absoluta

𝒇𝒊

Frecuencia

Relativa

𝒇𝒓𝒊

Frecuencia

Acumulada

Frecuencia

Relativa

Acumulada

1 2 5% 2 5%

2 4 10% 6 15%

3 3 7,5% 9 22,5%

4 4 10% 13 32,5%

5 7 17,5% 20 50%

6 6 15% 26 65%

7 3 7,5% 29 72,5%

8 5 12,5% 34 85%

9 2 5% 36 90%

10 4 10% 40 100%

¿Qué porcentaje de

alumnos obtuvo

suficiente?

Valores que toma la variable

𝒙𝒊

Frecuencia

Absoluta

𝒇𝒊

Frecuencia

Relativa

𝒇𝒓𝒊

Frecuencia

Acumulada

Frecuencia

Relativa

Acumulada

1 2 5% 2 5%

2 4 10% 6 15%

3 3 7,5% 9 22,5%

4 4 10% 13 32,5%

5 7 17,5% 20 50%

6 6 15% 26 65%

7 3 7,5% 29 72,5%

8 5 12,5% 34 85%

9 2 5% 36 90%

10 4 10% 40 100%

¿Qué nota se ha

repetido más?

Siendo el ángulo completo de

360°, se le asigna a cada sector

el ángulo al centro

correspondiente.

Ejemplo:

360° . 10% = 36°

Datos Agrupados

168 160 168 175 175

168 168 158 179 160

178 169 158 163 171

162 165 163 156 174

160 165 154 163 165

161 162 166 163 159

170 165 150 167 164

165 173 172 168 168

Se toman las medidas (talla) de 40 personas.

Realiza un histograma para representar la información.

Tallas en cm.:

Ejemplo

168 160 168 175 175

168 168 158 179 160

178 169 158 163 171

162 165 163 156 174

160 165 154 163 165

161 162 166 163 159

170 165 150 167 164

165 173 172 168 168

Se toman las medidas (talla) de 40 personas. Tallas en cm.:

Máximo

Mínimo

Amplitud o Rango: 179 – 150 = 39

• Si son “muchos” valores los que toma la variable, los

agrupamos en intervalos.

• Para N valores de la variable, 𝑁 intervalos

(aproximadamente)

Cantidad de

valores de la variable

Cantidad deDatos

18 17 25 36 33 19 22 21

18 25 37 19 21 32 24 19

41 26 22 18 17 36 33 21

24 19 38 19 18 24 29 22

19 18 22 21 33 37 19 24

22 34 18 27 26 31 19 29

1 2 2 2 1 1 2 1

2 2 1 1 1 1 2 2

1 2 1 1 2 2 2 2

1 1 1 2 1 2 1 2

1 1 1 1 2 2 1 2

2 2 1 1 1 2 1 2

Realiza una tabla de distribución de las frecuencias

para estos datos.168 160 168 175 175

168 168 158 179 160

178 169 158 163 171

162 165 163 156 174

160 165 154 163 165

161 162 166 163 159

170 165 150 167 164

165 173 172 168 168

• Entre 150 y 179 hay 29 valores de la variable

• 29 ≅ 5,38.

• Se recomienda agrupar en aproximadamente 5 intervalos (4, 5 o 6).

• Los intervalos no necesariamente tienen la misma longitud.

• En general es recomendable que tengan la misma longitud.

Distribución de Frecuencias(datos agrupados)

• Elijo hacer 5 intervalos de igual longitud:

Talla (cm.) Frecuencia

[150 , 156)

[156 , 161)

[162 , 167)

[168 , 173)

[174 , 179)

Intervalos

• 150–155: 150 154

• 156–161: 156 158 158 159 160 160 160 161

• 162–167: 162 162 163 163 163 163 164 165 165 165 165 165 166 167

• 168-173: 168 168 168 168 168 168 169 170 171 172 173

• 174-179: 174 175 175 178 179

Distribución de Frecuencias(datos agrupados)

Talla (cm.) Frecuencia

[150 , 156) 2

[156 , 161) 8

[162 , 167) 14

[168 , 173) 11

[174 , 179) 5

Se preguntó a un grupo de alumnos el número de horas

que estudian en una semana. Construye un histograma.

14 9 9 20 18

15 10 18 20 2

20 16 18 15 24

7 18 8 12 10

10 12 25 24 17

12 16 5 4 13

10 4 8 20 10

12 14 6 14 8

Ejercicio

Medidas de Localización y Variabilidad

• Medidas de Localización:

Las medidas de tendencia central son medidas estadísticas que

pretenden resumir en un solo valor a un conjunto de valores. Representan

un centro en torno al cual se encuentra ubicado el conjunto de los datos.

Las medidas de tendencia central más utilizadas son: media, mediana y

moda.

Medidas de Localización y Variabilidad

• Medidas de Variabilidad:

Indican la dispersión de datos en la escala de medición.

Las medidas principales son el rango, la desviación estándar y la

varianza.

Medidas de Tendencia Central

Media o Promedio Aritmético

Media

𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8 𝑥9 𝑥10 𝑥11 𝑥12 𝑥13 𝑥14 𝑥15

15,2 16,8 12,6 13,2 12,8 13,8 16,3 13,0 12,7 15,8 19,2 12,7 15,6 13,5 12,9

ҧ𝑥 =𝑥1+𝑥2+⋯+𝑥15

15=216,1

15= 14,41

Media

• En general, para un conjunto de n datos:

ҧ𝑥 =𝑥1 + 𝑥2 +⋯+ 𝑥𝑛

𝑛

Mediana

𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8 𝑥9 𝑥10 𝑥11 𝑥12 𝑥13 𝑥14 𝑥15

15,2 16,8 12,6 13,2 12,8 13,8 16,3 13,0 12,7 15,8 19,2 12,7 15,6 13,5 12,9

12,6 12,7 12,7 12,8 12,9 13 13,2 13,5 13,8 15,2 15,6 15,8 16,3 16,8 19,2

Ordenamos los 15 datos en forma creciente

𝑥 = 13,5