Post on 16-May-2018
1.1 - 1
Tema 2: Distribuciones de frecuencia y gráficas para datos
categórico y discretos
1
1.1 - 2 Copyright © 2010, 2007, 2004 Pearson Education, Inc. All Rights Reserved.
1. Centro: Un valor representativo o promedio que
indica dónde se encuentra el centro del conjunto de
datos.
2. Variación: Una medida de cuánto varían la data.
3. Distribución: La forma de la dispersión de la data
sobre el rango de valores de la variable
(acampanada, sesgada o uniforme).
Características importantes de la data
4. Datos extremos:
Valores que son muy
distintos a los otros
valores de la variable.
5. Tiempo:
Características que
cambian sobre el
tiempo.
1.1 - 3
Cuando se obtiene data de una encuesta o de un experimento, ésta se debe organizar en una forma manejable.
Formas de Organizar Data
• Tablas
• Gráficas
• Construir un resumen numérico
Formas para organizar datos
1.1 - 4
Una tabla o distribución de frecuencias
• agrupa la data en categorías o clases (que no tienen nada en común)
• indica el número de observaciones en cada categoría.
Tablas
1.1 - 5 Copyright © 2010, 2007, 2004 Pearson Education, Inc. All Rights Reserved.
1. Resumir conjuntos de datos grandes.
2. Analizar la naturaleza de los datos
3. Tener una base para la construcción de gráficas importantes.
Razones para construir una
distribución de frecuencia
1.1 - 6
Ejemplo 1: Tabla de frecuencia para data cualitativa o categórica
• Problema: Un fisioterapeuta quiere determinar los tipos de rehabilitación requeridos por sus pacientes. Para ello, obtiene una muestra aleatoria simple de 36 de sus pacientes y registra la parte del cuerpo que requieren rehabilitación.
• Construya una distribución de frecuencias para la localización de la lesión.
1.1 - 7
EJEMPLO: cont Un fisioterapeuta quiere obtener una idea de los tipos de rehabilitación requeridos por sus pacientes usando una muestra aleatoria simple de 36 de sus pacientes.
Cadera
Espalda
Codo
Cuello
Espalda
Espalda
Rodilla
Mano
Espalda
Espalda
Cadera
Ingle
Hombro
Espalda
Espalda
Espalda
Espalda
Codo
Mano
Hombro
Espalda
Hombro
Ingle
Mano
Hombro
Muñeca
Rodilla
Muñeca
Rodilla
Rodilla
Muñeca
Rodilla
Hombro
Rodilla
Espalda
Rodilla
Región del cuerpo Conteo Frecuencia
Cadera
Codo
Cuello
Espalda
Hombro
Ingle
Mano
Muñeca
Rodilla
1.1 - 8
Frecuencia absoluta y frecuencia relativa
• La tabla anterior muestra frecuencias absolutas (número de observaciones incluidas en cada categoría o clase).
• La frecuencia relativa es la proporción (o porcentaje) de observaciones dentro de una categoría.
• Se encuentra usando la fórmula:
• Una distribución de frecuencias relativas muestra la frecuencia relativa de cada categoría
frecuencia relativa = frecuencia absoluta
total de observaciones
1.1 - 9
EJEMPLO: cont Un fisioterapeuta quiere obtener una idea de los tipos de rehabilitación requeridos por sus pacientes usando una muestra aleatoria simple de 36 de sus pacientes. Construya una distribución de frecuencia relativa de los datos.
Categoría Frecuencia
absoluta
Frecuencia
relativa
Cadera 2
Codo 2
Cuello 1
Espalda 11
Hombro 5
Ingle 2
Mano 3
Muñeca 3
Rodilla 7
1.1 - 10
Una distribución de frecuencias acumuladas
muestra la frecuencia acumulada de cada
categoría.
2-10
Distribución de frecuencias acumuladas
La frecuencia acumulada correspondiente a una
clase particular es la suma de todas las
frecuencias hasta e incluyendo esa clase.
Una distribución de frecuencias relativas
acumuladas muestra el porciento acumulado de
observaciones menores o iguales a la categoría.
1.1 - 11 2-11
Distribución de frecuencias acumuladas
Ejemplo: La siguiente tabla muestra la distribución de
frecuencia absoluta del número de autos vendidos en cierta
compañía de autos. Determine la distribución de frecuencias
acumuladas y la distribución de frecuencias relativas
acumuladas .
1.1 - 12
• Las gráficas nos permiten resumir la data y nos ayudan a entender lo que la data dice, en general, acerca de los individuos en el estudio.
• Las gráficas para data categórica o cuantitativa discreta se construyen colocando cada categoría de data en uno de los ejes (normalmente el eje horizontal) y la frecuencia absoluta o la frecuencia relativa de cada categoría en el otro eje.
Gráficas para data categórica o cuantitativa discreta
1.1 - 13
Construcción de una gráfica de barra de frecuencia
M&M Cantidad de
dulces
Azul 5
Marrón 12
Rojo 9
Anaranjado 6
Amarillo 10
Verde 3
Usaremos data sobre colores de los M&M para construir
una gráfica de barra de frecuencia absoluta y relativa
M&M Frecuencias
absolutas Frecuencias
relativas
Azul
Marrón
Rojo
Anaranjado
Amarillo
Verde Tabla 1: Distribución de colores en
una bolsa de M&M’s de 12 oz.
1.1 - 14
Gráfica de barra de frecuencia relativa (creada en Excel)
Color de M&M Frecuencia absoluta
Azul 5
Marron 12
Rojo 9
Anaranjado 6
Amarillo 10
Verde 3
0
2
4
6
8
10
12
14
Azul Marron Rojo Anaranjado Amarillo Verde
Fre
cu
en
cia
Ab
so
luta
Distribución de frecuencias para M&M's
Características: • Las barras, que son del mismo ancho, se dibujan por cada categoría.
• La altura de cada barra representa la frecuencia o frecuencia relativa
de la categoría.
1.1 - 15
Gráfica de barra de frecuencia relativa (creada en Excel)
Color de M&M Frecuencia absoluta
Azul 5
Marron 12
Rojo 9
Anaranjado 6
Amarillo 10
Verde 3
0
0.05
0.1
0.15
0.2
0.25
0.3
Azul Marron Rojo Anaranjado Amarillo Verde
Fre
cu
en
cia
rela
tiv
a
Distribución de frecuencias relativas para M&M's
1.1 - 16
• Una gráfica circular es un círculo dividido en sectores.
• Cada sector representa una categoría de datos.
• El área de cada sector es proporcional a la frecuencia de la categoría.
• Ejemplo: Los siguientes datos representan el diagnóstico de una muestra aleatoria de 20 pacientes ingresados en un hospital. Determine el % del círculo ocupado por cada categoría.
Gráfica circular
Número de sectores en la
gráfica circular:
% del círculo que ocupa cada
sector:
Asalto:
Caída:
Herida de
bala:
Accidente de
vehículo: TOTAL: 20
1.1 - 17
Gráfica circular (cont.)
Número de sectores en la
gráfica circular:
Grados del círculo que ocupa cada sector:
Asalto: 5% de 360 =
Caída: 10% de 360=
Herida de
bala: 40% de 360=
Accidente de
vehículo: 35% de 360=
A mano, utilizamos un transportador para medir cada
ángulo y dibujarlo dentro del círculo.
1.1 - 18
Gráfica circular
1.1 - 19
Gráfica circular vs Gráfica de barra
• Las gráficas circulares sólo pueden crearse si todas las categorías de la variable bajo estudio están representados.
• Las gráficas circulares son útiles para mostrar la división de todos los valores posibles de una variable cualitativa en sus partes.
• Las gráficas circulares no son tan útiles en la comparación de dos valores específicos de la variable cualitativa. El énfasis está en la comparación de las partes con el todo.
• Utilice una gráfica de barras cuando se quiere comparar los diferentes valores de la variable entre si y no las partes con el todo.
1.1 - 20
Distribución de frecuencia para data cuantitativa discreta (muchos valores
posibles)
Características de esta data:
• discreta con muchos valores
posibles
Método para crear distribución de
frecuencia:
• Agrupar por categorías o
clases
1.1 - 21 Copyright © 2010, 2007, 2004 Pearson Education, Inc. All Rights Reserved.
4. Elegir un punto de comienzo (el valor mínimo del conjunto de
datos o un valor conveniente)
Pasos para construir una
distribución de frecuencias
1. Determinar el número de clases que se va a usar (debe ser
entre 5 y 20).
2. Determinar el valor máximo y mínimo del conjunto.
3. Calcular el ancho de la clase (redondear hacia arriba).
ancho de clase
(valor máximo) – (valor mínimo)
número de clases
1.1 - 22
Ejemplo: Construir una distribución de frecuencia para el conjunto que contiene pulsos de 40 féminas
SOLUCION:
• Usaremos 7 clases.
• Identificar el valor mínimo y
máximo
• mínimo ___, máximo ____
• Determinar el ancho de las
clases:
• 𝑎𝑛𝑐ℎ𝑜 =𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 −𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠
𝑎𝑛𝑐ℎ𝑜 =
• Decidir punto de comienzo:
60 60 60 64
64 64 64 68
68 68 68 68
72 72 72 72
72 72 72 72
76 76 76 76
76 76 80 80
80 80 80 80
88 88 88 88
88 96 104 124
1.1 - 23
Ejemplo: (continuación)
SOLUCION (continuación):
60 60 60 64
64 64 64 68
68 68 68 68
72 72 72 72
72 72 72 72
76 76 76 76
76 76 80 80
80 80 80 80
88 88 88 88
88 96 104 124
5. Usando el límite inferior de la primera clase, le sumas el ancho de
clase para conseguir los límite inferiores de las demás clases.
1.1 - 24
Ejemplo: (continuación)
SOLUCION (continuación):
60 60 60 64
64 64 64 68
68 68 68 68
72 72 72 72
72 72 72 72
76 76 76 76
76 76 80 80
80 80 80 80
88 88 88 88
88 96 104 124
6. Determinar los límites superiores de las clases.
7. Determinar las frecuencias de cada clase
1.1 - 25
• ¿valor mínimo y valor máximo?
672 y 738
• Usemos como límite inferior de la primera clase 670
• Usemos como ancho de la clase: 10
• Las clases y frecuencias:
Ejemplo 2 : Construir una distribución de frecuencia absoluta de datos discretos (muchos valores posibles)
Clases Frecuencia
Los datos dados representan el tiempo entre
erupciones (en segundos) de una muestra
aleatoria de 45 erupciones del géiser “Old
Faithful”
1.1 - 26
Ejemplo: Construir una tabla de frecuencias relativas para los datos del géiser “Old Faithful”
Tiempo entre Frecuencia Frecuencia
erupciones absoluta relativa
670 – 679
680 – 689
690 – 699
700 – 709
710 – 719
720 – 729
730 – 739