Capitulo 2. descripción de datos
description
Transcript of Capitulo 2. descripción de datos
2- 1
Capitulo
Dos
2- 2
Capitulo Dos Descripción de datos: Distribuciones de Descripción de datos: Distribuciones de
Frecuencia y su presentación gráficaFrecuencia y su presentación gráficaMETASAl terminar este capítulo usted podrá:
UNOOrganizar la información en una distribución de frecuencia. DOS Representar una distribución de frecuencia en un histograma, un polígono de frecuencia y un polígono de frecuencia acumulada.TRESPresentar la información utilizando técnicas de gráficas de líneas, gráficas de barras y gráficas de pastel.
Metas
2- 3
Distribución de Frecuencia
Una Distribución de FrecuenciaDistribución de Frecuencia es una agrupación de los datos en clases mutuamente excluyentes mostrando el número de observaciones en cada una.
2- 4
Determinar la pregunta que se tratará
Construir una distribución de frecuencia requiere:
Construyendo una distr. de frecuencia
2- 5
Determinar la pregunta que se tratará
Construir una distribución de frecuencia requiere:
Recolección de información en bruto
Construyendo una distr. de frecuencia
2- 6
Determinar la pregunta que se tratará
Construir una distribución de frecuencia requiere:
Recolección de información en bruto
Organizar la data (distribución de frecuencia)
Construyendo una distr. de frecuencia
2- 7
Determinar la pregunta que se tratará
Construir una distribución de frecuencia requiere:
Recolección de información en bruto
Organizar la data (distribución de frecuencia)
Presentación de la data (gráfica)
Construyendo una distr. de frecuencia
2- 8
Determinar la pregunta que se tratará
Construir una distribución de frecuencia requiere:
Recolección de información en bruto
Organizar la data (distribución de frecuencia)
Presentación de la data (gráfica)
Conclusiones
Construyendo una distr. de frecuencia
2- 9
Collecting raw data
Organizing data (frequency distribution)
Presenting data (graph)
Drawing conclusions
1.5 3.5 5.5 7.5 9.5 11.5 13.5
5
10
15
20
Construyendo una distr. de frecuencia
2- 10
Clase de Punto medioClase de Punto medio:: Punto que divide la clase en dos partes iguales. Este es el promedio de las clases de limites superiores e inferiores.
Clase de Clase de FrecuenciaFrecuencia: El número de observaciones en cada clase.
Clase de IntervaloClase de Intervalo: El intervalo de clase es obtenido restando el limite más bajo de una clase del limite más bajo de la clase siguiente. Los intervalos de clase deben ser iguales.
Definiciones
2- 11
EJEMPLO 1
15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6.
Organice la data en una distribución de frecuencia.
Dr. Tillman es el Decano de la escuela de negocios del Socastee University. El desea preparar un reporte que muestre el número de horas por semana que dedican los estudiantes a estudiar. El selecciono una muestra al azar de 30 estudiantes y determino el número de horas que cada estudiante estudio la semana pasada.
2- 12
Ejemplo 1 continua
Paso unoPaso uno:: Decidir el número de clase usando la formula
22kk > n > ndonde k=numero de clases n=numero de observaciones
o Hay 30 observaciones por tal n=30.
o Dos elevado a la quinta es 32.
o Por tal, tenemos por lo menos 5 clases, i.e., k=5.
2- 13
donde H=valor más alto, L=valor más bajo
33.8 – 10.3 5
= 4.7
Paso DosPaso Dos: Determine el intervalo de clases
H – LH – L kk
i > =
Redondear a un intervalo de 5 horas.
Fijar el limite menor de la primera clase a 7.5 horas, dando un total de 6 clases.
Ejemplo 1 continua
2- 14
EJEMPLO 1 continua
Horas de estudio Frecuencia, f
7.5 up to 12.5 1
12.5 up to 17.5 12
17.5 up to 22.5 10
22.5 up to 27.5 5
27.5 up to 32.5 1
32.5 up to 37.5 1
Paso TresPaso Tres: Fije los limites individuales de la clase yPaso Cuatro y Cinco:Paso Cuatro y Cinco: Marque y cuente en número de artículos en cada clase.
2- 15
Clase de Punto MedioClase de Punto Medio: encuentre el punto medio para cada intervalo, usando la siguiente formula: Limite superior + limite inferior
2Horas de
estudio Punto medio f
7.5 up to 12.5 (12.5+7.5)/2 =10.0 1
12.5 up to 17.5 (17.5+12.5)/2=15.0 12
17.5 up to 22.5 (22.5+17.5)/2=20.0 10
22.5 up to 27.5 (27.5+22.5)/2=25.0 5
27.5 up to 32.5 (32.5+27.5)/2=30.0 1
32.5 up to 37.5 (37.5+32.5)/2=35.0 1
Ejemplo 1 continua
2- 16
Horas f Frecuencia Relativa
7.5 up to 12.5 1 1/30=.0333
12.5 up to 17.5 12 12/30=.400
17.5 up to 22.5 10 10/30=.333
22.5 up to 27.5 5 5/30=.1667
27.5 up to 32.5 1 1/30=.0333
32.5 up to 37.5 1 1/30=.0333 TOTAL 30 30/30=1
Ejemplo 1 continua
Una Distribución de Frecuencia RelativaDistribución de Frecuencia Relativa muestra el porcentaje de observaciones en cada clase.
2- 17
Presentación Gráfica de una Distribución de Frecuencia
Un Histograma es una gráfica en la que las clases se marcan en el eje horizontal y las frecuencias de clases en el eje vertical. Las frecuencias de clases se representan mediante la altura de las barras y estás últimas se dibujan una junto a otra.
Las tres formas de gráfico comunmente utilizados son Histogramas, Poligonos de Histogramas, Poligonos de FrecuenciaFrecuencia, y Frecuencia AcumuladaFrecuencia Acumulada.
2- 18
Histograma de horas dedicadas a estudiar
0
2
4
6
8
10
12
14
10 15 20 25 30 35
Horas dedicadas a estudio
Fre
cuen
cia
Punto medio
2- 19
Presentación Gráfica de una Distribución de Presentación Gráfica de una Distribución de FrecuenciaFrecuencia
Presentación Gráfica de una Distribución de Frecuencia
Un Poligono de FrecuenciaPoligono de Frecuencia consiste en segmentos de linea que conectan los puntos formados por las intersecciones de los puntos medios de clase y la frecuencia de clases.
2- 20
Poligono de FrecuenciaPoligono de Frecuencia de de horas dedicadas a estudiarhoras dedicadas a estudiar
0
2
4
6
8
10
12
14
10 15 20 25 30 35
Hours spent studying
Fre
qu
en
cy
Poligono de Frecuencia de horas dedicadas a estudiar
2- 21
Una Distribución de Distribución de Frecuencia Frecuencia AcumuladaAcumulada se utiliza para determinar cuantos o que proporción de los valores de la data se encuentran por debajo o por encima de ciertos valores.
Distribución de Frecuencia AcumuladaDistribución de Frecuencia Acumulada
Para crear un poligono de frecuencia acumulada, escale el limite superior de cada clase a lo largo del X-axis y la correspondiente frecuencia relativa a lo largo del Y-axis.
Distribución de Frecuencia Acumulada
2- 22
Tabla de Frecuencia Acumulada de horas Tabla de Frecuencia Acumulada de horas dedicadas a estudiardedicadas a estudiar
Horas de Estudio
Limite Superior
f FrecuenciaAcumulada
7.5 up to 12.5 12.5 1 1
12.5 up to 17.5 17.5 12 13 (1+12)
17.5 up to 22.5 22.5 10 23 (13+10)
22.5 up to 27.5 27.5 5 28 (23+5)
27.5 up to 32.5 32.5 1 29 (28+1)
32.5 up to 37.5 37.5 1 30 (29+1)
Tabla de frecuencia acumulada
2- 23
Distribución de Frecuencia Acumulada Distribución de Frecuencia Acumulada de Horas de Estudiosde Horas de Estudios
0
5
10
15
20
25
30
35
10 15 20 25 30 35
Horas dedicadas a estudio
Frecuencia
Distribución de frecuencia acumulada
2- 24
Gráfico de linea tipicamente es usado para presentar cambios o tendencia de una variable a través del tiempo.
AÑOS HOMBRE MUJER1992 30.5 32.91993 30.8 33.21994 31.1 33.51995 31.4 33.81996 31.6 34.01997 31.9 34.31998 32.2 34.61999 32.5 34.92000 32.8 35.22001 33.2 35.52002 33.5 35.8 Gráfico lineal
2- 25
Edad media de USA por genero
25
30
35
40
Eda
d m
edia
Males
Females
Ejemplo 3 continua
2- 26
Construir un gráfico de barra del número de desempleados por 100,000 habitantes en el 2001
Ciudad Número de desempleados por 100,000 habitantes
Atlanta, GA 7300 Boston, MA 5400 Chicago, IL 6700
Los Angeles, CA 8900 New York, NY 8200
Washington, D.C. 8900
Una Gráfica de Barras Gráfica de Barras se puede utilizar para representar cualquiera de los niveles de medición (nominal, ordinal, de intervalo, o de razón).
Gráfico de Barras
2- 27
Gráfico de barras para datos de desempleo
7300
5400
6700
89008200
8900
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
10000
1 2 3 4 5 6
Ciudades
# d
esem
ple
ado
s/10
0,00
0Atlanta
Boston
Chicago
Los Angeles
New York
Washington
2- 28
Gráfico P.
A una muestra de 200 corredores se les pregunto sobre sus preferencias de uso de zapatillas para correr. Dibujar un gráfico de pastel en base a la siguiente información.
Tipo de zapatillas
# de corredores
% del total
Nike 92 46.0
Adidas 49 24.5
Reebok 37 18.5
Asics 13 6.5
Other 9 4.5
Una Gráfica de PastelGráfica de Pastel es útil para ilustrar distribuciones de frecuencia relativa. Un circulo se divide proporcinalmente a su frecuencia relativa y partes del circulo distribuidos para diferentes grupos.
2- 29
46%
24.50%
18.50%6.50%
4.50%
Nike
Adidas
ReebokAsics
Other
Gráfico de pastel para zapatilla de correr