DESCRIPCIÓN DE LOS CONJUNTOS DE DATOS
Dr. Rafael Maradiaga
TOMA DE DATOS
La toma de datos es la obtención de una colección de los mismos que no han sido ordenados numéricamente.
Ejemplo
El conjunto de alturas de 100 estudiantes, sacados de una lista alfabética de una universidad.
www.
them
egal
lery
.co
TOMA DE DATOS
Entre la herramientas estadísticas que resultan de particular utilidad para organizar los datos se incluyen:
Tablas de frecuencias que colocan los todos los datos en clases especificas.
Diversos gráficos que pueden proporcionar una representación visual de los datos.
Tablas de contingencia y diagramas de "tallo y hoja", los cuales también permiten la presentación de un conjunto de datos de manera concisa y discernible.
www.
them
egal
lery
.co
m
ORDENAMIENTO
ORDENAMIENTO
Es colocar los datos numéricos tomados, en orden creciente o decreciente de acuerdo a su magnitud.
La diferencia entre el mayor y el menor de los números se llama recorrido o rango de los datos.
www.
them
egal
lery
.co
m
ORDENAMIENTO
Ejemplo:
Si la altura mayor de los 100 estudiantes es 74 pulgadas y la menor es de 60 pulgadas, el rango es de:
74 - 60 = 14 PULGADAS
www.
them
egal
lery
.co
m
DISTRIBUCION DE
FRECUENCIA
DISTRIBUCION DE FRECUENCIA
La información estadística puede constar de un gran número de observaciones y, mientras mayor sea el número, mayor puede ser la conveniencia y necesidad de presentarla en forma resumida, la cual puede omitir algunos detalles, pero en cambio puede revelar la naturaleza general de la información.
www.
them
egal
lery
.co
m
DISTRIBUCION DE FRECUENCIA
Cuando se dispone de gran número de datos, es útil distribuirlos en clases o categorias y determinar el número de individuos pertenecientes a cada clase, que es la frecuencia de clase.
www.
them
egal
lery
.co
m
DISTRIBUCION DE FRECUENCIA
Un ordenamiento tabular de los datos en clases, reunidas las clases y con frecuencias correspondientes a cada una, se conoce como una distribución de frecuencias o tabla de frecuencias.
Una distribución de frecuencias (o tabla de frecuencias) ordenará los datos si estos se dividen en clases y se registrará el número de observaciones en cada clase.
www.
them
egal
lery
.co
m
Alturas de 100 estudiantes en la Universidad
ALTURA (Pulg.)
60 - 62 63 - 65 66 - 68 69 - 71
72 - 74
TOTAL
Número de Estudiantes
518 42 27
8
100
La primera clase o categoría, por ejemplo, comprende las alturas de 60 a 62 pulgadas y vienen indicadas por el símbolo 60 - 62.
www.
them
egal
lery
.co
m
DISTRIBUCION DE FRECUENCIA
Puesto que 5 estudiantes tienen una altura perteneciente a esta clase, correspondiente frecuencia de clase es 5.
Los datos ordenados y resumidos como en la distribución de frecuencia anterior, se suelen llamar datos agrupados.
www.
them
egal
lery
.co
m
DISTRIBUCION DE FRECUENCIA
Aunque con el proceso de agrupamiento generalmente se pierden parte del detalle original de los datos, tiene la importante ventaja de presentarlos todos en un sencillo cuadro que facilita el hallazgo de las relaciones que pueda haber entre ellos, puestas así de manifiesto.
www.
them
egal
lery
.co
m
NÚMERO DE CLASES
NÚMERO DE CLASES
En una tabla de frecuencias el número de clases es algo arbitrario.
En general una tabla debería estar entre 5 a 20 clases.
Muy pocas no revelarían ningún detalle sobre los datos y demasiadas clases seria confuso como la lista de datos originales.
www.
them
egal
lery
.co
m
NÚMERO DE CLASES
Se puede seguir una regla simple para aproximar el número de clases a utilizar, C, es:
2C n
www.
them
egal
lery
.co
m
INTERVALOS DE CLASE
INTERVALO DE CLASES TABLA DE FRECUENCIA
Para la construcción original de una tabla de frecuencias, el intervalo de clase puede determinarse como:
IC = Valor más grande - Valor más número deseado de clases
pequeño
www.
them
egal
lery
.co
m
INTERVALOS DE CLASE
Un símbolo que define una clase, tal como 60 - 62 de la tabla anterior, se conoce con intervalo de clase
Los números extremos, 60 y 62, son los limites de clase
El número menor 60 es el limite inferior de la clase y el mayor 62 es el limite superior.
www.
them
egal
lery
.co
m
INTERVALOS DE CLASE
Los términos clase e intervalo de clase se utilizan a menudo indistintamente, aunque el intervalo de clase es realmente un símbolo para la clase.
Un intervalo de clase que, al menos teóricamente, no tiene limite superior o inferior, se conoce como intervalo de clase abierto.
www.
them
egal
lery
.co
m
INTERVALOS DE CLASE
Por ejemplo, el referirse a la edad de grupos de individuos el intervalo de clase, mayores de 65 años es un intervalo de clase abierto.
www.
them
egal
lery
.co
m
LIMITES REALES DE CLASES
LIMITES REALES DE CLASE
Si las alturas se registran con aproximación de pulgadas, el intervalos de clase 60 - 62 teóricamente incluye todas la medidas desde 59.5000a 62.5000pulgadas.
www.
them
egal
lery
.co
m
LIMITES REALES DE CLASE
Estos números, representados brevemente por los números exactos 59.5 y 62.5 se conocen como limites reales de clase o limites verdaderos de clase El menor de ellos, 59.5 es el limite real inferior y el mayor de ellos, 62.5 es limite real superior.
www.
them
egal
lery
.co
m
LIMITES REALES DE CLASE
Prácticamente, los limites reales de clase se obtienen sumando al limite superior de un intervalo de clase el limite inferior del intervalo de clase contiguo superior y dividiendo por 2.
www.
them
egal
lery
.co
m
LIMITES REALES DE CLASE
A veces, los limites reales de clase se utilizan para simbolizar las clases
Por ejemplo: tomemos la tabla anterior
www.
them
egal
lery
.co
m
ALTURA (Pulgadas)
60 - 62
63 - 65
66 - 68
69 - 71
72 - 74
TOTAL
Limites de clase Alturas de 100 estudiantes en la Universidad
Número de Estudiantes
5
18
42
27
8
100
www.
them
egal
lery
.co
m
LIMITES REALES DE CLASE
Las diferentes clases de la primera columna podrán iniciarse por:
59.5 - 62.5 62.5 - 65.5
..
www.
them
egal
lery
.co
m
LIMITES REALES DE CLASE
Sin embargo, con tal notación aparece una ambigüedad, pues los límites reales de clase no coincidirían con las observaciones reales.
www.
them
egal
lery
.co
m
LIMITES REALES DE CLASE
Así si una observación fuese 62.5 no seria posible discernir si pertenece al intervalo de clase (59.5 - 62.5) o al (62.5 - 65.5)
www.
them
egal
lery
.co
m
TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE
TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE
El tamaño o anchura de un intervalo de clase es la diferencia entre los limites reales de clase que lo forman y se conoce como anchura de clase, tamaño de clase o longitud de clase.
www.
them
egal
lery
.co
m
TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE
Si todos los intervalos de clase de una distribución de frecuencias tienen igual anchura, esta anchura común representa por "C"
www.
them
egal
lery
.co
m
TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE
En tal caso, "C" es igual a la diferencia entre dos sucesivos limites de clase inferiores o superiores
www.
them
egal
lery
.co
m
TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE
POR EJEMPLO:
EL INTERVALO DE CLASE ES C = 62.5 - 59.5 = 65.5 - 62.5 = 3
www.
them
egal
lery
.co
m
MARCA DE CLASE
MARCA DE CLASE
La marca de clase es el punto medio del intervalo de clase y se obtiene sumando los limites inferior y superior de la clase y dividiendo por 2.
www.
them
egal
lery
.co
m
MARCA DE CLASE
Así la marca de clase se llama también punto medio de la clase
Así todas las alturas en el intervalo de clase 60 - 62 pulgadas se consideran como de 61 pulgadas.
www.
them
egal
lery
.co
m
REGLAS GENERALES PARA FORMAR LAS DISTRIBUCIONES DE FRECUENCIA
REGLAS
1. Determinar el mayor y el menor entre los datos registrados y así encontrar el rango. (Diferencia entre el mayor y el menor de los datos)
www.
them
egal
lery
.co
m
REGLAS 2. Dividir el rango en un número conveniente de
intervalos de clase del mismo tamaño.
El número de intervalos de clase se toma generalmente entre 5 y 20 dependiendo de los datos.
Los intervalos de clase se eligen también en forma que las marcas de clase o puntos medios coincidan con datos realmente observados.
Eso tiende a reducir el llamado error de agrupamiento, en los análisis matemáticos posteriores.
Sin embargo, los limites reales de clase muchas veces no coincidirán con los datos observados.
www.
them
egal
lery
.co
m
REGLAS
3. Determinar el número de observaciones que cae dentro de cada intervalo de clase, es decir, encontrar las frecuencias de clase.
Lo mejor para esto es utilizar una hoja de conteo
www.
them
egal
lery
.co
m
HISTOGRAMÁS Y
POLIGONOS DE FRECUENCIAS
HISTOGRAMÁS Y POLIGONOS DE FRECUENCIA
1.Un histograma de frecuencias consiste en una serie de rectángulos que tienen
(a) sus bases sobre el eje horizontal (el eje x) con centros en las marcas de clase y longitud igual al tamaño de los intervalos de clase.
(b) superficie proporcionales a las frecuencias de clase.
www.
them
egal
lery
.co
m
HISTOGRAMÁS Y POLIGONOS DE FRECUENCIA
2. Polígono de frecuencias es un grafico de línea trazado sobre las marcas de clase, pueden obtenerse uniendo los puntos medios de los techos de los rectángulos en el histograma.
www.
them
egal
lery
.co
m
HISTOGRAMÁS Y POLIGONOS DE FRECUENCIA
FRECUENCIA
40
30
20
10
58 61 64 67 70 73 76 ALTURAS
núm
ero
DE
ESTU
DIA
NTE
S
www.
them
egal
lery
.co
m
DISTRIBUCION DE FRECUENCIAS RELATIVA
DISTRIBUCION DE FRECUENCIA
La frecuencia relativa de una clase es la frecuencia de la clase dividida por el total de frecuencias de todas las clases y se expresa generalmente como porcentaje.
Si las frecuencias en la anterior tabla de frecuencias se sustituyen por las correspondientes frecuencias relativas, la tabla resultante se llama:
www.
them
egal
lery
.co
m
DISTRIBUCION DE FRECUENCIA
distribución de frecuencias relativas, distribución porcentual o tabla de frecuencias relativas
www.
them
egal
lery
.co
m
DISTRIBUCION DE FRECUENCIAS ACUMULADAS. OJIVAS
DISTRIBUCION DE FRECUENCIA ACUMULADAS
La frecuencia total de todos los valores menores que el limite real superior de clase de un intervalo de clase dado se conoce como frecuencia acumulada hasta ese intervalo de clase inclusive.
www.
them
egal
lery
.co
m
DISTRIBUCION DE FRECUENCIA ACUMULADAS
Una tabla que represente las frecuencias acumuladas se llama distribución de:
www.
them
egal
lery
.co
m
DISTRIBUCION DE FRECUENCIA ACUMULADAS
Frecuencias acumuladas, Tabla de frecuencias acumuladas o; Brevemente distribución acumulada.
www.
them
egal
lery
.co
m
Alturas de 100 estudiantes en la Universidad
ALTURA (Pulgadas)
Menor que 59.5
Menor que 62.5
Menor que 65.5
Menor que 68.5
Menor que 71.5
Menor que 74.5
TOTAL
número de Estudiantes
0
5
23
65
92
100
100
www.
them
egal
lery
.co
m
Histogramas y polígonos de frecuencia
FRECUENCIA
100
80
60
40
20
59.5 62.5 65.5 68.5 71.5 74.5 ALTURAS
NÚ
MER
O D
E ES
TUD
IAN
TES
www.
them
egal
lery
.co
m
DISTRIBUCION DE FRECUENCIA ACUMULADAS
Un grafico que muestre las frecuencias acumuladas menores que cualquier limite real superior de clase trazado sobre los limites reales superiores de clase se llama polígono de frecuencias acumuladas u ojiva
www.
them
egal
lery
.co
m
DISTRIBUCION DE FRECUENCIA ACUMULADAS
En algunos casos es preferible considerar una distribución de frecuencias acumuladas de todos los valores mayores o iguales al limite real inferior de clase de cada intervalo de clase.
www.
them
egal
lery
.co
m
DISTRIBUCION DE FRECUENCIA ACUMULADAS
En este caso consideremos las alturas de 59.5 pulgadas o más, 62.5 pulgadas o más, esta a veces se llama distribución acumulada o más mientras que la considerada anteriormente es la distribución acumulada menor que.
www.
them
egal
lery
.co
m
DISTRIBUCION DE FRECUENCIA ACUMULADAS
Las correspondientes ojivas se llaman " o más" y "menor que".
www.
them
egal
lery
.co
m
DISTRIBUCION DE FRECUENCIA ACUMULADAS
Siempre que nos refiramos a distribuciones acumuladas u ojivas sin especificar, se entenderá que son del tipo "menor que"
www.
them
egal
lery
.co
m
DISTRIBUCION DE FRECUENCIAS RELATIVAS ACUMULADAS. Ojivas porcentulaes
DISTRIBUCION DE FRECUENCIA RELATIVAS ACUMULADAS. OJIVAS PORCENTUALES
La frecuencia relativa acumulada o frecuencia porcentual acumulada es la frecuencia acumulada dividida por la frecuencia total.
www.
them
egal
lery
.co
m
CURVAS DE FRECUENCIA. OJIVAS SUAVIZADAS
CURVAS DE FRECUENCIAS. OJIVAS SUAVIZADAS
El conjunto de datos puede considerarse normalmente como perteneciente a una muestra extraída de una población grande
www.
them
egal
lery
.co
m
CURVAS DE FRECUENCIAS. OJIVAS SUAVIZADAS
A causa de las muchas observaciones que podemos realizar en la población es posible teóricamente (para datos continuos) elegir los intervalos de clase muy pequeños y todavía tener un número adecuado de observaciones dentro de la clase.
www.
them
egal
lery
.co
m
CURVAS DE FRECUENCIAS. OJIVAS SUAVIZADAS
Así se tiene que el polígono de frecuencias o el de frecuencias relativas para una población grande puede estar formado por muchos pequeños segmentos rectos que aproximan el conjunto a una curva, las curvas de este tipo pueden llamarse curvas de frecuencia o curvas de frecuencia relativa, respectivamente.
www.
them
egal
lery
.co
m
CURVAS DE FRECUENCIAS. OJIVAS SUAVIZADAS
Es razonable esperar que tales curvas teóricas provengan de la aproximación a suavizar los polígonos de frecuencias o de los polígonos de frecuencias relativas de la muestra, la aproximación es tanto más exacta conforme aumenta el tamaño de la muestra.
Por esta razón una curva se conoce como un polígono de frecuencias suavizado.
www.
them
egal
lery
.co
m
CURVAS DE FRECUENCIAS. OJIVAS SUAVIZADAS
normalmente es más sencillo suavizar una ojiva que un polígono de frecuencias.
www.
them
egal
lery
.co
m
TIPOS DE CURVAS DE FRECUENCIA SUAVIZADAS
TIPOS DE CURVAS DE FRECUENCIAS
Las curvas de frecuencias presentan determinadas formas características que les distinguen:
www.
them
egal
lery
.co
m
TIPOS DE CURVAS DE FRECUENCIAS.
a) las curvas de frecuencias simétricas o bien formadas se características por el hecho de que las observaciones que equidistan del máximo central tienen la misma frecuencia.
b) en las curvas de frecuencias moderadamente asimetricas o sesgadas la cola de la curva a un lado del máximo central es mayor que al otro lado.
c) si la cola mayor se presenta a la derecha de la curva se dice que esta sesgada a la derecha o que tiene sesgo positivo, mientras que si ocurre lo contrario se dice que la curva esta sesgada a la izquierda o que tiene un sesgo negativo.
www.
them
egal
lery
.co
m
d)
e)
f)
g)
TIPOS DE CURVAS DE FRECUENCIAS.
en las curvas en forma de "j" o de "j invertida", el máximo se presenta en un extremo.
las curvas de frecuencias en forma de "u" tienen un máximo en ambos extremos.
una curva de frecuencias bimodal tiene dos máximos.
una curva de frecuencias multimodal tiene más de dos máximos
www.
them
egal
lery
.co
m
PROBLEMÁS
PROBLEMA 1.
Sean los números 17, 45, 38, 27, 6, 48, 11, 57, 34, 22:
a) colocarlos en orden creciente y decreciente. b) determinar el rango.
www.
them
egal
lery
.co
m
PROBLEMA 2.
La puntuación final en la clase de matemática de 80 estudiantes en la universidad se registran en la siguiente tabla:
www.
them
egal
lery
.co
m
PROBLEMA 2.
68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77
www.
them
egal
lery
.co
m
PROBLEMA 2.
con relación a esta tabla, encontrar: (a) la puntuación más alta, (b) la puntuación más baja, (c) el rango. (d) las puntuaciones de los cinco estudiantes de mayor puntuación. (e) las puntuaciones de los cinco estudiantes de menor puntuación. (f) la puntuación del decimo estudiante de mayor puntuación. (g) cuantos estudiantes obtuvieron puntuación de 75 o mayor. (h) cuantos estudiantes obtuvieron puntuación menor de 85. (i) que porcentaje de estudiantes obtuvo una puntuación mayor que 65 pero no mayor que 85. (h) que puntuaciones no tienen ningún estudiante.
www.
them
egal
lery
.co
m
PROBLEMA 3.
En la siguiente tabla se muestra una distribución de frecuencias de salarios semanales en dólares de 65 empleados de la compañía M&M:
www.
them
egal
lery
.co
m
SALARIOS (dólares)
50.00 - 59.00
60.00 - 69.00
70.00 - 79.00
80.00 - 89.00
90.00 - 99.00
100.00 - 109.00
110.00 - 119.00
PROBLEMA 3. número
de Empleados 8
10
16
14
10
52
www.
them
egal
lery
.co
m
PROBLEMA 3.
determinar:
(a) (b) (c)
(d)
el limite inferior de la sexta clase, el limite superior de la cuarta clase la marca de clase (o punto medio) de la tercera clase. los limites reales de la quinta clase.
www.
them
egal
lery
.co
m
PROBLEMA 3. determinar:
(e) tamaño del quinto intervalo de clase, (f) frecuencia de la tercera clase (g) frecuencia relativa de la tercera clase. (h) intervalo de clase que tiene mayor frecuencia.
www.
them
egal
lery
.co
m
PROBLEMA 3. Determinar:
porcentaje de empleados con salarios menores a $80.00 por semana.
porcentaje de empleados con menos de $100.00 pero con $60.00 semanales al menos.
www.
them
egal
lery
.co
m
PROBLEMA 3.
5intervalo de clase marca de clase Frecuencia
IC MC = X i f f * Xi Xi - X / Xi - X / f */ Xi - X / 49.5 50 - 54 54.5 52 1 52 -23.375 23.375 23.375 54.5 55 - 59 59.5 57 2 114 -18.375 18.375 36.75 59.5 60 - 64 64.5 62 11 682 -13.375 13.375 147.125 64.5 65 - 69 69.5 67 10 670 -8.375 8.375 83.75 69.5 70 - 74 74.5 72 12 864 -3.375 3.375 40.5 74.5 75 - 79 79.5 77 21 1617 1.625 1.625 34.125 79.5 80 - 84 84.5 82 6 492 6.625 6.625 39.75 84.5 85 - 89 89.5 87 9 783 11.625 11.625 104.625 89.5 90 - 94 94.5 92 4 368 16.625 16.625 66.5 94.5 95 - 99 99.5 97 4 388 21.625 21.625 86.5
80 6030 663
Media = X 75.375 Desviacio Es 8.2875
Coefiente de variación 0.10995025 www.
them
egal
lery
.co
m
PROBLEMA 4.
Si las marcas de clase en una distribución de frecuencias de pesos de estudiantes son: 128, 137, 146, 155, 164, 173 y 182 libras, hallar:
www.
them
egal
lery
.co
m
PROBLEMA 4
(a) el tamaño de intervalo de clase. (b) los limites reales de clase, (c) los limites de clase, suponiendo los pesos
medidos con aproximación de unidad de libra.
(d) representar gráficamente los resultados.
www.
them
egal
lery
.co
m
www.themegallery.com
Top Related