Datos agrupados

11

Click here to load reader

description

Descargado de internet visítame en: http://ceirlome.jimdo.com/ http://www.youtube.com/user/RaesahKhawala sígueme https://twitter.com/loeza_oficial encuentra test en: http://www.daypo.com/autores.php?t=104255#tests

Transcript of Datos agrupados

Page 1: Datos agrupados

� 1�

Hernán Darío Toro - 8

1 Datos Agrupados

Las características de los elementos de una población pueden ser de tipo cualitativo o detipo cuantitativo. En el primero caso se trata de cualidades que distinguen un elemento deotro y lo ubican en clases independientes y separadas. Las propiedades de tipo cuantitativoson aquellas que pueden medirse o contarse.

Ejercicio 1 Clasi�ca las siguientes variables de una población en cualitativas y cuantitati-vas.

Familia de un árbol Color favoritoTipo de hojas Máximo grosor de un troncoNúmero de hojas de un libro PesoEstatura Promedio de golesSueldo mensual EstratoNúmero de hermanos Deporte favoritoNombre Tiempo que tardo en hacr una tareaSexo

Una característica cuantitativa que toma datos aislados de modo que no acepta valoresintermedios entre dos consecutivos, se llama Cuantitativa Discreta. Si se trata de una car-acterística que puede tomar valores consecutivos, se dice que es una variable CuantitativaContinua.Las diferentes características de los elementos de una población pueden representarse de

diversas maneras: tablas, diagramas de barras o diagramas circulares.

1.1 Agrupación voluntaria

La representación de una variable continua puede hacerse mediante tablas, en donde lavariable se presenta agrupada en clases o intervalos numéricos, por medio de diagramas debarras unidas, llamadas histogramas o usando diagramas lineales.

Ejemplo 2 En la clase de educación física el profesor tomó la medida de la estatura de losalumnos del grado octavo; él apuntó los datos aproximando en centímetros, así: si medíaentre 154.1 cm. y 154.4 cm. anotaba 154 cm.; pero si medía entre 154.5 cm. y 154.9 cm.anotaba 155 cm. En una primera presentación el profesor agrupó los datos como se dan enla siguiente tabla:

Estatura en cm. 146 148 150 152 153 155 157 161 163 166 168 170No de alumnos 1 2 2 3 5 9 7 4 3 2 1 1

Page 2: Datos agrupados

� 2�

Hernán Darío Toro - 8

Como la estatura es una variable continua (¿por qué?), es posible agrupar los datos,considerar intervalos de cinco cm. y reunir, en cada uno, los alumnos cuya estatura está enese intervalo, así

Ejemplo 3 Como el rango de la estatura está entre 146 cm. y 170 cm. podemos agrupar encinco intervalos de 5 cm. cada uno. El profesor agrupa asi: en el primer intervalo incluye alos alumnos con 145.5 cm. o más hasta 150.4 cm. y así sucesivamente. ¿Qué estudiantesestán en el cuarto intervalo?

Estatura (fi)[145, 150) 5[150, 155) 17[155, 160) 7[160, 165) 7[165, 170) 4

De acuerdo con la tabla el maestro observa que 17 de sus estudiantes tienen una estaturasuperior a 150 cm. hasta 155 cm., y que los alumnos con estatura inferior son apenas 4. Lagrá�ca correspondiente a la tabla anterior se muestra en la �gura 1.

Figure 1: Histograma correspondiente a la distribución de frecuencias para las estaturas.

Si una característica o variable es continua, los datos pueden aproximarse y agruparse enintervalos llamados Intervalos de clase o simplemente clases.Para conocer la longitud de un intervalo se encuentra la diferencia entre los valores

extremos superiores (o inferiores) de dos intervalos consecutivos. La representación grá�ca

Page 3: Datos agrupados

� 3�

Hernán Darío Toro - 8

llamada histograma Se realiza mediante barras unidas, con base proporsional a la longituddel intervalo y altura proporsional a la frecuencia del intervalo. El diagrama lineal se obtieneuniendo con segmentos los puntos medios de las bases superiores de las barras del histograma,éstos puntos se llaman marcas de clase. Las marcas de clase se calculan mediante la fórmula:

yi =Ls + Li2

Ejercicio 4 En una ciudad costera, un sábado de agosto, se midió con radar la velocidad,en kilometros por hora, de 50 motocicletas que pasaron frente a un paso de nivel (¿qué es unpaso de nivel?). Los datos se encuentran en la siguiente tabla:

90 85 110 80 75 120 105 100 103 9896 89 135 108 125 130 120 102 97 86132 128 115 142 106 102 95 89 96 107121 132 126 128 134 138 139 110 123 108102 98 92 90 128 135 138 143 109 133

i. Agrupa los datos en 10 intervalos de clase de igual longitud. Elabora la tabla y el his-tograma correspondientes.

ii. Agrupa los datos en intervalos de clase de longitud 10. Elabora la tabla y el histogramacorrespondientes.

Solución 5 (i.) El menor dato es 75 y el mayor es 143, por lo tanto podemos considerarque los datos varían entre 70 y 150, es decir que están todos en el intervalo (70; 150). Paraencontrar la longitud de cada intervalo de clase aplicamos la siguiente fórmula:

l =Ls � Lim

l : longitud del intervalo de clase (la que debemos determinar).Li : límite inferior del intervalo de variación de los datos.Ls : límite superior del intervalo de variación de los datos.m : número de intervalos que se desea construir.Teniendo en cuenta la fórmula anterior es fácil ver que Li = 70, Ls = 150 y además el

ejercicio plantea agrupar en 10 intervalos, por lo tanto m = 10. Se tiene entonces:

l =150� 7010

) l = 8

Page 4: Datos agrupados

� 4�

Hernán Darío Toro - 8

Es decir que los intervalos de clase tendrán una longitud igual a 8. La tabla queda entoncesde la siguiente manera:

Intervalo de clase Frecuencia[70; 78) 1[78; 86) 2[86; 94) 6[94; 102) 7[102; 110) 10[110; 118) 3[118; 126) 5[126; 134) 8[134; 142) 6[142; 150) 2

Con esta tabla ya es posible contruir el histograma, el cual se verá como el de la �gura 2.

Figure 2: Histograma correspondiente a la distribución de frecuencias para la velocidad

1.2 Frecuencia

En un par de ocasiones hemos mensionado el término frecuencia aunque no hemos dado unade�nición precisa. Entendemos por frecuencia el número de veces que se repite cierta acción,

Page 5: Datos agrupados

� 5�

Hernán Darío Toro - 8

como por ejemplo en la expresión: ¿Con qué frecuencia vas al odontólogo? En estadísticalas cosas no son diferentes, dada una variable que toma diferentes valores, cada uno de éstosvalores puede presentarse cierto número de veces, esa en la frecuencia, el número de vecesque se presenta (o se repite) un dato.Diferenciaremos los siguientes tipos de frecuencia, los cuales explicaremos usando un

ejemplo:

Ejemplo 6 Treinta estudiantes se presentaron a un concurso de Biología y estos fueron susresultados:

Intervalos de clase fi Fi hi Hi yi70� 74 4 4 13; 3% 13; 3% 7275� 79 5 9 16; 7% 30% 7780� 84 6 15 20% 50% 8285� 89 7 22 23; 3% 73; 3% 8790� 94 8 30 26; 7% 100% 92

donde fi es la frecuencia absoluta, es decir, el número de estudiantes que hay en el inter-valo i, por ejemplo en el intervalo 4, la frecuencia es f4 = 7. Fi representa la frecuenciaabsoluta acumulada hasta el intervalo i, por ejemplo, para encontrar la frecuencia acumuladacorrespondiente al intervalo 4, se hace

F4 = f1 + f2 + f3 + f4

= 4 + 5 + 6 + 7

= 22

Por otro lado, hi corresponde al porcentaje de estudiantes que hay en el intervalo de clase i(o frecuencia relativa) se calcula mediante la fórmula:

hi = 100fin

por ejemplo el porcentaje de estudiantes que hay en la clase 3 es:

h3 = 100f3n= 100

�6

30

�= 100 (0; 2) = 20

por lo tanto el valor es h3 = 20%La frecuencia relativa acumulada es Hi y se calcula igual que la Fi solo que usando ls

frecuencias relativas. Por ejemplo, la frecuencia relativa acumulada de la clase 3 es:

H3 = h1 + h2 + h3

= 13; 3 + 16; 7 + 20

= 50

Page 6: Datos agrupados

� 6�

Hernán Darío Toro - 8

y, �nalmente yi es la marce de clase de cada intervalo.

Ejercicio 7 La velocidad de 50 vehículos esta agrupada en la siguiente tabla.

Intervalo de clase fi Fi hi Hi yi[70; 78) 1[78; 86) 2[86; 94) 6[94; 102) 7[102; 110) 10[110; 118) 3[118; 126) 5[126; 134) 8[134; 142) 6[142; 150) 2Total 50

Completa la tabla y responde la siguientes preguntas:

i. ¿Cuántos vehículos llevan una velocidad menor a 110 km/h?

ii. ¿Qué porcentaje se encuentra por debajo de 120 km/h?

1. ¿Qué porcentaje supera los 110 km/h?

2. Si se estableciera una velocidad máxima de 120 km/h, ¿cuántos vehículos serían san-cionados? ¿A que porcentaje corresponde?

3. Si se estableciera una velocidad mínima de 94 km/h, ¿cuántos vehículos serían san-cionados? ¿A que porcentaje corresponde?

1.3 Notación Sigma

La notación sigma se utiliza para escribir de forma abreviada sumas que involucran muchossumandos. Considere por ejemplo que se quieren sumar las edades de 100 personas, demanera que x1 es la edad de la primera persona, x2 es la edad de la segunda persona y asisucesivamente hasta que x100 es la edad de la última persona.

Page 7: Datos agrupados

� 7�

Hernán Darío Toro - 8

Usemos la variable n para contar estas personas, entonces n = 1; : : : ; 100, de esta forma,n se llama un contador o un índice. Tenemos entonces que xn es la edad de la n�ésimapersona. La suma la podemos escribir de la siguiente forma:

x1 + x2 + � � �+ x100 =100Xn=1

xn

El símboloPse es la letra griega sigma mayúscula, y representa la operacion de suma.

Debe interpretarse como la repetición del proceso de sumar, es decir, n toma el primer valor,1, luego 2, luego 3 y así sucesivamente hasta llegar al último: 100. En cada uno de estospasos se obtiene un resultado, y lo que hace

Pes sumar todos estos resultados.

Ejemplo 8 Sea n = 1; : : : ; 10, de manera que xn son los primeros 10 números primos.Calcular la suma

P10n=1 xn.

Solución 9 Si xn son los primeros 10 números primos, entonces: x1 = 2, x2 = 3, x3 = 5,x4 = 7, x5 = 11, x6 = 13, x7 = 17, x8 = 19, x9 = 23, x10 = 29. Se tiene entonces,

10Xn=1

xn = x1 + x2 + x3 + x4 + x5 + x6 + x7 + x8 + x9 + x10

= 2 + 3 + 5 + 7 + 11 + 13 + 17 + 19 + 23 + 29

= 129

Considere ahora que se quieren sumar los números del 1 al 100. En ese caso se tiene,100Xn=1

n = 1 + 2 + 3 + � � �+ 100

De forma similar si se quieren sumar los múltiplos de 3 expresión queda:100Xn=1

3n = 1 + 2 + 3 + � � �+ 300

Ejercicio 10 Calcula las siguientes sumas, considerando que xn son los primeros 10 múlti-plos de 3

1.P10

n=1 xn

2.P10

n=1 (x2n + 3)

3.P10

n=1 (3x2n + xn)

4.P10

n=1

p(x3n � xn)

Page 8: Datos agrupados

� 8�

Hernán Darío Toro - 8

2 Grá�cos en datos agrupados

Una forma alternativa a las tablas, para resumir los datos de una variable es la utilización deun dibujo o grá�ca que permita interpretar mejor algunas de sus características principales.Es importante tener en cuenta que las representaciones grá�cas ayudan a comprender mejorcomo se comportan los datos, pero de ninguna manera reemplazan el análisis cuantitativode la información. Son sólo ayudas visuales.

2.1 Diagrama circular

Los diagramas circulares resaltan el porcentaje en que aparece una característica o atributorespecto al total. Este tipo de grá�ca es útil para representar variables que tienen pocascategorías, ya que en el caso de una variable con muchas categorías hay un exceso de sectores

Ejemplo 11 Durante el mes de abril se tomó la temperatura registrada al medio día. Lainformación fue organizada en la siguiente tabla.

Temperaturafi

10oC 11oC 12oC 13oC 14oC 15oC 16oC 17oC 18oC 19oC5 7 4 1 1 3 0 0 18 19

Representemos en un diagrama circular la temperatura del mes de abril.

Solución 12 Son en total 30 días y un circulo tiene en total 360o, por tanto a cada temper-atura que se presentó le corresponde un sector de 360o

30� fi = 12ofi:

En general, cuando se tienen n datos y se desea hacer un diagrama circular se divide 360o

entre n para determinar el número de grados correspondientes a cada parte; �nalmente semultiplica ese valor por las frecuencias absolutas y eso nos da al ángulo de cada sector delcírculo. Se colorea el diagrama según el número de datos de cada especie.

Ejercicio 13 Representa en un diagrama circular las edades de 20 estudiantes de gradooctavo.

Edad 13 14 15fi 7 11 2

Ejercicio 14 A continuación se presenta la información sobre la categoría en es escalafóndocente de un grupo de profesores universitarios y para simpli�car la escritura se adopta la

Page 9: Datos agrupados

� 9�

Hernán Darío Toro - 8

Figure 3: Diagrama circular correspondiente al la temperatura observada durante el mes deabril

siguiente codo�cación: 1: Auxiliar, 2: Asistente, 3: Asociado y 4: Titular. Los valores dela variable "Categoría del escalafón docente" para 40 profesores es el siguiente.

1 3 4 1 1 4 2 23 1 1 3 1 1 4 34 1 2 4 3 2 1 24 2 3 2 2 3 1 13 4 2 2 2 4 4 1

a. Determina la distribución de frecuencias (fi; Fi; hi; Hi).b. Elabora el diagrama circular correspondiente a fi

2.2 Ojiva

La ojiva es la grá�ca de la frecuencia (absoluta o relativa) acumulada. Usualmente se utilizala frecuencia relativa expresada en términos de porcentaje. El intervalo (o el límite superiordel intervalo) aparece en el eje horizontal y la frecuencia absoluta o relativa en el eje vertical.La ojiva indica la frecuencia acumulada en y por debajo de un intervalo dado. Esta grá�ca

facilita la comparación dos grupos de datos de forma visual y de manera mucho más efectiva

Page 10: Datos agrupados

� 10�

Hernán Darío Toro - 8

que el polígono de frecuencia, puesto que permite comparar los porcentajes acumulados dedos distribuciones con respecto al mismo intervalo.Construcción:

a. En el límite superior de cada clase se traza el punto que corresponda en altura a lafrecuencia absoluta o relativa acumulada.

b. Se conectan estos puntos con segmentos.

Ejemplo 15 Treinta estudiantes se presentaron a un concurso de Biología y estos fueronsus resultados:

Intervalos de clase fi Fi hi Hi xi[70; 75) 4 4 13; 3% 13; 3% 72[75; 80) 5 9 16; 7% 30% 77[80; 85) 6 15 20% 50% 82[85; 90) 7 22 23; 3% 73; 3% 87[90; 95) 8 30 26; 7% 100% 92

La ojiva correspondiente es

Figure 4: scanear para trazar ojiva

Page 11: Datos agrupados

� 11�

Hernán Darío Toro - 8

Ejemplo 16 Un concesionario de autos realizó una prueba para vehículos de gama media,con el propósito de medir el rendimiento de combustible. Para esto seleccionó 20 automóvilesal azar y realizó con cada uno de ellos el mismo viaje. Los resultados de su investigaciónson los siguientes:

Km/gal fi Fi hi Hi yi[15; 25) 5[25; 35) 9[35; 45) 4[45; 55) 2

a. ¿Cuál es la longitud de los intervalos de clase?

b. ¿Cuál es la marca de clase de cada intervalo de clase?

c. Un automóvil adicional presentó un rendimiento e 36,5 kilómetros por galón. ¿en queintervalo de clase lo ubicarías? ¿Cuál es ahora la frecuencia para este intervalo declase? Elabora la nueva tabla.

d. Elabora el histograma para la distribución de frecuencias de la tabla que construiste en elliteral c.

e. Completa la tabla y traza la ojiva y el diagrama circular correspondientes.