Unidad 2 Distribuciones de frecuencia.docx

38
25 ¡Error! Utilice la pestaña Inicio para aplicar Título 1 al texto que desea que aparezca aquí.¡Error! Utilice la pestaña Inicio para aplicar Título 1 al texto que desea que aparezca aquí.Capítulo 2 UNIDAD II ITVP EMILIANI 25

Transcript of Unidad 2 Distribuciones de frecuencia.docx

Estadstica Descriptiva

56

Captulo 255

UNIDAD II

Distribuciones de frecuencia

Distribuciones de frecuencia

Los datos son colecciones de cualquier cantidad de observaciones relacionadas.Una coleccin de datos se conoce como conjunto de datos y una sola observacin es un punto de dato.

Para que los datos sean tiles, necesitamos organizar nuestras observaciones, de modo que podamos distinguir patrones y llegar a conclusiones lgicas.

Recoleccin de datos

Los especialistas en estadstica seleccionan sus observaciones de manera que todos los grupos relevantes estn representados en los datos. Los datos pueden provenir de observaciones reales o de registros que se mantienen para otros propsitos. Los datos pueden ayudar a los responsables de tomar decisiones a hacer suposiciones bien pensadas acerca de las causas y, por tanto, de los efectos probables de ciertas caractersticas en situaciones dadas. Tambin el conocimiento de tendencias adquirido de la experiencia previa puede permitir estar al tanto de posibles resultados y actuar en consecuencia. Cuando los datos son ordenados de manera compacta y til, los responsables de tomar decisiones pueden obtener informacin confiable sobre el ambiente y usarla para tomar decisiones inteligentes. Los administradores deben tener mucho cuidado y asegurar que los datos utilizados estn basados en suposiciones e interpretaciones correctas. Para ello, se utilizan las pruebas para datos.

La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato de la variable su frecuencia correspondiente.

Tipos de frecuencias

Frecuencia absoluta

La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico.Se representa por f

La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N.

f1+ f2+ f3+...+fn = nPara indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria.Frecuencia Relativa

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos.

Frecuencia Relativa porcentual

Expresada partir de fr en trminos de porcentaje

Frecuencia Acumulada

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

Se representa por fa

Frecuencia acumulada relativa

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento. Se representa por

Y Respectivamente

Distribuciones de frecuencia Cualitativas

Las distribuciones de frecuencia cualitativas presentan como variable un atributo o caracteres no cuantitativos, por lo que entre ellas tenemos:

Distribucin cronolgica

En ella la variable representa perodos de tiempo no cuantificables

Perodo (Variable)Habitantes de x pas (frecuencia)

Edad de piedra1000000

Edad del metal5667889

Edad media9009090934

Renacimiento76524376743

poca contempornea100893284892392384984

Distribucin Geogrfica

En ste tipo de distribuciones se toma en cuenta como variable regiones del espacio terrestre.

PasCantidad de Automviles rojos, (dato irrelevante)

Guatemala87324578

Costa Rica792365

Panam724435

Honduras13451324

Distribucin por atributos

La variable toma valores de cualidades

Color de AutomvilCantidad

Rojo812734

Verde 123758213

Negro4123123

Blanco1823572234

Distribuciones Cuantitativas de datos

Como hemos visto una serie de datos, podemos clasificarla de diferentes maneras. Todo depender de la naturaleza de los datos, la cantidad de datos, el parmetro a conocer o calcular, o por conveniencia al investigador.

En este tipo de distribuciones, la variable es de carcter estrictamente numrico y se puede clasificar en:

a. Distribucin de Frecuencias Simpleb. Distribucin de frecuencia agrupada en intervalos con amplitud constante

Distribucin de Frecuencias simple

Este ordenamiento es ideal para cuando la variable toma no muchos valores discretos de modo que resulta fcil colocar los valores de la variable:

Para su construccin seguiremos el siguiente esquema:

Ejemplo:

Se tiene la siguiente coleccin de datos

66576872

82666570

66726568

Ordenamos los datos, n = 12

576565666666686870727282

Tabulamos y asignamos la frecuencia

Xf

571

652

663

682

701

722

821

Total12

Recuerde verificar que

A partir de sta distribucin, es posible determinar la frecuencia relativa fr, la frecuencia porcentual fr%, frecuencia acumulada fa, frecuencia acumulada relativa y porcentual, far y far%.

XfFrfr%fafarfar%

5711/120.08(1/12)*100811/120.088

6522/120.17(1/12)*1001733/120.2525

6633/120.25(1/12)*1002566/120.550

6822/120.17(1/12)*1001788/120.6767

7011/120.08(1/12)*100899/120.7575

7222/120.17(1/12)*100171111/120.9292

8211/120.08(1/12)*10081212/121100

Total de la sumatoria1211100%100%

Veamos el detalle de algunas columnas.

Para fr

Para cada valor de frecuencia se calcula su respectiva frecuencia relativa

Para el valor X=57fr1 = 1/12 = 0.08 y su respectiva fr%1 = 8%

Quiere decir que el dato 57 representa un 8% del total de la muestra

Para el valor X=65Fr2 = 2/12 = 0.17 y su respectiva fr%2 = 17%

Quiere decir que el dato 65 representa un 17% del total de la muestra

Para el valor X=66Fr3 = 3/12 = 0.25 y su respectiva fr%3 = 25%

Quiere decir que el dato 66 representa un 25% del total de la muestra

Y as para los dems valores de la variable

Para frecuencia acumulada fa

La fa1 se obtiene luego de sumar la frecuencia acumulada anterior con la frecuencia 1, y como la frecuencia acumulada anterior es fa0 = 0 entonces:

fa1 = frecuencia acumulada anterior + frecuencia del intervalo = 0 + 1 = 1

La fa2 se obtiene luego de sumar la frecuencia acumulada anterior con la frecuencia 2, y como la frecuencia acumulada anterior 1 entonces:

fa2 = frecuencia acumulada anterior + frecuencia del intervalo = 1 + 2 = 3

La fa3 se obtiene luego de sumar la frecuencia acumulada anterior con la frecuencia 3, y como la frecuencia acumulada anterior 3 entonces:

fa3 = frecuencia acumulada anterior + frecuencia del intervalo = 3 + 3 = 6

La fa4 se obtiene luego de sumar la frecuencia acumulada anterior con la frecuencia 4, y como la frecuencia acumulada anterior 6 entonces:

fa4 = frecuencia acumulada anterior + frecuencia del intervalo = 6 + 2 = 8

De igual forma para todos los valores siguientes; hasta que el ltimo valor de frecuencia acumulada es igual a n.Para far y far%

Para far

Para cada valor de frecuencia acumulada se calcula su respectiva frecuencia acumulada relativa

Para el valor X=57far1 = 1/12 = 0.08 y su respectiva fr%1 = 8%

Quiere decir que para el valor x=57 llevamos un 8% acumulado del total de datos.

Para el valor X=65far2 = 3/12 = 0.25 y su respectiva fr%2 = 25%

Quiere decir que para el valor x=65 llevamos un 25% acumulado

Para el valor X=66far3 = 6/12 = 0.5 y su respectiva fr%3 = 50%

Quiere decir que para el valor x=66 llevamos un 50% acumulado

Y as para los dems valores de la variable

Notamos valiosa informacin calculada a partir de una distribucin de frecuencias simple

XfFrfr%fafarfar%

5711/120.08(1/12)*100811/120.088

6522/120.17(1/12)*1001733/120.2525

6633/120.25(1/12)*1002566/120.550

6822/120.17(1/12)*1001788/120.6767

7011/120.08(1/12)*100899/120.7575

7222/120.17(1/12)*100171111/120.9292

8211/120.08(1/12)*10081212/121100

Total de la sumatoria1211100%100%

Ejercicio 1En el siguiente espacio describa detalladamente para cada una de las colecciones de datos el proceso para construir una distribucin de frecuencias simple, y concluya con la tabla que muestre f, fr, fr%, fa, far, far%.

1. 525510500490485480

478475470460455450

445440435430425420

2. 500440510470460425430

490525500525510460455

475485480485480478475

440470460430455450445

435525500490480478485

430475460470450455440

425445430435420425480

490510490430425420470

500490485455

3. 455475470475455485435

495475455475465475480

485495485465500465475

435485430595475475485

495420440480470450485

450465475440420425585

475455440455475495485

495425455475575485495

485505465495465475585

495475

4. 1.001.051.351.951.800.951.351.351.201.13

1.031.301.201.131.000.951.201.201.021.00

1.050.981.021.001.031.151.051.020.961.80

1.101.000.961.800.991.351.351.951.101.00

1.351.021.171.001.001.201.201.131.351.02

1.101.001.061.101.101.051.021.001.101.05

Distribucin de frecuencia en Datos agrupados por intervalos

Una tabla de frecuencias est formada por las categoras o valores de una variable y sus frecuencias correspondientes. sta tabla es lo mismo que una distribucin de frecuencias, se crea por medio de la tabulacin y agrupacin, por lo que se puede construir una distribucin de frecuencias con intervalos o clases.

Si tenemos una coleccin de datos que representen una muestra y el tamao de dicha muestra es

Entonces si no se indica lo contrario utilizaremos una distribucin por intervalos para organizar los datos

Paso 1

Recopilacinde los datos782, 1333, 515, 1475, 696, 832, 1052, 700, 958, 542, 1296, 704, 814, 1482, 1023, 739, 643, 956, 1023, 784.

Paso 2

Se ordenan los datos de menor a mayor5157007849871296

54270481410231333

64373983210231475

69678295610521482

Paso 3

Se determina el nmero de clasesPara esto se emplea la frmula:

En la que n representa el total del nmero de datos que se van a ordenar y analizar.

K = Numero de clases= 4.47

Este valor se redondea al prximo nmero superior ya que aparece un valor decimal, sin importar que este sea menor a 0.5. De esta forma el nmero de clases se quedara:

Nmero de clases, k = 5.

Otro mtodo para el clculo del nmero de clases k

Cabe mencionar que en este caso particular se aplica elmtodode larazcuadrada para determinar el nmero de clases, pues el nmero de datos que se desea analizar es pequeo. Sin embargo, para los casos en que la base de datos es grande, se sugiere aplicar elmtodode Sturges, quien presenta la siguiente frmula para para calcular el nmero de clases:

Paso 4

Calculo del intervalo exactoo amplitud (i). Para esto, la frmula empleada es:

En donde Rango

(R) = Dato mayor Dato menor

Se observa que el valor mayor de la base de datos es 1482, y el valor ms pequeo es de 515, por ello;

Amplitud = 193.4

Paso 5

Se determina el Ancho de Clase ajustado segn el valor de la unidad de variacin o incremento (I)En este ejemplo, la unidad de variacin de los datos es igual a 1, por lo que el tamao ajustado o ancho de clase debe ser por lo menos igual al siguiente valor entero incrementado en 1, o sea 194.

Paso 6

Se calculan los Lmites Aparentes Inferiores (LAI) y Superiores de cada clase (LAS).Para ello se emplea la frmula:

Para los lmites aparentes inferiores. Este clculo se inicia tomando en cuenta que el primer Lmite Aparente Inferior de la primera clase es el valor menor de los datos que se desean ordenar, esto es 515.

Limite Aparente Inferior de la Primera Clase=515

Limite Nominal Inferior de la Segunda Clase=515+Amplitud

= 515+194=709

Limite Nominal Inferior de la Tercera Clase =709+194 =903

Limite Nominal Inferior de la Cuarta Clase =903+194 =1097

Limite Nominal Inferior de la Quinta Clase

=1097+194 =1291

Aunque sabemos que solo son 5 clases las que compondr la Tabla deDistribucinde Frecuencias, calcularemos un Limite Aparente Inferior hipottico, por si fuese necesario.

Limite Aparente InferiorHipottico

=1291+194 =1485

Hasta ahora, lo que hemos logrado, se puede observar de la siguiente manera en la Tabla deDistribucinde Frecuencia

CLASELAILASffafr%far%

1515

2709

3903

41097

51291

6 H1485

En este mismo paso figura la necesidad de calcular los Limites Nominales Superiores

De forma que

Lmite Superior de la clase 1

LAS1= LAI1 + (i I)

LAS1 = 515 + (194 1) = 708

Lmite Superior de la clase 2LAS2= LAI2 + (i I)

LAS2 = 709 + (194 1) = 902

Lmite Superior de la clase 3LAS3= LAI3 + (i I)

LAS3 = 903 + (194 1) =

Lmite Superior de la clase 4LAS4= LAI4 + (i I)

LAS4 = 1097 + (194 1) = 1290

Lmite Superior de la clase 5LAS5= LAI5 + (i I)

LAS5 = 1291 + (194 1) = 1484

Lmite Superior de la clase 6 si fuese necesarioLAS6= LAI6 + (i I)

LAS6 = 1485 + (194 1) = 1687

Recuerde que la unidad de variacin o incremento (I) es igual a 1, segn lo expuesto anteriormente

Los lmites Aparentes, ya completos se veran en la DFI (distribucin de frecuencia por intervalos) as:

CLASELAILASffafr%far%

1515708

2709902

39031096

410971290

512911484

6 H14851687

Calculando la sexta clase si existiese algn dato que sobrepase el LAS5 y fuese necesaria otra clase.

Paso 7

En este paso iniciamos el conteo de los datos. Para ello procedemos de la manera que se explica; a partir de la base de datos que se orden de menor a mayor, se van contando los nmeros que estn comprendidos en cada intervalo de clase, de preferencia, estos se van tachando en la misma base de datos.

Observe que en la primera clase, cuyo intervalo va de 515 a 708, estn los nmeros 515, 542, 643, 696, 700 y 704, por lo que podemos decir que en este primer intervalo o Clase 1, tenemos una frecuencia absoluta de seis, ya que solo hay seis nmeros que estn dentro del intervalo mencionado.

En la segunda clase (intervalo que va de 709 a 902) estn los nmeros 739, 782, 784, 814 y 832. En esta Clase la frecuencia seria de 5.

En la Clase 3, los nmeros que debemos buscar son los que sean iguales o mayores que 903 e iguales o menores de 1096. Los nmeros que estn comprendidos entre estos lmites son el 956, 987, 1023, 1023 otra vez, y el 1052, La frecuencia absoluta seria 5

Para la clase 4, los nmeros deben ser iguales o mayores de 1097 pero iguales o menores de 1290. Vase que en este intervalo no hay ningn valor, por ello la f es igual a cero.

Para terminar, la ltima clase exige que se busquen valores mayores o iguales a 1291 y menores o iguales a 1484. Se observa que los valores comprendidos son el 1296, 1333, 1475 y 1482, lo cual indica que la f es igual a 5.

Con las frecuencias absolutas bien definidas para cada Clase, la DFI quedara de la forma que se exhibe

CLASELAILASffafr%far%

15157086

27099025

390310965

4109712900

5129114844

Frecuencia Acumulada

La Frecuencia acumulada de cierta n clase, corresponde a la sumatoria de los valores de las Frecuencias Absolutas abajo del Limite Real superior de la clase n contemplada.

Nos disponemos ahora a calcular la Frecuencia Acumulada. Para esto se emplea la formula

Con esta frmula calculamos la Frecuencia acumulada de las 5 clases.

fa1 = 0 + 6 = 6

fa2 = 6 + 5 = 11

fa3 = 11 + 5 = 16

fa4 = 16 + 0 = 16

fa5 = 16 + 4 = 20

Incluyendo estos datos en la columna de la Frecuencia acumulada, la DFI quedara

La columna del Porciento de la Frecuencia absoluta (%Fr, Frecuencia Relativa) se calcula fcilmente dividiendo cada valor de la Frecuencia absoluta entre el total de datos que en esta base de datos particular es igual a 20, a saber, para el primer caso n=20

Para lograr la Frecuencia Relativa acumulada se dividi la Frecuencia acumulada (fa) entre el total de datos, el cual es igual a 20 (n), segn la ltima frmula dada anteriormente.

Lmites Reales

Los lmites Reales de Clase son los que realmente se emplean para elaborar cualquier grfico que se desee utilizar para analizar los datos de una manera rpida y precisa. Para ello se emplea la frmula que se muestra enseguida

De forma que los Limites Reales para la primera clase secalcularanas

Lmite Real Inferior de la clase 1

Lmite Real Inferior de la clase 2

O bien con el Lmite Real Inferior 1Mediante:

Entonces

Lmite Real Inferior de la clase 3

O bien con el Lmite Real Inferior 2Mediante:

Entonces

Lmite Real Inferior de la clase 4

O bien con el Lmite Real Inferior 3Mediante:

Entonces

Lmite Real Inferior de la clase 5

O bien con el Lmite Real Inferior 4Mediante:

Entonces

Para los Lmites Reales SuperioresLmite Real Superior de la clase 1

Lmite Real Superior de la clase 2

O bien con el Lmite Real Superior 1Mediante:

Entonces

Lmite Real Superior de la clase 3

O bien con el Lmite Real Superior 2Mediante:

Entonces

Lmite Real Superior de la clase 4

O bien con el Lmite Real Superior 3Mediante:

Entonces

Lmite Real Superior de la clase 5

O bien con el Lmite Real Superior 4Mediante:

Entonces

Incluyendo la nueva columna de estos lmites en la DFIquedara:IntervaloLAILASLRILRSffafrfar

1515708514.5708.56630%30%

2709902708.5902.551125%55%

39031096902.51096.551625%80%

4109712901096.51290.50160%80%

5129114841290.51484.542020%100%

Marca de Clase

sta columna indica un valor representativo para cada intervalo, o su valor medio;

Y para cada intervalo los siguientes valores para la marca de clase:

Intervalo o claseMarca de clase Xi

1(515 + 708)/2 = 611.5

2(709 + 902)/2 = 805.5

3(903 + 1096)/2 = 999.5

4(1097 + 1290)/2 = 1193.5

5(1291 + 1484)/2 = 1387.5

Ejercicio 2Estructure la Tabla de Distribucin de Frecuencia para las bases de datos que se dan enseguida. No se olvide incluir los clculos para el Nmero de Clases, el Ancho de Clases, Limites Nominales, Limites Reales, etc. y colocar el incremento en cada caso.

Tabla 1500440510470460425430

490525500525510460455

475485480485480478475

440470460430455450445

435525500490480478485

430475460470450455440

425445430435420425480

490510490430425420470

500490485455

Determine el nmero de Clases

Determine el rango de la coleccin de datos

Determine la amplitud del intervalo

Determine el incremento

Construya su tabla de lmites aparentes, recuerde comenzar por el valor ms pequeo.

Determine la tabla de lmites reales

Determine las frecuencias; absoluta, relativa porcentual, acumulada, acumulada relativa porcentual, y adems la marca de clase

Tabla 20.820.90.950.961.021.081.091.111.141.16

1.191.231.271.281.291.31.31.351.371.39

1.411.431.441.471.481.491.491.51.531.54

1.571.581.631.651.661.671.681.711.721.75

1.751.781.851.871.911.972.022.062.062.13

Muestre una DFI con las caractersticas de la tabla1

Tabla 39.617.120.217.814.710.215.319.712.79.9

15.718.59.511.617.211.114.821.31316.5

14.114.920.617.512.312.814.416.810.916.7

10.811.91515.411.413.519.113.712.915.8

9.516.320.617.51314.318.716.616.614.9

Muestre una DFI con las caractersticas de la tabla1

Tabla 4

47495149604650584655

45473543473543547655

50684946563738696260

50707262664946625243

61535149305257695055

52544860653753488063

51696863185938436652

39755845664947465560

46494260603860636566

Muestre una DFI con las caractersticas de la tabla1

Tabla 5

0.1650.160.1380.1450.1550.150.1850.16

0.130.140.1450.150.1650.1380.210.125

0.170.1680.1380.1270.1450.1560.1580.16

0.1450.150.150.1550.1450.1440.1480.16

0.1560.160.1650.170.1850.170.1850.19

0.150.20.1750.1150.120.150.170.165

0.1350.140.1450.150.1550.160.160.17

0.170.1650.1550.1450.1560.170.140.21

0.1750.180.1680.1350.1670.1750.20.17

Ejercicio 3

1. Estas son los puntajes obtenidos por los 100 candidatos que se presentaron a un concurso:

38513265252834122943

7162503782419478153

166250374177594625

55384616726461335921

13923743585288277466

6328361956843864250

9851623174347545826

12423468774560317223

1822703455920685549

33521440385450114176

Muestre una DFI con las caractersticas de la tabla1.

2. En una cierta ciudad, se registra el nmero de nacimientos ocurridos por semana durante las 52 semanas del ao, siendo los siguientes los datos obtenidos:

64281816106751289

121711916191818161412710

311712591115941611

78101532139111713128

56

ITVP Emiliani55