EJEMPLO DE APLICACIÓN
La secretaria de educación está implementando un estudio sobre la
asignación salarial de los docentes del departamento con el objetivo de
promover un plan de vivienda. Para llegar a conclusiones precisas los
encargados del estudio han elaborado una encuesta que consta de 10
preguntas a una muestra de 200 profesores de todos los municipios. Dos
de las 10 preguntas estaban redactadas así:
1. Cuál es su grado de escalafón? _____
2. Su asignación salarial (En miles de pesos) de acuerdo a su grado de
escalafón se ubica en los siguientes rangos.
a. 500 _ 700 ______
b. 700 _ 900 ______
c. 900 _ 1100 ______
d. 1100 _ 1300 ______
e. 1300 _ 1500 ______
f. 1500 _ 1800
Los resultados de las encuestas para la primera pregunta se resumen en
la siguiente tabla.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 2 91 2 3 4 5 6 7 8 9 10 11 12 13 14 2 91 2 3 4 5 6 7 8 9 10 11 12 13 14 2 91 2 3 4 5 6 7 8 9 10 11 12 13 14 3 91 2 3 4 5 6 7 8 9 10 11 12 13 14 3 91 2 3 4 5 6 7 8 9 10 11 12 13 14 3 1 2 3 4 5 6 7 8 9 10 11 12 13 14 2 1 2 3 4 5 6 7 8 9 10 11 12 13 1 2 1 2 3 4 5 6 7 8 9 10 11 12 2 1 2
1 2 3 4 5 6 7 8 9 10 1 12 2 1 2 1 2 3 4 5 6 7 8 9 9 1 12 2 1 2 1 2 3 4 3 6 7 9 9 9 1 12 3 1 2 1 2 3 2 3 6 2 9 9 3 12 12 3 1 9
Haciendo uso de R, Calcular las medidas cuantiles para datos no
agrupados, realizar gráficos Boxplot.
Solución:
Los datos se organizaron en un archivo txt, denominado “Escalafon.txt”
y se grabó en la carpeta de trabajo. En el entorno de R se ha
direccionado, direccionando hacia la carpeta en donde se encuentra el
archivo. Las siguientes líneas hacen llamado de los datos.
datos=read.table("Escalafon.txt")
attach(datos)
datos
Veamos un resumen de las medidas cuantiles
summary(datos)
Min. : 1.00 1st Qu.: 3.00 Median : 6.00 Mean : 6.34 3rd Qu.: 9.00 Max. :14.00
De inmediato se obtienen los cuartiles de la distribución, además del
valor mínimo, máximo y el promedio. Para este caso el promedio se
requiere redondearlo ya que se está considerando los grados de
escalafón como datos enteros, por tanto:
X=6Las medidas cuartiles se pueden representar mediante la caja de
bigotes o los Boxplot
La grafica se obtiene mediante los comandos
boxplot(datos, main="Grados de Escalafon", xlab="Escalafon", ylab="Numero de
docentes")
Una representación con mejor presentación se obtiene mediante la
codificación
boxplot(datos, notch=TRUE, col=(c("darkgreen")), main="Grados de escalafon",
xlab="Docentes")
Para reconocer las demás medidas cuantiles en R, se requiere tener los
datos como un vector, veamos un ejemplo para un número determinado
de datos extraído de la información obtenida en el grupo de los 200
docentes entrevistados
datos1=c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,2,9,1,2,3,4,5,6,7,8,9,10,11,12,13,14,2,9,1,
2,3,4,5,6,7,8,9,10,11,12,13,14,3,9)
quantile(datos1, prob = seq(0, 1, length = 11), type = 5)
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 1.0 2.0 3.0 4.0 6.0 7.5 9.0 10.0 11.0 13.0 14.0
quantile(datos1)
0% 25% 50% 75% 100% 1.00 3.75 7.50 10.25 14.00
quantile(datos1, prob = c(0.15, 0.25, 0.35))
15% 25% 35% 2.05 3.75 5.00
EJERCICIO DE APLICACIÓN
1. Al consejo directivo de un colegio le han llegado las quejas de que los
precios de las comidas y artículos que se venden en la cafetería están
elevados. Para averiguar si el rumor es cierto se tomaron como muestra
algunos artículos encontrándose los siguientes precios.
70 86 75 72 66 90 85 70
72 81 70 75 84 62 66 74
82 75 68 83 81 65 75 70
73 65 82 80 66 73 95
85 84 75 68 80 75 68 72
78 73 72 68 84 75 72 80
Para ayudar al consejo directivo y determinar si el rumor es cierto o
falso realice las siguientes actividades.
a. Agrupar en intervalos de clase apropiados
Levels: (61,66] (66,71] (71,76] (76,81] (81,86] (86,91] (91,95]
[1] (66,71] (81,86] (71,76] (71,76] (61,66] (86,91] (81,86] (66,71]
(71,76]
[10] (76,81] (66,71] (71,76] (81,86] (61,66] (61,66] (71,76] (81,86]
(71,76]
[19] (66,71] (81,86] (76,81] (61,66] (71,76] (66,71] (71,76] (61,66]
(81,86]
[28] (76,81] (61,66] (71,76] (91,95] (81,86] (81,86] (71,76] (66,71]
(76,81]
[37] (71,76] (66,71] (71,76] (76,81] (71,76] (71,76] (66,71] (81,86]
(71,76]
[46] (71,76] (76,81]
f h F H
(61,66] 6 0.1276596 6 0.1276596
(66,71] 8 0.1702128 14 0.2978723
(71,76] 16 0.3404255 30 0.6382979
(76,81] 6 0.1276596 36 0.7659574
(81,86] 9 0.1914894 45 0.9574468
(86,91] 1 0.0212766 46 0.9787234
(91,95] 1 0.0212766 47 1.0000000
b. Determinar el precio promedio de los artículos
74.6
c. Determinar la mediana de los artículos
75.00
d. Calcule, Q1, Q3.
Min. 1stQu. Median Mean 3rd Qu.Max.
32.00 70.00 75.00 75.47 81.00 95.00
e. Realice un gráfico de bigotes y su respectivo análisis con las medidas
visualizadas
Como se puede observar, entre 70 y 80 está la mayor cantidad de
precios que se repiten en la cafetería, sin embargo los bigotes se
extienden bastante más hacia arriba de lo que se consideraría normal en
esta serie de datos agrupados, por lo cual, podemos deducir que existe
cierta inclinación en lo precios de la cafetería que tienden a estar más
elevados de la cuenta.
f. Realice un gráfico de barras
g. Realice un gráfico de ojivas de la distribución.
EJERCICIOS PARA PRACTICAR
1. Un estudio en las diferentes escuelas y colegio de un país, consistió
en anotar el número de palabras leídas en 15 segundos por un grupo de
120 sujetos disléxicos y 120 individuos normales. Teniendo en cuenta
los resultados de la tabla
No de palabras
leídas
Disléxicos Normales
26 24 9
27 16 21
28 12 29
29 10 28
30 2 32
Calcule:
1. Las medias aritméticas de ambos grupos.
2. Las medianas de ambos grupos.
3. El porcentaje de sujetos disléxicos que superaron la mediana de
los normales
// Los disléxicos no superan la mediana de los normales, se puede
ver en la tabla anterior.
4. Las modas de ambos grupos.
5. Que implica que la moda del segundo grupo sea mayor que la
del primer grupo.
// Las modas de ambos grupos son iguales.
Realizar los anteriores cálculos en R-Estadístico, dibujar las respectivas
cajas de bigotes.
2. Con el fin de observar la relación entre la inteligencia y el nivel
socioeconómico (medido por el salario mensual familiar) se tomaron dos
grupos, uno formado con sujetos de cociente intelectual inferior a 95 y
otro formado por los demás; De cada sujeto se anotó el salario mensual
familiar. Teniendo en cuenta los resultados que se indican en la tabla:
Nivel
socioeconómico
Sujetos con CI <
95
Sujetos con
Intervalos Frecuencia Frecuencia
6 – 10 75 19
10 – 16 35 26
16 – 22 20 25
22 – 28 30 30
28 – 34 25 54
34 – 40 15 46
a. Dibuje un gráfico que permita comparar ambos grupos.
b. Calcule las medidas de tendencia central para aquellos sujetos con CI
< 95
c. Calcule las medidas de tendencia central para aquellos sujetos con CI
> 95
d. interprete los diferentes resultados obtenidos teniendo en cuenta los
gráficos obtenidos.
//Teniendo en cuenta los gráficos obtenidos (la caja de bigotes) podemos ver que en la
realidad las personas con un coeficiente intelectual menor a 95, es tiene una mediana
de igual longitud, a diferencia a los del coeficiente mayores o iguales a 95, hay mucha
desigualdad y varia las medidas.
Realices las anteriores operaciones en R-estadístico
3. Considere las siguientes medidas: media, mediana, moda, (max +
min)/2, primer cuartil, tercer cuartil. Dos de las propiedades de abajo
pertenecen a las medidas anteriores.
1. Su valor siempre tiene que ser igual a uno de los datos observados.
2. Divide al conjunto de datos en dos conjuntos de igual tamaño.
3. Es el centro de los datos en un intervalo de clase.
4. Siempre existe.
4. Se ha definido una nueva medida Cuantil, los Quintiles, en cuantas
partes divide a una distribución los quintiles, y cuál es el quintil cuyo
valor corresponde a la mediana?
1. 5 partes
2. El 3 quintil
3. 50 partes
4. El segundo Quintil
5. Si se dan los siguientes Cuantíles: Q1; Q2 ; Q3; D2; D5; D8; P25; P50;
P90; en cual de los siguientes alternativas los Cuantíles mostrados son
equivalentes
A. Q3; D8; P50
B. Q2; D5; P50
C. Q3; D8; P90
D. Q2; D5; P25
E. Q1; D2; P50
6. Se sabe que ninguna de las sucursales de una empresa comercial
tiene más de 9 empleados o menos de 7. La mayoría tiene 8 empleados,
pero el 25% tiene 9 empleados y una de cada 10 sucursales tiene 7
empleados. ¿Cuál es el promedio de empleados por sucursal?.
A. 10.15
B. 8.15
C. 9.15
D. 15.15
E. 11.15
7. Un estudiante descubre que su calificación en un reciente examen de
estadística, corresponde al percentil 70. Si 80 estudiantes presentan el
examen, aproximadamente, significa que el número de estudiantes que
sacaron calificación superior a él fueron:
A. 56
B. 24
C. 30
D. 20
E. 10
8. Los salarios pagados a los empleados de una compañía se muestran
en la siguiente tabla.
Cargos Numer
o
Salario
Directores 2 930.00
0
Supervisor
es
4 510.00
0
Economist 6 370.00
as 0
Contadore
s
4 350.00
0
Auxiliares 26 246.00
0
Obreros 110 190.00
0
El valor de la media y el Q2
1. 250.000
2. 360.000
3. 229052
4 370.000
9. En una muestra de las compras de 15 estudiantes en la tienda de una
escuela primaria, se observan las siguientes cantidades de ventas,
dispuestas en orden de magnitud ascendente: $100, $100, $250, $250,
$250, $350, $400, $530, $900, $1250, $1350, $2450, $2710, $3090,
$4100.
El valor de la media, mediana y moda de estas cantidades de ventas son
respectivamente:
A. $1200, $530, $205
B. $1210, $205, $530
C. $1210, $3090, $900
D. $250, $530, $900
E. $1210, $530, $250