Post on 28-Dec-2015
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 1 Lic. Carlos A. Ávila (MAE Administración de Empresas)
UNIVERSIDAD CATOLICA DE HONDURAS
NUESTRA SEÑORA DE LA PAZ
CAMPUS DE SAN PEDRO Y SAN PABLO
ESTADISTICA I Lic. Carlos a. Ávila
TEMA I: CONCEPTOS BASICOS LA ESTADISTICA
Importancia de la Estadística:
El análisis estadístico permite la toma de decisiones en diversas áreas como ser la
formulación de políticas económicas por parte de algún gobierno, las tasas tributarias,
programas sociales, gastos en presupuesto, la búsqueda de rentabilidad, control de calidad,
minimización de costos, combinación de productos e inventarios, el éxito de un nuevo
producto, evaluación de oportunidades de inversión, la efectividad de un nuevo
medicamento, etc.
Oportunidades que ofrece la Estadística:
Como la Estadística tiene aplicación universal, esta persigue dos objetivos primordiales:
A. Tomar decisiones
B. Solucionar problemas
Ramas de la Estadística:
1. Estadística Descriptiva: Es una evaluación del comportamiento de los valores de una
variable o característica. Para realizar dicha evaluación, el experto se ayuda de
graficas, tablas y diagramas para mostrar los datos y así facilitar su comprensión.
2. Estadística Inferencial: Se usa, para realizar comparaciones con datos históricos y
bajo una determinada tendencia, tratar de predecir lo que podría suceder más
adelante.
3. Teoría de decisiones: Los métodos y las técnicas de la inferencia estadística son
usadas por los administradores para tomar decisiones en situaciones de
incertidumbre. (Significa no saber con precisión que ocurrirá más adelante, pero
además significa anticiparse y prepararse a lo que podría suceder más adelante).
Definiciones Básicas: Datos: Son colecciones de cualquier cantidad de observaciones relacionadas a una
característica que se denomina Variable. A una colección de datos se le conoce como
Conjunto de Datos.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 2 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Población: Es el conjunto completo o total de los individuos, objetos o medidas que
poseen alguna característica común observable. Es la recolección completa de todas
las observaciones de interés que el investigador desea estudiar y que por lo general
suele ser inaccesible. Generalmente las poblaciones pueden ser finitas o infinitas.
Parámetro: Es toda medida que describa una población. Ej. El ingreso promedio de
los asalariados en Honduras, la producción total de todas las maquilas. El parámetro
describe una población.
Muestra: Es una colección de algunos elementos o datos de una Población, pero no
de toda la población. Es un subconjunto o parte de la población, que lleva implícita
todas las características del universo. Ej.: Para determinar el sabor de una sopa no
necesita comerse toda la olla, solo basta con comerse un plato. Una muestra
contiene relativamente las características principales de una población.
Muestra Aleatoria: Muestra elegida independientemente de todas las demás, con la
misma probabilidad que cualquier otra, y cuyos elementos están elegidos
independientemente unos de otros con la misma probabilidad.
Nota: Estudiar en base a una muestra es más sencillo que basar un estudio con una
Población completa por las siguientes razones:
a. Ahorra tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo.
b. A consecuencia del punto anterior, se ahorran costos.
c. Estudiar la totalidad de individuos con una característica determinada en
muchas ocasiones puede ser una tarea inaccesible o imposible de realizar.
d. Aumenta la calidad del estudio. Al disponer de más tiempo y recursos, las
observaciones y mediciones realizadas a un reducido número de individuos
pueden ser más exactas y plurales que si se tuviese en realidad que realizar a una
población.
Estadístico: Es una medida descriptiva de una muestra. El Estadístico es a la muestra
lo que el Parámetro es a la población. Además se puede definir como el elemento
que describe una muestra y sirve como una estimación del parámetro de la población
correspondiente.
Muestra Representativa: Contiene las mismas características relevantes de la
población en la misma proporción en que están incluidas en tal población.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 3 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Variable: Es cualquier rasgo o característica de la muestra o población que se
observa, que pueda medirse o clasificarse. Ej.: Edad, Sexo, Estado Civil, Peso, Grado
de Motivación, Temperatura, Partidos Políticos.
Tipos de Variable: Las variables se clasifican en dos grupos generales:
a) Cualitativas: Estas variables normalmente se miden por atributos. Ej.: La
variable Sexo puede tener dos posibles resultados en su escala, Masculino o
Femenino. Dentro de las variables cualitativas tenemos:
Variables Nominales: Los resultados de estas características se registran dentro de
categorías o clases desordenadas. Ej.: Una muestra de personas puede agruparse según su
tipo de sangre, de manera que:
1----- A 1----- O
2----- B 2----- A
3----- AB 3----- B
4----- O 4----- AB
El orden o las secuencias no tienen relevancia alguna, solo pueden enlistarse. Ej. Marcas de
Vehículos, preferencia religiosa, color de cabello y raza de una persona.
Variables Ordinales: Al igual que las nominales, estas clasifican sus resultados dentro de
clases o categorías, solo que de forma ordenada. El orden entre categorías es relevante. Ej.:
Los daños en general se pueden clasificar por su grado de gravedad:
1----- Fatal 5----- Sobresaliente
2----- Severo 4----- Muy bueno
3----- Daño moderado 3----- Bueno
4----- Daño menor 2----- No satisfactorio
Nota: El orden de las categorías puede ser Ascendente o Descendente. En estas variables la
magnitud no es relevante.
b) Cuantitativas: Estas variables se miden en base a números o cifras. Ej.: Una
muestra de 100 personas puede ser clasificada por su Peso (en libras), Un
periodo de 30 días puede ser medido por su Temperatura (en grados
centígrados). Las variables cuantitativas se clasifican en:
Variables Discretas: Se refieren a que las características tienen una cantidad finita de
resultados. Estos resultados generalmente se restringen a valores enteros. Ej.: cantidad de
veces que una mujer da a luz, número de camas disponibles en un hospital, numero de autos
vendidos por una compañía, numero de estudiantes en una clase, etc.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 4 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Variables Continuas: Aquí los datos o resultados de una característica no precisamente se
restringen a ciertos valores específicos (admite tanto valores enteros como fraccionarios).
Una variable de este tipo puede tomar cualquier valor entre dos valores dados. Ej.: El tiempo
(horas, minutos, segundos), el nivel de colesterol en la sangre, la temperatura, peso, talla de
ropa, etc.
Nota: Una regla práctica para distinguir una variable discreta de una continua es: “Si los
datos son el resultado de medir, son variables continuas, y si los datos son el resultado de
contar, son discretas.
c) Variables de clasificación de Rango: De una característica central se puede
desglosar características más específicas. Estas observaciones pueden
ordenarse de mayor a menor de acuerdo a su magnitud y después asignarle
números para determinar secuencias correspondientes a su lugar en la lista.
Ej.:
“Principales problemas sociales que aquejan a Honduras”:
Rango Problema Total
1 Desempleo 2750
2 Inseguridad 1845
3 Problemas económicos 1270
4 Falta de vivienda 850
5 Poca calidad educativa 785
n = 7500
“Principales causas de muerte natural en Honduras en 2008”
1 Enfermedades del Corazón 12365
2 Diversos tipos de cáncer 10350
3 Enfermedades cerebro vasculares 7650
4 Neumonía 3820
5 SIDA 2815
n = 37000
La importancia del muestreo:
Gran parte del trabajo en Estadística se realiza en base a muestras. Las muestras son
necesarias debido a que con frecuencia las poblaciones son demasiado grandes para ser
estudiadas en su totalidad. Por su demanda de Costo y Tiempo excesivo, lo primordial es
seleccionar una muestra de la población, calcular el estadístico de la muestra, y utilizar este
resultado para estimar el parámetro correspondiente de la población.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 5 Lic. Carlos A. Ávila (MAE Administración de Empresas)
La exactitud es vital en toda estimación. Esto depende en gran parte de la forma como se
tomo la muestra. Sin embargo, frecuentemente se comprueba que la muestra no es del todo
representativa de la población, lo cual provocara un error de muestreo. Un error de
muestreo es la diferencia entre el parámetro desconocido de la población y el estadístico de
la muestra utilizado para calcular el parámetro.
Un error de muestreo puede presentarse por dos razones:
1) El azar en el proceso de muestreo: es posible seleccionar elementos de muestra
atípicos que no representan a la población.
2) El Sesgo muestral: este ocurre cuando hay una tendencia a seleccionar determinados
elementos de muestra en lugar de otros. Ej. En una encuesta a mujeres, tener una
tendencia a seleccionar mujeres casadas por sobre las solteras.
Funciones Primordiales de la Estadística:
Recolección de los datos
Organización de los datos
Presentación de los datos
Análisis de los datos
Interpretación de los datos
Problemas de la sección 1: 1. Clasifique cada variable de acuerdo a su tipo y ejemplifique cada uno:
a. Ciudad
b. Calidad de producto
c. Distancia recorrida
d. Ingreso salarial
e. Temperatura ambiente
f. Magnitud de un desastre natural
g. Puntaje en un examen de Estadística
h. Estado civil de una persona
i. Religión
j. Sexo
k. Raza
l. Color de cabello
m. Estatura
n. Compra de alimentos
o. Número de vehículos producidos
p. Número de estudiantes inscritos en la UNICAH
q. Edad
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 6 Lic. Carlos A. Ávila (MAE Administración de Empresas)
r. Preferencia política
s. Profesión
t. Marcas de gaseosas
u. Área de un terreno
v. Perímetro de una zona
w. Volumen de un objeto
x. Número de goles anotados por un equipo
y. Peso de una caja de cereal
z. Numero de amigos en Facebook
aa. Clasificación de los hoteles
bb. Calificación de un Banco
cc. Tiempo de llegada a la universidad
dd. Duración de una batería
ee. Precio de un paquete de harina
ff. Marcas de ropa
gg. Tipos de Empresa
hh. Grado de motivación
ii. Cantidad de miembros de una familia
jj. Número de camas en una clínica
kk. Número de partos en una mujer
ll. Numero de Identidad
mm. Cantidad de pasajeros en una aerolínea
nn. Problemas más graves de Honduras
oo. Principales causas de decesos en el país
pp. Modos de transporte
qq. Intensidad de un huracán
rr. Color de los ojos
ss. Talla de Zapato
tt. Duración de una película
uu. Domicilio
vv. Tipos de empresa de acuerdo al tamaño
ww. Tipos de película cinematográfica
xx. Numero de operarios en una maquila
yy. Promedio de una asignatura
zz. Deuda de una tarjeta de crédito
aaa. Tipos de Fruta
bbb. Numero de planetas en el sistema solar
ccc. Cantidad de Remesas recibidas
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 7 Lic. Carlos A. Ávila (MAE Administración de Empresas)
ddd. Desempeño laboral de un empleado
eee. Departamentos de un país
fff. Grado de instrucción educativa
ggg. Grado militar
hhh. Jerarquía familiar
2. Genere 15 variables diferentes a las del listado anterior. Agregue el respectivo
ejemplo para cada una.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 8 Lic. Carlos A. Ávila (MAE Administración de Empresas)
TEMA II: ORDENAMIENTO Y ARREGLOS DE DATOS
Arreglo de Datos: A partir de datos sin procesar, el ordenamiento de datos tiene sus
ventajas:
a. Ordenados de forma ascendente o descendente, permite notar
rápidamente los valores mayor y menor de los datos.
b. Permite dividir los datos en secciones.
c. Permite ver si los valores aparecen más de una vez en el
ordenamiento.
d. Permite observar la distancia entre valores sucesivos de los
datos.
A. Distribuciones o Tablas de Frecuencias: Es la forma más común de organizar los
datos en categorías o clases parciales y luego contar el numero de observaciones que
quedan dentro de cada categoría. Las tablas de frecuencia (también conocida como
Tabla Estadística) pueden organizar datos de solo una variable a la vez. Esto se
realiza debido a que cuando la cantidad de datos o elementos a analizar es
demasiado grande, este análisis se vuelve extenuante y monótono.
Características de las Distribuciones de Frecuencias:
1. Las clases o categorías son completamente inclusivas pues todos los datos de una
muestra caen en una u otra categoría.
2. Las clases son mutuamente inclusivas ya que ningún dato cae en más de una
categoría.
3. Cada clase tiene un límite superior (LS) y un límite inferior (LI). Estos límites se
pueden convertir por conveniencia, en limites reales superiores (LRS) y limites reales
inferiores (LRI).
4. Los Estadísticos toman como un estándar el hecho de que en una distribución de
Frecuencias, el número de clases este en un rango de entre 5 a 15 clases. (5< # clases
<15)
5. Existe una fórmula para determinar el número de intervalos aproximados a usar. A
partir de n muestras, el # de clases se obtiene a partir de la formula:
2c ≥ n
C ≥ Log n
Log 2
6. Para crear un arreglo de datos es “preferible” que la cantidad de datos obtenidos sea
mayor o igual a 30.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 9 Lic. Carlos A. Ávila (MAE Administración de Empresas)
7. Las categorías deben tener la misma amplitud.
8. Las clases jamás pueden traslaparse. Debe conocerse exactamente donde comienzan
y donde terminan.
9. Existen clases abiertas cuando se usan “menos de” o “mas de”, para reducir el
número de clases porque existe valores mucho menores o mucho mayores que el
resto de datos.
Elementos importantes de una Tabla Estadística o Distribución de Frecuencias:
a. Límites Reales Inferiores y Superiores (LRI y LRS): Se calculan a partir de los límites
inferiores y superiores normales. Se realiza para que cualquier tabla o distribución
quede mejor estructurada. Se encuentra a través de un promedio entre el límite
inferior de una clase y el límite superior de la clase anterior o por arriba de ella.
b. Frecuencia Absoluta (Fabs): Es el número de datos que se encuentra presente en
cada intervalo o clase.
c. Ancho del intervalo (W): Diferencia entre dos límites sucesivos de clase ya sean
superiores o inferiores y también puede ser la diferencia entre dos puntos medios
sucesivos (marca de clase).
El ancho de que tendrá cada clase se puede definir a través de la siguiente fórmula:
Anchura del intervalo (W) = Valor unitario siguiente Valor mas
después del valor más __ pequeño de
grande de los datos los datos
_______________________________________
Número total de clases (C)
d. Frecuencia Relativa (Fr): Es el porcentaje que representa cada frecuencia del número
total de datos.
Fr = (Fabs/n)*100.
e. Marca de Clase (Xm): Es el punto medio entre los límites superior e inferior de un
intervalo o clase.
Xm = (LS + LI)/2.
f. Frecuencia Acumulada (Fac): De un intervalo es el número total de observaciones
entre cada clase y todas las anteriores a esta. Es la suma sucesiva (en grada) de la
frecuencia absoluta de una clase y las frecuencias absolutas de las clases anteriores.
Fac = ∑ sucesiva de Fabs
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 10 Lic. Carlos A. Ávila (MAE Administración de Empresas)
g. Frecuencia Relativa Acumulada (Frac): De un intervalo es el porcentaje del número
total de observaciones con un valor menor o igual al límite superior del intervalo.
También, es la suma sucesiva de la frecuencia relativa de una clase y las frecuencias
relativas de las clases anteriores.
Frac = ∑ sucesiva de Fr
Frac = (Fac/n)*100
B. Tablas de CONTINGENCIA: A diferencia de las tablas de frecuencia, las tablas de
contingencia permiten examinar y comparar dos o más variables al mismo tiempo.
Problemas de la sección 2: 1. Un conjunto de datos contiene 60 observaciones, la más grande de 679 y la más
pequeña de 140.
a. ¿Cuántas clases debería tener la tabla de frecuencias?
b. ¿Cuál sería la anchura del intervalo correspondiente?
c. ¿Cuáles son los límites y puntos medios de cada clase?
2. En un estudio reciente sobre 580 graduados de administración de negocios, el salario
inicial más alto que se reporto fue de L. 42,499 lempiras y el más bajo fue de L.
14,800 lempiras. Usted desea crear la tabla de frecuencias para analizar y comparar
estos datos con las ofertas de trabajo que usted ha recibido.
a. ¿Cuántas clases pondrá en su tabla de frecuencia?
b. ¿Cuál es el intervalo de clase?
c. ¿Cuáles son los límites y puntos medios de cada clase?
3. Los siguientes datos representan el número de pasajeros que reporta la aerolínea
TACA de los últimos 58 vuelos. Los datos son los siguientes:
58 89 45 67 54 110
64 76 65 45 49 93
79 56 71 85 87 77
74 98 69 79 81 86
62 56 88 69 79 48
71 54 69 62 86 90
65 79 46 77 106 115
55 75 62 73 66 57
73 64 69 101 50
90 70 74 61 73
Desarrolle una tabla de distribución de frecuencias completa.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 11 Lic. Carlos A. Ávila (MAE Administración de Empresas)
4. Los siguientes resultados sobresalen a partir de un estudio sobre el número de horas
que pasan conectados a internet, algunos usuarios seleccionados al azar por semana:
23.6 31.9 12.1 10.3 20.8 42.0 24.0 15.2 19.1 11.6 34.3 42.4 60.0
30.5 31.8 22.4 13.2 10.4 17.2 35.4 56.0 13.0 42.5 31.8 38.5 23.8
44.2 50.8 16.5 52.3 34.2 42.6 14.1 22.4 48.2 29.6 64.3 75.0 32.0
15.2 26.9 41.3 53.7 32.4 13.8 25.1 43.2 39.7 67.2 23.8 40.6 23.7
67.0 54.0 49.8 23.9 36.3 45.4 33.2 20.9 14.7 53.1
Construya una tabla de distribución de frecuencias.
5. El departamento de tránsito a través de sus agentes, ha reportado el número de
licencias que se han decomisado en San Pedro Sula, por faltas graves en los últimos 5
años:
125 157 113 127 201
165 145 119 148 158
148 168 117 105 136
136 125 148 108 178
179 191 225 204 104
205 197 119 209 157
209 205 221 178 247
235 217 222 224 187
265 148 165 228 239
245 152 148 115 150
265 190 135 180 120
Desarrolle una tabla de distribución de frecuencias completa.
6. A continuación se presentan los datos de 39 personas que llegaron a una entrevista
de trabajo, de acuerdo a su tipo de sangre:
A B A O AB O B O A O
O AB B A O A O B AB O
O A B O O B A O B A
B O O AB A AB O A O
Desarrolle una tabla de distribución de frecuencias.
7. Un dueño de auto lote, tiene registrados los automóviles que ha vendido en los
últimos 6 meses. Aquí detallamos los datos:
Nombre Marca y Modelo Nombre Marca y Modelo
a. Roberto Hyundai Accent ’00 p. Alejandra Isuzu KB ‘99
b. Estela Kia Sorento ’04 q. Ramiro Toyota Corolla ‘06
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 12 Lic. Carlos A. Ávila (MAE Administración de Empresas)
c. Antonio Kia Spectra ‘02 r. Romeo Hyundai Elantra ‘02
d. Benjamín Isuzu Rodeo ’98 s. Fernanda Toyota RAV4 ‘03
e. Daniel Isuzu Dmax ’07 t. Armando Hyundai SantaFe ‘04
f. Edgardo Toyota Camry ’08 u. Rocío Kia Sephia ‘00
g. José Toyota 3.0 ’07 v. Carlos Toyota Yaris ‘02
h. Esther Hyundai Veracruz ’05 w. Oscar Toyota Corolla ‘97
i. Oswaldo Isuzu Rodeo ’02 x. Lorena Hyundai Tiburón ‘98
j. Javier Toyota Echo ’03 y. Iván Kia Rio ‘00
k. Pedro Isuzu Dmax ’07 z. Waleska Toyota Prado ‘08
l. Nelson Kia Sportage ’01 aa. Sandra Hyundai H100 ‘00
m. Mario Kia Sorento ’06 bb. Ricardo Toyota Corona ‘04
n. Juan Toyota Tundra ’08 cc. Carolina Toyota Pickup ‘98
o. Vanessa Isuzu KB ’98 dd. Cristian Kia Spectra ‘05
Desarrolle una tabla de contingencia completa con las variables Sexo y Marca.
8. El director de transporte noroccidental de SOPTRAVI está muy preocupado por la
velocidad a la que los conductores manejan en un tramo de carretera principal. Los
datos de la velocidad de 48 conductores expresada en mph son los siguientes:
15 32 45 46 42 39 68 47 18 31 48 59 56 42 39 48 69 61
44 42 38 52 55 58 62 48 53 56 58 48 47 52 37 64 29 55
38 29 62 49 69 18 61 55 49 70 81 50
El Departamento de transporte ha determinado que la velocidad más segura para
esta carretera es más de 39 y menos de 56 mph. ¿Qué proporción de conductores
maneja dentro de este intervalo?
9. En una población bajo estudio existen 5,600 mujeres y 14,400 hombres. Si se decide
seleccionar una muestra de solo 550 individuos de esta población, ¿Cuántos deberán
ser mujeres y cuantos deberán ser hombres para que esta muestra sea considerada
estrictamente representativa?
10. Si los siguientes grupos de edad son incluidos en las proporciones indicadas,
¿Cuántos individuos de cada grupo de edad deben incluirse en una muestra de 2800
personas para que esta sea representativa?
Grupo de edad 12 – 17 18 – 23 24 – 29 30 – 35 36 +
Proporción relativa 0.17 0.31 0.26 0.21 0.05
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 13 Lic. Carlos A. Ávila (MAE Administración de Empresas)
TEMA III: GRAFICOS ESTADISTICOS
Para efectos de representación la mayoría de graficas se usaran en dos dimensiones (dos
ejes). El eje horizontal muestra los valores de la variable (la característica que se está
midiendo). El eje vertical indica o representa las frecuencias absolutas, relativas o
acumuladas según sea el caso.
La utilidad de los gráficos es doble. En primer lugar, sustituir a las tablas estadísticas, y
segundo, constituir por si mismos una poderosa herramienta para el análisis de los datos,
siendo en la mayoría de ocasiones el medio más efectivo no solo para describir y resumir la
información, sino también para analizarla.
El propósito de un grafico es ayudar a la comprensión y comunicación de la evidencia
aportada por los datos respecto a una hipótesis en estudio.
Gráficos para distribuciones de variables Continuas:
a) Histogramas: Consiste en una serie de rectángulos, cuyo ancho es proporcional a la
anchura de intervalo (limites superior e inferior de cada clase) de los datos que se
encuentran dentro de una clase y cuya altura es proporcional al número de
elementos que caen dentro de cada clase. Describe una distribución de frecuencias
discretas o continúas. Un Histograma puede ser de frecuencias absolutas o relativas.
Ventajas del Histograma:
1. Los rectángulos muestran cada clase de la distribución por separado.
2. El área de cada rectángulo, en relación con el resto, muestra la proporción del
número total de observaciones que se encuentran en esa clase.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 14 Lic. Carlos A. Ávila (MAE Administración de Empresas)
b) Polígonos de Frecuencias: Es muy parecido al Histograma en varios aspectos. Esta
grafica emplea los mismos ejes que el Histograma. Se construye a partir del punto
medio de cada clase (marca de clase). La altura de los rectángulos es directamente
relacionada a la frecuencia absoluta o relativa de cada clase. Luego se unen los
puntos relacionados (marca de clase con su frecuencia correspondiente) con una
línea recta para formar el polígono. Para completar la grafica es necesario agregar
dos clases, una en cada extremo, que contienen cero observaciones para que el
polígono alcance el eje horizontal en ambos extremos.
Ventajas de los Polígonos de Frecuencia:
1. Son más sencillos que el Histograma.
2. Traza con claridad el patrón de los datos.
3. El polígono se vuelve cada vez más liso y parecido a una curva conforme se aumenta
el número de clases y de observaciones.
c) Ojivas: También se les conoce como Polígonos de Frecuencia Acumulada (También
puede construirse a partir de frecuencias relativas acumuladas). Esta grafica se
construye a partir de una distribución de frecuencias acumuladas “menor que” y
“mayor que”. Las clases se forman a partir del Limite Real Inferior de cada intervalo.
Esta grafica nos permite obtener Deciles, Cuartiles y Percentiles (Valores de posición).
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 15 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Gráficos para distribuciones de variables Discretas:
d) Diagrama de Barra: Constituye un tipo popular de graficas para presentar
distribuciones de frecuencia de variables nominales u ordinales. En el diagrama, las
diferentes categorías de las observaciones se presentan a lo largo de un eje
horizontal. Se dibuja una barra vertical sobre cada categoría de forma que la altura
de la barra represente la frecuencia o la frecuencia relativa de las observaciones de
cada clase. Las barras deben de ser de igual amplitud y estar separadas de forma que
no se perciba continuidad.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 16 Lic. Carlos A. Ávila (MAE Administración de Empresas)
e) Diagrama Circular: Esta grafica es de especial utilidad para mostrar proporciones
(porcentajes) relativas de una variable. Este grafico se construye en un círculo, que
tiene como medida 360 grados. La grafica representa una superficie o área, mas no
un volumen. Los ángulos se grafican en sentido contrario a las manecillas del reloj y
en cada sector circular generado se escribe el valor de la frecuencia y el nombre de
su categoría correspondiente.
f) Grafico con líneas: Se usa cuando los datos se relacionan entre sí, es decir, cuando
existe cierta continuidad entre las observaciones, como por ejemplo, el crecimiento
poblacional, la evolución del peso o estatura de una persona a través del tiempo, los
ingresos o egresos de una empresa medido por días o semana, las variaciones
presentadas en la medición realizada en algún experimento cada segundo o minuto.
La grafica de líneas consiste en una serie de puntos trazados en las intersecciones de
las marcas de clase y las frecuencias de cada una, uniéndose consecutivamente con
líneas. Además, es posible presentar varias series de observaciones en un mismo
grafico para así realizar análisis de información.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 17 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Problemas de la sección 3: 1. Construya para los ejercicios 3 y 5 de la sección 2:
a. Histograma
b. Polígono de Frecuencia
c. Ojiva “Menor Que”
2. Para el ejercicios 6 de la sección 2, construya:
a. Diagrama de Barras
b. Diagrama Circular
3. En el siguiente reporte se muestran las muertes por lesiones de 150 niños de entre 5
a 9 años de edad en EUA (2005 – 2010).
Causa No. de muertes
Homicidios 11
Ahogamiento 21
Insolación 42
Incendios 18
Accidentes 15
Otros 13
Construya: a) Grafico de Barras b) Grafico circular.
4. IHADFA ha generado un estudio sobre el consumo anual de cerveza por botella (en
millones) en HONDURAS.
Año 2004 2005 2006 2007 2008 2009 2010
Consumo 250 290 570 420 600 540 690
Construya un grafico de barra y un grafico de línea.
5. Según información del departamento de Migración, el numero de deportados que se
han reportado en los últimos 6 años es:
Año 2005 2006 2007 2008 2009 2010
Casos 5358 6632 7849 7221 9388 11297
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 18 Lic. Carlos A. Ávila (MAE Administración de Empresas)
TEMA IV: MEDIDAS DE TENDENCIA CENTRAL
Por lo general las distribuciones de frecuencia nos indican ciertas tendencias y patrones en
los datos. Para describir completamente estas tendencias se requieren medidas más
precisas. Estas medidas conforman una serie de números que se conocen como Estadística
Sumaria, para así describir las características del conjunto de datos. Las características antes
especificadas pueden ser:
A. TENDENCIA CENTRAL: Se refiere al punto medio de una distribución. A estas medidas
se le conocen también como medidas de posición. Estas medidas ubican e identifican
el punto alrededor del cual se centran los datos.
B. DISPERSION: Se refiere a la extensión de los datos en una distribución, es decir, el
grado en que las observaciones se distribuyen. Las medidas de dispersión indican el
punto hasta el cual las observaciones individuales se esparcen alrededor del punto
central. Miden la dispersión o la variabilidad de los datos y reflejan la tendencia de
las observaciones individuales a desviarse de dicho punto central.
C. SESGO: Esta relacionado a las curvas que representan los puntos de un conjunto de
datos, que pueden ser simétricas o sesgadas. Las curvas simétricas tienen una forma
tal que una línea vertical que pase por el punto más alto de la curva, dividirá el área
de esta en dos partes iguales. Las curvas son sesgadas cuando los valores de una
distribución de frecuencias están concentrados en el extremo inferior o en el
superior de la escala de medición del eje horizontal. Los valores no se encuentran
igualmente distribuidos.
D. CURTOSIS: Se refiere al grado de agudeza de una curva. Dos curvas pueden tener la
misma tendencia central, la misma dispersión, y ser ambas simétricas. Pero una de
las curvas tendrá un pico de grafica más agudo que el otro.
Las medidas de Tendencia Central y de Dispersión se pueden calcular a partir de datos
Agrupados y datos No Agrupados.
MEDIDAS DE TENDENCIA CENTRAL (DATOS NO AGRUPADOS)
La Media Aritmética: es la medida de tendencia central a la cual se le considera
como un simple promedio aritmético.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 19 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Ventajas:
1. Es una medida familiar para la mayoría y es intuitivamente claro.
2. Cada conjunto de datos posee una y solo una media.
3. Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias
de varios conjuntos de datos.
4. La media puede calcularse aun cuando la serie de datos no esté ordenada.
Desventajas:
1. Aunque la media es confiable en el sentido de que toma en cuenta todos los valores
del conjunto de datos, puede verse afectada por valores extremos que no son
representativos del resto de los datos.
2. Cuando el conjunto de datos es muy extenso (por decir 200 datos), resulta
extremadamente tedioso calcular la media. En ese caso se tendría que usar el
método de datos agrupados.
3. Es imposible calcular la media a partir de clases con un extremo abierto, ya sea en el
inferior o superior de la escala.
Para datos No Agrupados se calcula de la siguiente forma:
µ = ∑X (Media para Población) ẋ = ∑x (Media para muestra)
N n
La Mediana: Es llamada también como la media posicional, porque queda
exactamente en la mitad del conjunto de datos, después de que las observaciones se
han colocado en serie ordenada. La mitad de las observaciones estará a la izquierda
de la mediana y la otra mitad estará a la derecha de la mediana.
Ventajas:
1. Los valores extremos de una serie ordenada de datos no afectan tan intensamente a
la mediana así como afecta a la media aritmética.
2. La mediana es fácil de entender y se puede calcular a partir de cualquier tipo de
datos, incluido en clases con extremo abierto.
3. Es posible encontrar la mediana a partir de descripciones cualitativas en lugar de
números.
Desventajas:
1. Como la mediana es una posición promedio, para poder calcularla, la serie de datos
debe estar totalmente ordenada a diferencia de la media que no lo necesita.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 20 Lic. Carlos A. Ávila (MAE Administración de Empresas)
2. Ciertos procedimientos estadísticos que utilizan la mediana, son más complejos que
aquellos que utilizan la media.
3. Cuando la serie de datos es extensa, se consume tiempo en demasía para calcular la
mediana.
NOTA: Si se desea utilizar una estadística de muestra para estimar un parámetro de
población, es preferible usar la media aritmética, en lugar de la mediana.
Para datos No Agrupados se calcula de la siguiente forma:
a) Se obtiene la POSICION donde está ubicada la mediana.
Mediana X = (n+1) / 2 (Posición de la mediana)
b) Se define el VALOR de la mediana a través de la posición.
Si el conjunto de datos contiene:
Un número par de elementos, la mediana es el promedio de los dos elementos de
en medio.
Un número impar de elementos, la mediana es el valor que está en medio del
arreglo de datos (Posición exacta).
La Moda: Es una medida de tendencia central diferente de la media, pero un tanto
parecida a la mediana, pues en realidad no se calcula a partir de un proceso
aritmético ordinario. La moda es el valor que más se repite en una serie de datos. Es
la observación que se presenta con mayor frecuencia. La moda rara vez se usa como
medida de cálculo para sacar conclusiones en datos no agrupados. Preferiblemente
debe usarse para datos agrupados. Es importante destacar que así como una serie de
datos normalmente una moda, también que no tenga ninguna o que tenga más de
una moda.
Ventajas:
1. La moda, al igual que la mediana, se puede utilizar como una posición central para
datos tanto cuantitativos como cualitativos.
2. Al igual que la mediana, la moda no se ve mayormente afectada por los valores
extremos.
3. La moda se puede calcular incluso a partir de clases con extremo abierto.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 21 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Desventajas:
1. La moda es la medida de tendencia central menos utilizada.
2. Cuando los conjuntos de datos contienen más de una moda, estas resultan más
difíciles de interpretar y comparar.
Problemas de la sección 4:
1. Los talleres de servicio del grupo Q, registran el numero de autos revisados el mes
anterior por cada una de sus 25 sucursales de la forma siguiente:
823 648 321 634 752
669 427 555 904 586
722 360 468 847 641
217 588 349 308 766
634 480 590 805 720
La compañía tiene la creencia de que una sucursal no puede mantenerse con menos
de 390 servicios mensuales. Es también política de la compañía otorgar una
bonificación económica al gerente de la sucursal que genere más de 695 servicios
mensuales.
a. ¿Ordene los datos de la tabla e indique cuantas sucursales no pueden
mantenerse y cuantas recibirán bonificación?
b. Obtenga las medidas de Tendencia Central: Media, Moda y Mediana.
c. Destaque dos conclusiones con los datos encontrados anteriormente.
2. El administrador de un hospital privado ordeno un estudio del tiempo que un
paciente tiene que esperar antes de ser tratado por el personal de urgencias. Los
datos que presentamos a continuación fueron tomados durante un día normal:
Tiempo de espera (en minutos):
12 16 21 20 24 3 11 17 29 18 26 4
7 14 25 3 27 15 6 5 13 9 8 21
A partir de estos datos encuentre los valores de medidas de tendencia central.
3. Una fábrica hizo un muestreo del numero de ausencias de los trabajadores por
semana, obteniendo los resultados siguientes:
4 12 8 14 11 6 7 13 11 13 11 20 5 19 10 15
24 7 29 6 13 9
a. Encuentre las medidas de tendencia central.
b. La junta directiva de la fábrica define que si el promedio de ausencias es de al
menos 8 días, entonces debería tomar medidas drásticas. ¿Sera esto necesario?
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 22 Lic. Carlos A. Ávila (MAE Administración de Empresas)
4. La UNICAH tiene registrados el número de estudiantes de primer ingreso que se
matriculan por trimestre durante los últimos 6 años:
350 275 180 315 228 145 250 160 210 125 380 220
415 335 295 245 190 278
Calcule las medidas de Tendencia central.
La administración de la universidad no ha tenido necesidad de poner publicidad pues
asumen que con un promedio de 350 estudiantes de primer ingreso por periodo se
considera muy aceptable. ¿Es correcta la información?
5. Un médico general recibe pacientes de todas las edades, en su clínica privada, en el
que cobra precios módicos por cada consulta. Se presentan las edades de los
pacientes que ha atendido la última semana:
10 25 50 4 12 24 12 31 24 36 66 55 42 48 27 19 23
44 30
Calcule las Medidas de tendencia central.
6. Una fabrica realiza un estudio sobre el numero de fallas por día que una maquina
ensambladora presenta, en el depto. de producción. El gerente de la empresa decide
que si el numero de fallas es de 10 o más, reemplazara la maquina:
14 5 9 10 9 12 7 12 13 7 8 6 11 5 4 7 9 13 11
a. ¿Sera necesario reemplazar la maquina?
b. Encuentre la Moda y la Mediana.
7. Un fabricante de cosméticos adquirió una máquina para llenar de botellas de
perfume de 3 ml. Para probar la precisión del volumen que deposita la maquina en
cada botella, se hizo una corrida de prueba con 18 recipientes. Los volúmenes
resultantes (en ml) de la prueba fueron los siguientes:
3.02 2.89 2.92 2.84 2.90 2.97 2.95 2.94 2.93
3.01 2.97 2.95 2.90 2.94 2.96 2.99 3.03 2.97
a. La compañía no está dispuesta a recalibrar la maquina a menos que el volumen de
llenado este 0.04 ml por debajo de los 3 ml. ¿Deberán recalibrar?
b. Encuentre la Moda y la Mediana.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 23 Lic. Carlos A. Ávila (MAE Administración de Empresas)
TEMA V:
OTRAS MEDIDAS DE TENDENCIA CENTRAL (MEDIA PONDERADA)
La Media Ponderada o Pesada: Nos permite calcular el promedio que toma en
cuenta la importancia de cada valor respecto al total.
Se calcula de la siguiente forma:
Xw = ∑ (w * x) donde w = peso asignado a cada observación
∑w
Problemas de la sección 5: 1. Un fontanero vende 5 tipos de limpiadores para desagües. A continuación se muestra
la tabla con los resultados siguientes:
Limpiador Utilidad por lata Volumen de ventas en latas
Glunk Out L 2.25 7
Bubble Up L 3.50 9
Dream Drain L 5.75 15
Clear More L 7.50 12
Main Drain L 6.30 10
Encuentre la media correspondiente a este caso.
2. El director de planta de LACTHOSA desea comparar los salarios promedio en su
planta de Honduras con los de la competencia que está ubicada en Guatemala. De los
5,930 empleados que tiene 1,212 ganan $12.30 la hora; a 650 les paga $15.50; 3098
ganan $23.50 y al resto se les paga $17.12. De los 5,364 empleados que laboran en la
otra planta 1,654 ganan $12.75; 815 ganan $17.80 y los demás $20.10. Saque sus
propias conclusiones.
3. Los miembros de un club deben pagar cuotas con base en su precio promedio. De los
80 miembros, 18 pesaron 110 libras, 23 pesaron 130 libras, 22 hicieron girar la
balanza hasta 150 libras y el resto pesaron 180 libras. Si los miembros deben pagar L.
60.00 por cada libra que pesan en promedio. ¿Cuánto debe desembolsar cada
miembro?
4. Un profesor decide utilizar un promedio pesado para obtener las calificaciones
finales de los estudiantes que acuden a la clase que imparte. El promedio de tareas
tendrá un valor de 10% de la calificación final, el examen semestral valdrá 20% de la
nota final, el examen final, 30%; el proyecto semestral 25%, y los exámenes parciales
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 24 Lic. Carlos A. Ávila (MAE Administración de Empresas)
15%. A partir de los datos siguientes, calcule el promedio final para cinco estudiantes
del seminario.
Estudiante Tareas Ex. Parciales Proyecto Ex. Semestral Ex. Final 1 85 89 94 87 90 2 78 84 88 91 92 3 94 86 93 86 89 4 82 79 88 84 93 5 95 90 92 82 88
5. Un despacho de asesoría financiera y administrativa, tiene 4 tipos de profesionistas
entre su personal: asesores financieros, asociados principales, personal de campo, y
personal de oficina. Las tasas promedio que se cobran a los clientes por el
desempeño da cada una de estas categorías profesionales son $75/hora, $55/hora,
$40/hora y $25/hora, respectivamente. Los registros de la firma indican el siguiente
número de horas cobradas el año anterior en cada categoría: 8,500, 13,750, 21,300, y
30,450 respectivamente. Si el despacho intenta allegarse una tasa promedio de cobro
para estimar lo que se debe cobrar a los clientes en el año siguiente. ¿Cuál será la
tasa promedio a cobrar?
6. La Ferretería Monterrosa vende tres tipos de cerca para casas, en San Pedro Sula. El
tipo A cuesta L. 112.00 por pie de instalación, el tipo B cuesta L. 145.00 por pie, y el
tipo C, el de mejor calidad cuesta L. 180.00 por pie. Ayer se vendieron 370 pies del
tipo A, 250 pies del tipo B y 160 del tipo C.
a. ¿Cuál fue el costo medio por pie vendido?
b. ¿Cuál es el monto de la factura?
7. Mauricio Ruiz compro 35 acciones a L. 300.00 cada una, 54 acciones a L. 400.00 cada
una, 96 acciones a L. 600.00 y 65 acciones a L. 700.00 cada una.
a. ¿Cuál es el monto total de su inversión?
b. ¿Cuál es el precio promedio por acción?
8. La siguiente tabla da el porcentaje de la fuerza laboral que está desempleada y el
tamaño de la fuerza laboral en las tres ciudades más importantes de Honduras. El
ministro de trabajo presenta un informe para el evento HOP. ¿Cuál sería la tasa de
desempleo adecuada para presentarla como representativa del país?
Ciudad % Desempleo Tamaño fuerza laboral
La Ceiba 12.5 152,500
San Pedro Sula 19.8 473,800
Tegucigalpa 23.2 669,320
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 25 Lic. Carlos A. Ávila (MAE Administración de Empresas)
9. Don Mario Flores, fabrica una pintura sellante para automóviles en San Pedro Sula. El
utiliza 4 químicos diferentes en el proceso de producción. Para hacer su producto,
Don Mario debe utilizar 2 galones de calcimina que cuesta L. 50 el galón, ½ galón de
kalsolita a L.25 por galón, 1 galón de aglutinante que cuesta L. 15 por galón, y 3
galones de aceite secante a L. 40 por galón. Calcule el costo de un galón de sellante.
TEMA VI:
OTRAS MEDIDAS DE TENDENCIA CENTRAL (MEDIA GEOMETRICA)
La Media Geométrica: Proporciona una medida precisa de un cambio porcentual
promedio en una serie de números. Estas cantidades tienden a cambiar en un cierto
periodo de tiempo, por lo que la media geométrica busca encontrar para estas
cantidades, una tasa de cambio promedio. El cálculo de la media geométrica es una
forma apropiada de tomar en cuenta efectos multiplicativos, como la inflación y el
interés compuesto.
La media geométrica usa una variable conocida como factor de crecimiento que es
Igual a:
Tasa de interés
FC = 1 + 100
La fórmula para encontrar la media geométrica es:
________________________________
M.G. = N
√ FC1 * FC2 * FC3 * FC4 *………………* FCn
Problemas de la sección 6: 1. El director ejecutivo de la compañía textilera Rio Lindo, desea determinar la tasa de
crecimiento en los ingresos de la empresa en los últimos 7 años. Los resultados se
presentan a continuación:
Año Ingreso
2004 $48,000
2005 $56,000
2006 $70,000
2007 $65,000
2008 $74,000
2009 $69,000
2010 $69,000
El director determina que si el crecimiento promedio es menor que el promedio de
mercado que es de 10%, se asumirá una nueva campaña publicitaria.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 26 Lic. Carlos A. Ávila (MAE Administración de Empresas)
a. ¿Qué decisión tomara el director en este caso?
b. Cuantos factores de “crecimiento” aparecen en el problema
2. El descontento de los empleados de una maquila se refleja en el número de quejas
oficiales durante los últimos 8 meses: 36, 41, 37, 49, 42, 38, 40 y 28. Con base en
estos datos ¿Cuál es el incremento promedio mensual en las quejas?
3. Una procesadora de frutas ha elevado el costo de la canasta completa en un periodo
de que abarca los últimos 5 años en los siguientes porcentajes:
2006 2007 2008 2009 2010 2011
6.75% 12.5% 9% 6% 7.5% 5.25%
¿Cuál es el aumento porcentual promedio del costo de la fruta en el periodo de 5
años?
4. Luis Silva se encuentra calculando el factor de crecimiento promedio de su tienda de
aparatos de sonido en los últimos seis años. Utilizando una media geométrica, llega a
un resultado de 1.22. los factores de crecimiento individuales de los últimos 5 años
fueron 1.19, 1.35, 1.23, 1.28 y 1.30, pero Bob perdió los registros del sexto año
después de haber calculado la media. ¿Cuál era el factor de crecimiento del último
año?
5. Una compañía fabricante de tableros de circuitos eléctricos, ha producido el
siguiente número de unidades en los últimos 5 años:
2004 2005 2006 2007 2008
12500 13250 14310 15741 17630
Calcule el aumento porcentual promedio de unidades producidas en este periodo y
utilice el resultado para estimar la producción proyectada para el 2011?
6. Una empresa de equipos deportivos está probando el efecto de tres planes
publicitarios sobre las ventas en los últimos 6 meses. Dados los siguientes datos,
¿cuál de los planes es el más efectivo?
Mes Plan A Plan B Plan C
Enero 33,200 28,400 26,750
Febrero 36,800 31,450 29,675
Marzo 40,425 35,875 33,980
Abril 43,340 38,740 37,390
Mayo 46,395 41,250 40,465
Junio 44,875 42,550 40,955
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 27 Lic. Carlos A. Ávila (MAE Administración de Empresas)
7. Una compañía tiene registros del costo de procesamiento de cada pedido. Durante
los últimos 5 años, este costo fue (en lempiras) de 1045, 1202, 1089, 1195 y 1254.
¿Cuál fue el crecimiento porcentual promedio de la empresa durante ese lapso? Si
esta tasa promedio se mantiene estable durante 3 años más, ¿Cuánto le costara a la
empresa procesar un pedido al final de ese periodo?
TEMA VII:
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS
La Media Aritmética: la formula general es:
_
X = ∑ (Fabs x Xm)
N
Existe un método “más corto” para calcular la media aritmética. A este método se le conoce
como Codificación.
A través de este método se elimina el problema de tener puntos medios o marcas de clase
muy grandes o inconvenientes. En lugar de usar los puntos medios reales para realizar los
cálculos, se pueden asignar enteros consecutivos de valor pequeño, conocidos como
códigos, a cada uno de los puntos medios. El entero cero puede ser asignado a cualquier
punto medio, pero para que los enteros asignados sean “pequeños”, se asigna el cero al
punto medio de la parte media de la distribución (o la parte más cercana a esta). A partir de
ahí se asignan enteros negativos a los valores menores a dicho punto medio y enteros
positivos a los valores más grandes. La formula bajo este método es:
_
X = X0 + w ∑ (u x fabs)
n
En donde: X0 = valor del punto medio al que se le asigno el código 0
w = ancho del intervalo
u = código asignado a cada punto medio de clase
fabs = frecuencia absoluta de cada clase
n = número total de observaciones de la muestra
La Mediana: La fórmula para calcularla es:
X = Lmed + (n+1) - (F+1)
2 w
fm
En donde: Lmed = Limite inferior de la clase mediana
n = número total de elementos de la distribución
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 28 Lic. Carlos A. Ávila (MAE Administración de Empresas)
F = frecuencia acumulada anterior a la clase mediana
fm = frecuencia absoluta de la clase mediana
w = anchura del intervalo
La Moda: La fórmula para calcularla es:
X = Lmod + d1 w
d1 + d2
En donde: Lmod = Limite inferior de la clase modal
d1 = fabs clase modal menos fabs clase anterior a la clase modal
d2 = fabs clase modal menos fabs clase posterior a la clase modal
w = anchura del intervalo
Problemas de la sección 7: 1. A continuación se presenta una distribución de frecuencias con un resumen de los
niveles de azúcar en la sangre en una muestra de 70 pacientes que presentan
problemas renales crónicos.
Nivel de Azúcar Número de pacientes
65 – 79 7
80 – 94 8
95 – 109 9
110 – 124 9
125 – 139 12
140 – 154 10
155 – 169 8
170 – 184 7
Calcule las medidas de tendencia central.
Construya una ojiva menor que y formule 2 preguntas en sentido contrario
2. La siguiente tabla clasifica en categorías 100 visitas al consultorio de especialistas en
enfermedades cardiovasculares en Honduras según la duración en cada visita.
Duración (minutos) Cantidad de visitas
1 – 5 12
6 – 10 15
11 – 15 21
16 – 20 30
21 – 25 13
26 – 30 9
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 29 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Total 100
Encuentre las medidas de tendencia central para este caso.
3. Una muestra de 90 comerciantes en San Pedro Sula, revelo las siguientes ventas del
año pasado:
Ventas (en miles de Lempiras) Numero de microempresas
100 – 149 9
150 – 199 14
200 – 249 20
250 – 299 25
300 – 349 16
350 – 399 6
a. Encuentre las medidas de tendencia central.
b. Construya una ojiva menor que y saque dos conclusiones.
4. Las edades de 50 gerentes de las empresas más grandes del país, aparecen en la
siguiente tabla de frecuencias.
Calcule las medidas de tendencia central.
Edades Frecuencia
50 y menos de 55 8
55 y menos de 60 13
60 y menos de 65 15
65 y menos de 70 10
70 y menos de 75 3
75 y menos de 80 1
5. A continuación el gerente de una sucursal bancaria presenta el saldo promedio
mensual de 600 cuentas de cheques:
Monto (dólares) Frecuencia Monto (dólares) Frecuencia
0.00 – 49.99 78 250.99 – 299.99 47
50.00 – 99.99 123 300.00 – 349.99 13
100.00 – 149.99 187 350.00 – 399.99 9
150.00 – 199.99 82 400.00 – 449.99 6
200.00 – 249.99 51 450.00 – 499.99 4
a. Encuentre la media aritmética a través de los dos métodos.
b. Encuentre la moda y la mediana de la distribución.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 30 Lic. Carlos A. Ávila (MAE Administración de Empresas)
TEMA VIII:
MEDIDAS DE DISPERSION
Medidas de Dispersión (Datos No Agrupados)
En un conjunto de datos, la media, la moda y la mediana solo revelan una parte de la
información importante sobre las características de los datos. La otra parte relevante de la
información para entender el patrón de los datos lo encontraremos en las medidas de
dispersión, también conocidas como medidas de extensión o variabilidad.
¿Porque es importante la dispersión en una distribución de datos?
Proporciona información adicional que permita juzgar la confiabilidad de las medidas
de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición
central es menos representativa de los datos, a diferencia de cuando estos se
agrupan más estrechamente alrededor de la media.
Permite reconocer y rechazar distribuciones de datos que tengan las dispersiones
más grandes o amplias.
Como existen problemas característicos para dispersiones muy grandes, es necesario
distinguir qué tipo de dispersión presentara una distribución de datos.
El Rango o Alcance: Es la medida de dispersión más simple pero menos utilizada. El
alcance es la diferencia entre la observación más baja y la observación más alta de un
arreglo de datos.
Su fórmula es:
Alcance = Valor más alto del arreglo - Valor más bajo del arreglo
El alcance es fácil de usar pero de utilidad muy limitada, pues aparte de estos dos valores, no
toma en cuenta ninguna otra observación del arreglo. En consecuencia ignora la variación
entre todos los demás datos y se ve influido por los valores extremos.
La Varianza (σ2): Es una de las medidas que calculan la distancia promedio de
cualquier observación del conjunto de datos con respecto a la media de la
distribución. La Varianza es el promedio de las observaciones respecto a su media
elevadas al cuadrado. Cada población y cada muestra tiene su propia varianza. Las
unidades que expresan la varianza se muestran elevadas al cuadrado lo cual provoca
que la varianza se exprese en términos que en la realidad no tienen significado o
interpretación lógica.
a. La fórmula para Varianza de una población es :
σ2 = ∑ (x - µ)2 = ∑ x2 - µ2
N N
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 31 Lic. Carlos A. Ávila (MAE Administración de Empresas)
b. La fórmula para Varianza de una muestra es:
S2 = ∑ (x – x)2 = ∑ x2 - nx2
n-1 n-1 n-1
La Desviación Estándar: Es otra medida del cálculo de la distancia promedio de
cualquier observación del conjunto de datos respecto de la media aritmética de la
distribución. Es en esencia, la raíz cuadrada de la varianza.
a. La fórmula para desviación estándar de la población es:
σ = √ σ2
b. La fórmula para desviación estándar de la muestra es:
S = √ S2
Medidas de Dispersión (Datos Agrupados)
a. La formula de Varianza es:
σ2 = ∑ fabs (Xm - µ)2 = ∑ (fabs) Xm2 - µ2 (Población)
N N
S2 = ∑ (fabs) Xm2 - nX2 (Muestral)
n - 1
b. La formula de Desviación Estándar es:
σ = √ σ2 (Población)
S = √ S2 (Muestra)
El Coeficiente de Variación: En ocasiones cuando se consideran dos o más
distribuciones, con medias significativamente diferentes o que están medidas en
unidades distintas, no es adecuado sacar conclusiones respecto a la dispersión solo
con base en la desviación estándar.
El Coeficiente de Variación es una medida relativa (porcentual) de dispersión.
Determina el grado de dispersión de un conjunto de datos relativo a su media. La
formula es la misma tanto para datos agrupados como no agrupados.
CV = S x (100) (Muestra) CV = σ x (100) (Población)
X µ
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 32 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Problemas de la sección 8: 1. La empresa de Transportes Rodríguez lleva un registro del kilometraje de todos sus
vehículos. A continuación presentamos registros del kilometraje semanal:
810 450 756 789 210 657 589 488 876 689
1250 560 689 890 987 559 788 943 447 775
a. Calcule la media para el kilometraje de los 20 camiones.
b. Encuentre las medidas de dispersión.
2. Calcule las medidas de dispersión del problema 5, sección 4.
3. Los siguientes datos de muestras se han obtenido para el número de clientes diarios
en Tiendas Nichita:
34 45 23 37 26 32 31 41 39 42 29 30 43 36 34 40 38 27
a. Calcule las medidas de Dispersión.
b. Calcule las medidas de tendencia central.
c. ¿Si el número de clientes no sobrepasa los 32 clientes, la tienda cerraría operaciones.
En este caso lo hará?
4. Dos marcas de Zapatos para correr fueron evaluados en cuanto a uso y desgaste.
Cada uno reporto los siguientes números de horas de uso antes de que se detectara
algún desgaste significativo.
Marca A 97 83 75 82 98 65 75 93
Marca B 78 56 87 54 89 65 89
a. ¿Cuál zapato presenta mayor desgaste? (Media Aritmética)
b. ¿Cuál zapato parece tener un programa de control de calidad que produzca la mejor
consistencia en su desgaste? (Coeficiente de Variación)
5. Se usan dos procesos para producir diskettes de computadora. Han surgido
problemas respecto a las variaciones en los tamaños de tales discos. Con base en los
datos de muestra aquí observados, de ocho tamaños de discos en pulgadas para cada
proceso, explique cual proceso aconsejaría usted si su objetivo es minimizar la
desviación en el tamaño alrededor de la media.
Proceso 1 Proceso 2
3.41 3.22 3.81 3.26
3.74 3.06 3.26 3.79
3.89 3.65 3.07 3.14
3.65 3.33 3.35 3.51
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 33 Lic. Carlos A. Ávila (MAE Administración de Empresas)
6. Encuentre las medidas de dispersión para datos agrupados de los ejercicios 2 y 3 de
la sección 7.
7. Datos sobre las edades de los 100 mejores ejecutivos de las 500 mejores firmas de la
Revista Fortune revelan una edad media de 56.2 años y una desviación estándar de
12.7 años. Su ingreso medio es de $89,432 con s=$16,097. ¿Cuál variable, edad o
ingreso presentan la mayor variación?
8. Daniel Benítez, usa dos máquinas diferentes para producir papeleras para las
fotocopiadoras CANON. Una muestra de las papeleras de la primera máquina
midieron 12.2, 11.9, 11.8, 12.1, 11.9, 12.4, 11.3 y 12.3 pulgadas. Las bandejas
elaboradas de la segunda maquina midieron 12.2, 11.9, 11.5, 12.4, 12.2, 11.9 y 11.8
pulgadas. Daniel debe usar la maquina con mayor consistencia en los tamaños de las
papeleras. ¿Cuál maquina deberá usar?
9. Dos compañías de Radio mantienen una férrea competencia, para encontrar cual de
las dos complace con más canciones. Durante las últimas 24 horas se recolectaron y
tabularon los datos sobre el número de canciones puestas por ambas estaciones.
Utilice los datos para preparar un reporte para comparar las estaciones.
a. Calcule las medidas de tendencia central y de dispersión.
b. Cual estación es más consistente en sus operaciones.
Numero de canciones por hora Radioactiva W105
5 – 10 2 4
11 – 16 4 5
17 – 22 6 7
23 – 28 8 5
29 – 34 2 3
35 – 40 3 1
10. El chef jefe del restaurante Taco Bell acaba de recibir dos docenas de jitomates de su
proveedora, pero todavía no los acepta. Sabe por la factura que el peso promedio de
un jitomate es 7.5 onzas, pero insiste en que todos tengan un peso uniforme.
Aceptara los jitomates solo si el peso promedio es 7.5 onzas y la desviación estándar
sea menor a 0.5 onzas. Los pesos de los jitomates son los siguientes:
6.3 7.2 7.3 8.1 7.8 6.8 7.5 7.8 7.2 7.5 8.1 8.2 8.0 7.4 7.6 7.7 7.6 7.4 7.5 8.4 7.4 7.6 6.2 7.4 ¿Cuál es la decisión del chef y por qué?
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 34 Lic. Carlos A. Ávila (MAE Administración de Empresas)
11. El gerente de Cinemark en San Pedro Sula, saco un balance del número de asistentes
por día que han llegado a las salas en los últimos 6 meses (datos en días):
Número de asistentes Frecuencia (días)
180 – 249 18
250 – 319 37
320 – 389 49
390 – 459 44
460 – 529 19
530 – 599 13
Calcule las 3 medidas de dispersión.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 35 Lic. Carlos A. Ávila (MAE Administración de Empresas)
TEMA IX:
OTRAS MEDIDAS DE DISPERSION
Otras Medidas de Dispersión: También son conocidas como medidas posicionales
de dispersión. Se utilizan para determinar a partir de qué valor o entre que valores se
ubica un determinado segmento de los datos de una distribución. Entre ellas
tenemos:
Cuartiles (Q): Dividen una distribución en 4 segmentos iguales, en donde cada
una de ellas representa el 25% de los datos. Cada distribución tiene un máximo
de 3 cuartiles.
La fórmula para calcular la ubicación respectiva es:
Qi = (n + 1) Q (Datos no Agrupados)
4
Qi = LRI + (PQ - fai ) w ; en donde fac ≥ (N + 1) i = PQ (Datos Agrupados)
FQ 4
Deciles (D): Dividen una distribución en 10 segmentos iguales, en donde cada una
de ellas representa el 10% de los datos. Cada distribución tiene un máximo de 9
deciles.
La fórmula para calcular la ubicación respectiva es:
Di = (n + 1) D (Datos no Agrupados)
10
Di = LRI + (PD - fai) w; en donde fac ≥ (N + 1) i = PD (Datos Agrupados)
FD 10
Percentiles (P): Dividen una distribución en 100 segmentos iguales, en donde
cada una de ellas representa el 1% de los datos. Cada distribución tiene un
máximo de 99 percentiles.
La fórmula para calcular la ubicación respectiva es:
Pi = (n + 1) P (Datos no Agrupados)
100
Pi = LRI + (PP - fai) w; en donde fac ≥ (N + 1) i = PP (Datos Agrupados)
FP 100
Alcance o Rango Intercuartilico (RIQ): Es la diferencia entre el tercer cuartil y el
primer cuartil. Dentro de este rango o alcance se ubican la mitad de las
observaciones. Consta del 50% de los datos, que se ubican entre Q1 y Q3,
cortando y dejando de paso al 25% inferior y al 25% superior de los datos. Esto
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 36 Lic. Carlos A. Ávila (MAE Administración de Empresas)
permite que esta medida no se vea influenciada por valores extremos. La formula
es:
RIQ = Q3 – Q1
Problemas de la sección 9: 1. Encuentre dos cuartiles, dos deciles y dos percentiles de los ejercicios 2 y 4, de la
sección 4.
2. Encuentre dos cuartiles, dos deciles y dos percentiles de los ejercicios 1 y 3 de la
sección 7.
3. Encuentre Rango Intercuartilico de los Problemas 2 (Sección 4) y 3 de (Sección 7)
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 37 Lic. Carlos A. Ávila (MAE Administración de Empresas)
TEMA X:
APLICACIONES ADICIONALES DE LA DESVIACION ESTANDAR
El Teorema de Chebyshev = Formulado por P.L. Chebyshev, matemático ruso, 1821 –
1894, establece que para todo conjunto de datos, por lo menos 1 – 1/K2 % de las
observaciones están dentro de K desviaciones estándar de la media, en donde K es
cualquier número mayor que 1:
Teorema de Chebyshev = 1 – (1/K2)
La Regla Empírica y la Distribución Normal: la desviación estándar se puede usar
para sacar ciertas conclusiones si el conjunto de datos está distribuido normalmente.
Una distribución normal es una distribución de datos continuos que produce una
curva simétrica en forma de campana. Las observaciones ubicadas a los extremos de
la curva ocurren con muy poca frecuencia, las observaciones que están más cerca de
la mitad ocurrirán con mayor frecuencia, estas condiciones producen la campana
simétrica. La observación modal (la más frecuente) se encuentra ubicada en el pico
de la distribución. En una distribución normal la media, la moda y la mediana están
ubicadas en la misma posición (son iguales). Es importante agregar que la mitad de
las observaciones está por encima de la media y la otra mitad está por debajo (50% y
50%).
La Regla Empírica, que es una extensión al Teorema de Chebyshev (en la cual se dice
que no importa qué forma tenga la distribución, al menos 75% de los valores caen
dentro de +/- 2σ a partir de la media y al menos 89% de los valores caen dentro de
+/- 3σ a partir de la media), específica que:
68.3% de las observaciones caen dentro de +/- 1 desviación estándar de la
media.
95.5% de las observaciones caen dentro de +/- 2 desviaciones estándar de la
media.
99.7% de las observaciones caen dentro de +/- 3 desviaciones estándar de la
media.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 38 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Resultado Estándar: A través de este resultado se puede describir que tan lejos las
observaciones individuales de una distribución se apartan de la media de la
distribución. Específicamente nos da el número de desviaciones estándar que una
observación en particular ocupa por debajo o por encima de la media. Se calcula
como:
Resultado estándar = x - µ
σ
Sesgo: Se refiere a que no todas las distribuciones son normales, ya que algunas
pueden estar sesgadas ya sea a la derecha o a la izquierda. En ambos casos, la moda
es por definición la observación que ocurre con mayor frecuencia. Por lo tanto, se
encuentra en el pico de la observación. Sin embargo por su sola naturaleza, la media
se ve afectada por las observaciones extremas. Por tanto, es halada en dirección del
sesgo, más de lo que esta la mediana, la cual se encuentra en algún sitio entre la
moda y la media. El sesgo puede medirse mediante el Coeficiente de sesgo de
Pearson:
Coeficiente de Sesgo (P) = 3 (X – mediana)
S
Si P < 0, los datos están sesgados a la izquierda
Si P > 0, los datos están sesgados a la derecha
Si P = 0, los datos están distribuidos normalmente
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 39 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Problemas de la sección 10: 1. Un conjunto de datos distribuidos normalmente tiene una media de 5,000 y una
desviación estándar de 450. Qué porcentaje de las observaciones (Si el numero de
observaciones o elementos es 350) están:
a. Entre 4550 y 5450.
b. Entre 4100 y 5900.
c. Entre 3650 y 6350.
d. Por encima de 6350
e. Por debajo de 4550.
2. Una empresa maderera corta troncos a una longitud media de 25 pies, con una
desviación estándar de 4.5 pies. Si los cortes están distribuidos normalmente (tenga
en cuenta que en bodega hay 34,500 troncos inventariados) que porcentaje de
troncos tienen:
a. ¿Menos de 20.5 pies?
b. ¿Mínimo 16 pies?
c. ¿A lo sumo 25 pies?
d. ¿Máximo 29.5 pies?
3. Un conjunto de datos sobre el peso de contenido de 1000 bolsas de comida para
perros marca Puppy Chow tiene una media de 50 libras y una desviación estándar de
2.3 libras. No se sabe si los datos están distribuidos normalmente. Los fabricantes
esperan que por lo menos 750 de las bolsas pesen entre 40.8 y 59.2 libras. ¿Qué
seguridad puede darles?
4. Debido a que las tasas de interés han caído desde 2008 debido a la crisis mundial, se
encontró que una muestra de las tasas hipotecarias a 15 años en las instituciones
bancarias fue de:
7.1%, 7.3%, 7.0%, 6.9%, 6.6%, 6.9%, 6.5%, 7.3%, 6.85% a. Calcule las medidas de tendencia central. b. Calcule el coeficiente de Sesgo de Pearson, para determinar el tipo de sesgo del
arreglo. c. Calcule la Varianza y la desviación estándar.
5. Una supervisora en una planta ensambladora recibió las siguientes clasificaciones de
eficiencia durante 12 meses:
56, 69, 48, 75, 65, 72, 81, 43, 61, 42, 36, 52. a. ¿Cuál de las medidas de tendencia central será la que ella debe colocar para crear
una impresión más favorable?
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 40 Lic. Carlos A. Ávila (MAE Administración de Empresas)
b. Calcule el coeficiente de Sesgo de Pearson.
6. Dados los siguientes puntajes de 12 pruebas para una clase de Estadística, calcule el
coeficiente de Sesgo de Pearson. Asuma que estos datos son muestrales:
80, 83, 87, 85, 90, 86, 84, 82, 88, 98, 92, 77, 95
7. La compañía American Airlines revelo en el año 2009, una media de 78.7 pasajeros
por día, con una desviación estándar de 12.14. Para programar los tiempos para una
nueva ruta que la compañía ha abierto, la gerencia desea saber con qué frecuencia
los pasajeros están dentro de K = dos desviaciones estándar de la media, y cual es
dicho intervalo.
8. Calcule Pearson para el problema 9, sección 8.
9. Un conjunto de 60 observaciones tiene una media de 66.8, una varianza de 12.60 y
una forma de distribución desconocida.
a. ¿Entre que valores deberán caer al menos 75% de las observaciones, de acuerdo con
el teorema de Chebyshev?
b. Si la distribución es simétrica y con forma de campana, aproximadamente cuantas
observaciones deberán encontrarse en el intervalo 59.7 – 73.9?
c. Encuentre los resultados estándar para las siguientes observaciones tomadas de la
distribución: 61.45, 75.37, 84.65, 51.50.
10. David Ordoñez, propietario de una enorme panadería, afirmo que el nivel de
producción promedio por semana de su empresa fue 11,398 barras de pan, con una
varianza de 49,729. Si los datos utilizados para calcular los resultados se recolectaron
en el periodo de 32 semanas, ¿Durante cuantas semanas estuvo el nivel de
producción debajo de 11,175? ¿Y cuántas arriba de 11,844?
11. Una compañía multinacional tiene 3 oficinas en 3 ciudades distintas. Los niveles de
salario difieren de una ciudad a otra. En la oficina de Washington, D.C. el aumento
promedio a los salarios durante el año anterior fue de $1500 con una desviación
estándar de $400. En la sucursal de Nueva York, el aumento promedio fue de $3760
con una desviación estándar de $622. En Los Ángeles, el aumento promedio fue de
$850, con una desviación estándar de $95. Se entrevisto a 3 empleados. El empleado
de Washington recibió un aumento de $1100; el de Nueva York obtuvo un aumento
de $3200 y el de Los Ángeles, $500. ¿Cuál de los tres tuvo el menor aumento en
relación con la media y la desviación estándar de los aumentos correspondientes a su
oficina?
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 41 Lic. Carlos A. Ávila (MAE Administración de Empresas)
TEMA XI: PRINCIPIOS DE PROBABILIDAD
En la actualidad, la teoría matemática de la Probabilidad es la base para las aplicaciones
estadísticas tanto en investigaciones sociales como en la toma de decisiones.
Conceptos básicos de la probabilidad:
Probabilidad: Es la posibilidad de que algo pase. Las probabilidades se pueden
expresar como fracciones propias o como decimales que están entre cero y uno.
Tener una probabilidad de cero, significa que algo nunca va a suceder y una
probabilidad de uno significa que algo va a suceder siempre.
Evento: Es uno o más de los posibles resultados de hacer un experimento.
Ej. Los eventos del experimento de lanzar una moneda son cara y cruz. Sacar un as de copas de una baraja de naipes. Ser elegido de entre cien estudiantes para responder una pregunta.
Experimento: es la actividad principal que genera dichos eventos.
Ej. Lanzar una moneda.
Lanzar un dado.
Sacar una carta de una baraja.
Cursar una materia en la universidad
Espacio Muestral: Es el conjunto de todos los resultados posibles de un experimento.
Ej. Del lanzamiento de una moneda se puede obtener cara o cruz.
Del lanzamiento de un dado se pueden obtener resultados del 1 al 6.
Al cursar una materia en la universidad, uno puede aprobar o reprobar.
De una baraja se pueden obtener 52 resultados posibles.
Eventos Mutuamente Excluyentes: Se dice que los eventos son mutuamente
excluyentes si uno y solo uno de ellos puede tener lugar a un tiempo.
Ej. De lanzar una moneda podemos obtener cara o cruz, pero no ambas.
Usted puede pasar o reprobar una materia, pero no ambos resultados.
Usted puede llegar tarde o temprano a clase, pero no ambas al mismo
tiempo.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 42 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Lista Colectivamente Exhaustiva: Una lista es exhaustiva cuando en una lista de
posibles eventos que pueden resultar de un experimento se incluyen todos los
resultados posibles.
Ej. Del lanzamiento de un dado los posibles resultados van del 1 al 6.
Los estudiantes de una escuela pueden estar a tiempo o no estar en el salón
de clase cuando se pasa lista.
Tipos de Probabilidad:
Probabilidad Clásica: El Planteamiento clásico define la probabilidad de que un
evento ocurra como:
Probabilidad de un evento = Numero de resultados en los que puede ocurrir un evento
Número total de resultados posibles
A la probabilidad clásica también se le define como probabilidad a priori, debido a que si se
usan ejemplos previsibles como monedas no alteradas, dados no cargados y mazos de
barajas normales, entonces es posible establecer el resultado sin la necesidad de realizar el
experimento. Las conclusiones son basadas en puro razonamiento lógico. Este
planteamiento es útil en experimentos como los mencionados anteriormente, pero se ve en
problemas al quererlo aplicar en tomas de decisiones administrativas. Es importante tomar
en cuenta que el experimento descrito de un evento puede ser “con reemplazo o sin
reemplazo” después de cada intento.
Probabilidad de Frecuencia relativa de presentación: También conocida como
probabilidad a posteriori, define la probabilidad como:
1. La frecuencia relativa observada en un evento durante un gran número de intentos
2. La fracción de veces que un evento se presenta a la larga, cuando las condiciones
son estables.
Frecuencia Relativa = Numero de veces que ha ocurrido un evento en el pasado
Número total de observaciones
Ej. Cuál es la probabilidad de que yo viva hasta los 85 años.
La probabilidad de que mañana haya un accidente aéreo.
Este método usa la frecuencia relativa de las presentaciones pasadas de un evento como
probabilidad. Se determina que tan frecuente ha sucedido algo en el pasado y se usa esa
cifra para predecir la probabilidad de que el evento suceda de nuevo en el futuro. Otra
característica es que el resultado de la probabilidad obtiene mayor precisión a medida
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 43 Lic. Carlos A. Ávila (MAE Administración de Empresas)
aumenta el número de observaciones. Claro está que hay que tener en cuenta el tiempo y el
costo que implicaría tener más observaciones.
Probabilidad Subjetiva: Están basadas en las creencias de las personas que efectúan
la estimación de probabilidad.
Ej. Al dolerle los huesos, una anciana cree que se avecina la lluvia.
Construir una planta nuclear sobre una falla geológica, en ese caso sería la
probabilidad de que suceda un accidente en la planta, sin contar con antecedentes
de ese tipo.
Reglas de PROBABILIDAD
La mayoría de administradores que usa la probabilidad se preocupa por dos condiciones:
El caso en que un evento u otro se presente.
La situación en que dos eventos presenten al mismo tiempo.
Probabilidad Marginal o Incondicional: Es también denominada como probabilidad
sencilla, que quiere decir que solo un evento puede llevarse a cabo.
Relaciones entre eventos: Un Conjunto es toda reunión de objetos. Cada conjunto
contiene una serie de elementos. Es totalmente probable que algunos elementos
estén presentes en ambos conjuntos, si esto sucede, se dice que existe una
Intersección de eventos, que es cuando los elementos tienen las dos características
de los conjuntos. La intersección se simboliza como A∩B.
Una herramienta muy importante para mostrar la relación entre conjuntos, es
conocida como Diagrama de Venn, desarrollado por John Venn, matemático ingles
(1834 – 1923). Los eventos se representan por medio de círculos que pueden ir o no
ir interceptados, que van dibujados dentro de un rectángulo cuya área mide 1.
El diagrama de Venn representado en el ejemplo 1 puede describirse como la
relación entre el conjunto A y el conjunto B. El área combinada de ambos conjuntos
recibe el nombre de unión de los conjuntos A y B. La unión en este caso contiene
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 44 Lic. Carlos A. Ávila (MAE Administración de Empresas)
todos los tipos de criaturas que tienen dos piernas, pueden volar, o ambas cosas a la
vez. El área donde los conjuntos A y B se solapan se define como la intersección de A
y B. Contiene todos los tipos de criaturas que pertenecen a la vez a A y a B, es decir,
que tienen dos piernas y pueden volar.
Un diagrama de Venn de dos conjuntos define 4 áreas diferentes (la cuarta es la
exterior), que pueden unirse en 6 posibles combinaciones:
A (dos patas)
B (vuelan)
A y B (dos patas y vuelan)
A y no B (dos patas y no vuelan)
no A y B (más o menos de dos patas, y vuelan)
no A y no B (ni tienen dos patas ni vuelan)
Diagrama de Venn mostrando todas las intersecciones posibles entre tres conjuntos A, B y C.
La Unión de A y B, se simboliza como AUB, consta de elementos que están o en A o en B o
en ambos.
Regla de la Adición:
Para eventos Mutuamente Excluyentes (eventos no pueden darse al mismo tiempo):
P (AUB) = P (A) + P (B)
Para eventos No Mutuamente Excluyentes (eventos pueden darse al mismo tiempo):
P (AUB) = P (A) + P (B) – P (A∩B)
Eventos Complementarios: Son los eventos en que si uno de ellos ocurre, el otro no
puede ocurrir. Estos eventos por supuesto que son mutuamente excluyentes y
colectivamente exhaustivos. La referencia exacta es que de un mismo evento en
particular, puede que este ocurra o no ocurra. La formula es:
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 45 Lic. Carlos A. Ávila (MAE Administración de Empresas)
P (A) + P (no A) = 1
P (A) = 1 – P (no A)
Problemas de la sección 11: 1. Sea A, el evento de que un estudiante en particular curse Calculo I y el evento B sea
que curse Estadística I.
¿Qué significado tiene el evento AΩB?
¿Qué significado tiene el evento AUB?
¿Cuál es el complemento de A?
¿Cuál es el complemento de B?
¿Son los eventos A y B mutuamente excluyentes?
2. Al lanzar un dado, cual es la probabilidad de obtener:
Un número impar
Un 4
Sacar un número que no sea 5
Sacar un 7
No sacar un 2
3. Considere una pila de 9 cartas de espadas, numeradas del 2 al 10 y un dado.
Proporcione la probabilidad de cada uno de los siguientes totales, al sumar los
valores del dado y de la carta:
2 3 8 9 12 14 16
4. Durante el año anterior, las ventas semanales en una Tienda de mascotas, han sido
“bajas” durante 10 semanas, “considerables” durante 26 semanas, y “altas” el resto
del año. Cuál es la probabilidad de que las ventas de esta semana sean:
Considerables
Bajas
Altas
No Bajas
Por lo menos considerables
5. Clasifique las siguientes estimaciones de probabilidad en cuanto a su tipo (clásica,
frecuencia relativa o subjetiva):
La probabilidad de lograr un tiro penal en hockey sobre hielo es 0.47
La probabilidad de que el presidente Lobo renuncie es de 0.75.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 46 Lic. Carlos A. Ávila (MAE Administración de Empresas)
La probabilidad de sacar 2 seises al lanzar dos dados es 1/36.
La probabilidad de caerme al caminar es 0.38.
La probabilidad de que viaje a Europa este año es 0.14.
La probabilidad de que un auto arranque en un día muy frio es 0.97
6. El gerente de Cinemark en San Pedro Sula, saco un balance del número de asistentes
por día que han llegado a las salas en los últimos 6 meses (datos en días):
Número de asistentes Frecuencia (días)
180 – 249 18
250 – 319 37
320 – 389 49
390 – 459 44
460 – 529 19
530 – 599 13
Calcule la probabilidad de que mañana lleguen a Cinemark:
a) Entre 390 y 460 personas.
b) Máximo 320 personas.
c) Por lo menos 250 personas.
d) No lleguen más de 530 espectadores.
e) A lo sumo 180 personas.
7. Para el caso de bebes nacidos en Honduras, la probabilidad de que su peso sea
menor a los 8.5 libras es de 19% y la probabilidad de que el periodo de gestación sea
menor a 8 meses y medio es de 31%. Además la probabilidad de que estos dos
eventos ocurran simultáneamente de 0.14.
En el caso de una niña se elija al azar ¿Cuál es la probabilidad de que ocurra A o B?
Trace un diagrama de Venn para ilustrar la relación entre los eventos.
¿Cuál es la probabilidad que un bebe, su peso no sea menor a 8.5 libras?
¿Son estos eventos mutuamente excluyentes?
8. Las siguientes estadísticas muestran el número de veces que una misma persona
haya ido varias veces al cine.
Edad Probabilidad
Menos de 6 0.0030
6 – 10 0.1240
11 – 15 0.2630
16 – 20 0.2900
21 – 25 0.2200
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 47 Lic. Carlos A. Ávila (MAE Administración de Empresas)
26 – 30 0.0850
31 – 35 0.0140
Más de 35 0.0010
Total 1.0000
¿Cuál es la probabilidad de que una persona haya ido menos de 20 veces al cine en el
año?
¿Cuál es la probabilidad de que esta persona haya ido por lo menos 30 veces?
¿Cuál es la posibilidad de que una persona no haya ido entre 20 y 25 veces al cine?
¿Cuál es la posibilidad de que una persona haya ido al cine entre 25 y 40 veces al
año?
9. Se realizo un sondeo entre el personal del Hospital Mario Catarino Rivas sobre la
destitución del Dr. Juan Carlos Zúñiga. El sondeo se realizo entre médicos y
enfermeras de la institución:
Sondeo de opinión Médicos (M) Enfermeras (E)
Muy de acuerdo 5 3
Poco de acuerdo 7 5
NS/NR 8 6
Nada de acuerdo 20 26
¿Cuál es la probabilidad de que un trabajador, seleccionado al azar del grupo
sondeado, no haya respondido sobre la destitución?
¿Cuál es la posibilidad de que una enfermera seleccionada al azar este de alguna
forma de acuerdo con la destitución?
¿Cuál es la probabilidad de que un trabajador seleccionado al azar no esté de
acuerdo con la destitución?
¿Son mutuamente excluyentes los eventos? ¿Explique?
¿Existe dependencia o influencia alguna entre los eventos, Explique?
10. A continuación se presenta una distribución de frecuencias de las tomas de muestra
de los niveles de azúcar en la sangre que presentan 500 pacientes del Hospital
Escuela en Tegucigalpa.
Nivel de azúcar en la sangre Frecuencia
60 – 69 14
70 – 79 23
80 – 89 95
90 – 99 106
100 – 109 122
110 o más 140
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 48 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Si se considera que los pacientes que tienen un nivel de 110 o más de hemoglobina
son personas diabéticas, ¿Cuál es la probabilidad de que un paciente escogido al azar,
tenga diabetes?
¿Cuál es la probabilidad de que un paciente tenga nivel normal de azúcar en la
sangre? Tome en cuenta que el nivel normal de azúcar es de 80 a 110.
¿Cuál es la probabilidad de que una persona seleccionada al azar tenga muy bajo
nivel de azúcar?
¿Cuál es la probabilidad de que el nivel de azúcar de una persona no esté entre 90 y
100?
¿Son estos eventos independientes? Explique por qué.
11. A continuación se presentan datos de la probabilidad del número de hijos que en
promedio tiene una familia en Honduras:
Número de hijos Proporción de familias que tienen esta cantidad de hijos
0 0.04
1 0.12
2 0.32
3 0.23
4 0.13
5 0.09
6 0.07
¿Cuál es la probabilidad de que una familia escogida al azar tenga 4 hijos o más?
¿Cuál es la probabilidad de que una familia escogida al azar tenga 2 o 3 hijos?
¿Cuál es la probabilidad de que una familia elegida al azar tenga al menos un hijo?
¿Cuál es la probabilidad de que una familia al azar no tenga hijos?
¿Cuál es la probabilidad de que una familia no tenga 5 hijos?
12. Hondutel registra la duración de las llamadas telefónicas efectuadas por 175
personas durante el día de navidad:
Duración (minutos) Frecuencia
1 – 7 45
8 – 14 32
15 – 21 34
22 – 28 22
29 – 35 16
36 – 42 12
43 – 49 9
50 – 56 5
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 49 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Cuál es la probabilidad de que la siguiente llamada dure:
a. ¿Cuándo muchos 21 minutos?
b. ¿Hasta 42 minutos?
c. ¿Entre 22 y 36 minutos?
d. ¿Mínimo 56 minutos?
e. ¿Máximo 1 minuto?
f. ¿No pase de 29 minutos?
13. La siguiente tabla muestra el número de computadores vendidos diariamente por
una tienda minorista.
Numero de computadores vendidos Número de días
0 10
1 38
2 16
3 26
4 20
Determine la probabilidad de que el número de computadores que se vendan hoy
sea:
a. 2
b. Menos de 3
c. Más de 1
d. Por lo menos 1
e. Ninguno
f. No sea 4
14. La compañía multinacional Pfizer, ha producido una capsula para controlar la presión
arterial. El departamento de producción realiza inspecciones permanentes de cada
capsula ya terminada. Uno de los inspectores se ha dado cuenta que de cada 1000
capsulas que se revisan, 25 tienen defectos internos, 18 tienen defectos de
empaquetado y 9 tienen ambos tipos de defectos. En su informe, el inspector debe
incluir la probabilidad de que haya defectos en las capsulas.
¿Cuál es la probabilidad que haya defectos en las capsulas?
¿Cuál es la probabilidad de que una capsula no tenga defectos internos?
¿Cuál es la probabilidad que una capsula tenga defectos internos y de empaquetado?
¿Cuál es la probabilidad de que una capsula no tenga defectos?
Construya un diagrama de Venn
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 50 Lic. Carlos A. Ávila (MAE Administración de Empresas)
15. La empresa CEMCOL distribuye una marca específica de tractor. El gerente de
mantenimiento ha encontrado dos tipos de fallas en los tractores. Uno de los fallos es
de problemas eléctricos y el otro consiste en problemas de temperatura. El gerente
sabe que la probabilidad que un tractor seleccionado al azar tenga problemas
eléctricos es del 45%. La probabilidad que un tractor tenga ambas fallas es del 35%.
La probabilidad que el tractor tenga falla eléctrica o de temperatura es 70%
a. ¿Cuál es la probabilidad que un tractor tenga falla de temperatura?
b. ¿Cuál es la probabilidad que un tractor no tenga fallo eléctrico?
c. ¿Cuál es la probabilidad que un tractor no tenga fallo eléctrico y no tenga fallo de
temperatura?
d. ¿Cuál es la probabilidad que un tractor tenga fallo de temperatura y fallo eléctrico?
16. Si suponemos que es igualmente posible que un bebe nazca en cualquier día de la
semana, ¿Cuáles son las probabilidades de que un bebe nazca,
a) ¿Un martes?
b) ¿Un día que empiece con M?
c) ¿Entre miércoles y viernes, incluyéndolos?
d) No nazca un domingo.
e) Nazca Lunes o Martes.
f) Nazca Viernes y Sábado.
17. Un inspector de una compañía tiene la tarea de comparar la confiabilidad de dos
estaciones de bombeo. Cada estación es susceptible a dos tipos de falla:
descompostura en el bombeo y fugas. Cuando ocurre una de las dos (o ambas), la
estación debe parar. Los datos disponibles indican que prevalecen las siguientes
probabilidades:
Estación P(falla en bombeo) P(fuga) P(ambas)
1 0.07 0.10 0
2 0.09 0.12 0.06
¿Qué estación tiene la mayor probabilidad de parar?
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 51 Lic. Carlos A. Ávila (MAE Administración de Empresas)
TEMA XII
TABLAS DE CONTINGENCIA
Tablas de Contingencia: Estas tablas son útiles para calcular probabilidades de
experimentos con eventos múltiples. Los valores en los márgenes de la tabla se
llaman probabilidades marginales. De acuerdo a las celdas de la estructura principal
de la tabla, la probabilidad de la intersección de dos eventos se denomina como
probabilidad conjunta.
Problemas de la sección 12: 1. En una compañía de cobros, un gerente tiene 120 cuentas por cobrar pendientes. El
gerente informa que de las 25 cuentas que están en el intervalo de $0 a $4999, 10
están vencidas, 5 atrasadas y el resto son morosos, colocando al deudor en peligro de
ser visitado por el representante legal. De las 37 cuentas comprendidas entre $5000
y $9999, 15 están vencidas, 10 están atrasadas y el resto son morosas. Hay 39
cuentas en el intervalo entre $10000 y $14999, de las cuales 11 están vencidas, 18
son morosas y el resto están atrasadas. De las cuentas restantes que están en el
intervalo comprendido entre $15000 y más, 7 están morosas, 7 están atrasadas y el
resto están vencidas. El gerente general de la compañía desea ver una tabla de
contingencia de estas cuentas. Calcule:
La probabilidad de que las cuentas no sean morosas.
La probabilidad de que las cuentas estén vencidas.
La probabilidad de que las cuentas no estén atrasadas.
Las cuentas de menos de $10,000 que no estén atrasadas.
Las cuentas de más de $5,000 que hayan vencido.
2. Una organización recolecta datos sobre 500 economistas en la academia, la industria
privada, y el gobierno respecto a sus opiniones sobre si la economía podría ser
estable, podría expandirse o podría entrar en un periodo de contracción en el futuro
próximo. Sin embargo, parte de la información se perdió, resultando la siguiente
tabla de contingencia parcial. Con base en los datos restantes, cree una tabla de
probabilidad. ECONOMIA
Economistas Estable (S) Expansión (E) Contracción (C) Total
Academia (A) 125 100
Industria Privada (I) 35 110
Gobierno (G) 25 40 65
Total 200
De la tabla de probabilidad, encuentre:
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 52 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Pb (I)
Pb (G)
Pb (A U I)
Pb (S ∩ E)
Pb (G U C)
Pb (no E)
Pb (S ∩ no G)
3. La empresa Zip Zona Verde tiene 560 empleados de los cuales 320 son hombres y el
resto son mujeres. 170 hombres son de Personal, 95 son Auxiliares y el resto son de
Línea. De las mujeres, 140 son de Línea, 40 de Auxiliar y el resto de Personal.
Construya una tabla de contingencia y calcule:
a. Pb (A)
b. Pb (no L)
c. Pb (H ∩ no P)
d. Pb (M U L)
e. Pb (A ∩ P)
4. De 1000 jóvenes de 18 años, 550 tienen empleo y 780 son bachilleres. De los 780
bachilleres, 450 tienen empleo. Cuál es la probabilidad de que un joven de 18 años
tomado aleatoriamente sea:
Un bachiller empleado
Empleado pero no bachiller
Desempleado o un bachiller
Desempleado y no bachiller
No bachiller
5. Una caja contiene 75 canicas, 45 son azules, 30 de estas tienen una apariencia
veteada. El resto de ellas son rojas y 20 de estas también están veteadas. Las canicas
que no están veteadas, son transparentes. Cuál es la probabilidad de sacar:
a) ¿Una canica azul?
b) ¿Una canica transparente?
c) ¿Una canica azul veteada?
d) ¿Una canica roja transparente?
e) ¿Una canica no transparente?
f) ¿Una canica roja o transparente?
g) ¿Una canica veteada transparente?
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 53 Lic. Carlos A. Ávila (MAE Administración de Empresas)
6. Editorial McGraw Hill, tiene en bodega 75 títulos distintos de libros, clasificados por
tipo y costo de la siguiente manera:
Costo
Tipo US$10 US$15 US$20 Total
Ficción 10 3 21
Biografías 12 10
Histórico 17 23
Total 2
Complete la tabla de contingencia y encuentre las siguientes probabilidades:
Pb (B)
Pb (no H)
Pb (no $10)
Pb (H ∩ F)
Pb ($20 U B)
Pb (B U >$10)
Pb ($15 ∩ no F)
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 54 Lic. Carlos A. Ávila (MAE Administración de Empresas)
TEMA XIII
PROBABILIDADES BAJO INDEPENDENCIA ESTADISTICA
Se dice que los eventos son estadísticamente independientes, cuando la
presentación de uno de ellos, no tiene efecto alguno, sobre la probabilidad de
presentación de cualquier otro evento. Existen tres tipos de probabilidad bajo esta
condición:
a) P. Marginal: Es la probabilidad simple de la presentación de un evento. Si se lanza
una moneda la primera vez y se obtiene como resultado una cruz, y luego se vuelve a
lanzar por segunda vez, el resultado podría ser cara o cruz. El resultado del primer
lanzamiento no marca en lo absoluto el resultado del segundo o de cualquier otro
lanzamiento. Estos eventos son independientes.
b) P. Conjunta: La probabilidad de dos o más eventos que se presentan juntos o en
sucesión es el producto de sus probabilidades marginales.
a. P (A∩B) = P (A) x P (B)
c) P. Condicional: Es la probabilidad de que un segundo evento (B) se presente si un
primer evento (A) ya ha sucedido.
a. P (A/B) = P (B)
b. P (B/A) = P (A)
Aunque parezca incongruente, la formula lo que en realidad presenta es que en la realidad
aunque se quiera establecer que un evento está condicionado porque otro ya haya sucedido,
en la realidad no se da de esa forma.
Problemas de la sección 13:
1. Al observar la población de Honduras, se concluye que la probabilidad de que un
adulto entre 50 y 65 años no cuente con un seguro de salud con cualquier tipo de
cobertura es de 55%.
Suponga que usted elige aleatoriamente a una mujer de 52 años y a un hombre
sin relación alguna con ella de 59 años, entre esta población ¿Cuál es la
posibilidad de que ninguno de los dos este asegurado?
¿Cuál es la probabilidad de que ambos posean seguro medico?
Si se eligen 5 adultos de la población no relacionados entre sí de 50 y 64 años de
edad, ¿Cuál es la probabilidad de que 3 de ellos carezcan de seguro?
De 4 adultos al azar, cual es la probabilidad que dos de ellos cuenten con seguro.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 55 Lic. Carlos A. Ávila (MAE Administración de Empresas)
¿Son estos eventos Independientes?
2. La Probabilidad de que una mujer casada elegida aleatoriamente al azar no use
ningún método de anticoncepción es de 0.48
¿Cuál es la probabilidad de que 5 mujeres de este grupo elegida al azar 3 no usen
método anticonceptivo?
¿Cuál es la probabilidad que de las 5 mujeres elegidas todas usen método
anticonceptivo?
¿Cuál es la probabilidad de que ninguna use método anticonceptivo?
¿Son estos eventos mutuamente excluyentes?
¿Son estos eventos independientes?
3. La señora Victoria ha llegado al hospital a dar a luz y el resultado es un lindo varón.
Tres horas después llega doña Carmen a dar a luz al hospital.
¿Cuál es la probabilidad de que doña Carmen dé a luz una niña, dado que doña
Victoria ha dado a luz un varón?
¿Cuál es la probabilidad de que doña Carmen dé a luz un varón, dado que doña
Victoria ha dado a luz un varón?
¿Cuál es la probabilidad de que doña Carmen y doña Victoria den a luz un varón y
una niña respectivamente?
4. Una clínica tiene 4 aparatos de Rayos X, que cuando fallan cada una se repara por
separado. A partir de la experiencia se sabe que cada aparato se encuentra fuera de
servicio el 14% del tiempo.
Si la primera máquina está funcionando normalmente, ¿Cuál es la probabilidad de
que tres de las otras maquinas estén defectuosas?
Si la primera máquina se encuentra defectuosa, ¿Cuál es la probabilidad de que al
menos dos de las otras maquinas se encuentren defectuosas?
¿Si la clínica tuviera 6 aparatos, Cuál es la probabilidad de que cuatro de ellas
maquinas estén funcionando correctamente?
¿Cuál es la posibilidad de que 2 de las maquinas presenten fallos?
5. El señor William Robertson, ejecutivo de una tabacalera está consciente de la
responsabilidad social que la empresa debe tener con la sociedad. La compañía lanza
una campaña publicitaria para hacer conciencia en el consumo del cigarrillo. El señor
Robertson acaba de instalar 4 anuncios panorámicos en la carretera a la entrada de la
ciudad y sabe por su experiencia, la probabilidad de cada anuncio sea visto por un
conductor escogido aleatoriamente. La probabilidad de que el primer anuncio sea
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 56 Lic. Carlos A. Ávila (MAE Administración de Empresas)
visto por un conductor es de 0.75, la probabilidad de que el segundo sea visto es de
0.83, la probabilidad para el tercero es de 0.86, y la del cuarto es de 0.90.
Suponiendo que el evento consistente en que un conductor vea uno cualquiera de
los anuncios es independiente de si ha visto o no los demás; ¿Cuál es la probabilidad
de que:
Los cuatro anuncios sean vistos por un conductor escogido aleatoriamente.
El primero y el cuarto anuncios sean vistos, sin que el segundo y el tercero sean
notados.
Ninguno de los anuncios sea visto.
El tercero y el cuarto no sean vistos.
Dos de los anuncios no sean vistos.
Tres anuncios sean vistos.
6. Una bolsa tiene 32 canicas: 4 rojas, 9 negras, 12 azules, 6 amarillas y 1 morada. Las
canicas se sacan una a la vez con reemplazo. Calcule la probabilidad de que:
La segunda canica sea amarilla dado que la primera fue amarilla
La segunda canica sea roja dado que la primera fue negra
La tercera canica sea morada dado que la primera y segunda fueron moradas
La primera canica sea roja o azul
La primera canica no sea negra
La primera canica sea azul y morada
7. El departamento de salud efectúa rutinariamente dos inspecciones independientes a
los restaurantes; un restaurante aprobara la inspección solo si ambos inspectores lo
aprueban en cada una de ellas. El inspector A tiene mucha experiencia, en
consecuencia, solo aprueba 4% de los restaurantes que realmente están violando el
reglamento sobre salubridad. El inspector B tiene menos experiencia y aprueba 12%
de los restaurantes con fallas. Cuál es la probabilidad de que:
El inspector A apruebe el restaurante, aun cuando el inspector B haya encontrado
violaciones al reglamento
El inspector B apruebe un restaurante que este violando el reglamento, aun cuando
el inspector A ya lo haya aprobado
Un restaurante que este violando el reglamento sea aprobado por el departamento
de salud
Uno de los inspectores apruebe el restaurante
El inspector B no apruebe el restaurante
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 57 Lic. Carlos A. Ávila (MAE Administración de Empresas)
8. Cuando fallan las compuertas de una pequeña represa hidroeléctrica, se les repara
de manera independiente una de la otra; la represa tiene 4 compuertas. A partir de la
experiencia, se sabe que cada compuerta esta fuera de servicio 6% de todo el
tiempo.
Si la compuerta uno está fuera de servicio, ¿Cuál es la probabilidad de que las
compuertas 2 y 3 estén fuera de servicio?
Cuál es la probabilidad de que 2 de ellas funcionen correctamente.
Cuál es la probabilidad de todas funcionen bien.
Cuál es la probabilidad de que al menos una de ellas no funcionen.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 58 Lic. Carlos A. Ávila (MAE Administración de Empresas)
TEMA XIV
PROBABILIDADES BAJO DEPENDENCIA ESTADISTICA
La dependencia estadística existe cuando la probabilidad de que se presente algún evento
depende o se ve afectada por la presentación de otro evento. Existen dos tipos de
probabilidad bajo esta condición:
P. Condicional:
P (A/B) = P (A∩B) / P (B)
P (B/A) = P (A∩B) / P (A)
P. Conjunta:
P (A∩B) = P (A/B) x P (B)
P (B∩A) = P (B/A) x P (A)
Cuando existe dependencia entre dos eventos, cada evento desempeña un rol importante
para definir condicionalidad.
Bajo estas condiciones siempre un evento ocurrirá primero (llamado condicionante) e
inmediatamente ocurrirá el segundo evento (llamado condicionado).
La condicionalidad se presenta de dos maneras:
Condicionado DADO Condicionante
2do. Evento / 1er. Evento
Si Condicionante ENTONCES Condicionado
1er. Evento 2do. Evento
1. CONDICIONADO DADO CONDICIONANTE
2. SI CONDICIONATE ENTONCES CONDICIONADO
El Condicionante es el evento que ocurre en primera instancia.
El Condicionado es el evento que ocurre después de haber ocurrido el Condicionante.
Problemas de la sección 14: 1. En un comedor de beneficencia, una trabajadora social, reúne los siguientes datos.
De las personas que acuden al comedor, 62% son hombres, 35% son alcohólicos y
24% son hombres alcohólicos.
a. ¿Cuál es la probabilidad de que un hombre que asiste al comedor, tomado al azar sea
alcohólico?
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 59 Lic. Carlos A. Ávila (MAE Administración de Empresas)
b. ¿Cuál es la probabilidad de que una persona seleccionada al azar no sea alcohólica?
c. ¿Cuál es la probabilidad de que una persona seleccionada sea mujer?
d. ¿Cuál es la probabilidad de que la persona al azar sea hombre o alcohólico?
e. ¿Cuál es la posibilidad de que la persona no llegue al comedor no sea alcohólica?
2. Según una investigación, la probabilidad de que una familia posea dos seguros
diferentes dado que sus entradas anuales son mayores de $50,000 es de 0.77. De las
personas entrevistadas, 59% de las familias tuvieron entradas mayores a los $50,000
anuales y 48% tiene dos seguros diferentes.
a. ¿Cuál es la probabilidad de que una familia tenga dos seguros diferentes y una
entrada mayor a $50,000 al año?
b. ¿Cuál es la probabilidad de que una familia no tenga 2 seguros diferentes?
c. ¿Si una familia posee dos seguros, entonces cual es la posibilidad de que tenga
entradas mayores a $50,000.00?
d. ¿Cuál es la probabilidad de que una familia no tenga entradas mayores a $50,000?
3. Durante un estudio sobre accidentes automovilísticos, el Consejo de Seguridad en las
carreteras encontró que 60% de los accidentes suceden de noche, 52% están
relacionados con conductores alcoholizados y 37% se presentan de noche y están
relacionados con conductores ebrios.
a. ¿Cuál es la probabilidad de que un accidente esté relacionado con un conductor
alcoholizado, dado que sucedió de noche?
b. ¿Cuál es la probabilidad de que un accidente haya sucedido de noche, dado que está
relacionado con un conductor ebrio?
c. ¿Cuál es la probabilidad de que un accidente suceda de día?
d. ¿Cuál es la probabilidad de que un accidente no esté relacionado con conductores
ebrios?
e. ¿Cuál es la probabilidad de que el accidente ocurra de noche o esté relacionado con
un conductor alcoholizado?
4. El director regional de salud, está preocupado por la posibilidad de que algunos de
sus empleados vayan a huelga. Estima que la posibilidad de que sus médicos vayan a
huelga es de 0.70 y la probabilidad de que sus enfermeras vayan a huelga es de 0.55.
Además estima que si las enfermeras van a huelga, existe 85% de posibilidades de
que los médicos realicen un paro solidario de actividades.
a. ¿Cuál es la probabilidad de que ambos grupos se vayan a huelga?
b. Si los médicos hacen huelga, ¿Cuál es la probabilidad de que las enfermeras lo hagan
también como acto de solidaridad?
c. ¿Cuál es la probabilidad de que las enfermeras no vayan a huelga?
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 60 Lic. Carlos A. Ávila (MAE Administración de Empresas)
d. ¿Cuál es la probabilidad de que los médicos no vayan a huelga?
e. ¿Cuál es la probabilidad de que los médicos o las enfermeras vayan a huelga?
5. Una compañía desea actualizar su sistema de computación y una parte importante
de la actualización es un nuevo sistema operativo. La compañía ha pedido a un
ingeniero que evalúe el sistema operativo. Suponga que la probabilidad de una
evaluación favorable es 0.65. Si la probabilidad de que la compañía actualice su
sistema dada una evaluación favorable es 0.85. ¿Cuál es la probabilidad de que la
compañía actualice su sistema y reciba una evaluación favorable?
6. La biblioteca de la universidad ha entrevistado a afiliados elegidos al azar durante el
último mes para ver quienes usan la biblioteca y que servicios requieren. Los afiliados
se clasifican en licenciatura, postgrado y académicos. Los servicios se clasifican como
consulta, publicaciones periódicas o libros. La tabla contiene los datos de 350
personas. Suponga que los afiliados usan solo un servicio por visita.
Afiliados Referencia Publicaciones periódicas Libros
Licenciatura 44 26 72
Postgrado 24 61 20
Académicos 16 69 18
84 156 110
Encuentre la probabilidad de que un afiliado seleccionado al azar:
a) Sea estudiante de Licenciatura.
b) Visite la sección de publicaciones periódicas, dado que es un estudiante de
Postgrado.
c) Sea Académico y visite la sección de libros.
d) Si visita la sección de Referencias, entonces sea estudiante de Postgrado
e) No sea Académico
f) No visite las publicaciones periódicas
g) Visite la sección de libros o no sea estudiante Académico
7. Dado que Pb (A)=3/4, Pb (B)=1/6, Pb (C)=1/3, Pb (AC)=1/7 y Pb (B/C)=5/21, encuentre
las siguientes probabilidades: Pb (A/C), Pb (C/A), Pb (BC) y Pb (C/B).
8. Suponga que para 2 eventos A y B, Pb (A)=0.65, Pb (B)=0.80, Pb (A/B)=Pb(A) y Pb
(B/A)=0.85. ¿Es esta una asignación de probabilidad consistente?
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 61 Lic. Carlos A. Ávila (MAE Administración de Empresas)
TEMA XV
INTRODUCCION A LAS DISTRIBUCIONES DE PROBABILIDAD
En cierta medida, estas distribuciones están relacionadas a las distribuciones de frecuencia.
Es un despliegue de todos los posibles resultados de un experimento junto con las
probabilidades de cada resultado. Es un listado de las probabilidades de todos los posibles
resultados que podrían obtenerse si el experimento se llevara a cabo. Existen dos tipos de
distribuciones de Probabilidad:
Discreta: Aquí la variable principal solo puede tomar un número limitado de valores.
Continua: En este tipo de distribución, la variable considerada puede tomar cualquier
valor dentro de un rango o intervalo dado.
Una variable es aleatoria si toma diferentes valores como resultado de un experimento
aleatorio. Esta variable puede ser:
Variable aleatoria discreta: la variable puede tomar solo un número limitado de
valores.
Variable aleatoria continua: la variable puede tomar cualquier valor dentro de un
rango o intervalo dado.
Valor Esperado E(X): De una variable aleatoria discreta, es la media ponderada de todos los
posibles resultados en los cuales los pesos son las probabilidades respectivas de tales
resultados.
Media o Valor Esperado µ = E(X) = ∑ (Xi) P (Xi)
Varianza de una distribución σ2 = ∑ (Xi - µ)2 P (Xi)
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 62 Lic. Carlos A. Ávila (MAE Administración de Empresas)
PROBLEMAS SECCION 15 1. Basándose en la siguiente grafica de una distribución de probabilidad, construya una
tabla que corresponda a la grafica.
2. La presidenta nacional de la asociación contra el cáncer, intenta estimar la cantidad
que ofrecerá cada persona en la tele maratón anual de la asociación. Usando los
datos recolectados en los últimos 10 años, calculo las siguientes probabilidades de las
diferentes cantidades prometidas. Dibuje una grafica que ilustre esta distribución de
probabilidad.
Donaciones $25 $50 $75 $100 $125
Probabilidades 0.45 0.25 0.15 0.10 0.05
3. Las siguientes variables aleatorias ¿son discretas o continuas? En cada caso explique
el porqué de su respuesta.
Los carros vendidos por Roberto
Los ingresos que gana Roberto
Los tiempos de terminación de un trabajo en particular
Los empleados requeridos para completar dicho trabajo
4. Bob Walters, quien invierte con frecuencia en el mercado de valores, estudia con
detenimiento cualquier inversión potencial. En la actualidad examina la posibilidad
de invertir en una compañía de electricidad. Mediante el estudio del rendimiento en
el pasado, Walters ha desglosado los resultados potenciales en cinco resultados de
sus probabilidades asociadas. Los resultados son tasas de rendimientos anuales sobre
una sola acción que hoy cuesta $150. Encuentre el valor esperado del rendimiento
sobre la inversión en una sola acción de la compañía.
Rendimiento de la inversión ($) 0.00 10.00 15.00 25.00 50.00
Probabilidad 0.20 0.25 0.30 0.15 0.10
5. José Martínez acaba de comprar un Blue Ray en Jetstereo a un costo de L. 5700.00.
Ahora tiene la opción de comprar una póliza de servicio extendido que ofrece 5 años
de cobertura por L. 1900.00. Después de hablar con sus amigos y leer los informes,
José cree que puede incurrir en los siguientes gastos de mantenimiento durante los
próximos 5 años:
Gasto 0 50 100 150 200 250 300
Probabilidad 0.35 0.25 0.15 0.10 0.08 0.05 0.02
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 63 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Encuentre el valor esperado de los costos de mantenimiento pronosticados. ¿Debe
José pagar L. 1900.00 por la garantía?
6. Sea X una variable aleatoria discreta que representa la cantidad de servicios de
diagnostico que un niño recibe durante una visita al consultorio de un pediatra; estos
servicios incluyen procedimientos como los análisis de sangre y de orina. La
distribución de probabilidad de X se muestra a continuación:
r P (X=r)
0 0.671
1 0.229
2 0.053
3 0.031
4 0.010
5+ 0.006
Total 1.000
a) Elabore una grafica de distribución de probabilidad.
b) Encuentre el valor esperado.
c) ¿Cuál es la probabilidad de que un niño reciba exactamente tres servicios de
diagnostico en una visita al consultorio del pediatra?
d) ¿Cuál es la probabilidad de que el niño reciba por lo menos un servicio?
e) ¿Cuál es la probabilidad de que un niño reciba cuatro o más servicios?
7. Sea X una variable aleatoria de una distribución de probabilidad, que representa el
orden de nacimiento de los niños nacidos en Honduras:
r P (X=r)
1 0.416
2 0.330
3 0.158
4 0.058
5 0.021
6 0.009
7 0.004
8+ 0.004
Total 1.000
a) ¿Cuál es la probabilidad de que un niño sea el primogénito o el segundo hijo?
b) ¿Cuál es la probabilidad de que un bebe sea cuando mucho el tercer hijo nacido?
c) Dibuje una grafica de distribución de probabilidad.
d) Calcule el valor esperado.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 64 Lic. Carlos A. Ávila (MAE Administración de Empresas)
SECCION XVI
DISTRIBUCIONES DE PROBABILIDAD DISCRETA
Entre las distribuciones aleatorias discretas más comunes tenemos:
Distribución Binomial: Esta distribución describe una variedad de procesos de
interés para los administradores y economistas, y describe datos discretos, que son
resultado de un experimento conocido como Proceso de Bernoulli, en honor al
matemático suizo del siglo XIX, Jacob Bernoulli. La distribución Binomial es apropiada
solo si la probabilidad de éxito permanece constante, esto ocurre si el muestreo se
realiza con reemplazo o cuando la población es infinita (muy grande). Este proceso
puede describirse en cuatro propiedades:
1. Cada intento tiene solamente dos resultados posibles: Éxito o Fracaso.
2. La probabilidad de un éxito (p) sigue siendo constante de un ensayo al siguiente, al
igual que lo hace la probabilidad de fracaso (q). Dicho de otro modo, la probabilidad
de resultado de cualquier intento, permanece fijo con respecto al tiempo.
3. El éxito y el fracaso son mutuamente excluyentes.
4. Los intentos son estadísticamente independientes, es decir, el resultado de un
evento no afecta el resultado de cualquier otro evento subsecuente.
5. El experimento puede repetirse muchas veces.
La formula Binomial es:
Probabilidad de r éxitos en n ensayos = n! pr qn-r.
r! (n-r)!
En donde:
p = probabilidad de tener éxito
q = probabilidad de de fracaso (q = 1 – p)
r = numero de éxitos deseados
n = numero de intentos hechos
En distribución Binomial es posible obtener la media y la desviación estándar, así:
La Media µ = np
La desviación estándar σ = √npq
PROBLEMAS SECCION 16 1. En 2007, 35% de los adultos son fumadores de alguna forma (cigarrillos, puros o
pipas). A través de una distribución Binomial, de una muestra de 14 personas,
encuentre la probabilidad de:
a. ¿Que por lo menos 6 personas fumen de alguna forma?
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 65 Lic. Carlos A. Ávila (MAE Administración de Empresas)
b. ¿Cuándo mucho 3 personas fumen?
c. ¿Que 4 personas fumen de cualquier forma?
d. ¿Que todas fumen?
e. ¿Que ninguna persona fume?
f. Encuentre la media y la desviación estándar para este caso.
2. Al ministerio de Salud le interesa estudiar la probabilidad de que un paciente que ha
sido inyectado con una jeringa infectada con hepatitis B contraiga la enfermedad. Si
30% de los pacientes expuestos a la hepatitis B se infecta, encuentre a partir de una
muestra de 17 personas:
a. ¿La probabilidad de que por lo menos 3 individuos contraigan hepatitis B?
b. ¿La probabilidad de que cuando mucho 6 pacientes contraiga la enfermedad?
c. ¿La probabilidad de que 14 pacientes contraigan la enfermedad?
d. Encuentre la media y la desviación Standard para este caso.
3. De acuerdo con la Encuesta Nacional de Salud en Honduras, 20% de la población es
zurda.
a. ¿Cuál es la probabilidad de que exactamente tres de once personas sean zurdas?
b. ¿Cuál es la probabilidad de que por lo menos seis de once personas sean zurdas?
c. ¿Cuál es la probabilidad de que cuando muchos dos individuos del total de la muestra
sean zurdos?
d. ¿Cuál es la probabilidad de que por lo menos cuatro personas sean zurdas?
e. Encuentre la media y la desviación estándar de este caso.
4. En un fin de semana en la Emergencia del Hospital Mario Catarino Rivas, se
presentan 9 casos sospechosos de ser portadores de la Influenza AH1N1, pues
presentan los síntomas característicos de la enfermedad. De acuerdo a esta muestra
asumiendo que tiene las características de una distribución Binomial (la tasa de
incidencia es de 25%) encuentre:
a. ¿Cuál es la probabilidad de que dos personas del grupo sean casos confirmados de la
enfermedad?
b. ¿Cuál es la probabilidad de que 9 de ellas tengan un cuadro positivo confirmado de la
enfermedad?
c. ¿Cuál es la probabilidad de que a lo sumo tres de ellas sean casos confirmados de la
enfermedad?
d. Encuentre la media y la desviación Standard de esta situación
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 66 Lic. Carlos A. Ávila (MAE Administración de Empresas)
5. En un jardín de niños, una profesora ha encontrado que existe un 60% de
posibilidades de que un estudiante lleguen temprano. Encuentre la probabilidad de
que de una muestra de 12 estudiantes:
a. Tres lleguen tarde a clases
b. Por lo máximo 7 lleguen tarde a clases
c. Uno de ellos llegue tarde a clases
d. Por lo menos 5 lleguen tarde a clases
e. Encuentre la media y la desviación estándar para esta situación.
6. En una encuesta a boca de urna hoy 29 de noviembre, día de las elecciones
generales, muy a pesar de los esfuerzos de la resistencia por no validar las elecciones,
un periodista ha encontrado que existe un 55% de posibilidades de que una persona
vote por el partido liberal. Cuál es la probabilidad de que de una muestra de 20
electores:
a. ¿8 electores voten por el partido nacional?
b. ¿Ningún elector vote por el partido nacional?
c. ¿17 voten por el partido nacional?
d. ¿Cuándo mucho 10 voten por el partido nacional?
e. ¿Por lo menos 5 electores voten por el partido nacional?
f. Encuentre la media y la desviación estándar de la intención de voto del día 29 de
noviembre.
Distribución Hipergeometrica: esta distribución aplica en casos cuando la
población (N) es pequeña y ocurre el muestreo sin reemplazo, lo que implica que la
probabilidad de éxito variara, y no será constante. La formula es:
Distribución P (x) = rCx N-rCn-x
Hipergeometrica NCn
En donde:
N = tamaño de la población
r = numero de éxitos de la población
n = tamaño de la muestra
x = numero de éxitos de la muestra
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 67 Lic. Carlos A. Ávila (MAE Administración de Empresas)
PROBLEMAS SECCION 16B 1. Como subgerente de una empresa de materias primas, usted debe contratar 10
personas entre 30 candidatos, de los cuales 22 tienen títulos universitarios. ¿Cuál es
la probabilidad de que 5 de los que usted contrate tengan un titulo?
2. Cuarenta trabajadores de una oficina han recibido nuevos computadores. 27 tienen
una nueva tecnología llamada MMX. Si se seleccionan 10 aleatoriamente, ¿Cuál es la
probabilidad de que 3 de ellos estén equipados con la tecnología?
3. Una encuesta ha revelado, que 6 de 10 empleados ganan más de L.200,000 al año.
De 3 empleados seleccionados, ¿Cuál es la probabilidad de que los 3 ganen esa cifra?
Distribución de Poisson: Ideada por el matemático francés Simeón Poisson (1781 –
1840), la distribución Mide la probabilidad de un evento aleatorio sobre algún
intervalo de tiempo o espacio. Ejemplo de algunos procesos descritos a través de
esta distribución como ser: la distribución de llamadas telefónicas que llegan a un
conmutador, la demanda de pacientes que requieren servicio en una institución de
salud, la llegada de automóviles a una caseta de peaje y el numero de accidentes
registrados en cierta intersección de calles. Las características principales que
determinan una distribución de Poisson son:
1. La probabilidad de ocurrencia del evento es constante para dos intervalos
cualesquiera de tiempo o espacio.
2. La ocurrencia del evento en un intervalo es independiente de la ocurrencia de otro
intervalo cualquiera.
La fórmula para esta distribución es:
P (x) = λx x е-λ
X!
En donde:
X = número de veces que se presenta el evento.
λ = número promedio de ocurrencias por unidad de espacio o tiempo.
e = 2.71828, base de la función exponencial natural.
λ = np (Así se puede calcular la media cuando no se da directamente el valor de esta
variable)
Es importante destacar que la distribución de Poisson es una buena aproximación de
la distribución Binomial cuando n es igual o mayor que 20 y p es igual o menor a 0.05
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 68 Lic. Carlos A. Ávila (MAE Administración de Empresas)
PROBLEMAS SECCION 16C 1. De acuerdo con el Departamento de Salud de Massachusetts, 224 mujeres que
dieron a luz en este estado, en 1998, obtuvieron resultados positivos del anticuerpo
del VIH. Suponga que con el tiempo 25% de los bebes nacidos de estas mujeres
lleguen a ser seropositivos. Bajo la distribución de Poisson:
a) Si se eligen muestras de n=224 individuos de una población de niños nacidos de
mujeres con el anticuerpo de VIH. ¿Cuál sería la cantidad media de niños infectados
por muestra?
b) ¿Cuál sería la desviación Standard?
2. La cantidad de casos de tuberculosis informados por la Secretaria de Salud durante
un solo mes posee una distribución de Poisson con parámetro λ=3.5.
a) ¿Cuál es la probabilidad de que se informen al menos 8 casos de tuberculosis en un
mes determinado?
b) ¿Cuál es la probabilidad de que a lo sumo se presenten 5 casos de esta enfermedad?
c) ¿Cuál es la probabilidad de que no se presente ningún caso?
d) ¿Cuál es la probabilidad de que se presenten 7 casos de la enfermedad?
e) Encuentre la media y la desviación Standard de este situación
3. En cierto municipio la cantidad de suicidios reportados cada mes en promedio es de
2.75 (λ). Suponga que la cantidad de suicidios da como resultado una distribución de
Poisson.
a) ¿Cuál es la posibilidad de que no se reporte un suicidio durante un mes
determinado?
b) ¿Cuál es la probabilidad de que se reporten 8 suicidios?
c) ¿Cuál es la probabilidad de que a lo sumo se reporten cuatro suicidios?
d) ¿Cuál es la posibilidad de que se reporten seis o más suicidios?
e) Encuentre la desviación Standard.
4. El juzgado contencioso de San Pedro Sula, maneja varios tipos de litigios, pero la
mayoría de tipo conyugal. De hecho 96% de los pleitos que se atienden en el juzgado
son de tipo conyugal. Cuál es la probabilidad de que de 80 litigios que se atienden en
los juzgados:
a) Exactamente 7 no sean de tipo conyugal.
b) 10 de ellos no sean de tipo conyugal.
c) Por lo menos 8 no sean de tipo conyugal.
d) A lo sumo 5 no sean de tipo conyugal.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 69 Lic. Carlos A. Ávila (MAE Administración de Empresas)
5. El departamento de impresiones y grabados es el principal responsable de imprimir
papel moneda en los Estados Unidos. El departamento tiene una impresionante baja
frecuencia de errores de impresión; solo 0.5% de los billetes presentan errores graves
que no permiten su circulación. Cuál es la probabilidad de que de un fajo de 1000
billetes:
a) ¿Ninguno presente errores graves?
b) ¿Diez presenten errores que no permitan su circulación?
c) ¿A lo sumo catorce no presenten errores de circulación?
d) ¿Por lo menos 8 presenten errores que impidan su circulación?
6. Sea X una variable aleatoria que representa la cantidad de niños en un grupo de 2000
que mueren antes de alcanzar su primer año de vida. En América Central, la
probabilidad de que un niño muera durante su primer año de vida es de 0.0085.
Asuma que este caso origina una distribución de Poisson. (Haga uso de la formula)
a) ¿Cuál es la cantidad media de niños que morirían en un grupo de este tamaño?
b) ¿Cuál es la probabilidad de que a lo sumo cinco años de un total de 2000 mueran en
su primer año de vida?
c) ¿Cuál es la probabilidad de que entre 15 y 20 niños mueran durante su primer año de
vida?
d) ¿Cuál es la probabilidad de que a lo sumo tres niños mueran durante su primer año
de vida?
e) ¿Cuál es la probabilidad de que 7 niños mueran durante su primer año de vida?
f) Encuentre la desviación estándar de esta situación.
Distribución Exponencial: Es una distribución continua. Mide el paso el paso del
tiempo entre el numero de ocurrencias, a diferencia de la distribución de Poisson que
mide el numero de ocurrencias en un determinado intervalo de tiempo o espacio.
Mientras la distribución de Poisson describe las tasas de llegada dentro de algún
periodo dado, la distribución exponencial estima el lapso entre tales arribos. Si el
número de ocurrencias tiene distribución de Poisson, el lapso entre las ocurrencias
estará distribuido exponencialmente. La probabilidad de que el lapso sea menor o
que o igual a cierta cantidad x es:
Distribución Exponencial P (X≤x) = 1 – е-µt
En donde:
t = lapso de tiempo
е = la función exponencial natural
µ = tasa promedio de ocurrencia
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 70 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Es importante mencionar que con el paso del tiempo X aumenta, y la probabilidad
disminuye.
PROBLEMAS SECCION 16D 1. Los aviones llegan a un pequeño aeropuerto en Roatán, a una proporción de dos por
hora. Tomara una hora reparar un rampa utilizada para desembarcar pasajeros. ¿Cuál
es la probabilidad de que un avión llegue mientras la rampa esta en reparación?
2. El computador principal de la universidad queda fuera de línea tres veces por
semana. Un catedrático debe completar un proyecto que necesita de la
computadora. ¿Cuál es la probabilidad de que el computador este fuera de línea toda
la semana?
3. Durante un día típico de trabajo de 8 horas, las computadoras usadas para vigilar la
etapa de enfriamiento en la producción de neumáticos para autos señalan que la
temperatura no se mantiene en forma apropiada en 30 oportunidades. El director
ejecutivo de la compañía, está por hacer una inspección de la planta durante 30
minutos. ¿Cuál es la probabilidad de que este allí cuando se active la señal del
computador?
Distribución Uniforme: Es una distribución en la cual las probabilidades de todos
los resultados son las mismas. Todos los resultados sobre el rango total de
posibilidades de distribución son igualmente posibles desde el mínimo valor a hasta
el máximo valor b. En una distribución uniforme, las probabilidades son las mismas
para todos los posibles resultados.
La media o valor esperado de una distribución uniforme esta a la mitad de camino
entre sus dos puntos extremos, así:
E (x) = µ = a + b
2
La varianza de una distribución uniforme de probabilidad es:
σ2 = (b – a)2
12
El área total bajo la curva debe ser igual a 1 o 100%. Debido a que el área es la altura
por el ancho, la altura es:
Altura = Área = 1
Ancho b - a
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 71 Lic. Carlos A. Ávila (MAE Administración de Empresas)
En donde b-a es el ancho o rango de la distribución.
La probabilidad de que una observación caiga entre dos valores es:
P (X1≤X≤X2) = X2 – X1
Rango
PROBLEMAS SECCION 16E 1. Generalmente le toma entre 1.2 y 1.7 horas aproximadamente hacer su tarea de
estadística. Los tiempos están distribuidos de manera uniforme. ¿Qué tan probable
es que usted termine a tiempo para reunirse con sus amigos dentro de 1.4 horas?
2. Las latas de alimentos para perros Puppy Chow tiene un promedio de 16 onzas, con
un rango de 4.2 onzas.
a) ¿Cuál es la lata más pequeña en onzas que usted puede comprar para un perro?
b) ¿Cuál es la lata más grande que usted puede comprar para su perro lobo llamado
Killer?
c) ¿Si usted selecciona una lata al azar, cual es la probabilidad de que pese entre 15.8 y
16.5 onzas?
3. El tiempo requerido para conseguir una pista de bolos en un local oscila entre 23.5 y
40.5 minutos. Asumiendo una distribución uniforme, si la probabilidad de que usted
tenga que esperar más de 30 minutos excede del 60%, usted piensa jugar golf. ¿Cual
bolsa debería colocar en su baúl, la bolsa de golf o la de bolos?
4. El agua utilizada por un car-wash para lavar los carros es de 30 galones por carros. Lo
menos que se utiliza son 27 galones, y su uso esta distribuidora uniformemente. Una
encuesta muestra que los carros no quedan limpios a menos que se utilicen 32
galones de agua en la lavada. ¿Qué porcentaje de carros que salen del car-wash
quedan limpios?
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 72 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Distribución Normal: Es una distribución continua, pues se puede tomar cualquier
valor que este en un intervalo de valores dado. Aunque varios matemáticos han
contribuido a su desarrollo, su principal aporte se le debe al astrónomo matemático
Karl Gauss (siglo XIX). Existen dos razones básicas para definir que la distribución
normal es la más usada y más importante de todas en la Estadística:
1. Tiene algunas propiedades que la hacen aplicable a un gran número de situaciones
en las que es necesario hacer inferencias mediante la toma de muestras.
2. La distribución normal casi se ajusta a las distribuciones de frecuencias reales
observadas en muchos fenómenos, que incluyen características humanas (pesos,
alturas, IQ), resultados de procesos físicos (dimensiones y rendimientos), etc.
Características de la Distribución Normal
1. La curva tiene un solo pico; por tanto, es unimodal. Tiene una forma de campana.
2. La media de la población distribuida normalmente cae en el centro de su curva
normal.
3. Debido a la simetría de la distribución normal de probabilidad, la mediana y la moda
de la distribución se encuentran también en el centro; en consecuencia, para una
curva normal, la media, la mediana y la moda tienen el mismo valor.
4. Los dos extremos de la distribución normal de probabilidad se extienden
indefinidamente y nunca tocan el eje horizontal.
Se dice que no hay una sola distribución normal, sino una familia de curvas normales. Para
definir una distribución de este tipo, solo se necesitan dos parámetros: la media (µ) y la
desviación estándar (σ). No importa cuáles sean los valores de µ y σ para una distribución
normal, el área total bajo la curva es 1.00, destacando que las aéreas bajo la curva se
consideran como probabilidades.
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 73 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Ya que puede existir un número infinito de distribuciones normales, cada uno con su propia
media y desviación estándar, es imposible analizar por separado cada una de ellas, por lo
tanto es necesario convertir todas estas distribuciones normales a una forma estándar. Esta
conversión a la distribución normal estándar se efectúa con la formula de conversión o
formula Z.
(Formula Z) Z = X - µ
σ
Valor de Z: Es el numero de desviaciones estándar a las que una observación estará por
encima o por debajo de la media.
PROBLEMAS SECCION 16F
1. La presión arterial diastólica entre las mujeres de 18 a 74 años de edad se encuentra
distribuida normalmente con una media de μ=80 mm Hg y una desviación Standard
de σ= 11.6 mm Hg.
a) ¿Cuál es la probabilidad de que una mujer elegida al azar tenga una presión arterial
diastólica menor de 65 mm Hg?
b) ¿Cuál es la probabilidad de que la mujer tenga la presión arterial diastólica mayor
que 85 mm Hg?
c) ¿Cuál es la probabilidad de que una mujer tenga una presión arterial diastólica de
entre 60 y 90 mm Hg?
d) ¿Cuál es la probabilidad de que una mujer tenga una presión arterial diastólica
superior a 70 mm Hg?
e) ¿Cuál es la probabilidad de que una mujer tenga una presión arterial diastólica de por
lo menos 80 mm Hg?
2. La distribución de pesos de la población de varones en Estados Unidos es
aproximadamente normal con una media de μ= 172.2 libras y una desviación
estándar de σ= 29.8 libras.
a) ¿Cuál es la probabilidad de que un hombre elegido al azar pese menos de 130 libras?
b) ¿Cuál es la probabilidad de que pese más de 210 libras?
c) ¿Cuál es la probabilidad de que un varón escogido al azar tenga un peso fuera del
rango de 130 a 210 libras?
d) ¿Cuál es la probabilidad de que pese más de 160 libras?
e) ¿Cuál es la probabilidad de que pese menos de 180 libras?
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 74 Lic. Carlos A. Ávila (MAE Administración de Empresas)
3. En la zona noroccidental, la jefatura de transito ha determinado basado en hechos
históricos, que anualmente se presentan 8000 accidentes de tránsito con una
desviación estándar de 600.
a) ¿Cuál es la probabilidad de que en este año 2009 se presenten menos de 7500
accidentes?
b) ¿Cuál es la probabilidad de que en esta zona sucedan más de 9,000 accidentes?
c) ¿Cuál es la probabilidad de que transito reporte entre 7000 y 8500 accidentes?
d) ¿Que se presenten cuando mucho 8300 accidentes?
e) ¿Que no se presenten a lo sumo 9500 accidentes?
4. En una unidad de la Cruz Roja se midieron los niveles de colesterol en la sangre en un
grupo de personas mayores de 45 años resultados que arrojaron una media μ= 244
mg/100 ml y la desviación estándar σ= 51 mg/100 ml. A partir de estos datos estime:
a) ¿Cuál es la probabilidad de que el nivel de colesterol para este grupo sea de cuando
mucho 220 mg/100 ml?
b) ¿Cuál es la probabilidad de que una persona seleccionada al azar de este grupo tenga
más de 260 mg/100 ml?
c) ¿Si se establece que con un nivel de 300 mg/100 ml, una persona desarrollo una
enfermedad coronaria, Cual es la probabilidad de que un individuo padezca de una
enfermedad coronaria?
5. Una institución ha creado un programa de entrenamiento diseñado para mejorar las
habilidades de supervisión para aplicar en el departamento de producción de
cualquier empresa. Debido a que el programa es auto administrado, los supervisores
requieren un número diferente de horas para terminarlo. Bajo estudios anteriores, el
tiempo medio que se lleva para completar el programa es de 500 horas, con una
desviación estándar de 100 horas, normalmente distribuida. Encuentre la
probabilidad de que un participante requiera:
a) ¿Más de 450 horas para completar el programa?
b) ¿Entre 480 y 530 horas para finalizar el entrenamiento?
c) ¿A lo sumo 700 horas para finalizar el programa?
d) ¿Cuándo mucho 600 horas para finalizar el programa?
e) ¿Un máximo de 460 horas?
f) ¿Encuentre la media y la desviación estándar de la situación?
6. En su tercer año de funcionamiento, una liga de futbol tuvo un promedio de 16200
aficionados por juego, con una desviación estándar de 2500. De acuerdo con los
datos cual es la probabilidad de que el número de aficionados en cualquier juego sea:
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 75 Lic. Carlos A. Ávila (MAE Administración de Empresas)
a) ¿Mayor de 20,000?
b) ¿Menor a los 10,000?
c) ¿Este entre 13,000 y 18,500?
d) ¿Por lo menos 12,000?
e) ¿Cuándo mucho 17,600?
7. Los sobrecostos por actualización de computadoras en su empresa tienen un
promedio de $23,500, con una desviación estándar de $9,400. Como director
ejecutivo de la división de investigación, usted no desea arriesgarse a más de 34% de
probabilidad que el sobrecosto en una actualización propuesta recientemente
exceda de $25,000. ¿Debería ejecutar la actualización?
8. Los empleados de una compañía trabajan un promedio de 55.8 horas por semana,
con una desviación estándar de 9.8 horas. Los ascensos son más probables para los
empleados que están dentro del 10% de los que pasan más tiempo trabajando.
¿Cuánto debe trabajar usted para mejorar sus oportunidades de ascenso?
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 76 Lic. Carlos A. Ávila (MAE Administración de Empresas)
ANEXO
TABLAS ESTADISTICAS
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 77 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 78 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 79 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 80 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 81 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 82 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 83 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 84 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 85 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 86 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 87 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 88 Lic. Carlos A. Ávila (MAE Administración de Empresas)
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 89 Lic. Carlos A. Ávila (MAE Administración de Empresas)