Post on 05-Jul-2018
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 1/32
ESTADISTICA GENERAL
1Lic. Estadístico Hugo Luis Chunga Gutierrez
ESTADÍSTICA
Elaborado por: Lic. Ing. Hugo L. Chunga Gutiérrez
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 2/32
ESTADISTICA GENERAL
2Lic. Estadístico Hugo Luis Chunga Gutierrez
INTRODUCCIÓN
La palabra estadística a menudo nos trae a la mente imágenes de números apilados en grandes
arreglos y tablas, de volúmenes de cifras relativas a nacimientos, muertes, viajes, visitantes,
ingresos, ventas y así sucesivamente.
Algunas personas podrían pensar que la enseñanza de la estadística sólo interesa a los profesores,
o bien a los investigadores que trabajan en los diferentes departamentos de una universidad. Esta
es una creencia errónea y podemos encontrar Estadísticos en psicología, economía, medicina,
ingeniería y otras áreas.
¿Qué es la estadística?
Estadística es un conjunto de métodos científicos para la recopilación, representación
condensación y análisis de los datos extraídos de un sistema en estudio. Con el objeto de poder
hacer estimaciones y sacar conclusiones, necesarias para tomar decisiones.
La Estadística es un método de razonamiento para describir e interpretar información, cuya
característica principal es la variabilidad de los datos.
DIVISIÓN DE LA ESTADÍSTICA
La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la Estadística
Descriptiva y la Inferencial.
Estadística Descripti va: Se denomina estadística descriptiva, al conjunto de métodos estadísticos
que se relacionan con el resumen y descripción de los datos, como tablas, gráficas, y el análisis
mediante algunos cálculos.
Estadística Inf erencial Se denomina inferencia estadística al conjunto de métodos con los que se
hacen la generalización o la inferencia sobre una población utilizando una muestra. La inferencia
puede contener conclusiones que pueden no ser ciertas en forma absoluta, por lo que es necesario
que éstas sean dadas con una medida de confiabilidad que es la probabilidad.
La Estadística Inferencial investiga o analiza una población partiendo de una muestra tomada.
Estas dos partes de la estadística no son mutuamente excluyentes, ya que para utilizar los métodosde la inferencia estadística, se requiere conocer los métodos de la estadística descriptiva.
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 3/32
ESTADISTICA GENERAL
3Lic. Estadístico Hugo Luis Chunga Gutierrez
TÉRMINOS DE ESTADÍSTICA
Los términos estadísticos que se usan en estadística es necesario conocerlos para poder entender el
lenguaje estadístico que se utiliza en el desarrollo de la asignatura:
Población: En forma general, en estadística; se denomina población, a un conjunto de elementos
(que consiste de personas, objetos, etc.), que contienen una o más características observables de
naturaleza cualitativa o cuantitativa que se pueden medir en ellos.
La población debe estar perfectamente definida en el tiempo y en el espacio.
Muestra: Es un subconjunto de una población. Una muestra es representativa cuando los
elementos son seleccionados de tal forma que pongan de manifiesto las características de una
población. Su característica más importante es la representatividad.
.
Unidad estadística o Unidad de análisis o unidad elemental: Es elemento de la población que
reporta la información y sobre el cual se realiza un determinado analisis.
La unidad de estudio es la entidad que va a ser objeto de medición y se refiere al qué o quién es
sujeto de interés en una investigación.
Parámetro: son aquellos valores que caracterizan numéricamente a la población como tal. El
parámetro poblacional de interés es único (media, varianza, etc.), pero una población puede tener
muchas características de interés.
Indicador estadístico: Es el dato numérico, resultado de un proceso que cuantifica
científicamente una característica de una muestra. “Es el elemento característico que describe una
situación permitiendo su análisis”
Diferencia entre dato e información
El dato es un elemento aislado, recabado para un cierto fin, pero que no ha pasado por un proceso
que lo interrelacione con otros; mientras que la información trata de datos procesados y
relacionados de manera que nos pueden dar pauta a la correcta toma de decisiones
Por lo tanto la diferencia radica en que la información se compone de datos que ya han sido
procesados de algún modo para que tengan un sentido y un objetivo al momento de tomardecisiones.
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 4/32
ESTADISTICA GENERAL
4Lic. Estadístico Hugo Luis Chunga Gutierrez
La medición: Los datos se obtienen a través un proceso llamado medición. Desde este punto de
vista, puede definirse medición como el proceso por el cual asignamos una categoría (o un valor) a
una variable, para determinada unidad de análisis.
Variable: Es una característica que puede tomar diferentes valores. Las variables son
características observables, susceptibles de adoptar distintos valores o ser expresados en varias
categorías.
Podemos iniciar el tema indicando que definir las variables “me permi tirá dar respuesta a lo
que quiero estudiar”.
Datos: Comúnmente se le conoce como observaciones . Son los valores que toma la variable
en cada unidad estadística.
Son todas aquellas características o valores susceptibles de ser observados, clasificados y
contados.
La forma de medir las variables va a determinar el análisis matemático, estadístico, de las mismas.
Elementos de una variable:La identificación y definición de variables es la tarea más delicada de toda investigación y del
trabajo estadístico. Téngase presente que las variables se deducen a partir de los objetivos de
un estudio o investigación. En consecuencia, para tener éxito en la selección de variables, es
recomendable distinguir los siguientes elementos:
a) Nombre o denominación de la variable.
b) Definición o conceptualizacion de la variable.
c)
Un conjunto de categorías o niveles, que es definida por el investigador. Las categoríasno son únicas, lo mínimo es dos categorías y dependen de los objetivos de la
investigación.
Ejemplo:
Veamos la variable Cualitativa Estado Civil:
a) Nombre: Estado Civil o conyugal
b) Definición: Es la situación de la persona empadronada en relación con las leyes y
costumbres del país.
c) Categorías:
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 5/32
ESTADISTICA GENERAL
5Lic. Estadístico Hugo Luis Chunga Gutierrez
1) Soltero 2) Casado 3) Conviviente 4) Divorciado 5) Viudo
Veamos la variable cuantitativa, Ingreso:
a) Nombre: Ingresos
b) Definición: Son los recursos monetarios netos, incluyendo todas las bonificaciones que
percibe una persona por su ocupación principal y secundaria durante el periodo de
referencia de la encuesta.
c) Categorías: Puede proponerse en forma de niveles o simplemente intervalos.
Primera forma: Segunda forma:(01) Alto(02) Medio(03) Bajo
(01) Menos de 300(02) De 301 a 500(03) De 501 a 700
(04)
De 701 a mas
CLASIFICACIÓN DE LAS VARIABLES
Según su naturaleza:
VARIABLES CUALITATIVAS:
Miden una característica, en término de cualidad, nunca de forma numérica.
Cada uno de los valores que puede tomar la variable se llama categorías. Deben incluir todas
las opciones posibles que puede adoptar la variable.
Nominal: Son aquellos variables que establecen la distinción de los elementos en diversas
categorías, sin implicar algún orden entre ellas, distribuye a la unidad de análisis en dos o mas
categorías. Ejemplo: Sexo, Estado Civil, profesiones, etc.
Ordinal: Son aquellas variables que implican orden entre sus categorías, pero no grados de
distancias iguales entre ellas; están referidas a un orden o jerarquía, donde las categorías
expresan una posición de orden.
Ejemplo: Grado de instrucción, clases sociales, orden de merito, ciclo de estudios, escala de
dolor: Sin dolor, con poco dolor, con mucho dolor.
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 6/32
ESTADISTICA GENERAL
6Lic. Estadístico Hugo Luis Chunga Gutierrez
Si las variables cualitativas tienen solo dos categorías se llama variable cualitativa
dicotómica (Ejemplo: Sexo: Hombre. Mujer), y si tiene más de dos, variable cualitativa
politómica (color de cabello: negro, rubio, castaño, pelirrojo)
VARIABLES CUANTITATIVAS:
Miden una característica de forma numérica. Pueden ser:
Variables Discretas: Cuando el valor de la variable resulta de la operación de contar, su valor
representado solo por números naturales (enteros positivos) o entre dos valores consecutivos
no existe otro valor.
Ejemplo; Número de hijos de las pacientes con cáncer de mama, Número de pacientes
atendidos hospitales.
Variables Continuas: Cuando la variable es susceptible de medirse, es toda variable cuyo
valor se obtiene por medición o comparación con una unidad o patrón de medida. Las
variables pueden tener cualquier valor dentro de su rango o recorrido, por tanto se expresa por
cualquier número real. Entre dos valores consecutivos se pueden encontrar infinitos valores.
Ejemplo: Peso de los pacientes con tuberculosis, El grado de glucosa en la personas con
diabetes, la talla de los recién nacidos, etc.
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 7/32
ESTADISTICA GENERAL
7Lic. Estadístico Hugo Luis Chunga Gutierrez
Según escala de medición:
De escala nominal: Idem
De escala ordinal: Idem
De escala Intervalo: Mediante esta escala, además de existir una relación de orden como la
anterior, implica una relación de igualdad de diferencias entre pares de objetos respecto a una
característica determinada. Además las diferencias entre los números se corresponden
puntualmente con las diferencias entre los objetos en la propiedad del objeto de medición. Pero
el valor cero es arbitrario y convencional. Ejemplos: Temperatura, inteligencia, rendimiento
académico y personalidad.
De escala Razón o Proporción: Mediante esta escala además de existir una relación de
igualdad de diferencias como la anterior, considera un punto de origen fijo o natural, el cero
absoluto. El valor cero significa la nulidad o ausencia de la característica o variable que se
estudia; y la proporción tiene sentido, ejemplos: Peso, estatura y edad de los alumnos.
Número de alumnos, de computadoras, y de fotocopiadoras que posee un colegio.
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 8/32
ESTADISTICA GENERAL
8Lic. Estadístico Hugo Luis Chunga Gutierrez
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 9/32
ESTADISTICA GENERAL
9Lic. Estadístico Hugo Luis Chunga Gutierrez
EJERCICIOS 01
De los enunciados siguientes Identificar la población, muestra, unidad de análisis y la
variable (tipo de variable y sus elementos)
1) Se desea saber el estado civil, grado de hemoglobina y el tiempo de gestación de las mujeres
que se atendieron en ESALUD de la ciudad de Piura en los seis primeros últimos del año
anterior.
2)
En la a UNP se quiere saber cuál es el deporte más practicado, el tiempo de dedicación a estey que días lo practica, de los alumnos la cual se tomo información de 200 alumnos elegidos al
azar de las diferentes escuelas de esta universidad en el presente ciclo de estudios.
3) Se desea saber cuál es la estatura, el peso y la edad de los niños menores de 5 años con
enfermedades respiratorias atendidos en los hospitales de la ciudad de Piura, la cual para
obtener esta información para la estimación se eligió solo a tres hospitales de esa ciudad y a
50 niños por cada hospital del presente mes.
4) Una Institución publica recién creada empleara a 345 personas de las cuales ya están
seleccionadas, y a través de los registros de vida obtenemos de que universidad proceden, que
profesión tienen, que cargo ocuparan, estado civil, y el numero de hijos, esta institución recién
creada en la cuidad de tumbes.
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 10/32
ESTADISTICA GENERAL
10Lic. Estadístico Hugo Luis Chunga Gutierrez
DISTRIBUCION DE FRECUENCIAS
¿Qué es una distribución de frecuencias?
Distribución de frecuencias es una forma de organizar y resumir los datos con la finalidad dedescribir del comportamiento de las variables de interés. Esta organización, en su forma tabular,
consiste en presentar la lista de valores de una variable, clases o categorías de datos junto con el
número de veces que se repite cada valor de la variable o el número de valores que caen dentro de
cada clase o categoría respectivamente.
El número de veces que se repite cada valor de la variable o el número de valores que caen dentro
de cada clase o categoría se denominan frecuencias.
CUADROS O TABLAS ESTADÍSTICAS
Un cuadro estadístico es el arreglo ordenado, columnas y filas, de datos estadísticos o
características relacionadas, con el objeto de ofrecer información estadística de fácil lectura,
comparación e interpretación. Un cuadro estadísticos es le resultado de trabajos previos
(planeamiento, recopilación, tabulación, cálculos, etc.)
Partes pri ncipales:
1) Número del Cuadro
2) Titulo , es la descripción resumida del contenido del cuadro.
Responder a las clásicas preguntas: Que, Donde, Como y Cuando
3) Encabezamiento o conceptos
4)
Cuerpo
5) Columna Matriz
6) Fuente
7) Elaboración
.
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 11/32
ESTADISTICA GENERAL
11Lic. Estadístico Hugo Luis Chunga Gutierrez
GRÁFICOS ESTADÍSTICOS
En estadística denominamos gráficos a aquellas imágenes que, combinando la utilización De
sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema de referencia
(coordenadas), permiten presentar información cualitativa y cuantitativa.
La utilidad De los gráficos es doble, ya que pueden servir no sólo como sustituto a las tablas, sino
que también constituyen por sí mismos una poderosa herramienta para el análisis De los datos,
siendo en ocasiones el medio más efectivo no sólo para describir y resumir la información, sino
también para analizarla.
Gráficos estadísticos
IMPORTANCIA:
Son esenciales en el estudio y presentación de trabajos estadísticos.
Permite observar en forma instantánea el comportamiento de la variable.
Permite formar una idea sobre la tendencia de las variables en el futuro.
PRINCIPALES PARTES DE UN GRAFICO
1) Numero del Grafico
2) Titulo:
3) Los Diagramas:
4) Escalas:
5) Leyenda:
6) Fuente:
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 12/32
ESTADISTICA GENERAL
12Lic. Estadístico Hugo Luis Chunga Gutierrez
CUADROS ESTADÍSTICOS PARA VARIABLES CUALITATIVAS
En una muestra se recolecto datos sobre el estado civil de 30 personas que laboran en la empresa
EXPORT S.A de la cuidad de Talara.
co ca se co caca co ca ca se
se co se co co
co se co ca co
so co ca ca co
co co co co ca
Ejercicios1. Se escogió un salón de clases de cuarto grado, con un total de 25 estudiantes, y se les pidió que
calificaran del 1 al 5 un programa televisivo.
(5 = Excelente 4 = Bueno 3 = Regular 2= No muy bueno 1 = Malo)
Estos fueron los resultados:
1 3 3 4 1 2 2 2 5 1 2 1 2 4 5 1 5 3 5 1 4 1 2 3 5
2.
En el último del mes del año pasado se realizo en Chile la Reunión del Grupo Andino donde se
tomo datos de los participantes acerca de su nacionalidad.
C B P E P P C V P V
P V C B P P C E P B
Donde: P = Perú B = Bolivianos C = Colombianos E = Ecuatoriano V = Venezolano
3. En una encuesta de opinión acerca de las preferencias de una marca de bebida gaseosa por sus
colores: Negro(N), Blanco(B), Rojo(R), 20 consumidores dieron las siguientes respuestas:
B, N, N, B, R, N, N, B, B, N, B, N, N, R, B, N, B, R, B, N.
4. Al investigar el nivel socioeconómico en los valores: Bajo(B), medio (M), alto(A), 20 familias
dieron las siguientes respuestas:
M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B.
Donde:ca: casadaco: convivientese: separadaso: soltera
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 13/32
ESTADISTICA GENERAL
13Lic. Estadístico Hugo Luis Chunga Gutierrez
5. Una empresa encuestadora de mercados pregunta a un conjunto de personas acerca de la
preferencia de un cierto candidato para las próximas elecciones. Los candidatos son A, B, C, D,
E, la pregunta fue: ¿Si las elecciones fueran mañana por quien votaria usted?. Los resultados
fueron:
E D A E A B A B A D A B A C A C A B A C A C A B A B A
B A B A B A B A C A C A D A B E B A A B D A E
6. Se identifico una muestra de autos robados en la ciudad de Piura y se registro la marca de cada
auto. A continuación se presenta los datos que se obtuvo: (T = Toyota; D = Daewoo; N =
Nissan; W = Volkswagen; H = Hyundai)
T D T H T W D T W T
D W H N H H T H N NT D T D T H N W H T N T T D H T W N T DD N T T N T T D T D
7. Los siguientes datos corresponden a una muestra de 19 reclusos de un Centro penitenciario,
según el tipo de delito.
V R D D R R D D R V D D R R V R D D V
Donde:V : violación, R : robo agravado, D = Tráfico ilícito de drogas
8. Los siguientes datos provienen del resultado de entrevistar a 30 personas sobre la marca de
gaseosa que más consume a la semana:
Marca 1 Marca 2 Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 3 Marca 1 Marca 2Marca 1 Marca 1 Marca 2 Marca 1 Marca 3 Marca 3 Marca 2 Marca 1 Marca 1 Marca 1Marca 1 Marca 3 Marca 1 Marca 2 Marca 3 Marca 1 Marca 3 Marca 3 Marca 2 Marca 3
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 14/32
ESTADISTICA GENERAL
14Lic. Estadístico Hugo Luis Chunga Gutierrez
GRÁFICOS PARA VARIABLES CUALITATIVAS
Los gráficos más usuales para representar variables cualitativas son los siguientes:
DIAGRAMA DE BARRAS VERTICAL: Es una forma grafica de representar datos
cualitativos que se han resumido en una distribución de frecuencias de frecuencias relativas o
porcentuales.
C A N T I D A D
0
15
30
45
60
75
P r
i m a r
i a
A n a
l f a b
e t o
S e c u n
d a r
i a
S u p e r
i o r
GRADO DE INSTRUCCIÓN
GRÁFICOS SECTORIALES, CIRCULAR O DE PASTEL: Se usa para representar y
comparar la dimensión de las partes de un fenómeno con el fenómeno total. Para su
elaboración se utiliza la circunferencia, siendo necesario que los valores absolutos y/o
porcentuales, sean traducidos en GRADOS. Xiº= (360º Fiabs) / N o
Xiº= (360º %) / 100
Otros tipos de gráficos estadísticos para datos cualitativos:
GRÁFICO DE BARRAS COMPUESTAS: Para su elaboración se debe contar con una tabla
o cuadro de entrada doble.
MASCULINO
0
10
20
30
40
P r
i m a r
i a
A n a
l f a b e t o
S e c u n
d a r i a
S u p e r
i o r
GRADO DE INSTRUCCIÓN
FEMENINO
C A N T I D A D
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 15/32
ESTADISTICA GENERAL
15Lic. Estadístico Hugo Luis Chunga Gutierrez
PACIENTES ATENDIDOS POR TUBERCULOSIS PULMONAR POR GRADO DE INSTRUCCIÓN
SEGÚN SEXO
LIMA: ABRIL DEL 2005
GRADO DEINSTRUCCIÓN
SEXO TOTAL
MASCULINO FEMENINO
AnalfabetoPrimariaSecundariaSuperior
13350902
15280701
28631603
TOTAL 59 51 110FUENTE: Hospital Loayza, Oficina de Estadística
Investigador piensa que existen variaciones en los abortos en función de la condición
socioeconómica de las familias. Para ello selecciona a seis mujeres de 50 años pertenecientes a tres
niveles de condición socioeconómica. El número total de hijos nacidos por mujer se refleja en la
siguiente tabla.
Nivel SocioeconómicoAlto Medio Bajo
2 3 11 1 13 3 22 4 41 3 11 1 1
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 16/32
ESTADISTICA GENERAL
16Lic. Estadístico Hugo Luis Chunga Gutierrez
Sexo Edad Iglesia Grado de estudios Deporte Fuma Grado satisfacción Calificación
Masculino De 31 a 40 Evangélica Maestría Si No Muy Insatisfecho Bueno
Femenino De 21 a 30 Otras Titulado universitario Si No Ni satisfecho ni insatisfecho Regular
Masculino De 21 a 30 Catolica Titulado universitario Si No Insatisfecho Regular
Femenino De 31 a 40 Otras Titulado universitario Si No Insatisfecho Bueno
Masculino De 31 a 40 Otras Titulado universitario Si Si Insatisfecho Regular
Femenino De 31 a 40 Catolica Tecnica No No Satisfecho Bueno
Masculino De 21 a 30 Otras Tecnica Si Si Satisfecho Regular
Masculino De 31 a 40 Catolica Tecnica Si No Insatisfecho Regular
Masculino De 11 a 20 Evangelica Titulado universitario No No Insatisfecho Regular
Masculino De 21 a 30 Otras Tecnica No No Satisfecho Bueno
Masculino De 11 a 20 Otras Titulado universitario No No Satisfecho Regular
Femenino De 21 a 30 Catolica Titulado universitario No No Insatisfecho BuenoMasculino De 11 a 20 Catolica Titulado universitario Si Si Satisfecho Excelente
Femenino De 11 a 20 Otras Titulado universitario Si Si Insatisfecho Regular
Masculino De 21 a 30 Evangelica Doctorado/PhD No No Ni satisfecho ni insatisfecho Bueno
Masculino De 21 a 30 Evangelica Tecnica Si Si Satisfecho Bueno
Femenino De 11 a 20 Otras Maestria Si Si Insatisfecho Regular
Femenino De 21 a 30 Evangelica Titulado universitario No No Satisfecho Regular
Masculino De 21 a 30 Otras Tecnica Si Si Satisfecho Regular
Masculino De 31 a 40 Catolica Tecnica Si Si Satisfecho Bueno
Masculino De 11 a 20 Catolica Titulado universitario No No Satisfecho Regular
Masculino De 21 a 30 Evangelica Maestria No No Satisfecho Bueno
Masculino De 31 a 40 Otras Tecnica Si No Satisfecho Regular
Femenino De 21 a 30 Evangelica Maestria No No Ni satisfecho ni insatisfecho Bueno
Masculino De 11 a 20 Evangelica Maestria No No Satisfecho Regular
Masculino De 21 a 30 Otras Titulado universitario Si No Satisfecho Regular
Femenino De 31 a 40 Evangelica Tecnica No No Satisfecho Regular
Femenino De 21 a 30 Catolica Tecnica No No Satisfecho Bueno
Masculino De 21 a 30 Catolica Tecnica Si No Satisfecho Regular
Masculino De 31 a 40 Catolica Doctorado/PhD Si No Satisfecho Regular
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 17/32
ESTADISTICA GENERAL
17Lic. Estadístico Hugo Luis Chunga Gutierrez
CUADROS ESTADÍSTICOS PARA VARIABLES CUANTITATIVAS
PARA DATOS AGRUPADOS SIN INTERVALOS.
1.- Se tomo a 20 empresas de transportes de la Ciudad del norte del país la cual se tiene datos de
la cantidad de quejas por parte de los turistas que visitaron los diferentes puntos turísticos del
norte del país:
6 5 4 4 3 3 4 4 5 55 6 2 4 3 4 6 5 3 2
2.- Ante la pregunta del número de hijos por familia (variable X) una muestra de 20 hogares,
marcó las siguientes respuestas:
2, 1, 2, 4, 1, 3, 2, 3, 2, 0,3, 2, 1, 3, 2, 3, 3, 1, 2, 4.
3.- En una clase de 25 alumnos hemos preguntado la edad de cada uno, obteniendo estos
resultados:
14, 14, 15, 13, 15, 14, 14, 14, 14, 15, 13, 14,13, 14, 14, 14, 15, 14, 16, 14, 15, 15, 13, 14, 15
4.- El siguiente ejemplo que contiene las calificaciones obtenidas en una prueba de matemáticas:
78 93 61 100 70 83 88 74 97 72 66 73 76 81 83 64 91 70 77 86
5.- Los siguientes datos es acerca las tallas expresadas en cm de la mujeres en gestación de la
posta medica San Juan:
114 125 114 124 142 152 133 113 172 127 135 161 122 127 134 147
6.- Tenemos un conjunto de 20 calificaciones del curso de estadística:82 74 88 66 58 74 78 84 96 76 62 68 72 92 86 76 52 76 82 78
7.- Un estudio en una muestra de clientes de una empresa del número de llamadas recibidas reveló
la siguiente información:
52, 43, 30, 38, 30, 42, 12, 46, 39, 37, 34, 46, 32, 18, 41, 55
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 18/32
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 19/32
ESTADISTICA GENERAL
19Lic. Estadístico Hugo Luis Chunga Gutierrez
GRÁFICOS PARA VARIABLES CUANTITATIVAS
HISTOGRAMA:
Es una grafica que se utiliza para representar la distribución de frecuencias absolutas o
relativas simples.
Consiste en un grupo de rectángulos adyacentes que tienen sus bases en el eje de las abscisas
(donde se representa los intervalos de clase de la variable) y altura igual a las frecuencias de
cada clase.
POLÍGONO DE FRECUENCIA:
También es un grafico que se utiliza para representar la distribución de frecuencias absolutas
o relativas simples.Consiste en un grafico lineal que se obtiene uniendo los puntos hallados, mediante el par de
valores de marca y frecuencia correspondientes. Para fines de gráfico, se hace necesario
incrementar un intervalo de clase en cada extremo, con frecuencias cero.
C A N T I D
A D
0
5
10
15
20
25
7
30
35
EDAD (años)
12 17 22 27 32 37
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 20/32
ESTADISTICA GENERAL
20Lic. Estadístico Hugo Luis Chunga Gutierrez
MEDIDAS DE RESUMEN Y MEDIDAS DE DISPERSION
MEDIDAS DE RESUMEN:En las tres semanas anteriores están referidos, con cierto detalle, a la clasificación de variables,
recolección de datos, construcción de tablas de frecuencia y a la representación grafica, como fase
preliminar en la descripción y análisis estadístico. El objetivo principal de estas primeros temas,
ha sido determinar la naturaleza y formas de la distribución de frecuencias, como base para la
“reducción de datos” a través de ciertas características descriptivas y medidas de resumen.
En el problema de comparar dos o mas distribuciones de frecuencias, puede resultar fácil hacer
una comparación grafica de las frecuencias, sin embargo, existen dificultades para hacer
comparaciones cuantitativas. Estadísticamente para facilitar este análisis comparativo es necesario
disponer de algunos indicadores o medidas de resumen.
Para ello estudiaremos las medidas de posiciones centrales y no centrales.
MEDIDAS DE DISPERSIÓN:
Las medidas de dispersión o variabilidad son números que miden el grado de separación de los
datos con respecto a un valor central, que generalmente es la media aritmética. Las principales
medidas de dispersión son:
El rango, el rango intercuartil, la varianza, la desviación estándar, y el coeficiente de variación.
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 21/32
ESTADISTICA GENERAL
21Lic. Estadístico Hugo Luis Chunga Gutierrez
MEDIDAS DE POSICIONES CENTRALES PARA DATOS NO
AGRUPADOS
Son valores que reflejan el centramiento o punto central de la variable estudiada. Son tres: la
media, la mediana y la moda.
MEDIA ARITMÉTICA ( x )
La media aritmética de un conjunto de valores de una variable es el promedio de todas las
observaciones. Esto es, se suman todos los valores de la variable y se divide por el número de
valores. Esta medida se obtiene mediante la siguiente expresión:
n
x
x
n
i
i
1 n
x x x x
n
x X
ni
...........321
LA MEDIANA ( Me)
La mediana de un conjunto de valores ordenados de una variable, es el valor central.
Si el conjunto de datos tiene un número impar de valores entonces la mediana es el valor de la
variable que esta localizado en la parte central y si es par el número de valores, entonces lamediana es el promedio simple de los dos valores de la variable que están localizados en la parte
central.
Cuando se tiene un numero impar
Cuando se tiene un numero par
LA MODA O EL VALOR MODAL (MO):
Es el valor de la variable que más veces se repite, es decir, aquella cuya frecuencia absoluta es
mayor. No tiene porque ser única.
Ejemplo:
El conjunto: 2 2 5 7 9 9 9 10 10 11 13 tiene la moda Mo = 9
El conjunto: 3 5 8 10 12 16 18 no tiene moda.
El conjunto: 2 3 4 4 4 5 5 7 7 7 9 tiene dos modas 4 y 7; es una distribución“bimodal”.
1
2
n Me x
12 2
2
n n x x
Me
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 22/32
ESTADISTICA GENERAL
22Lic. Estadístico Hugo Luis Chunga Gutierrez
EJERCICIOS
1.- Consideremos el peso en kilogramos de una muestra de 13 alumnos deportista de esta
universidad:
65 76 48 48 68 78 90 87 67 72 78 77 84
2.- Supongamos que tenemos datos sobre las edades de 10 alumnos de esta universidad:
18 22 20 19 18 17 21 20 18 23
3.- Tenemos los calificativos de 11 alumnos en el curso de estadística:
09 10 08 17 14 08 11 14 12 14 14
4.- Los siguientes datos es acerca las tallas expresadas en cm de la mujeres en gestación de la
posta medica San Juan:
114 125 114 124 142 152 133 113 172 127 135 161 122 127 134 147
5.- Un estudio en una muestra de clientes de una empresa del número de llamadas recibidas reveló
la siguiente información:
52, 43, 30, 38, 30, 42, 12, 46, 39, 37, 34, 46, 32, 18, 41, 55
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 23/32
ESTADISTICA GENERAL
23Lic. Estadístico Hugo Luis Chunga Gutierrez
MEDIDAS DE POSICIONES NO CENTRALES PARA DATOS NO
AGRUPADOS
LOS CUARTILES (Qk ):
Los cua rt iles son los tres valores de la variable que dividen a un conjunt o de datos
ordenados en cuatro parte s iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.
LOS DECILES (Dk ):
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
LOS PERCENTILES (Pk ):
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
L= valor del centil (medida de la posición)K= porcentaje equivalente a la medida de posiciónn= tamaño de muestra
Si L resulta un número decimal se aproxima a entero y ese es el valor de la posición del porcentaje equivalente que estamos calculando.Ahora si resulta un número entero se toma esta posición junto con la siguiente para que se sumany se dividan entre dos.
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 24/32
ESTADISTICA GENERAL
24Lic. Estadístico Hugo Luis Chunga Gutierrez
MEDIDAS DE DISPERSION PARA DATOS NO AGRUPADOS
Varianza: es el promedio del cuadrado de las distancias entre cada observación y la media
aritmética del conjunto de observaciones.
Desviación típica o Desviación estándar: La varianza viene dada por las mismas unidades que la
variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersión la
desviación típica que se define como la raíz cuadrada positiva de la varianza.
Es la medida que mide cuánto se separan los datos.
Es una medida de dispersión, que nos indica cuánto pueden alejarse los valores respecto al
promedio (media), La desviación sólo significa qué tan lejos de lo normal
Coeficiente de variación de Pearson: Cuando se quiere comparar el grado de dispersión de dos
distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se
utiliza el coeficiente de variación de Pearson que se define como el cociente entre la desviación
típica y el valor absoluto de la media aritmética.
Es una medida que se emplea fundamentalmente para:
Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades de
medida. Por ejemplo, kilogramos y centímetros.
Comparar la variabilidad entre dos grupos de datos obtenidos por dos o más personas distintas.
Comparar dos grupos de datos que tienen distinta media.
Determinar si cierta media es consistente con cierta varianza.
Medida de dispersión Para una población Para una muestra
Varianza n
xi
2
2
1
2
2
n
x x s
i
Desviación estándar σ = √ s = √ Coeficiente de
variación ̅ ̅
CV representa el número de veces que la desviación típica contiene a la media aritmética y por lo
tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media.
Si CV < =33% el grupo de estudio es mas Homogéneo;Si CV > 33% el grupo de estudio es mas Heterogéneo;
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 25/32
ESTADISTICA GENERAL
25Lic. Estadístico Hugo Luis Chunga Gutierrez
Ejemplos
En la evaluación a 120 alumnos en 02 asignaturas, se obtienen los siguientes resultados:
1. Examen de Estadística: 1 2 3 5; . x s
2.
Examen de Investigación: 4 5 7 4; . x s ¿En cual de las pruebas el grupo tiene mayor variabilidad?
Analizar comparativamente la distribución de los sueldos de los 45 trabajadores de cierta empresa
Desv. Estándar MediaDirectivos 70 700Empleados 60 300Obreros 90 250
Con un micrómetro, se realizan mediciones del diámetro de un balero, que tienen una media de4.03 mm y una desviación estándar de 0.012 mm; con otro micrómetro se toman mediciones de la
longitud de un tornillo que tiene una media de 1.76 pulgadas y una desviación estándar de 0.0075
pulgadas. ¿ Cuál de los dos micrómetros presenta una variabilidad relativamente menor?
Entendiendo la varianza y la desviación estándar:
Ejemplo: Tú y tus amigos han medido las alturas de sus perros (en milímetros):
Nombre Perro Milímetros Fido 600. 00Pulgas 470. 00Ringo 170. 00Boby 430. 00Lindo 300. 00
Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.
Calcula la media, la varianza y la desviación estándar.
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 26/32
ESTADISTICA GENERAL
26Lic. Estadístico Hugo Luis Chunga Gutierrez
Así que la altura media es 394 mm. Vamos a dibujar esto en el gráfico:
Ahora calculamos la diferencia de cada altura con la media:
Para calcular la varianza, toma cada diferencia, elévala al cuadrado, y haz la media:
Varianza: σ2 = 206 + 76 + (-224) + 36 + (-94) = 108,520 = 21,7045 5
Así que la varianza es 21,704.
Y la desviación estándar es la raíz de la varianza, así que:
Desviación estándar: σ = √21,704 = 147
y lo bueno de la desviación estándar es que es útil: ahora veremos qué alturas están a distancia
menos de la desviación estándar (147mm) de la media:
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 27/32
ESTADISTICA GENERAL
27Lic. Estadístico Hugo Luis Chunga Gutierrez
Todas las estaturas entre 394 hasta 541. 32 (394 + 147. 32) son normales y estan dentro de los
limites establecidos, en este caso Fido es "Anormal" por estar muy alto.
Todas las estaturas entre 246. 68 hasta 394 (394 - 147. 32) son normales y estan dentro de los
limites establecidos, en este caso Chihua es "Anormal" por estar muy bajito.
Así que usando la desviación estándar tenemos una manera "estándar" de saber qué es normal, o
extra grande o extra pequeño.
Pudieramos decir que la desviacion estandar es la media de la media.
MEDIDAS DE POSICIONES CENTRALES PARA DATOS AGRUPADOS
LA MEDIA ARITMÉTICA
Los datos se pueden presentar en tablas sin intervalos y en tablas con intervalos, en ambos casos
se usa la Media aritmética Ponderada
M(Y) = 1
y
i i i
Y f
n
LA MEDIANA
1. La mediana en tablas sin intervalos
a) Que2
n no coincide con algún Nj se tiene que:
b) Que2
n coincide con algún Nj, se tiene que:
Entonces: 1
2: j i j M e Y Y
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 28/32
ESTADISTICA GENERAL
28Lic. Estadístico Hugo Luis Chunga Gutierrez
2. La mediana en tablas con intervalos
a. Hallamos2
n
LA MODA
La moda en tablas sin in tervalos
Una vez agrupados los datos en una tabla de frecuencia, el valor modal será el valor de la
variable que mas se repite o que tiene la mayor frecuencia. La mayor frecuencia se denotara con
j n .
La moda Mo = j n
2. La moda en tablas con intervalos
[
]
MEDIDAS DE POSICIONES NO CENTRALES PARA DATOSAGRUPADOS
LOS CUARTILAS (QK )
̅
DECILES:
̅
PERCENTILES:
̅
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 29/32
ESTADISTICA GENERAL
29Lic. Estadístico Hugo Luis Chunga Gutierrez
MEDIDAS DE DISPERSION PARA DATOS AGRUPADOS
Medida de dispersión Para una población Para una muestra
Varianza n
f x ii
2
2
1
2
2
n
f x x s
ii
Desviación estándar σ = √ s = √
Coeficiente de
variación ̅ ̅
EJERCICIOS
CUADRO N° 01
NIÑOS CON ENFERMEDADES RESPIRATORIAS DEL AAHH SAN MARTINSEGÚN EDAD, PIURA – JUNIO 2012
Edad
Niño con enfermedad
diarreica (f i)2 13 44 75 56 3
Total 20
CUADRO N° 02
ALUMNOS DE EPE DE LA UCV – PIURA SEGÚN PUNTAJES OBTENIDOSEN ESTADÍSTICA EN EL 2012
Puntaje Alumnos (f i)9 2
10 611 1012 713 614 5
Total 36
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 30/32
ESTADISTICA GENERAL
30Lic. Estadístico Hugo Luis Chunga Gutierrez
CUADRO N° 03
NÚMEROS DE HOSPITALES SEGÚN INGRESOS (EN MILES DE SOLES) OBTENIDOS EN NUESTRO PAÍS EN DICIEMBRE DE 2012
[Li , L
s>
xi f i F j
[90 – 120> 11 11[120 – 150> 13 24[150 – 180> 20 44[180 – 210> 17 61[210 - 240> 15 76[240 - 270> 3 79[270 – 300> 1 80
Total ***** 80 *****
CUADRO N° 04
NÚMEROS DE HOSPITALES SEGÚN INGRESOS (EN MILES DE SOLES) OBTENIDOS EN NUESTRO REGION EN DICIEMBRE DE 2012
[Li , L
s>
xi f i F j
[60 – 120> 14 14
[120 – 180> 16 30[180 – 240> 12 42[240 – 300> 10 52[300 - 360> 6 58[360 - 420> 2 60
Total ***** 60 *****
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 31/32
ESTADISTICA GENERAL
31Lic. Estadístico Hugo Luis Chunga Gutierrez
MEDIDAS DE DEFORMACIÓN
Comparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama de
barras de la distribución, con la distribución normal.
MEDIDA DE ASIMETRÍA
Diremos que una distribución es simétrica cuando su mediana, su moda y su media aritmética
coinciden.
Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas)
descienden más lentamente por la derecha que por la izquierda.
Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la
distribución es asimétrica a la izquierda. Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el
Coeficiente de Asimetría de Pearson:
S
Mo xC s
o S
Me xC s
)(3
Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha
y negativo cuando existe asimetría a la izquierda.
La interpretación del coeficiente (1.10) es como sigue:
Sí, 0 sC
, la distribución es con asimetría positiva o con cola a la derecha.
Sí, 0 sC
, la distribución es con asimetría negativa o con cola a la izquierda.
Sí, 0 sC
, la distribución es simétrica.
Asimetría Negativa
AsimetríaPositiva
8/15/2019 SEPARATA 2016
http://slidepdf.com/reader/full/separata-2016 32/32
ESTADISTICA GENERAL
MEDIDA DE APUNTAMIENTO O KURTOSIS
Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos
de distribuciones según su grado de Kurtosis:Distribución mesocúrtica (K = 0.5): presenta un grado de concentración medio alrededor de los
valores centrales de la variable (el mismo que presenta una distribución normal).
Distribución leptocúrtica (K = 1): presenta un elevado grado de concentración alrededor de los
valores centrales de la variable.
Distribución platicúrtica (K = 0): presenta un reducido grado de concentración alrededor de los
valores centrales de la variable.
El Estadígrafo de Kurtosis es:
7 5 2 5
9 0 1 0
PP P
K C o e f i c i e n t e e r c e n t i l d e K u r t o s i sP P