Módulo Estadística III.pdf
Transcript of Módulo Estadística III.pdf
TECNICAS E INSTRUMENTOS DE LA INVESTIGACIÓN
TÉCNICAS DE INVESTIGACIÓN
El método es el camino teórico, las técnicas constituyen los procedimientos concretos que el investigador utiliza para lograr información.
Los métodos son globales y generales, las técnicas son específicas y tienen un carácter práctico y operativo.
Las técnicas se subordinan a un método y éste a su vez es el que determina qué técnicas se van a usar.
Aunque el método y la técnica se encuentran íntimamente ligados no se identifican, pues ambos se complementan y son necesarias en la investigación.
Jorge Amores - ESTADISTICA
TECNICAS E INSTRUMENTOS DE LA
INVESTIGACIÓN
Jorge Amores - ESTADISTICA
Las técnicas constituyen el conjunto de mecanismos, medios o recursos dirigidos a recolectar, conservar, analizar y transmitir los datos de los fenómenos sobre los cuales se investiga.
Por consiguiente, las técnicas son procedimientos o recursos fundamentales de recolección de información, de los que se vale el investigador para acercarse a los hechos y acceder a su conocimiento.
Jorge Amores - ESTADISTICA
Elaborar sistemas de organización y clasificación de la informaciión
Las técnicas proporcionan diversos instrumentos y medios para la recolección, concentración y conservación de los datos (fichas, escalas, cuestionarios, inventarios, registros, videos, cd, etc)
IMPORTANCIA DE LAS TÉCNICAS DE INVESTIGACIÓN
Jorge Amores - ESTADISTICA
RECOLECCIÓN DE DATOS
Una vez que seleccionamos el diseño de investigación apropiado y la muestra adecuada, de acuerdo al problema de estudio e hipótesis, es importante recolectar los datos pertinentes sobre los atributos, conceptos o variables de las unidades de análisis o casos.
Jorge Amores - ESTADISTICA
RECOLECCIÓN DE DATOS
Recolectar datos implica elaborar un plan detallado de procedimientos que nos conduzcan a reunir datos con un propósito específico .
Jorge Amores - ESTADISTICA
RECOLECCIÓN DE DATOS (Determinando:)
a) Cuáles son las fuentes de donde se obtendrán los datos , esto es si los datos van a ser proporcionados por personas, observaciones, documentos, archivos, base de datos, etc.
• b) En donde se localizan tales fuentes, generalmente en la muestra seleccionada, pero es indispensable definir con precisión
Jorge Amores - ESTADISTICA
RECOLECCIÓN DE DATOS (Determinando:)
c)A través de que medio o método vamos a recolectar los datos, esto implica elegir uno o varios medios y definir los procedimientos que utilizaremos en la recolección de los datos. El método o métodos deben ser confiables, válidos y objetivos
•d) Una vez recolectados, de qué forma vamos a prepararlos para que puedan analizarse y respondamos al planteamiento del problema
Jorge Amores - ESTADISTICA
ELEMENTOS DEL PLAN DE RECOLECCIÓN DE DATOS
Los recursos disponibles
La muestra
Las definiciones operacionales
Las variables
Jorge Amores - ESTADISTICA
REQUISITOS QUE DEBE CUBRIR UN INSTRUMENTO DE MEDICIÓN
1.Confiabilidad
2.Validez
3.Objetividad
POBLACIÓN Y MUESTRA
La muestra para ser confiable debe ser representativa y
además ofrecer las ventajas de ser la más práctica, la más
económica y la más eficiente en su aplicación.
Por más perfecta que sea la muestra, siempre habrá una diferencia entre el resultado que se obtiene de ésta y el resultado del universo, esta
diferencia es lo que se conoce como error de muestreo. Jorge Amores - ESTADISTICA
POBLACIÓN Y MUESTRA
Aplicar en la muestra los procedimientos e instrumentos de recolección de la información.
Lograr que la muestra sea representativa, que refleje las características de la población en la misma proporción.
Determinar el tamaño de la muestra, para obtener el resultado al menor costo, menor tiempo y con el personal indispensable.
Disponer de un registro de la población, es decir, una lista de sus elementos.
Definir la población que sirve de base para la muestra.
AL EXTRAER LA MUESTRA SE DEBE:
Jorge Amores - ESTADISTICA
POBLACION Y MUESTRA
En donde:
O n = tamaño de la muestra
O N = tamaño de la población
O E = error de muestreo, identificado, para la
investigación, como 0,05 (5%).
Jorge Amores - ESTADISTICA
OPERACIONALIZACIÓN DE VARIABLES
Jorge Amores - ESTADISTICA
OPERACIONALIZACION DE LA VARIABLE INDEPENDIENTE
FORMACION TECNICA
CONCEPTUALIZACION CATEGORIAS INDICADORES ITEMS BASICOS
TECNICAS E
INSTRUMENTOS
Los objetivos empresariales Por qué? Entrevista, cuestionario a
EMPLEADOS son desconocidos empleados
* DEFICIENTE MANEJO
DE RECURSOS Los empleados de cada La razón? Encuesta, cuestionario a
HUMANOS sector trabajan por su propia empleados
* FALTA DE GESTION cuenta
* IMPROVISACION
* INEXISTENCIA DE
PLANES DE Apoyo técnico a las labores Por qué? Entrevista, cuestionario a
CAPACITACION de los empleados directivos y empleados
DIRECTIVOS
Desconcimiento de cada uno La razón? Encuesta, cuestioanario
de los sectores, concentración a empleados
de acividades en la oficina matriz
OPERACIONALIZACIÓN DE VARIABLES
Jorge Amores - ESTADISTICA
OPERACIONALIZACION DE LA VARIABLE DEPENDIENTE
RENTABILIDAD
CONCEPTUALIZACION CATEGORIAS INDICADORES ITEMS BASICOS
TECNICAS E
INSTRUMENTOS
* DEFICIENTE MANEJO DE Reducción de clientes Por qué? Entrevista, cuestionario a
LAS OPERACIONES CLIENTES clientes que han salido
* DEFICIENTE MANEJO
DE RECURSOS HUMANOS Insatisfacción de clientes La razón? Entrevista, cuestionario a
* INPRODUCTIVIDAD clientes que aún se encuentran
* GASTOS EXCESIVOS E
INNECESARIOS
* PERDIDAS ECONOMICAS
Capacitación insuficiente Por qué? Encuesta, cuestioanario
a empleados
EMPLEADOS
Planificación, dirección y La razón? Encuesta, cuestioanario
control del Recurso Humano a empleados
deficiente
Conjunto completo de individuos, objetos o datos que poseen alguna característica común observable, y que el investigador esta interesado en estudiar.
Población:
Subconjunto de la población, que lleva implícita todas las características del universo.
Muestra
TÉRMINOS COMUNES UTILIZADOS EN LA ESTADÍSTICA.
Jorge Amores - ESTADISTICA
Comprenden un número finitamente grande de unidades elementales.
Ejemplo: Todas las enfermeras del Ecuador
Cont. Población
LA POBLACIÓN
Población Infinita Población Finita
PUEDE SER
Es aquella que tiene un número limitado o finito de unidades elementales.
Ejemplo: Los salarios de las enfermeras del hospital Ambato. Jorge Amores - ESTADISTICA
Parámetro
Valor representativo de una población
relacionado con una característica determinada
Los parámetros se pueden inferir a
partir de una muestra
Variable
Es toda característica sujeta a medida o cuenta y que es susceptible
de variación
Cuantitativa: se expresa
numéricamente
Cualitativa: se refiere a cualidades
o atributos de los elementos
Jorge Amores - ESTADISTICA
Cont. Variable
PUEDE SER
VARIABLE
Variable
Independiente Variable
Dependiente
Jorge Amores - ESTADISTICA
Variable Independiente:
Es la que explica, condiciona o
determina cambios en otra llamada
dependiente.
•Es la supuesta causa de los cambios que se
operan en la variable dependiente
•Es la que el investigador manipula para
comprobar su efecto en la variabilidad de la
dependiente.
Cont. Variable
Jorge Amores - ESTADISTICA
En la mayor parte de los experimentos, el científico está interesado en determinar el efecto que tiene una variable, sobre alguna o mas variables. Para esto, el experimentador controla los niveles de la variable A y mide el efecto que posee sobre las demás variables. A la variable A se le denomina independiente debido a que en sus niveles son controlados por el investigador sin importar los cambios en las demás variables.
Cont. Variable
Jorge Amores - ESTADISTICA
Variable Dependiente:
•Es la que explica y condiciona determinada por la variable independiente, la variable dependiente en un experimento es la medida por un investigador para determinar el efecto de la variable independiente.
Cont. Variable
Jorge Amores - ESTADISTICA
En el experimento que estudia los efectos del alcohol sobre el comportamiento social, la cantidad de alcohol es la variable independiente, el comportamiento social de los sujetos se mide para ver si es afectado por la cantidad de alcohol consumida, así el comportamiento social es la variable dependiente.
Por ejemplo
Cont. Variable
En la investigación sobre la privación del sueño y el comportamiento agresivo, se controla la
cantidad de la privación del sueño, y se mide el comportamiento agresivo de los sujetos. La
cantidad de privación del sueño es la variable independiente y el comportamiento agresivo es
la variable dependiente.
Jorge Amores - ESTADISTICA
• Medidas que se realizan sobre los sujetos de un experimento. Por lo general, los datos constan de las medidas de la variable dependiente o de otras características del sujeto, como la edad, el género, el número de individuos. Los datos medidos de forma original se conocen como los datos crudos u originales
DATOS
• Número calculado a partir de los datos de la muestra, que cuantifica una característica de ella. Así, el promedio de un conjunto de datos de la muestra sería un estadístico.
• Ejemplo: El salario promedio de las enfermeras de un hospital.
ESTADÍSTICO
Jorge Amores - ESTADISTICA
Estadística
Tecnología del método científico que trata con variables aleatorias con el
objeto de recolectar, organizar, analizar, interpretar y presentar datos obtenidos de la realidad
Obtiene conclusiones , formula predicciones y
permite la toma de decisiones razonables
Examina una muestra en
términos de datos organizados y
resumidos Jorge Amores - ESTADISTICA
Jorge Amores - ESTADISTICA
Por lo tanto el método estadístico es una herramienta utilizada por el
hombre para comprender los hechos de la vida real
Jorge Amores - ESTADISTICA
CONCEPTOS GENERALES
Es el lenguaje universal
de las ciencias
Implica información,
números y gráficas
visuales para resumir
esta información y su
interpretación
Jorge Amores - ESTADISTICA
CONCEPTOS GENERALES
La estadísitica es un
sistema o método
usado en:
• Recolección
• Organización, análisis
y descripción
numérica de la
información
Que:
• Estudia el
comportamiento de
los fenómenos de
grupo
Jorge Amores - ESTADISTICA
MÉTODOS ESTADÍSTICOS
Estudios experimentales y observacionales
Un objetivo común para un proyecto de investigación estadística es investigar la causalidad, y en particular extraer una conclusión en el efecto que algunos cambios en los valores de predictores o variables independientes tienen sobre una respuesta o variables dependientes. Hay dos grandes tipos de estudios estadísticos para estudiar causalidad: estudios experimentales y observacionales.
Jorge Amores - ESTADISTICA
MÉTODOS ESTADÍSTICOS
Estudios experimentales y observacionales
En ambos tipos de estudios, el efecto de las diferencias de una variable independiente (o variables) en el comportamiento de una variable dependiente es observado. La diferencia entre los dos tipos es la forma en que el estudio es conducido. Cada uno de ellos puede ser muy efectivo
DISTRIBUCIÓN DE FRECUENCIAS
La distribución de frecuencias es un método utilizado para organizar y resumir datos.
Bajo este método los datos que componen una serie se clasifican y ordenan, indicándose el
número de veces que se repite.
La distribución nos permite manejar grandes cantidades de información en espacios
pequeños, ya sea a través de cuadros o tablas y por medio de gráficas que los complementan
Jorge Amores - ESTADISTICA
Los caracteres de los elementos de una población pueden ser cualitativos o cuantitativos.
Los datos cualitativos, denominados también atributos, son todos aquellos elementos que pueden ser descritos cualitativamente, es decir mediante palabras .
Ejemplo: clasificación de los alumnos de una universidad por lugar de origen, clasificación de un grupo de personas por ocupación, por cargo, por sexo, etc.
Jorge Amores - ESTADISTICA
DISTRIBUCIÓN DE FRECUENCIAS
Los caracteres cuantitativos denominados variables, son todas aquellas características susceptibles de ser expresadas cuantitativamente, es decir mediante números.
Ejemplo: peso, estatura, edad,
número de hijos, salarios, etc.
Jorge Amores - ESTADISTICA
DISTRIBUCIÓN DE FRECUENCIAS
VARIABLE DISCRETA Y CONTINUA
Las Variables Discretas son aquellas que admiten solamente valores enteros, es decir no tienen valores intermedios.
•Ejemplo: el número de hijos por familia, el número de empleados por departamento en una empresa
Las variables continuas son aquellas que admiten valores fraccionarios, pudiéndose establecer intervalos.
•Ejemplo: estatura, peso
Jorge Amores - ESTADISTICA
SÍMBOLOS (variable discreta y continua)
n = n = Tamaño de la muestra
N = N = Tamaño de la población o universo de donde
se extraen las muestras
xi = Xi = Identificación para cada valor observado (mayúsculas en la población y minúsculas en la muestra)
ƒi = ni = Frecuencias absolutas. Es el número de veces que
se repite cada valor de la variable
Xi = yi = Simboliza los valores que toma la variable
discreta
ƒi /n = hi = Frecuencia relativa, valor porcentual, obtenido al
dividir la frecuencia absoluta por n
Jorge Amores - ESTADISTICA
SÍMBOLOS (variable discreta y continua)
Fi = Ni = Frecuencia absoluta acumulada
Fi /n = Hi = Frecuencia relativa acumulada
Xi = yi = Marca de clase, en la variable continua
m = Número de valores que toma la variable Yi.
También se considera como el número de
intervalos o marcas de clase en la variable continua
i = c = Amplitud del intervalo
X’ i-1 -
X’ i
= Y’i-1 -
Y’i
= Forma de simbolizar la columna correspondiente a
los valores que toma la variable continua,
organizada en intervalos. Jorge Amores - ESTADISTICA
VARIABLE DISCRETA
Jorge Amores - ESTADISTICA
𝒉𝟏 =𝒏𝟏
𝒏 Las frecuencias relativas se
obtienen de la siguiente manera:
𝒉𝟐 =𝒏𝟐
𝒏
𝒉𝟑 =𝒏𝟑
𝒏 𝒉𝟒 =
𝒏𝟒
𝒏
Las frecuencias absolutas
acumuladas se obtienen de la
siguiente manera:
𝑁1 𝒏𝟏
𝑁2 𝒏𝟏 + 𝒏𝟐
𝑁3 𝒏𝟏 + 𝒏𝟐 + 𝒏𝟑
𝑁4 𝒏𝟏 + 𝒏𝟐 + 𝒏𝟑 + 𝒏𝟒
𝑁5 𝒏𝟏 + 𝒏𝟐 + 𝒏𝟑 + 𝒏𝟒 + 𝒏𝟓
VARIABLE CONTÍNUA
El primer paso consiste en determinar el valor máximo y el mínimo que toma la variable: Xmax y Xmin la diferencia entre el valor máximo y el mínimo, se denomina recorrido o rango. Esto es si Xmax = 94 y Xmin = a 47 el recorrido es 47
Jorge Amores - ESTADISTICA
VARIABLE CONTÍNUA
Introducimos dos nuevos símbolos que son:
m= número de intervalos
C= amplitud del intervalo
Jorge Amores - ESTADISTICA
O El valor de m se puede determinar de varias
maneras:
O Un número arbitrario que sea mayor o igual
que cinco, y menor o igual a 16.
O Método muy utilizado, consiste en la
aplicación de la fórmula: (m= 1+ 3.3 log n),
fórmula de sturges
O Otro procedimiento no muy recomendado,
calculando a m mediante la fórmula m= √n
Jorge Amores - ESTADISTICA
VARIABLE CONTÍNUA
(Número de intervalos)
O En cuanto a la aplitud C o I, que debe tomar
cada intervalo de la distribución, dependerá
del criterio establecido para presentar la
información:
O I = C = Rango / m, siempre aproximamos al
número inmediato superior, por pequeña
que sea la fracción.
O C= (X max - X min)/m
Jorge Amores - ESTADISTICA
VARIABLE CONTÍNUA
(Amplitud del intervalo)
O Al multiplicar los resultados de c x m, esto
es 8 x 6, el recorrido aumenta en una
unidad esto es a 48.
O La unidad de incremento se le puede restar
al límite inferior o aumentarse al límite
superior, en este caso se lo restamos a 47,
quedando el límite inferior en 46, a partir de
este valor comenzamos a agregar el valor de
c, para formar los distintos intervalos.
Jorge Amores - ESTADISTICA
VARIABLE CONTÍNUA
(Amplitud del intervalo)
En la variable continua se designa con (Y’i-1 - Y’i) o (X’i-1 - X’i), la columna correspondiente a los distintos valores que toma la variable.
Al primer valor Y’i-1 se denomina límite inferior del intervalo.
A Y’i se denomina límite superior.
La diferencia entre estos límites corresponde al valor de la amplitud del intervalo C o i
Jorge Amores - ESTADISTICA
VARIABLE CONTÍNUA
(Amplitud del intervalo)
Es de anotar que a cada límite inferior del intervalo se le ha agregado 0.1, lo que permite una fácil tabulación y así se sabe a cual intervalo corresponde el valor de Xi, obtenido.
Jorge Amores - ESTADISTICA
VARIABLE CONTÍNUA
Solución Ejercicio
Jorge Amores - ESTADISTICA
Marca de
clase
46.1 - 54 2 0.10 2 0.10 50
54.1 - 62 4 0.20 6 0.30 58
62.1 - 70 5 0.25 11 0.55 66
70.1 - 78 4 0.20 15 0.75 74
78.1 - 86 3 0.15 18 0.90 82
86.1 - 94 2 0.10 20 1.00 90
∑ = 20 1.00
𝑛
𝑋𝑖 ƒ𝑖 ƒ𝑖/𝑛 𝐹𝑖 𝐹𝑖/𝑛
𝟏
𝑋𝑖
MARCA DE CLASE
Para yi, marca de clase en la variable continua, se pueden obtener de 3 maneras:
a) Se promedia cada intervalo de la siguiente forma:
y1 = (y0 + y1)/2; y2 = (y1 + y2)/2
b) Se obtiene la primera marca de clase por el método anterior y si la amplitud C es constante, se le suma a la primera marca de clase obtenida y así sucesivamente.
c) Se divide la amplitud de cada intervalo por dos y se le suma al límite inferior del intervalo o se le resta al límite superior del intervalo.
Jorge Amores - ESTADISTICA
DISTRIBUCIÓN SIMÉTRICA
Una distribución es simétrica cuando las frecuencias absolutas o relativas, equidistantes a un punto central son iguales. Ej:
Jorge Amores - ESTADISTICA
46.1 - 54 2 0.10
54.1 - 62 6 0.30
62.1 - 70 12 0.60
70.1 - 78 12 0.60
78.1 - 86 6 0.30
86.1 - 94 2 0.10
∑ = 40 2.00
𝑛
𝑋𝑖 ƒ𝑖 ƒ𝑖/𝑛
𝟏
2 2 0.10
4 5 0.25
6 6 0.30
8 5 0.25
10 2 0.10
∑ = 20 1.00
𝑛
𝑋𝑖 ƒ𝑖 ƒ𝑖/𝑛
O Media
O Mediana
O Media geométrica
O Moda
O Varianza
O Desviación Media
O Desviación Mediana
Jorge Amores - ESTADISTICA
MEDIDAS DE TENDENCIA CENTRAL
Medidas de Tendencia
Central
Media Aritmética
Media Ponderada
Media Geométrica
Media Armónica
Mediana
Moda
Jorge Amores - ESTADISTICA
X =
Media Aritmética
Es la suma de todos los valores de la variable dividida entre el número total de elementos.
Es confiable porque refleja todos los valores del conjunto de datos, pero puede ser afectada por los valores extremos y de esa forma no constituye un valor típico.
Para el cálculo de la media aritmética se aplica la siguiente expresión:
n
)x...xx( n21 x
Jorge Amores - ESTADISTICA
Jorge Amores - ESTADISTICA
ESTADISTICA DESCRIPTIVA
INGRESOS SEMANALES EN DÓLARES
1000 1110 1010 1070 1030 1000
1150 990 1090 1080 1150 1200
1050 1030 1120 1050 1030 1150
1230 1170 1180 1110 1160 1100
1100 1060 1130 1105 935 1210
Media muestral No Agrupada
Media Ponderada Es el resultado de multiplicar cada uno de los elementos
por un valor particular para cada uno de ellos, llamado
peso y obteniendo a continuación la media aritmética del
conjunto formado por los productos anteriores.
Se calcula aplicando la siguiente expresión:
Los valores Xi corresponden a la variable y los valores pi
son los pesos que hacen referencia a su importancia.
Jorge Amores - ESTADISTICA
Media Ponderada
Ejemplo: Una empresa produce cuatro marcas de cigarrillos que se distribuyen a nivel nacional, cuyos precios de venta son: 1,25; 1,50; 1,80; y 2,00 dólares por cajetilla. Las ventas registradas en el último mes fueron respectivamente, en miles de cajetillas: 1.400; 1.250; 1.180; y, 950
Calcule el precio ponderado promedio de la cajetilla:
Xp = 1,25 (1.400) + 1,5 (1.250) + 1,8 (1.180) + 2 (950)
1.400 + 1.250 + 1.180 + 950
Xp = $ 1,60
Jorge Amores - ESTADISTICA
Media Geométrica La media geométrica (G) es igual a la raíz n-ésima del producto de todos los números
Se recomienda para datos de progresión geométrica, para promediar razones, porcentajes, interés compuesto , tasas de crecimiento y números índices
La media geométrica de un conjunto de números positivos, es siempre menor o igual que la media aritmética de dicho conjunto
Es menos sensible que la media aritmética a los valores extremos
Si un valor X= 0 entonces la G se anula
No se puede calcular si hay valores negativos
n
Jorge Amores - ESTADISTICA
Media Geométrica Ejemplo de Aplicación:
Las tasas de interés vigentes de tres bonos son 5%, 7%
y 4%. Calcular la media geométrica del interés:
G = 5.19%
La media aritmética sería:
X = 5.33%
Jorge Amores - ESTADISTICA
Media Armónica La media armónica (H) se define como la media aritmética de los recíprocos de un conjunto de datos.
Esta media se emplea para promediar variaciones con respecto al tiempo tales como: productividades, velocidades, tiempos, rendimientos, cambios, etc.
No se debe utilizar cuando hay valores cero o muy pequeños
Es poco influenciada por valores extremos muy grandes
Siempre es menor o igual que la media geométrica y que la media aritmética
Jorge Amores - ESTADISTICA
Media Armónica
Ejemplo: calcular la velocidad promedio a la que viaja un tren, que entre el punto A y el punto B recorre 200 km a 120 km/h; y entre B y C recorre 200 km a 180 km/h.
La velocidad promedio calculada con la media armónica será:
H = 2/(1/120) + (1/180) = 144 km/h
Es decir, los 400 km recorrerá en: 400/144 = 2.78 h
La media aritmética de la velocidad = 150 km/h
El recorrido de 400 km sería en: 400/150 = 2.67 h
Comprobación:
Entre A y B: 200 km/120 km/h = 1.67 h
Entre B y C: 200 km/180 km/h = 1.11 h 2.78
h
Jorge Amores - ESTADISTICA
Mediana
Es aquel valor de la variable que ocupa exactamente la posición
central cuando se tiene la serie de datos arreglada en orden de
magnitud. La Me no está influenciada por los valores extremos.
El número de observaciones es impar, en cuyo caso la Mediana
toma el valor de la observación que ocupa la posición central.
Ejemplo:
7, 9, 12, 12, 18, 27, 35, 36, 39
Me = 18
El número de observaciones es par, en tal caso la Mediana es
el promedio de los valores que ocupan la posición central.
Ejemplo:
7, 9, 12, 12, 18, 27, 35, 36, 39, 45
Me = 18 + 27 = 22.5
2
Jorge Amores - ESTADISTICA
Jorge Amores - ESTADISTICA
100
110
120
150
140
130
La mediana de la talla es
la talla de un niño ficticio
representado aquí en rojo
Moda
Se define como aquel valor de la variable que se presenta con mayor frecuencia (Md). Se usa especialmente con variables nominales que no pueden arreglarse en orden de magnitud.
Ejemplo: 5, 8, 10, 16, 4, 12, 8, 11, 8, 21 => Md=8
Cuando hay 2 valores o más que se repiten igual número de veces y ese número es el mayor, se dice que la serie es Bimodal o Multimodal, respectivamente.
Ejemplo: 3, 3, 1, 2, 2, 2, 3, 4, 4, 5, 2, 3 => Md1=2; Md2= 3
En el caso de que ningún valor se repita en la serie de datos, simplemente no existe valor modal.
Jorge Amores - ESTADISTICA
Rango Medio
Se obtiene al calcular la cantidad que está a la
mitad, entre los ingresos más altos y más bajos, de
acuerdo a lo siguiente:
Rm = (Xmax + Xmin)/2.
Ejemplo: Las edades de 10 estudiantes es: 23, 25,
26, 28, 24, 22, 20, 25, 26, 25
Rm= (28 + 20)/2
Rm= 24
Jorge Amores - ESTADISTICA
Taller # 1 Una empresa de producción registró los siguientes montos de ventas semanales,
expresadas en miles de dólares:
a. Calcule la media aritmética, media geométrica, media armónica moda y mediana, de
estos valores
b. Interprete los resultados
c. ¿Qué ocurre con estos valores cuando se incrementa a esta serie el monto de ventas
a 400 mil dólares en una semana “anormal”? Interprete los cambios que se
presentan en cada una de las medidas de Tendencia Central calculadas.
Semana Ventas Semana Ventas
1 54 11 67
2 48 12 68
3 58 13 39
4 50 14 35
5 25 15 56
6 47 16 66
7 75 17 33
8 46 18 62
9 60 19 65
10 70 20 67
Jorge Amores - ESTADISTICA
Medidas de
Dispersión
Varianza Desviación estándar
Rango Coeficiente de Variación
Jorge Amores - ESTADISTICA
La Varianza Es la medida de dispersión que mide el grado de variabilidad de un grupo de datos, que se sintetiza en el grado de homogeneidad o heterogeneidad de la variable. S2 =
Ejemplo: calcular la varianza de los valores de pH registrados en varias muestras de jugos de naranja:
S2 =
S2 =
S2 = 0.1057
Muestra pH (Xi) X2
1 3.2 10.24
2 3.5 12.25
3 3.1 9.61
4 2.8 7.84
5 2.6 6.76
6 3.1 9.61
7 3.5 12.25
8 3.4 11.56
Suma 25.2 80.12
Jorge Amores - ESTADISTICA
La Desviación Estándar
Constituye la raíz cuadrada de la varianza y representa el grado
de dispersión que tienen los datos con relación a su media. Se
expresa en las mismas unidades que tiene la variable.
El administrador de una empresa registra los minutos de
atrasos que han tenido sus empleados en el mes anterior, a fin
de establecer correctivos:
S2 = 703.77
S = 26.53 minutos
El gerente decide sancionar
a los empleados que
superan:
X + 1S = 42.17 + 26.53
= 68.7 minutos
Empleado Atraso (Xi) (Xi)2
A 85 7.225
B 33 1.089
C 48 2.304
D 20 400
E 12 144
F 55 3.025
Suma 253 14.187
Promedio 42.17 Jorge Amores - ESTADISTICA
El Rango
Es la diferencia entre el valor más alto y el más bajo, dentro de un grupo de datos. Mientras más grande sea el valor del rango, mayor será la dispersión y consecuentemente será más alta la varianza y la desviación estándar.
Para su cálculo primeramente se ordenan los datos de acuerdo a su magnitud y se resta el valor menor del valor más alto.
Para el ejemplo anterior el valor del rango (R) es:
R = valor mayor – valor menor
R = 85 – 12 = 73 minutos
Jorge Amores - ESTADISTICA
Coeficiente de Variación
Es una medida relativa de variabilidad, independiente de las unidades de medida, que elimina la dimensionalidad de las variables y tiene en cuenta la proporción existente entre medias y desviación estándar.
S
C.V. = x 100
X
El C.V. para los datos de los dos ejemplos anteriores serán:
1. pH jugo de naranja: 0.325 C.V. = x 100 = 10.32% 3.15
2. Atraso de empleados:
26.53 C.V. = x 100 = 62.91% 42.17
Jorge Amores - ESTADISTICA
Taller # 2 El precio de un producto agroindustrial en el comercio local, tomado en 20 locales comerciales, fue el siguiente:
1. Calcule la media, mediana y moda del precio
2. Calcule la varianza, desviación estándar, rango y coeficiente de variación
3. Interprete los resultados
Local Precio, $ Local Precio, $
1 2.5 11 2.6
2 2.8 12 2.8
3 2.6 13 2.9
4 2.6 14 2.3
5 2.9 15 2.6
6 2.3 16 2.6
7 2.4 17 2.7
8 2.6 18 2.5
9 2.4 19 2.4
10 2.5 20 2.6
Jorge Amores - ESTADISTICA
PROBABILIDADES
La definición clásica de probabilidad tiene la desventaja de que la expresión “igualmente posible” es vaga. Por esta razón se considera que la probabilidad estimada o probabilidad empírica de un evento es la frecuencia relativa de ocurrencia del evento cuando la cantidad de observaciones es muy grande.
La probabilidad misma es el límite de esta frecuencia relativa a medida que la cantidad de observaciones aumenta de manera indefinida.
Jorge Amores - ESTADISTICA
PROBABILIDADES
Definimos probabilidad como la frecuencia relativa con que ocurre un evento.
Probabilidad de eventos puede asignarse por observación o mediante la utilización de espacio muestra igualmente probable.
Las reglas de adición y multiplicación ayudan a encontrar la probabilidad de eventos compuestos.
Jorge Amores - ESTADISTICA
PROBABILIDADES
Ejemplo 1: Cuando se lanza un dado, éste puede caer de seis maneras distintas, dando los números: 1, 2, 3, 4, 5, 6.
Un evento E de que caiga un 3 o un 4, la probabilidad es:
Pr (E)=2/6, o bien 1/3. La probabilidad de no obtener un 3 o 4 (es decir, la probabilidad de obtener 1,2,5,6, es
Pr (E)= 1 – Pr (E)= 2/3.
Jorge Amores - ESTADISTICA
Taller de probabilidades
Ejercicio 1: ¿De cuántas maneras pueden sentarse 10
personas en un banco si hay 4 sitios disponibles?
Solución:
Nótese que importa el orden en que se sienten las
personas, ya que los cuatro sitios son diferentes, y
que una persona no puede ocupar más de un sitio a
la vez. Por lo tanto, hay V10,4 = 10!/6! = 10 * 9 * 8 * 7
= 5040 maneras.
Jorge Amores - ESTADISTICA
Taller de probabilidades
Ejercicio 2: En una clase de 10 alumnos van a
distribuirse 3 premios. Averiguar de cuántos modos
puede hacerse si:
1. los premios son diferentes;
2. los premios son iguales.
Jorge Amores - ESTADISTICA
Taller de probabilidades
Solución:
Hay dos supuestos posibles:
1. Si una misma persona no puede recibir más de un premio:
O Hay V10,3 = 10 * 9 * 8 = 720 maneras de distribuir los premios si éstos son diferentes;
O En el caso de que los premios sean iguales, pueden distribuirse de C10,3= 10 * 9 * 8=6 = 120 maneras.
2. Si una misma persona puede recibir más de un premio:
O Se pueden distribuir los premios, si éstos son diferentes, de VR10,3= 10^3 = 1000 maneras;
O Hay CR10,3 = 220 maneras de distribuir los premios si éstos son iguales.
Jorge Amores - ESTADISTICA
La Distribución Normal
1. La media, mediana y moda son coincidentes
2. Tiene una sola moda
3. Es asintótica al eje de las abscisas: el área bajo la curva es igual a 1
4. Es simétrica respecto a su media
5. Mientras mayor es el valor de más aplanada es la curva
6. El área bajo la curva entre ± 1 es igual al 68%; ± 2 es igual al 95%; ± 3 es igual al 99%
Jorge Amores - ESTADISTICA
Tipificación de Variables Se llama tipificación a la operación consistente en cambiar de una variable aleatoria X a otra variable Z de distribución tipificada, por medio de la expresión siguiente:
Z =
Ejemplo: conociendo que X = 18 y S = 3.2 calcular la probabilidad de que un valor Xi se ubique entre 15 y 25:
Z1 = = -0.94
Z2 = = 2.19
El área bajo la curva para estos valores es: 0.3264 y 0.4857
La probabilidad de que un valor Xi se ubique entre 15 y 25 será:
0.3264 + 0.4857 = 0.8121 81.21%
- 0.94 2.19
Jorge Amores - ESTADISTICA
Taller # 3 En la siguiente tabla se presentan los pesos de 30 pollos como parte representativa de un lote de 2.000
1. Calcule el valor del coeficiente de variación y determine si la muestra es representativa
2. Cuál es la probabilidad de que animales que pesan menos de 2.25 kg sean parte de este lote?
3. Cuál es la probabilidad de que hayan pollos que pesen más de 2.75 kg?
Número Peso, kg Número Peso, kg Número Peso, kg
1 2.05 11 2.82 21 2.70
2 2.28 12 2.48 22 2.42
3 2.60 13 2.50 23 2.89
4 2.75 14 2.70 24 2.50
5 2.60 15 2.30 25 2.45
6 2.48 16 2.38 26 2.60
7 2.44 17 2.69 27 2.38
8 2.80 18 2.47 28 2.39
9 2.90 19 2.45 29 2.60
10 2.65 20 2.68 30 2.65
Jorge Amores - ESTADISTICA
TALLER # 4
Se conoce que el peso promedio de un lote de
envases de mermelada es de 502 g., con una
desviación estándar de 4.25 g.
Calcular:
1. ¿Cuál es la probabilidad de encontrar envases con
más de 510 g. de peso?
2. ¿Cuál es la probabilidad de encontrar envases con
menos de 490 g. de peso?
3. ¿Cuál es la probabilidad de encontrar envases con
pesos entre 495 y 505 g. de peso? Jorge Amores - ESTADISTICA
Intervalos de Confianza
Es el conjunto de valores formado a partir de una muestra de datos,
de forma que exista la posibilidad de que el parámetro poblacional
(media) se encuentre dentro de dicho conjunto, con una probabilidad
específica. Esta probabilidad específica recibe el nombre de nivel de
confianza.
Los límites de confianza constituyen el rango o intervalo dentro del
cual se espera encontrar el verdadero valor del parámetro:
P(1 2) = 1 –α
En el que 1 y 2 son los límites inferior y superior del parámetro
poblacional , en tanto que α es el nivel de significación. Por tanto,
nivel de confianza = 1 - α
Jorge Amores - ESTADISTICA
Intervalo de confianza para la Media
Ejemplo: Calcular el intervalo de confianza para la media poblacional,
a partir de la siguiente información obtenida de una muestra de 30
unidades:
X = 41.25 S2 = 3.18
1. Se calcula la desviación estándar de la media (Sx):
Sx = Sx = = 0.33
2. Se calcula los límites inferior y superior del parámetro:
Li = X – Sx (tα) Ls = X + Sx (tα) para α = 5%:
Li = 41.25 – 0.33 (2,045) = 40.57
Ls = 41.25 + 0.33 (2,045) = 41.92
40.57 < < 41.92
Jorge Amores - ESTADISTICA
Uso de Intervalos de Confianza para verificar Hipótesis.
O Los intervalos de confianza permiten verificar hipótesis
planteadas respecto a parámetros poblacionales.
O Por ejemplo, supongamos que se plantea la hipótesis de
que el promedio de peso de nacimiento de cierta población
de primates es igual a la media nacional de 3250 gramos.
Jorge Amores - ESTADISTICA
Formular Hipótesis nula Ho e Hipótesis alternativa Ha
Seleccionar nivel de significación α
Identificar y aplicar estadístico de prueba
Tomar decisión: se acepta o se rechaza Ho
Prueba de Hipótesis
Jorge Amores - ESTADISTICA
Error Estadístico
Tipo I Se rechaza Ho cuando ésta es
verdadera
Tipo II Se acepta Ho
cuando ésta es falsa
Estos errores se pueden reducir:
Aumentando el número de repeticiones
Disminuyendo la desviación estándar Jorge Amores - ESTADISTICA
Prueba de “z”
Compara una media muestral con una media
poblacional
Permite comprobar una hipótesis que compara dos
muestras
Se utiliza cuando se cuentan con
muestras de tamaño grande
(>30 obs.)
Se asume independencia
entre las muestras
Jorge Amores - ESTADISTICA
Prueba de “z” para una muestra Muestra Peso Muestra Peso Muestra Peso
1 0.51 16 0.50 31 0.52
2 0.49 17 0.53 32 0.50
3 0.48 18 0.51 33 0.48
4 0.49 19 0.54 34 0.54
5 0.50 20 0.51 35 0.53
6 0.52 21 0.53 36 0.55
7 0.54 22 0.48 37 0.56
8 0.53 23 0.49 38 0.53
9 0.49 24 0.52 39 0.51
10 0.51 25 0.54 40 0.50
11 0.55 26 0.55 41 0.51
12 0.49 27 0.56 42 0.54
13 0.46 28 0.48 43 0.52
14 0.55 28 0.52 44 0.48
15 0.51 30 0.51 45 0.49
Una empresa farmacéutica
ha establecido que el peso
medio de un comprimido
debe ser igual a µ = 0.50 g.
Se tomó una muestra al
azar de 45 comprimidos de
un lote.
Determinar, al 5% de
significación si el peso de
los comprimidos de la
muestra, se ajusta al
requerimiento de la
empresa.
Ho: µ = x
Ha: µ ≠ x
Jorge Amores - ESTADISTICA
z =
Z = 3.90
Este valor de Z calculado debe compararse con el valor de Z tabular de la zona de rechazo al 5%:
0.5 – 0.025 = 0.475 Z = 1.96
Por lo tanto, se rechazará la Ho cuando
el valor de Z calculado > Z tabular
En este caso se rechaza la Ho a nivel del 5%
Conclusión: el peso de los comprimidos no se ajusta al requerimiento de la empresa farmacéutica
Prueba de “z” para una muestra
0.025 0.025
Jorge Amores - ESTADISTICA
Prueba de “z” para dos muestras Se utilizan dos métodos (A y B) para determinar el contenido de calorías por Kg de
30 muestras de raciones alimenticias. Se quiere conocer si los dos métodos
entregan resultados similares (Ho) o diferentes (Ha)
Muestra A B Muestra A B Muestra A B
1 335 347 11 330 329 21 345 349
2 362 359 12 325 338 22 334 351
3 338 359 13 338 346 23 323 348
4 329 334 14 336 345 24 344 346
5 333 341 15 334 340 25 344 348
6 371 391 16 331 348 26 348 350
7 356 334 17 327 356 27 350 352
8 341 341 18 328 352 28 349 347
9 334 347 19 329 338 29 339 340
10 335 314 20 340 329 30 340 338
Jorge Amores - ESTADISTICA
………Prueba de “z” 1. Cálculo de XA = 10.168
2. Cálculo de XB = 10.357
3. Promedio XA = 338,93
4. Promedio XB = 345,23
5. XA2 = 3 449.726
6. XB2 = 3 580.369
5. Suma de Cuadrados de XA = 3.451,87
6. Suma de Cuadrados de XB = 4.787,37
7. Varianza de XA = 119,03
8. Varianza de XB =165,08
9. Valor de “z” = = = -2.05
Jorge Amores - ESTADISTICA
………Prueba de “z”
Comprobación de la hipótesis: Ho: Método A = Método B
Ha: Método A ≠ Método B
Valor calculado de z = -2.05
Valor tabular para z (2.05) = 0.4798
Probabilidad = (0.500 – 0.4798) x 2 = 0.0404 4.04%
De manera que se rechaza la hipótesis Ho a nivel del 5%, es decir los dos métodos son diferentes con un nivel de confianza del 95%
Para niveles de significación del 5% siempre que z calculada sea mayor a |1.96| se rechaza la Ho
Para niveles de significación del 1% siempre que z calculada sea mayor a |2.57| se rechaza la Ho
Jorge Amores - ESTADISTICA
Análisis de Regresión y
Correlación Lineal Son técnicas estadísticas que se utilizan para
explicar el comportamiento de variables que intervienen en la investigación.
Su principal uso es para explicar asociaciones entre variables cuantitativas
Se puede introducir variables cualitativas previamente codificadas
La correlación mide la dirección y fuerza de asociación entre dos variables
La regresión establece una relación de causalidad o dependencia entre las variables
Jorge Amores - ESTADISTICA
Regresión Lineal Simple
Establece la relación que existe entre dos variables cuantitativas
Una de las variables debe ser considerada como dependiente,
criterio o respuesta y la otra como variable independiente,
predictiva o explicativa
Se pueden realizar predicciones de la variable dependiente
Se construye un modelo estadístico, cuya forma general es:
Jorge Amores - ESTADISTICA
Regresión Lineal Simple
El modelo de regresión lineal se ajusta a la ecuación de la línea
recta:
El proceso de cálculo de los coeficientes a y b es el siguiente:
Coeficiente b =
SPXY = XY –
SCX = X2 –
Coeficiente a = Y - bX Jorge Amores - ESTADISTICA
Ejemplo de Regresión Lineal Se realizó un estudio para conocer la influencia de la
precipitación en la disminución de la cantidad de
contaminación atmosférica, en diez localidades:
Localidad Precipitación mm
Disminución de Contaminación, ppm
1 18 55
2 7 17
3 14 36
4 31 85
5 21 62
6 5 18
7 11 33
8 16 41
9 26 63
10 29 87
Jorge Amores - ESTADISTICA
Ejemplo de Regresión Lineal
Con los datos anteriores:
1. Realizar un gráfico en el que se visualice la
relación entre las variables
2. Calcular los parámetros a y b de la ecuación
de regresión lineal
3. Realizar el análisis de varianza de la regresión
4. Realizar la interpolación para valores de
precipitación: X= 15 X = 20 X= 25
5. Construir intervalos de confianza al 5% para b
Jorge Amores - ESTADISTICA
Gráfico de la Regresión
y = 1.0213 + 2.7348 x
r² = 0.962
0
10
20
30
40
50
60
70
80
90
100
0 5 10 15 20 25 30 35
Dis
min
ució
n C
on
tam
ina
ció
n, p
pm
Precipitación, mm
Disminución de Contaminación, ppm
Jorge Amores - ESTADISTICA
Cálculo de los Parámetros a y b Loc. Precipitación
(X) Contaminación
(Y) X2 Y2 XY
1 18 55
324 3.025 990
2 7 17 49 289 119
3 14 36
196 1.296 504
4 31 85
961 7.225 2.635
5 21 62
441 3.844 1.302
6 5 18 25 324 90
7 11 33
121 1.089 363
8 16 41
256 1.681 656
9 26 63
676 3.969 1.638
10 29 87
841 7.569 2.523
178 497 3.890 30.311 10.820
X 17.8 49.7
Jorge Amores - ESTADISTICA
Cálculo de los Parámetros a y b
1. SPXY = XY – = 10.820 - =
1.973,40
1. SCX = X2 – = 3.890 - = 721,60
2. Coeficiente b = = = 2,735
4. Coeficiente a = Y – b X = 49,70 – 2,735 (17,80) = 1,02
Jorge Amores - ESTADISTICA
Análisis de Varianza de la Regresión
1. Suma de Cuadrados Total: SCT =Y2 - = 30.311 -
SCT = 5.610,10
2. Suma de Cuadrados de la Regresión: SCR = a Y + b XY –
SCR = 1,11 (497) + 2,73 (10.820) - = 5.389,37
3. Suma de Cuadrados del Error: SCE = SCT – SCR
SCE = 5.610,10 – 5.389,37 = 220,73
Jorge Amores - ESTADISTICA
Análisis de Varianza de la Regresión
Fuente de
Variación
Grados de
Libertad
Suma de
Cuadrados
Cuadrados
Medios
F
Total 9 5.610,10
Regresión 1 5.389,37 5.389,37 195,33
Error 8 220,73 27,59
Prueba de Hipótesis: Ho: b = 0 Ha: b≠ 0
Valor de F tabular con 1 y 8 gl: α 0,05 = 5,32 α 0,01 = 11,26
Dado que F calculado > F tabular tanto al 5% como al 1%: se
rechaza Ho y se acepta H1, es decir la pendiente b es diferente de
cero, ya que si existe una relación lineal altamente significativa
entre precipitación y disminución de la contaminación
Jorge Amores - ESTADISTICA
Pronóstico de valores de Y
Mediante la resolución de la ecuación de la
regresión, se pueden estimar valores de Y a
partir de valores conocidos de X:
1. X = 15: Y = 1,02 + 2,73 (15) = 41,97
2. X = 20: Y = 1,02 + 2,73 (20) = 55,62
3. X = 25: Y = 1,02 + 2,73 (25) = 69,27
Jorge Amores - ESTADISTICA
Intervalos de confianza para el coeficiente de regresión
1. Intervalo de confianza al 95%: b ± Sb (t tab, 0.05, n-2 gl)
2. Cálculo del error estándar de b (Sb):
Sb = = = 0,195
3. Valor t tabular nivel α 5%, con 8 gl = 2,336
4. Límite inferior: LI = 2,73 – (0,195 * 2,336) = 2,27
5. Límite superior: LS = 2,73 + (0,195 * 2,336) = 3,19
6. Intervalo de confianza al 95% para b:
2,27 2,73 3,19
Jorge Amores - ESTADISTICA
Coeficiente de Determinación (r2)
Indica el grado de ajuste de la recta de regresión a los valores de la
muestra, es decir, mide la proporción de la variación en Y que
explica la variación independiente X en el modelo de regresión.
Los valores de r2 varían de 0 a 1. Un valor cercano a 0 indica que no
hay relación lineal entre las variables. Un valor cercano a 1 indica
un ajuste lineal perfecto.
r2 =
SCR = Suma de Cuadrados de la Regresión
SCT = Suma de Cuadrados Total
Jorge Amores - ESTADISTICA
Coeficiente de Determinación (r2)
El valor del coeficiente r2 para el ejemplo de la relación entre precipitación y disminución de la contaminación, se calcula de la siguiente manera:
r2 = = 0.96
Es decir que el 96% de las variaciones en la disminución de la contaminación, es explicada por las variaciones en la precipitación
Jorge Amores - ESTADISTICA
Coeficiente de Correlación (r)
Representa el grado de la intensidad de asociación entre dos
variables, o el grado en que dos variables cambian una con
respecto a la otra. El coeficiente r toma valores entre -1 y +1,
de acuerdo a la fuerza de la asociación y si la relación es
inversa o directa.
r = ó también r = r2
El signo del coeficiente r es el mismo que el del coeficiente de
regresión b
El coeficiente r no varía al variar la escala de medición
Jorge Amores - ESTADISTICA
Coeficiente de Correlación (r)
r = +1 r = 0 r = -1
Correlación perfecta positiva Correlación perfecta negativa Sin correlación
Jorge Amores - ESTADISTICA
Prueba de Hipótesis para r Las hipótesis nula y alternativa se plantean como:
Ho: r = 0 Ha: r ≠ 0
Una forma de comprobar la Ho es comparar el valor calculado de
r con el valor tabular correspondiente para r al nivel α escogido
(5% o 1%) y con n – 2 grados de libertad.
Otra forma es calculando el valor de “t” de la siguiente manera:
t =
El valor calculado de t se compara con el valor tabular de la tabla
de t al nivel α escogido (5% o 1%) y con n – 2 grados de libertad Jorge Amores - ESTADISTICA
Cálculo del coeficente r
El valor de r para el ejemplo de la relación entre precipitación y
disminución de la contaminación, será:
r = = = 0,98
ó directamente:
r = r2 = 0,96 = 0,98
Jorge Amores - ESTADISTICA
Prueba de Hipótesis para r
Prueba de Ho: r = 0 Ha: r ≠ 0
r tabular al 5% con 8 gl = 0,632
Como r calculado (0,98) > r tabular (0,632), se rechaza Ho y se
acepta Ha
Comprobación usando valor tabular de t:
t = = = 13,86
t al 5% con 8 gl = 2,306
Como t calculado > a t tabular se rechaza Ho y se acepta Ha
Jorge Amores - ESTADISTICA
Prueba de Ji Cuadrado
(X2)
Bondad de Ajuste
Comprueba el ajuste entre
valores observados y
esperados
Independencia Comprueba la
independencia de variables
Jorge Amores - ESTADISTICA
Ji Cuadrado (X2) para Bondad
de Ajuste
Prueba el ajuste entre las frecuencias observadas de una
muestra y las frecuencias esperadas de una distribución
hipotética. Es decir las discrepancias entre la teoría y la
realidad.
Esta prueba puede utilizarse incluso con datos medibles en una
escala nominal.
La hipótesis nula (Ho) de la prueba Ji Cuadrado postula una
distribución de probabilidad totalmente especificada, como el
modelo matemático de la población que ha generado la
muestra, es decir:
Ho: valores observados = valores esperados
Jorge Amores - ESTADISTICA
Ji Cuadrado (X2) para Bondad
de Ajuste
El procedimiento es el siguiente:
1. Arreglar las observaciones en una tabla de contingencias
2. Determinar el valor teórico de las frecuencias para cada casilla
3. Calcular las diferencias entre valores observados y esperados
4. Elevar al cuadrado las diferencias y dividirlas entre el valor
esperado correspondiente
5. La sumatoria de los valores anteriores es el estadístico X2
6. Obtener el valor tabular crítico de X2 con k – 1 grados de
libertad y nivel de significación α
7. Decidir si se acepta o rechaza la hipótesis. Cuando X2c X2t
se rechaza Ho Jorge Amores - ESTADISTICA
Ejemplo de X2 para Bondad de
Ajuste Se conoce que la distribución del grupo sanguíneo es una característica típica de la población. Por estudios previos se ha establecido que cierta etnia presenta para los grupos sanguíneos A, B, AB y O los siguientes porcentajes: 35, 10, 6 y 49. Al tomar una muestra de 200 individuos de una zona cercana, los valores observados para estos grupos sanguíneos fueron 85, 38, 17 y 60 respectivamente.
Se desea conocer si la muestra de los 200 individuos pertenece a la etnia en mención.
Jorge Amores - ESTADISTICA
X2 para Bondad de Ajuste
1. Tabla de contingencia para valores observados y esperados
2. Cálculo de X2:
3. X2 = =
4. X2 = 3.21 + 16.20 + 2.08 + 14.73 = 36.22
Frecuencias Grupos Sanguíneos
A B AB O
Observadas 85 38 17 60
Esperadas 200 * 0.35 =
70
200 * 0.1 =
20
200 * 0.06 = 12 200 * 0.49 =
98
Jorge Amores - ESTADISTICA
Prueba de Hipótesis de X2
Ho: la población muestreada pertenece a la etnia
Ha: la población muestreada no pertenece a la etnia
1. Grados de libertad: k – 1: 4 – 1 = 3
2. X2 tabular, al 5% y 3 gl = 7.81
3. Dado que X2 calculado > X2 tabular, 36.22 > 7.81 se rechaza
Ho
4. Conclusión: la población muestreada no pertenece a la etnia
en referencia
Jorge Amores - ESTADISTICA
TALLER
Un estudio de mercado para lanzar un nuevo producto, determinó el siguiente comportamiento de una muestra de 200 personas tomadas como parte del universo de potenciales consumidores:
Muy satisfechos 110
Medianamente satisfechos 40
Poco satisfechos 20
Nada satisfechos 30
Estudios anteriores para productos similares, determinaron que la proporción esperada en el comportamiento de los consumidores debería ser:
Muy satisfechos 68%
Medianamente satisfechos 16%
Poco satisfechos 10%
Nada satisfechos 6%
Compruebe la hipótesis a nivel del 5% de que el nuevo producto tiene una aceptación en los consumidores que se ajusta a las proporciones esperadas
Jorge Amores - ESTADISTICA
Ji Cuadrado (X2) para Independencia
La prueba de X2 se usa también para probar la independencia
de variables.
Con los valores observados se construyen tablas de
contingencia, que son tablas de doble entrada en las que se
presentan las diferentes combinaciones de las variables que se
analizan.
Se calculan los valores esperados de la siguiente manera:
Valor esperado =
Jorge Amores - ESTADISTICA
Ejemplo de X2 para Independencia
Se realizó una encuesta al azar en la universidad a un grupo
de 250 estudiantes, para conocer su preferencia por ciencias
exactas (CE), sociales (CS) o humanas (CH), obteniéndose los
siguientes resultados:
Se quiere probar la Ho: no existe preferencia de género para
escoger las carreras en las tres áreas muestreadas de la
universidad
Género CE CS CH Total
Femenino 21 64 45 130
Masculino 34 38 48 120
Total 55 102 93 250
Jorge Amores - ESTADISTICA
Ejemplo de X2 para
Independencia 1. Cálculo de las frecuencias esperadas:
2. Cálculo de X2:
X2 =
X2 = 2.02 + 2.26 + 0.23 + 2.19 + 2.45 + 0.25 = 9.40
Género CE CS CH Total
Femenino =
28.60
= 53.04 =
48.36
130
Masculino =
26.40
=
48.96
=44.64
120
Total 55 102 93 250
Jorge Amores - ESTADISTICA
Prueba de Hipótesis para X2
Para probar Ho: no existe preferencia de género para
escoger las carreras, se procede:
El valor calculado de X2 debe ser contrastado con el valor
tabular de la distribución de X2 al nivel de significación α
escogido y con (r filas – 1) * (c columnas -1)
X2 tab 0.05, 2 gl = 5.99
Dado que X2 calculado (9.40) > X2 tabular (5.99) se
rechaza la Ho , consecuentemente se acepta Ha: si existe
preferencia de género para escoger las carreras
Jorge Amores - ESTADISTICA
TALLER
En una investigación sobre la enfermedad diarreica en niños menores de seis años, un
médico tuvo interés de conocer si existían diferencias en la incidencia de la enfermedad
respecto a la condición socioeconómica de una población a la que estudió.
El estudio se realizó con una muestra de 167 niños y se planteó la Ho: no existen
diferencias en la incidencia de la enfermedad en las tres clases socioeconómicas. La Ha: la
enfermedad incide de forma diferente de acuerdo a la condición socioeconómica.
Los siguientes fueron los datos observados:
Condición socioeconómica Con diarrea Sin diarrea Total
Alta 15 25 40
Media 20 32 52
Baja 60 15 75
Total 95 72 167
Calcule los valores esperados y realice la prueba de hipótesis de independencia de variables
a nivel del 5% e interprete los resultados
Jorge Amores - ESTADISTICA