Portafolio de estadistica
-
Upload
jesepozo1992 -
Category
Documents
-
view
495 -
download
11
Transcript of Portafolio de estadistica
![Page 1: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/1.jpg)
PORTAFOLIO DE ESTADÍSTICA INFERENCIAL
UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI
ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL INTERNACIONAL
Tulcán – Ecuador
1
DOCENTE: MSC. JORGE POZO
INTEGRANTE:
JESENIA POZO
MARZO 2012- AGOSTO 2012
![Page 2: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/2.jpg)
INTRODUCCION
La estadística inferencial es necesaria cuando queremos hacer alguna
afirmación sobre más elementos de los que vamos a medir. La estadística
inferencial hace que ese salto de la parte al todo se haga de una manera
“controlada”. Aunque nunca nos ofrecerá seguridad absoluta, sí nos ofrecerá
una respuesta probabilística. Esto es importante: la estadística no decide;
sólo ofrece elementos para que el investigador o el lector decidan. En
muchos casos, distintas personas perciben diferentes conclusiones de los
mismos datos.
El proceso será siempre similar. La estadística dispone de multitud de
modelos que están a nuestra disposición. Para poder usarlos hemos de
formular, en primer lugar, una pregunta en términos estadísticos. Luego
hemos de comprobar que nuestra situación se ajusta a algún modelo (si no
se ajusta no tendría sentido usarlo). Pero si se ajusta, el modelo nos
ofrecerá una respuesta estadística a nuestra pregunta estadística. Es tarea
nuestra devolver a la psicología esa respuesta, llenándola de contenido
psicológico.
La estadística descriptiva, como indica su nombre, tiene por finalidad
describir. Así, si queremos estudiar diferentes aspectos de, por ejemplo, un
grupo de personas, la estadística descriptiva nos puede ayudar. Lo primero
será tomar medidas, en todos los miembros del grupo, de esos aspectos o
variables para, posteriormente, indagar en lo que nos interese. Sólo con
esos indicadores ya podemos hacernos una idea, podemos describir a ese
conjunto de personas.
2
![Page 3: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/3.jpg)
OBJETIVO DE LA ESTADÍSTICA
La estadística es el conjunto de técnicas que se emplean para la
recolección, organización, análisis e interpretación de datos. Los datos
pueden ser cuantitativos, con valores expresados numéricamente, o
cualitativos, en cuyo caso se tabulan las características de las
observaciones. La estadística sirve en administración y economía para tomar
mejores decisiones a partir de la comprensión de las fuentes de variación y
de la detección de patrones y relaciones en datos económicos y
administrativos.
JUSTIFICACIÓN
El presente portafolio tiene como justificación recolectar todo el trabajo dado
en clases como portafolio de apoyo del estudiante y además ampliar mas el
contenido con investigaciones bibliográficas de libros ya que esto nos
permitirá analizar e indagar de los temas no entendidos para auto educarse
el estudiante y así despejar los dudas que se tiene con la investigación y el
análisis de cada uno de los capítulos ya que la estadística inferencial es
amplia y abarca problemas que estas relacionados con el entorno para
poder sacar nuestras propias decisiones ya que la estadística inferencial nos
ayudara a la carrera en la que estamos siguiendo como lo es comercio
exterior ampliar mas nuestros conocimientos y utilizar más el razonamiento y
sacar conclusiones adecuadas según el problema que se presente en el
entorno ay que las matemáticas y la estadística nos servirá a futuro para así
poderlos emplear a futuro .
3
![Page 4: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/4.jpg)
CAPITULO I
EL SISTEMA INTERNACIONAL DE UNIDADES
Las unidades del sistema internacional de unidades se clasifican en
fundamentales y derivadas. Las unidades fundamentales no se pueden
reducir. Se citan las unidades fundamentales de interés en la asignatura de
ciencias e ingenierías de os materiales.
Las unidades derivadas se expanden en función de las unidades
fundamentales utilizando signos matemáticos de multiplicación y de división.
Por ejemplo las unidades de densidad del sí son el kilogramo por metro
cubico algunas unidades derivadas tienen nombres y símbolos especiales.
Unidad de masa El kilogramo (kg) es igual a la masa del prototipo
internacional del kilogramo (Diaz, 2008)
Unidad de tiempo El segundo (s) es la duración de 9 192 631 770 periodos
de la radiación correspondiente a la transición entre los dos niveles
HIPERFINOS del estado fundamental del átomo de cesio 133. (Diaz, 2008)
Unidad de intensidad de corriente eléctrica El ampere (A) es la intensidad
de una corriente constante que manteniéndose en dos conductores
paralelos, rectilíneos, de longitud infinita, de sección circular despreciable y
4
![Page 5: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/5.jpg)
situados a una distancia de un metro uno de otro en el vacío, produciría una
fuerza igual a 2·10-7 newton por metro de longitud. (Diaz, 2008)
Unidad de temperatura termodinámica El kelvin (K), unidad de
temperatura termodinámica, es la fracción 1/273,16 de la temperatura
termodinámica del punto triple del agua. (Diaz, 2008)
Unidad de cantidad de sustancia El mol (mol) es la cantidad de sustancia
de un sistema que contiene tantas entidades elementales como átomos hay
en 0,012 kilogramos de carbono 12. (Diaz, 2008)
Unidad de intensidad luminosa La candela (CD) es la unidad luminosa, en
una dirección dada, de una fuente que emite una radiación monocromática
de frecuencia 540·1012 HERTZ y cuya intensidad energética en dicha
dirección es 1/683 WATT por estereorradián. (Diaz, 2008)
Peso: es una magnitud derivada se considera como una unidad vectorial.
(Diaz, 2008)
Escalar: aquel que indica el número y la unidad. (Diaz, 2008)
Vector: indica número unidad dirección etc. (Diaz, 2008)
Magnitud derivada: el peso de la unidad newton es una unidad de fuerza.
(Diaz, 2008)
Gravedad: es la que permite a los cuerpos caer en perpendiculares según la
gravedad de la tierra (Diaz, 2008)
MULTIPLOS Y SUBMULTIPLOS
Múltiplo
Un múltiplo de un número es otro número que lo contiene un número entero
de veces. En otras palabras, un múltiplo de n es un número tal que, dividido
por n, da por resultado un número entero Los primeros múltiplos del uno al
diez suelen agruparse en las llamadas tablas de multiplicar. (Pineda, 2008)
5
![Page 6: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/6.jpg)
Submúltiplo
Un número entero a es submúltiplo de otro número b si y sólo si b es múltiplo
de a, (Pineda, 2008).
COMENTARIO:
El Sistema Internacional de Unidades (SI) tiene la finalidad de: Estudiar el
establecimiento de un conjunto de reglas para las unidades de medida y
como estudiantes de comercio exterior nos ayuda muchísimo porque con el
podemos obtener los resultados al almacenar una mercancía en el
contenedor sin perder el tiempo que es valioso en la carrera, y también si
perder el espacio dentro de dicho contenedor.
El sistema internacional de unidades es estudiado para obtener datos reales
y a su vez poder dar nuestros resultados sacando conclusiones propias de la
carrera Para una comunicación científica apropiada y efectiva, es esencial
que cada unidad fundamental de magnitudes de un sistema, sea
especificada y reproducible con la mayor precisión posible.
6
![Page 7: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/7.jpg)
ORGANIZADOR GRAFICO:
7
Sistema Internacional de Medidas y Unidades
Magnitudes fundamentales
Una magnitud fundamental
es aquella que se define
por sí misma y es
independiente de las
demás (masa, tiempo,
longitud, etc.).
Magnitudes derivadas
Para resolver el problema que suponga la utilización de unidades diferentes en distintos lugares del mundo, en la XI Conferencia General de Pesos y Medidas (París, 1960) se estableció el Sistema Internacional de Unidades (SI). En el cuadro siguiente puedes ver las magnitudes fundamentales del SI, la unidad de cada una de ellas y la abreviatura que se emplea para representarla:
Son la que
dependen de las
magnitudes
fundamentales.
Múltiplos Submúltiplos
Un número es un
submúltiplo si otro lo
contiene varias veces
exactamente. Ej.: 2 es
un submúltiplo de 14,
Un múltiplo de n es un número tal que,
dividido por n, da por resultado un número
entero
![Page 8: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/8.jpg)
TRABAJO # 1
MÚLTIPLOS Y SUBMÚLTIPLOS
MÚLTIPLOS.- Se pueden obtener múltiplos de cualquier número, son
aquellos que se obtiene al sumar el mismo número varias veces o al
multiplicarlo por cualquier número. (son infinitos), (Aldape & Toral, 2005,
pág. 94).
Ejemplo:
Múltiplos de 5:
5-10-15-20-25-30-35-405-500-1000
SUBMÚLTIPLOS.- Los submúltiplos son todo lo contrario, son las divisiones
exactas de un número, (Aldape & Toral, 2005).
Por ejemplo :
Submúltiplos de 30:
6, 10, 5, 2, 3, etc.
8
![Page 9: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/9.jpg)
MAGNITUDES FUNDAMENTALES Y DERIVADAS
LAS MAGNITUDES FUNDAMENTALES.- Una magnitud fundamental es
aquella que se define por sí misma y es independiente de las demás (masa,
tiempo, longitud, etc.).
LONGITUD: Es la medida del espacio o la distancia que hay entre
dos puntos. La longitud de un objeto es la distancia entre sus
extremos, su extensión lineal medida de principio a fin, (Serway &
Faughn, 2006).
MASA: Es la magnitud que cuantifica la cantidad de materia de un
cuerpo, (Serway & Faughn, 2006).
TIEMPO: Es la magnitud física que mide la duración o separación de
acontecimientos sujetos a cambio, de los sistemas sujetos a
observación, (Serway & Faughn, 2006).
INTENSIDAD DE CORRIENTE ELECTRICA: Se denomina
intensidad de corriente eléctrica a la cantidad de electrones que pasa
a través de una sección del conductor en la unidad de tiempo,
(Serway & Faughn, 2006).
TEMPERATURA: Es una magnitud referida a las nociones comunes
de calor o frío. Por lo general, un objeto más "caliente" tendrá una
temperatura mayor, (Serway & Faughn, 2006).
INTENSIDAD LUMINOSA: En fotometría, la intensidad luminosa se
define como la cantidad flujo luminoso, propagándose en una
dirección dada, que emerge, atraviesa o incide sobre una superficie
por unidad de ángulo solido, (Enríquez, 2002).
CANTIDAD DE SUSTANCIA: Su unidad es el mol. Surge de la
necesidad de contar partículas o entidades elementales
microscópicas indirectamente a partir de medidas macroscópicas
(como la masa o el volumen). Se utiliza para contar partículas,
(Enríquez, 2002).
9
![Page 10: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/10.jpg)
MAGNITUDES DERIVADAS.- Son la que dependen de las magnitudes
fundamentales.
VELOCIDAD: Es la magnitud física que expresa la variación de
posición de un objeto en función del tiempo, o distancia recorrida por
un objeto en la unidad de tiempo, (Enríquez, 2002).
AREA: Área es la extensión o superficie comprendida dentro de una
figura (de dos dimensiones), expresada en unidades de medida
denominadas superficiales, (Enríquez, 2002).
VOLUMEN: Es una magnitud definida como el espacio ocupado por
un cuerpo, (Enríquez, 2002).
FUERZA: se puede definir como una magnitud vectorial capaz de
deformar los cuerpos (efecto estático), modificar su velocidad o
vencer su inercia y ponerlos en movimiento si estaban inmóviles,
(Enríquez, 2002).
TRABAJO: El trabajo, en mecánica clásica, es el producto de una
fuerza por la distancia que recorre y por el coseno del ángulo que
forman ambas magnitudes vectoriales entre sí, (Enríquez, 2002).
La unidad del trabajo es el JOULE.
ENERGIA: Es una magnitud física abstracta, ligada al estado
dinámico de un sistema y que permanece invariable con el tiempo en
los sistemas aislados. La unidad de la energía es el Joule, (Enríquez,
2002).
10
![Page 11: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/11.jpg)
Fórmulas de área y volumen de cuerpos geométricos
Figura Esquema Área Volumen
Cilindro
Esfera
Cono
Cubo A = 6 a2 V = a3
PrismaA = (perim. base •h) + 2 •
area base
V = área base •
h
Pirámide
11
![Page 12: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/12.jpg)
CONCLUSIONES
El sistema internacional de unidades es muy importante porque se
involucra en nuestra carrera permitiendo la relación económica con
otros países mediante comercio internacional y su negociación entre
ellos. como también la práctica de problemas del sistema
internacional de unidades nos ayudan a ver la realidad de nuestro
entorno de cómo podemos solucionar problemas al momento de
exportar una mercancía, que cantidad de materia prima,
electrodomésticos, enceres que actualmente se exporta en gran
cantidad, puede alcanzar dentro de un contenedor.
El sistema internacional de unidades nos ayudan a vincularnos en los
negocios, como realizar negociaciones en el exterior porque a través
de este sistema podemos indicar el volumen, área, del tipo de
trasporte el cual se va a exportar la mercancía, que cantidad de cajas
por ejemplo podemos enviar al exterior este sistema es muy
fundamental en la carrera de comercio exterior.
Recomendaciones
Se recomienda saber todas las medidas del sistema internacional de
unidades como también las magnitudes , longitud, masa y volumen de
las figuras geométrica para que nuestro producto o mercancía pueda
ser exportada al exterior, es necesario conocer debido a que nos
permitirá realizar una buena negociación conociendo la cantidad de
mercancía que puede introducirse en el transporte.
Es de mucha importancia, que como estudiantes de la carrera de
comercio exterior conozcamos las unidades básicas más utilizadas
que se encuentran presentes en el Sistema internacional para una
correcta aplicación en los ejercicios propuestos. La utilización de las
medidas del Sistema Internacional se presenta a nivel internacional y
12
![Page 13: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/13.jpg)
por ende son aplicadas en el los negocios de Comercio Internacional
ya que permite una mejor movimiento e intercambio.
13
![Page 14: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/14.jpg)
BIBLIOGRAFÍA
Aldape, A., & Toral, C. (2005). Matemáticas 2. México: PROGRESO S.A.
Altamirano, E. (2007).
Anderson, D. R. (2005). Estadística para Administración y Economía. México: Cengage Learning.
Diaz, R. G. (2008). Unidades fundamentales .
Enríquez, H. (2002). Fundamentos de Electricidad. México: LIMUSA S.A.
Física, E. d. (1997). Brian Mckittrick. Madrid: Reverté S.A.
García, M. A. (2000). Estadística Avanzada con el Paquete Systat. Murcia: I.S.B.N.
J.R, W. D. (20007). Ciencias e Ingenieria de las Materias .
14
![Page 15: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/15.jpg)
Pineda, L. (2008). matematicas.
Rodrígues, M. E. (2001). Coeficientes de Asociación. México: Plaza y Valdés.
Sabadías, A. V. (2001). Estadística Descriptiva e Inferencial . Murcia: COMPOBELL.
Serway, R. A., & Faughn, J. S. (2006). FÍSICA para bachillerato general. New York: THOMSON.
Weiers, R. M. (2006). Introducción a la Estadística para Negocios. México: Learning Inc.
Willliams, T. A. (2008). Estadística para Administración y Economía. México: Cengage Learning.
LINKOGRAFIA
http://www.sc.ehu.es/sbweb/fisica/unidades/unidades/unidades.htm
file:///K:/Tabla-de-Magnitudes-Unidades-Y-Equivalencias.htm
file:///K:/books.htm
file:///K:/volumenes/areas_f.html
file:///K:/cuerposgeoAreaVolum.htm
ANEXOS:
1.- Convertir 2593 Pies a Yardas.
15
![Page 16: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/16.jpg)
2.- Convertir 27,356 Metros a Millas
3.- Convertir 386 Kilogramos a Libras.
4.- Convertir 2,352 Segundos a Año.
5.- Convertir 1.1 Millas/Hora a Metros/Segundo.
16
![Page 17: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/17.jpg)
TRANSFORMACIONES
En muchas situaciones tenemos que realizar operaciones con magnitudes
que vienen expresadas en unidades que no son homogéneas. Para que los
cálculos que realicemos sean correctos, debemos transformar las unidades
de forma que se cumpla el principio de homogeneidad, (Ledanois & Ramos,
2002).
Por ejemplo, si queremos calcular el espacio recorrido por un móvil que se
mueve a velocidad constante de 72 Km/h en un trayecto que le lleva 30
segundos, debemos aplicar la sencilla ecuación S = v·t, pero tenemos el
problema de que la velocidad viene expresada en kilómetros/hora, mientras
que el tiempo viene en segundos. Esto nos obliga a transformar una de las
dos unidades, de forma que ambas sean la misma, para no violar el principio
de homogeneidad y que el cálculo sea acertado, (Ledanois & Ramos, 2002).
Para realizar la transformación utilizamos los factores de conversión.
Llamamos factor de conversión a la relación de equivalencia entre dos
unidades de la misma magnitud, es decir, un cociente que nos indica los
valores numéricos de equivalencia entre ambas unidades, (Ledanois &
Ramos, 2002).
EJERCICIOS REALIZADOS EN CLASE
Volumen 300m3 transformar en pulgadas 3
v=300m3X (100)3¿¿
V= 100000mmh
ms
17
![Page 18: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/18.jpg)
V= 100000mmh
x4m
1000m ,mx
1h3600 s
=0 .028ms
Q= 7200000 PULGADA
h8transformar
litros
s2
Q=7200000pulgada3
h8 X (2 .54 )3 ¿¿
Vol. Paralelepípedo L x a x h
Vol. Cubo a3
Vol. Esfera 43II R3
Vol. Cilindro II R2hVol. Pirámide A X B
3
Área cuadrada l2
Área de un rectángulo B x h
Área de un circulo II R2
Área de un triangulo b X h2
En una bodega tiene un largo de 60 m un ancho de 30 m cuantas cadjas de
manzana puede ubicar en esta bodega en estas cajas tiene 60cm de lado y
30 de ancho y 40 de altura.
Vol. de p bodega = l x a h = 60 x 30 x3 = 5400 m3
Vol. De p caja = 60 x 30 x 40 = 72000 cm3
TRANSFORMACIÓN
18
![Page 19: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/19.jpg)
72000cm3 x1m3
1000000cm3 =0.0072m3
X= 1caja x54000m3
0.072m3 =75000cajas
Un tanquero tiene una longitud de 17 m y un radio del tanque de 1.50 m.
¿Cuántos litros se puede almacenar en dicho tanque?.
RESOLUCION
VOL. CILINDRO = II R2h
VOL. CILINDRO= 3.1416 X (1.50¿2 X (17)= 0 120.17 m3
TRANSFORMACIÓN
120.17 m3 x1000000 cm3
1m3 x1 l
100 cm3 =120165 .20 litros
SISTEMA INTERNACIONAL DE UNIDADES
19
![Page 20: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/20.jpg)
LONGITUD
1 Km 1000 m
1 m 100 cm
1 cm 10 mm
1 milla 1609 m
1 m 1000 mm
MASA
1qq 100 lbs.
1 Kg 2.2 lbs.
1 qq 45.45 Kg
1 qq 1 arroba
1 arroba 25 lbs.
1 lb 454 g
1 lb 16 onzas
1 utm 14.8 Kg
1 stug 9.61 Kg
1 m 10 Kg
1 tonelada 907 Kg
ÁREA
m2 100 cm2
1 m2 10000 cm2
1 hectárea 10000 m2
1 acre 4050 m2
1 pie (30.48 cm¿2
1 pie 900.29 cm2
1 m2 10.76 pies2
COMENTARIO EN GRUPO:
20
![Page 21: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/21.jpg)
Como comentario en grupo podemos decir que las transformaciones nos
servirá en la carrera del comercio exterior y además poder resolver
problemas que se presenten ya que al realizar ejercicios de cilindros y
tanque etc., y otras formas geométricas nos servirá para determinar cuántas
cajas o bultos, etc. que pueden alcanzar en una almacenera o en cada uno
de los contenedores esto nos servirá al realizar prácticas o al momento de
emprender nuestro conocimientos a futuro.
ORGANIZADOR GRAFICO:
LONGITUD
21
![Page 22: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/22.jpg)
Observamos que desde los submúltiplos, en la parte inferior, hasta los
múltiplos, en la parte superior, cada unidad vale 10 veces más que la
anterior, (Riley & Sturges, 2004).
LONGITUD1 KM 100 M1 M 100M, 1000MM1 MILLA 1609M1 PIE 30,48CM, 0,3048M1 PULGADA 2,54CM1 AÑO LUZ 9,46X1015M
TIEMPO.
El tiempo es la magnitud física con la que medimos la duración o separación
de acontecimientos sujetos a cambio, de los sistemas sujetos a observación,
esto es, el período que transcurre entre el estado del sistema cuando éste
aparentaba un estado X y el instante en el que X registra una variación
perceptible para un observador (o aparato de medida). El tiempo ha sido
frecuentemente concebido como un flujo sucesivo de situaciones
atomizadas, (López, March, García, & Álvarez, 2004).
MEDIDAS DEL TIEMPO1 AÑO 365 DIAS1 MES 30 DIAS1SEMANA 7 DIAS1 DIA 24 HR1 HORA 60 MIN,3600SEG1 MINUTO 60 SEG.
MASA Y PESO.
La masa es la única unidad que tiene este patrón, además de estar en
Sevres, hay copias en otros países que cada cierto tiempo se reúnen para
ser regladas y ver si han perdido masa con respecto a la original. El
kilogramo (unidad de masa) tiene su patrón en: la masa de un cilindro
fabricado en 1880, compuesto de una aleación de platino-iridio (90 % platino
- 10 % iridio), creado y guardado en unas condiciones exactas, y que se
22
![Page 23: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/23.jpg)
guarda en la Oficina Internacional de Pesos y Medidas en Seres, cerca de
París, (Hewitt, 2004).
PESO
De nuevo, atención a lo siguiente: la masa (la cantidad de materia) de cada
cuerpo es atraída por la fuerza de gravedad de la Tierra. Esa fuerza de
atracción hace que el cuerpo (la masa) tenga un peso, que se cuantifica con
una unidad diferente: el Newton (N), (Torre, 2007).
SISTEMA DE CONVERSION DE MASA1 TONELADA
1000 KG
1 QQ 4 ARROBAS, 100 L1 ARROBA 25 L1 KG 2,2 L
1 SLUG 14,58 KG1 UTM 9,8 KG1 KG 1000 GR1 L 454 GR, 16 ONZAS
TRABAJO # 2
23
![Page 24: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/24.jpg)
24
![Page 25: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/25.jpg)
25
![Page 26: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/26.jpg)
26
![Page 27: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/27.jpg)
27
![Page 28: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/28.jpg)
28
![Page 29: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/29.jpg)
29
![Page 30: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/30.jpg)
30
![Page 31: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/31.jpg)
31
![Page 32: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/32.jpg)
32
![Page 33: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/33.jpg)
CONCLUSIÓN:
La conversión de unidades es la transformación de una cantidad, expresada
en una cierta unidad de medida, en otra equivalente. Este proceso suele
realizarse con el uso de los factores de conversión y las tablas de
conversión del Sistema Internacional de Unidades.
Frecuentemente basta multiplicar por un factor de conversión y el resultado
es otra medida equivalente, en la que han cambiado las unidades.
Cuando el cambio de unidades implica la transformación de varias unidades
se pueden utilizar varios factores de conversión uno tras otro, de forma que
el resultado final será la medida equivalente en las unidades que buscamos.
Cuando se trabaja en la resolución de problemas, frecuentemente surge la
necesidad de convertir valores numéricos de un sistema de unidades a otro,
por lo cual es indispensable tener conocimientos sobre las equivalencias de
los diferentes sistemas de unidades que nos facilitan la conversión de una
unidad a otra, tomando en cuenta el país y la medida que se emplee en los
diferentes lugares.
RECOMENDACIÓN:
En toda actividad realizada por el ser humano, hay la necesidad de medir
"algo"; ya sea el tiempo, distancia, velocidad, temperatura, volumen,
ángulos, potencia, etc. Todo lo que sea medible, requiere de alguna unidad
con qué medirlo, ya que las personas necesitan saber qué tan lejos, qué tan
rápido, qué cantidad, cuánto pesa, en términos que se entiendan, que sean
reconocibles, y que se esté de acuerdo con ellos; debido a esto es
necesario tener conocimientos claros sobre el Sistema De Conversión De
Unidades pues mediante el entendimiento de este sistema o patrón de
referencia podremos entender y comprender con facilidad las unidades de
medida las cuales las podremos aplicar en la solución de problemas de
nuestro contexto.
33
![Page 34: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/34.jpg)
CRONOGRAMA DE ACTIVIDADES:
MES DE MARZO-ABRIL
ACTIVIDADES M J V S D L M
Investigar sobre el Sistema Internacional de Unidades y la Áreas y volúmenes de diferentes figuras geométricas
X X
Ejecución del Formato del Trabajo X
Resumen de los textos investigados X X
Finalización del Proyecto X
Presentación del Proyecto X
BIBLIOGRAFIA
Enríquez, H. (2002). Fundamentos de Electricidad. México: LIMUSA S.A.
Física, E. d. (1997). Brian Mckittrick. Madrid: Reverté S.A.
García, M. A. (2000). Estadística Avanzada con el Paquete Systat. Murcia:
I.S.B.N.
Hewitt, P. G. (2004). Física Conceptual. México: Pearson Educación S.A.
J.R, W. D. (20007). Ciencias e Ingenieria de las Materias .
Ledanois, J. M., & Ramos, A. L. (2002). Magnitudes, Dimensiones y
Conversiones de Unidades. Caracas: EQUINOCCIO.
López, J. C., March, S. C., García, F. C., & Álvarez, J. M. (2004). Curso de
Ingeniería Química. Barcelona: REVERTÉ S.A.
Pineda, L. (2008). matematicas.
Riley, W. F., & Sturges, L. F. (2004). ESTÁTICA. Barcelona: REVERTÉ.
LINKOGRAFIA:
34
![Page 35: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/35.jpg)
http://es.wikipedia.org/wiki/
Magnitud_fundamental#Unidades_en_el_Sistema_Internacional_de_Unid
ades_.28SI.29
http://es.wikipedia.org/wiki/Superficie_%28matem%C3%A1tica%29
http://www.quimicaweb.net/ciencia/paginas/magnitudes.html
http://www.profesorenlinea.cl/geometria/VolumenCilindro.htm
http://mimosa.pntic.mec.es/clobo/geoweb/volum1.htm
http://www.sc.ehu.es/sbweb/fisica/unidades/unidades/unidades.htm
ANEXOS:
1.- Investigar las medidas de un tráiler, de una mula y de un camión sencillo,
además las medidas de las cajas de plátano, manzanas, quintales de papa y
arroz. Con esa información calcular el número de cajas y quintales que
alcanzan en cada uno de los vehículos.
TRAILER MULA CAMION SENCILLO
Largo 14.30m Largo 8.27m Largo 10.80m
Ancho 2.45m Ancho 2.50m Ancho 2.60m
Alto 2.6m Alto 1.44m. Alto 4.40m
Medidas de las cajas:
Medidas de las cajas de plátano
LARGO ANCHO ALTO
20cm 51cm 34cm
Medidas de las cajas de manzana
7.5cm 9.5cm 7.5cm
35
![Page 36: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/36.jpg)
Desarrollo:
vol. trailer=l∗h∗a
vol. trailer=14.30m∗2.6 m∗2.45m
vol. trailer=91.09m3
vol.mula=l∗h∗a
vol.mula=8.27m∗1.44 m∗2.50m
vol.mula=29.77m3
vol. camion sencillo=l∗h∗a
vol. camion sencillo=10.8m∗4.40m∗2.60m
vol. camion sencillo=123.55m3
vol. caja platano=l∗h∗a
vol. caja platano=14.30cm∗2.6 cm∗2.45cm
vol. caja platano=91.09cm3
vol. caja platano=91.09cm3∗(1m)3
(100cm)3 =9.11∗10−05 m3
vol. cajamanzana=l∗h∗a
vol. cajamanzana=7.5cm∗9.5cm∗7.5cm
vol. cajamanzana=534.38cm3
36
![Page 37: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/37.jpg)
vol. cajamanzana=534.38cm3∗(1m)3
(100cm)3 =5.3∗108m3
a. vol. trailer=91.09m3
vol. caja platano=9.11∗10−05m3
1 caja de plátano-----------------911*10-05m3
X 91.09m3
x=1cajade platano∗91.09m3
9.11∗10−05 m3
x=999820.23 cajas de platano .
b. vol. trailer=91.09m3
vol. cajamanzana=5.3∗108m3
1 caja de manzana-----------------5.3*108m3
X 9.11*10-05m3
x=1cajade manzana∗¿9.11∗10−05m3
5.3∗108m3
x=1.7¿10−13cajas de manzana.
c. vol. trailer=91.09m3
1qqpapa∗( 100 lb1qq )( 1kg
2.2 lb )( 1000cm3
1kg )( 1m3
1kg )=( 100000m3
2200000 )=0.05m3
37
![Page 38: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/38.jpg)
1 qq de papa-----------------0.05m3
X 9.11*10-05m3
x=1qqde papa∗9.11∗10−05 m3
0.05m3
x=1.82¿10−03 qqde papa
d. vol. trailer=91.09m3
1qqde arroz∗( 100 lb1qq )( 1kg
2.2lb )( 1000cm3
1kg )( 1m3
1kg )=( 100000m3
2200000 )=0.05m3
1 qq de arroz-----------------0.05m3
X 9.11*10-05m3
x=1qqdearroz∗9.11∗10−05 m3
0.05m3
x=1.82¿10−03 qqde arroz
e. vol.mula=29.77m3
vol. caja platano=9.11∗10−05m3
1 caja de plátano-----------------911*10-05m3
X 29.77m3
38
![Page 39: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/39.jpg)
x=1cajade platano∗29.77m3
9.11∗10−05 m3
x=326783.75cajas de platano .
f. vol.mula=29.77m3
vol. cajamanzana=5.3∗108m3
1 caja de manzana-----------------5.3*108m3
X 29.77m3
x=1cajade manzana∗29.77m3
5.3∗108m3
x=5.62¿108 cajas demanzana .
g. vol.mula=29.77m3
1qq papa=0.05m3
1 qq de papa-----------------0.05m3
X 29.77m3
x=1qqde papa∗29.77m3
0.05m3
x=595.4 qqde papa.
h. vol.mula=29.77m3
1qqarroz=0.05m3
1 qq de arroz-----------------0.05m3
X 9.11*10-05m3
39
![Page 40: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/40.jpg)
x=1qqdearroz∗9.11∗10−05 m3
0.05m3
x=1.82¿10−03 qqde arroz
i. vol. camion sencillo=123.55m3
vol. caja platano=9.11∗10−05m3
1 caja de plátano-----------------911*10-05m3
X 123.55m3
x=1cajade platano∗123.55m3
9.11∗10−05m3
x=1.36∗106 cajas de platano .
j. vol. camion sencillo=29.77m3
vol. cajamanzana=5.3∗108m3
1 caja de manzana-----------------5.3*108m3
X 123.55m3
x=1cajade manzana∗123.55m3
5.3∗108m3
x=2.33¿10−07cajas de manzana.
k. vol. camion sencillo=29.77m3
1qq papa=0.05m3
40
![Page 41: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/41.jpg)
1 qq de papa-----------------0.05m3
X 123.55m3
x=1qqde papa∗123.55m3
0.05m3
x=2471qqde papa.
l. vol. camion sencillo=29.77m3
1qq papa=0.05m3
1 qq de arroz-----------------0.05m3
X 123.55m3
x=1qqdearroz∗123.55m3
0.05m3
x=2471qqde arroz.
41
![Page 42: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/42.jpg)
CRONOGRAMA DE ACTIVIDADES DEL PRIMER CAPÍTULO:
TiempoActividades
MARZO ABRIL MAYO
SEMANAS SEMANAS SEMANAS
1 2 3 4 1 2 3 4 1 2 3 4
PRIMERA CLASE
Competencia especifica (27-Marzo-2012)
X
Introducción de la Materia(27-Marzo-2012)
x
SEGUNDA CLASE
Sistema Internacional de Unidades(03-Abril-2012)
X
Tarea Sistema Internacional de Unidades.Entregar el 10 de abril del 2012
X
TERCERA CLASE
Aplicación de transformaciones (17 de abril del 2012)
X
Tarea Ejercicios de aplicación acerca del Sistema Internacional de unidades según las transformaciones(24 de abril del 2012)
X
CUARTA CLASE
Evaluación primer capitulo(03 de Mayo del 2012)
x
42
![Page 43: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/43.jpg)
43
![Page 44: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/44.jpg)
44
![Page 45: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/45.jpg)
45
![Page 46: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/46.jpg)
CAPITULO II
MARCO TEORICO:
COEFICIENTE DE CORRELACIÓN Y REGRESIÓN LINEAL
La correlación estadística determina la relación o dependencia que existe entre las
dos variables que intervienen en una distribución bidimensional. Es decir,
determinar si los cambios en una de las variables influyen en los cambios de la
otra. En caso de que suceda, diremos que las variables están correlacionadas o
que hay correlación entre ellas.
Una medida estadística ampliamente utilizada que mide el grado de
relación lineal entre dos variables aleatorias. El coeficiente de correlación
debe situarse en la banda de -1 a +1. El coeficiente de correlación se
calcula dividiendo la covarianza de las dos variables aleatorias por el
producto de las desviaciones típicas individuales de las dos variables
aleatorias. Las correlaciones desempeñan un papel vital en la creación de
carteras y la gestión de riesgos, (Weiers, 2006).
Comentario:
A una correlación se la puede apreciar con un grupo de técnicas
estadísticas empleadas para medir la intensidad de dicha relación entre dos
variables, en donde se deben identificar la variable dependiente y la
independiente.
DIAGRAMA DE DISPERSIÓN
Representación gráfica del grado de relación entre dos variables cuantitativas.
46
![Page 47: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/47.jpg)
Características principales
A continuación se comentan una serie de características que ayudan a
comprender la naturaleza de la herramienta.
Impacto visual
Un Diagrama de Dispersión muestra la posibilidad de la existencia de correlación
entre dos variables de un vistazo.
Comunicación
Simplifica el análisis de situaciones numéricas complejas.
Guía en la investigación
El análisis de datos mediante esta herramienta proporciona mayor información que
el simple análisis matemático de correlación, sugiriendo posibilidades y
alternativas de estudio, basadas en la necesidad de conjugar datos y procesos en
su utilización, (García, 2000).
Comentario:
El diagrama de dispersión sirve para una representación gráfica más fácil y
útil cuando se quiere describir el comportamiento de un conjunto de dos
variables, en donde aparece representado como un punto en el plano
cartesiano.
COEFICIENTE DE CORRELACIÓN RECTILINEA DE PEARSON
En estadística, el coeficiente de correlación de Pearson es un índice que mide la
relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la
covarianza, la correlación de Pearson es independiente de la escala de medida de
las variables.
47
![Page 48: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/48.jpg)
De manera menos formal, podemos definir el coeficiente de correlación de
Pearson como un índice que puede utilizarse para medir el grado de relación de
dos variables siempre y cuando ambas sean cuantitativas.
El coeficiente de correlación es una medida de asociación entre dos
variables y se simboliza con la literal r; los valores de la correlación van de
+ 1 a - 1, pasando por el cero, el cual corresponde a ausencia de
correlación. Los primeros dan a entender que existe una correlación
directamente proporcional e inversamente proporcional, respectivamente,
(Willliams, 2008).
Comentario:
El coeficiente de correlación de Pearson nos da una idea de que tan
relacionadas están dos variables, este número varía entre 0 y 1; si el
coeficiente es > 0.9, entonces es una buena correlación y cuando un
coeficiente es < 0.3 indica que las variables no están correlacionadas entre
ellas y por lo que el 1 representa una correlación perfecta.
INTERPRETACIÓN DE UN COEFICIENTE DE CORRELACIÓN
El coeficiente de correlación como previamente se indicó oscila entre –1 y +1
encontrándose en medio el valor 0 que indica que no existe asociación lineal entre
las dos variables a estudio. Un coeficiente de valor reducido no indica
necesariamente que no exista correlación ya que las variables pueden presentar
una relación no lineal como puede ser el peso del recién nacido y el tiempo de
gestación. En este caso el r infraestima la asociación al medirse linealmente. Los
métodos no paramétrico estarían mejor utilizados en este caso para mostrar si las
variables tienden a elevarse conjuntamente o a moverse en direcciones diferentes.
Como ya se ha planteado el grado de correlación mide la intensidad de
relación lineal, ya sea directa, inversa o inexistente entre dos variables, se
48
![Page 49: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/49.jpg)
dice que es directa si tiene signo positivo, inversa de signo negativo y nula
cuando el valor sea aproximadamente igual a cero, (Anderson, 2005).
Comentario:
El coeficiente de correlación mide solo la relación con una línea recta, dos
variables pueden tener una relación curvilínea fuerte, a pesar de que su
correlación sea pequeña; por lo tanto cuando analicemos las relaciones
entre dos variables debemos representarlas gráficamente y posteriormente
calcular el coeficiente de correlación para un mejor entendimiento.
FORMULA
R=n¿¿
REGRESIÓN LINEAL SIMPLE
Elegida una de las variables independientes y representadas los valores de la
variable bidimensional, si observamos que la función que mejor se adapta a la
forma de la nube de puntos es una recta, tendremos un problema de regresión
lineal. Si hemos elegido el carácter X como variable independiente, tendremos a la
recta de regresión de Y sobre X. Si elegimos Y como variable independiente, se
obtendrá la recta de regresión de X sobre Y.
Regresión Lineal Simple.- suponga que tenemos una única variable respuesta
cuantitativa Y, y una única variable predictora cuantitativa X. Para estudiar la
relación entre estas dos variables examinaremos la distribución condicionales de Y
dado X=x para ver si varían cuando varia x. (MORER, 2004)
COMENTARIO:
49
![Page 50: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/50.jpg)
Podemos concluir diciendo que una de las variables independientes y
representadas los valores que mejor se adapta a la forma de la nube de
puntos es una recta, tendremos un problema de regresión lineal. A demás el
hecho de entender de que se trata una regresión lineal y saberla aplicar
relacionando dos variables nos será de mucha ayuda en nuestro futuro ya
que nos permitirá aplicar lo aprendido en problemas reales que se nos
presenten en nuestra vida profesional como por ejemplo el saber que tan
buena resulta una relación entre exportaciones e importaciones que el
Ecuador ha realizado y así con esto poder tomar decisiones.
CORRELACIÓN POR RANGOS
Cuando se obtienen datos en parejas, tales como observaciones de dos variables
para un mismo individuo, deseamos conocer si las dos variables están
relacionadas o no y de estarlo, el grado de asociación entre ellas.
Correlación Por Rangos.- Este coeficiente de Sperman, es muy utilizado en
investigaciones de mercado, especialmente cuando no se deben aplicar medidas
cuantitativas para ciertas características cualitativas, en aquellos casos , en donde
se pueden aplicar ambos coeficientes de correlación, encontraremos que sus
resultados son bastante aproximados. (BENCARDINO, 2006)
COMENTARIO:
Son datos en pareja para poder conocer la relación que existe entre ellas
para un solo individuo en común, y medir el grado de asociación entre ellas.
Esto es muy interesante ya que en un futuro nos ayudara en lo que nos
vamos a desarrollar que es un ambiente de negocios, ya que podemos
aplicar esta técnica estadística aprendida, y así poder solucionar problemas
que se nos presenten comúnmente y saber que tan buena es la relación
entre las dos variables propuestas es decir nos ayudara mucho ya que nos
50
![Page 51: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/51.jpg)
dará una idea de que tan relacionadas linealmente están dos variables y si
su relación es positiva o negativa.
RANGO
La diferencia entre el menor y el mayor valor. En {4, 6, 9, 3, 7} el menor valor es 3,
y el mayor es 9, entonces el rango es 9-3 igual a 6. Rango puede significar
también todos los valores de resultado de una función.
Rango.- es una categoría que puede aplicarse a una persona en función de su
situación profesional o de su status social. Por ejemplo: “Tenemos que respetar el
rango del superior a la hora de realizar algún pedido”, “Diríjase a mi sin olvidar su
rango o será sancionado. (MORER, 2004)
COMENTARIO:
Rango es el valor que se diferencia entre el menor y el mayor valor. Rango
puede significar también todos los valores de resultado de una función, y se
puede así relacionar y correlacionar a dos variables para obtener resultados
que nos ayudan a la toma de decisiones. A demás un rango es importante
ya que nos permite la obtención de datos más exactos y pues con esto
nuestro trabajo se entonara de forma más real y sobre todo de forma más
precisa, y por ende tomaremos decisiones más acertadas.
COMENTARIO GENERAL:
La correlación y regresión lineal están estrechamente relacionadas entre si las
cuales nos ayudan a comprender el análisis de los datos muéstrales para saber
qué es y cómo se relacionan entre sí dos o más variables en una población que
deseemos estudiar para así poder determinar posibles resultados que nos darán
51
![Page 52: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/52.jpg)
en un estudio de mercado por ejemplo ya que nuestra carrera de comercio exterior
está muy relacionada con ese ámbito.
La regresión lineal por otro lado nos permitirá graficar las dos variables a estudiar
determinando su situación y si es conveniente o no desarrollar lo propuesto o
investigado. La finalidad de una ecuación de regresión seria estimar los valores de
una variable con base en los valores conocidos de la otra.
Es decir en resumen que nos permitirá tomar decisiones acertadas dentro de un
estudio ya sea en una población que determinara el éxito o fracaso entre dos
variables a estudiar, y facilitara la recolección de información.
ORGANIZADOR GRAFICO:
52
![Page 53: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/53.jpg)
TRABAJO #3
53
CORRELACION Y REGRESION LINEAL
ayuda a la toma de decisiones segun lo resultante en la
aplicacion de estos
grupodetécnicasestadísticasusadasparamedirlafuerzadelaasociaciónen
tredosvariables
se ocupa de establecer si existe una relación así como de determinar su magnitud y dirección mientras que la
regresión se encarga principalmente de utilizar a la
relación para efectuar una predicción.
determinar posibles resultados como por ejemplo
del exito en un estudi de mercado
permite evaluar decisiones que se tomen en una
poblacion
herramienta basica para estudios y analisis que pueden determinar el exito o fracaso
entre dos opciones
![Page 54: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/54.jpg)
UNIVERSIDAD POLITÉCNICA ESTATAL DEL
CARCHI
FACULTAD DE COMERCIO INTERNACIONAL, INTEGRACIÓN, ADMINISTRACIÓN Y ECONOMIA EMPRESARIAL
Carrera: Escuela de Comercio Exterior y Negociación Internacional
“ESTADISTICA INFERENCIAL”
ING. Jorge Pozo
INTEGRANTE: Jesenia Pozo
CURSO: Sexto “B”
TULCÁN, MARZO 2012
54
![Page 55: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/55.jpg)
55
![Page 56: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/56.jpg)
56
![Page 57: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/57.jpg)
57
![Page 58: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/58.jpg)
58
![Page 59: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/59.jpg)
59
![Page 60: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/60.jpg)
60
![Page 61: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/61.jpg)
61
![Page 62: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/62.jpg)
62
![Page 63: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/63.jpg)
63
![Page 64: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/64.jpg)
64
![Page 65: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/65.jpg)
65
![Page 66: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/66.jpg)
66
![Page 67: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/67.jpg)
67
![Page 68: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/68.jpg)
68
![Page 69: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/69.jpg)
69
![Page 70: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/70.jpg)
70
![Page 71: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/71.jpg)
71
![Page 72: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/72.jpg)
72
![Page 73: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/73.jpg)
73
![Page 74: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/74.jpg)
74
![Page 75: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/75.jpg)
75
![Page 76: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/76.jpg)
76
![Page 77: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/77.jpg)
77
![Page 78: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/78.jpg)
78
![Page 79: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/79.jpg)
79
![Page 80: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/80.jpg)
80
![Page 81: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/81.jpg)
81
![Page 82: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/82.jpg)
82
![Page 83: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/83.jpg)
83
![Page 84: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/84.jpg)
CRONOGRAMA DE ACTIVIDADES:
Actividad
Días
ResponsableMar, 08 Mié, 09 Jue, 10 Vie,11 Sáb,12 Dom,13 Lun,14 Mar,1
5
Mié,16 Jue,1
7
Copias Jesenia Pozo
Iniciar con los ejercicios
Jesenia Pozo
Terminar los ejercicios
Jesenia Pozo
Prueba Jesenia Pozo
84
![Page 85: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/85.jpg)
ANEXOS:
Ejemplo 1:
La siguiente tabla representa las puntuaciones de 7 sujetos en dos variables X e
Y.
X: 6 3 7 5 4 2 1
Y: 7 6 2 6 5 7 2
Calcule:
a. El coeficiente de correlación de Pearson entre X e Y
b. La recta de regresión de Y sobre X en puntuaciones directas
c. La varianza de Y ( ), la varianza de las puntuaciones pronosticadas ( ) y
la varianza error (
a)
X Y XY X2 Y2
6375421
7626572
4218143020142
36949251641
49364
3625494
28 35 140 140 203
85
![Page 86: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/86.jpg)
b)
c)
Ejemplo 2:
Se tienen los datos conjuntos de dos variables, X e Y, con los valores que se
muestran en la tabla:
X: 1; 3; 5; 7; 9; 11; 13
Y: 1; 4; 6; 6; 7; 8; 10
a. Si utilizamos la variable X como predictora de la variable Y, ¿qué porcentaje
de variabilidad de Y no puede ser explicada por la variabilidad de X?.
b. ¿Qué valor pronosticaríamos en la variable Y, si en la variable X obtenemos
un valor de 10?
c. Suponiendo que no dispusiéramos de la información relativa a la variable X,
¿qué valor pronosticaríamos para la variable Y? (Razone su respuesta).
86
![Page 87: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/87.jpg)
a) Completamos la siguiente tabla:
X Y XY X2 Y2
1 1 1 1 1
3 4 12 9 16
5 6 30 25 36
7 6 42 49 36
9 7 63 81 49
11 8 88 121 64
13 10 130 169 100
49 42 366 455 302
El cuadrado del coeficiente de correlación (coeficiente de determinación) se
interpreta como proporción de varianza de la variable Y que se explica por las
variaciones de la variable X. Por tanto: es la proporción de varianza no
explicada. Esta proporción multiplicada por 100 es el tanto por ciento o porcentaje.
b) Aplicamos la ecuación de regresión de Y sobre X: Y= b.X + a. Siendo b la
pendiente y ala ordenada cuyas expresiones aparecen entre paréntesis.
87
![Page 88: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/88.jpg)
c) Le pronosticaríamos la media, porque no disponiendo información de la variable
X es con el que cometemos menos error de pronóstico.
Ejemplo 3:
Elección de la prueba estadística para medir la asociación o correlación. Las
edades en días están en escala de tipo intervalo, tenemos dos variables, entonces
aplicamos esta prueba.
Objetivo: Conocer qué grado de asociación existe entre la edad y peso corporal de
niños de edades desde el nacimiento hasta los 6 meses.
Hipótesis.
Entre las observaciones de edad de los niños y peso corporal existe correlación
significativa.
Ho. Entre las observaciones de edad de los niños y pero corporal no existe
correlación significativa.
88
![Page 89: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/89.jpg)
Ejemplo 4:
Se ha evaluado a 7 sujetos su inteligencia espacial (variable X) y sus
puntuaciones fueron: 13, 9, 17, 25, 21, 33, 29. Además se les pidió a los sujetos
que reconocieran un conjunto de figuras imposibles (variable Y). Después de
calcular la ecuación de regresión para pronosticar Y a partir de X, se sabe que
89
![Page 90: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/90.jpg)
para una puntuación típica de 1,2 en X se pronosticaría una puntuación típica de
0,888 en Y. También se sabe que la desviación típica de las puntuaciones
pronosticadas para Y es 11,1. Con estos datos calcular:
a. El coeficiente de correlación de Pearson entre X e Y
Sujeto Xi
1 13 169
2 9 81
3 17 289
4 25 625
5 21 441
6 33 1089
7 29 841
Sumatorio
147 3535
a. La ecuación de regresión en puntuaciones diferenciales para pronosticar Y
a partir de X
90
![Page 91: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/91.jpg)
a. La varianza de los errores del pronóstico.
Ejemplo 5:
De dos variables X e Y, y para un grupo de 5 sujetos, se saben los siguientes
datos que se muestran en la tabla:
Calcular:
a) Recta de regresión de Y sobre X en puntuaciones directas.
91
![Page 92: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/92.jpg)
b) Coeficiente de correlación de Pearson entre X e Y
c) La varianza de las puntuaciones pronosticadas.
EJEMPLO 6:
Se desea importar desde el país de Colombia transformadores eléctricos. El
Ecuador tiene las cotizaciones de cinco empresa diferentes, y se hace el análisis
de cual empresa es la más conveniente, y las unidades que se va a vender en el
país de importación.
Empresas
Valor de los transformadore
sx
Unidades posibles a
vendery
X2 Y2 XY
1
2
3
4
5
1800
1500
1200
900
850
100
98
80
62
58
3.240.000
2.250.000
1.440.000
810.000
722.500
10.000
9.604
6.400
3.844
3.364
180.000
147.000
96.000
55.800
49.300
∑x = 6.250 ∑y = 398 ∑
x2=8.462.50
0
∑
y2=33.21
2
∑xy=
528.100
Fórmula:
92
![Page 93: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/93.jpg)
r=n¿¿
r=5 (528.100 )−(6.250 )(398)
√ [5 (8.462 .500 )−(39.062.500)2 ] ¿¿¿
r= 2.640.500−2.487 .500
√ [ 42.312 .500−39.062 .500 ] [166.060−158.404 ]
r= 153.000
√ [ 3.250 .000 ] [ 7.656 ]
r= 153.000157.740,29
r=0,969948768=0,97
Análisis: si se obtiene ese porcentaje se puede lograr una venta exitosa para la
empresa importadora.
EJEMPLO 7:
Se desea importar desde el país de Colombia transformadores eléctricos. El
Ecuador tiene las cotizaciones de cinco empresa diferentes, y se hace el análisis
de cual empresa es la más conveniente, y las unidades que se va a vender en el
país de importación.
Empresas
Valor de los transformadore
sx
Unidades posibles a
vendery
X2 Y2 XY
93
![Page 94: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/94.jpg)
1
2
3
4
5
1800
1500
1200
900
850
100
98
80
62
58
3.240.000
2.250.000
1.440.000
810.000
722.500
10.000
9.604
6.400
3.844
3.364
180.000
147.000
96.000
55.800
49.300
∑x = 6.250 ∑y = 398 ∑
x2=8.462.50
0
∑
y2=33.21
2
∑xy=
528.100
Fórmula:
r=n¿¿
r=5 (528.100 )−(6.250 )(398)
√ [5 (8.462 .500 )−(39.062.500)2 ] ¿¿¿
r= 2.640.500−2.487 .500
√ [ 42.312 .500−39.062 .500 ] [166.060−158.404 ]
r= 153.000
√ [ 3.250 .000 ] [ 7.656 ]
r= 153.000157.740,29
r=0,969948768=0,97
Análisis: si se obtiene ese porcentaje se puede lograr una venta exitosa para la
empresa importadora.
EJEMPLO 8:
94
![Page 95: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/95.jpg)
La empresa MIDECAR ha clasificado como mercancías de mayor responsabilidad
las mercancías peligrosas y frágiles obteniendo así los siguientes datos
mensuales sobre las toneladas de mercancías que ingresan sobre este tipo:
MESES Mercancías
Peligrosas
Mercancías
Frágiles
x y x^2 y^2 xy
Enero 189 85 35721 7225 16065,00
Febrero 105 96 11025 9216 10080,00
Marzo 125 78 15625 6084 9750,00
Abril 116 48 13456 2304 5568,00
Mayo 124 98 15376 9604 12152,00
659 405 91203 34433 53615
r=n¿¿
r=5 (53615 )−(659)(405)
√¿¿¿
r= 268075−266895
√ [ 456015−434,281 ] [172165−164025 ]
r= 1180
√ [ 21734 ] [ 8410 ]
r= 1180
√182782940
95
![Page 96: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/96.jpg)
r= 118013519.72
r= 118013519.72
=0.08
La relación que existe dentro de las mercancías frágiles y peligrosas tiende a
positiva como lo demuestra el resultado numérico coma la formula y al grafica
respecto al eje x y eje y.
EJEMPLO 9:
96
![Page 97: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/97.jpg)
3. De una determinada empresa Exportadora de Plátano se conocen los
siguientes datos, referidos al volumen de ventas (en millones de dólares) y al
gasto en publicidad ( en miles de dólares) de los últimos 6 años:
a) ¿Existe relación lineal entre las ventas de la empresa y sus gastos en
publicidad?
97
![Page 98: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/98.jpg)
r=N ¿¿
r=6 (7312 )−(296)(129)
√¿¿¿
r= 5688
√34803.195=0.304
ANALISIS: En este caso r es 0.304 por tanto existe correlación ordinal positiva y
es imperfecta, es decir a mayor gasto en publicidad mayor volumen de ventas.
EJEMPLO 10:
La empresa FERRERO desea importar nueces desde Colombia por lo cual no
está seguro que empresa de transporte contratar para la mercancía de acuerdo a
esto esta empresa decide verificar los rendimientos que han tenido estas
empresas en el transporte por lo cual ha hecho una investigación de mercado y a
obtenido los siguientes resultados.
98
![Page 99: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/99.jpg)
EMPRESAS DE
TRANSPORTE
CALIDAD DE
SERVICIO (X)
RENDIMIENTO
(Y)
X2 Y 2 XY
TRANSCOMERINTER
TRANSURGIN
TRANSBOLIVARIANA
SERVICARGAS
19
17
16
14
46
44
40
30
361
289
256
196
2116
1936
1600
900
874
748
640
420
66 160 1102 6552 2682
r¿(∑ XY )−(
(∑x ) (∑Y )N
)
√[∑X 2−((∑ X)2/(N ))][∑X 2−((∑ X)2/(N ))]
r=4 (2682 )−( (66 )160 )
√(4 (1102 )−(662 )) (4 (6552 )−(1602 ))
r= 0,038
Es una relación positiva pero se podría decir que la empresa no podrá depender
de las dos variables ya que no son muy dependientes el uno del otro.
99
![Page 100: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/100.jpg)
EJEMPLO 11:
Se está efectuando un proyecto de investigación en una empresa para determinar
si existe relación entre los años de servicio y la eficiencia de un empleado. El
objetivo de estudio fue predecir la eficiencia de un empleado con base en los años
de servicio. Los resultados de la muestra son:
Empleados
Años de Servicio
“X”
Puntuación de eficiencia
“Y”XY X2 Y2
Y`A 1 6 6 1 36 3.23B 20 5 100 400 25 4.64C 6 3 18 36 9 3.61D 8 5 40 64 25 3.77E 2 2 4 4 4 3.31F 1 2 2 1 4 3.23G 15 4 60 225 16 4.30H 8 3 24 64 9 3.77
61 30 254 795 128
0 5 10 15 20 250
1
2
3
4
5
6
7
r=n¿¿
100
![Page 101: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/101.jpg)
r=8¿¿
r = .3531
DESVIACIÓN ESTÁNDAR
syx=√∑ ¿¿¿¿
syx=√∑ y2−a¿¿¿
b = 202 = .0765
2639
a = 3.75 - .0765 (7.625) = 3.16
( y - y )2 ( y - y´ )2
5.0625 7.6729
1.5625 0.0961
0.5625 0.3721
1.5625 1.5129
3.0625 1.7161
3.0625 1.5129
0.0625 0.09
0.5625 0.5929
r2 = 15.5 - 13.5659 = 0.1247 = 0.1247
EJEMPLO 12:
101
![Page 102: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/102.jpg)
Un analista de operaciones de comercio exterior realiza un estudio para analizar la
relación entre la producción y costos de fabricación de la industria electrónica. Se
toma una muestra de 10 empresas seleccionadas de la industria y se dan los
siguientes datos:
EMPRESAMILES DE
UNIDADES xMILES DE
$ yXY X2 Y2
A 40 150 6000 1600 22500
B 42 140 5880 1764 19600
C 48 160 7680 2304 25600
D 55 170 9350 3025 28900
E 65 150 9750 4225 22500
F 79 162 12798 6241 26244
G 88 185 16280 7744 34225
H 100 165 16500 10000 27225
I 120 190 22800 14400 36100
J 140 185 25900 19600 34225
Σx 777 Σy 1657 Fxy 132938 Σx2 70903 Σy 2 277119
20 40 60 80 100 120 140 1600
20
40
60
80
100
120
140
160
180
200
102
![Page 103: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/103.jpg)
r=N∑ XY−¿¿
r = 1´329,380 - 1´287,489 =
[709030 - 603729][2771190 - 2745949]
r = ___41891 = r= _41891__ = 0.8078
(105301) (25541) 51860.32
DESVIACION ESTANDAR
syx=√∑ ¿¿¿¿
syx=√∑ y2−a¿¿¿
Syx = (277119) - 134.7909 (1657) - (.3978) (132.938)
10 - 2
Syx = 10.53
MARCO TEORICO:
CORRELACIÓN Y REGRESIÓN LINEAL
La correlación y la regresión están muy relacionadas entre sí. Ambas implican la
relación entre dos o más variables. La correlación se ocupa principalmente. De
establecer si existe una relación, así como de determinar su magnitud y dirección,
103
![Page 104: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/104.jpg)
mientras que la regresión se encarga principalmente de utilizar a la relación. En
este capítulo analizaremos la correlación y más adelante la regresión lineal
Relaciones;
La correlación se ocupa de establecer la magnitud y la dirección de las relaciones.
Analizaremos algunas características importantes generales de estas con las que
comprenderemos mejor este tema.
Relaciones lineales:
Veamos una relación lineal entre dos variable. La siguiente tabla nos muestra el
salario mensual que percibieron cinco agentes de ventas y el valor en dólares de
las mercancías vendidas por cada uno de ellos en ese mes.
Agente variable X mercancía vendida ($) Y variable salario ($)1 0 5002 1000 9003 2000 13004 3000 17005 4000 2100
Podemos analizar mejor la relación entre estas variables. Si trazamos una grafica
trazamos los valores XyY, para cada agente de ventas, como los puntos de dicha
grafica. Sería una grafica de dispersión o de dispersigrama.
La grafica de dispersión para los datos de los agentes de ventas aparece en el
cuadro.
Una relación lineal.- entre dos variables, es aquella que puede representarse con
la mejor exactitud mediante una línea recta.
104
![Page 105: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/105.jpg)
Problema de que ambos tienen escalas muy diferentes. Como mencionamos
anteriormente podemos resolver esta dificultad al convertir cada calificación en su
valor Z transformado, lo cual colocaría a ambas variables en la misma escala, en
la escala Z.
Para apreciar la utilidad de los puntajes Z en la determinación de la correlación,
consideremos el siguiente ejemplo. Supongamos que el supermercado de su
barrio está vendiendo naranjas, las cuales ya están empacadas; cada bolsa tiene
marcado el precio total. Ud. quiere saber si existe una relación entre el peso de las
naranjas de cada bolsa y su costo. Como Ud. Es investigador nato, elige al azar
seis bolsas y la pesa, de hecho están relacionadas estas variables. Existe una
correlación positiva perfecta entre el costo y el peso de las naranjas. Asi el
coeficiente de correlación debe ser igual a + 1.
Para utilizar esta ecuación primero hay que convertir cada puntaje en bruto en su
valor transformado. Esto puede tardar mucho tiempo y crear errores de redondeo
con alguna algebra, esta ecuación se puede transformar en una ecuación de
cálculo que utilice datos en bruto:
Ecuación para el cálculo de la r de pearson
r¿(∑ XY )−(
(∑x ) (∑Y )N
)
√[∑X 2−((∑ X)2/(N ))][∑X 2−((∑ X)2/(N ))]
Donde ∑XY es la suma de los productos de cada pareja XyY ∑ XY
también se llama la suma de los productos cruzados.
105
![Page 106: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/106.jpg)
Datos hipotéticos a partir de cinco sujetos:
r¿(∑ XY )−(
(∑x ) (∑Y )N
)
√[∑X 2−((∑ X)2/(N ))][∑X 2−((∑ X)2/(N ))]
r¿(106 )−(
(21 ) (22 )5
)
√[111−((21)2/(5))][112−((22)2/(5))]
13.618.616
=0.731=0.73
PROBLEMA DE PRÁCTICA:
106
SUBJETIVO X Y X2 Y2 XY
A 1 2 1 4 2
B 3 5 9 25 15
C 4 3 16 9 12
D 6 7 36 49 42
E 7 5 49 25 35
TOTAL 21 22 111 112 106
![Page 107: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/107.jpg)
Tenemos una relación lineal imperfecta y estamos interesados en calcular la
magnitud y dirección de la magnitud y dirección de la relación mediante la r
Pearson.
# de
estudiantes
IQ
(promedio de
calificaciones)
Promedio
de datos
Y
X2 Y2 XY
123456789
101112
TOTAL
110112118119122125127130132134136138
1503
1.01.61.22.12.61.82.62.03.22.63.03.6
27.3
12.10012.54413.92414.16114.88415.62516.12916.90017.42417.95618.49619.044
189.187
1.002.561.444.416.763.246.764.00
10.246.769.00
12.9669.13
110.0179.2141.6249.9317.2225.0330.2260.0422.4384.4408.0496.8
3488.0
r¿(∑ XY )−(
(∑x ) (∑Y )N
)
√[∑X 2−((∑ X)2/(N ))][∑X 2−((∑ X)2/(N ))]
r¿(3488.7 )−(
(1503 ) (27.3 )12
)
√[189.187−((1503)2/(12))] [69.13−((27.3)2/(12))]
x=69.37581.088
=0.856=0.86
107
![Page 108: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/108.jpg)
Una segunda interpretación de la r de pearson es que también se puede
interpretar en términos de la variabilidad de Y explicada por medio de X. este
punto de vista produce más información importante acerca de r y la relación entre
X y Y en este ejemplo la variable X representa una competencia de ortografía y la
variable Y la habilidad de la escritura de seis estudiantes de tercer grado. Suponga
que queremos que queremos predecir la calificación de la escritura de Esteban, el
estudiante cuya calificación en ortografía es de 88.
Para calcular la r de Pearson para cada conjunto. Observe que en el conjunto B,
donde la correlación es menor, a algunos de los valores
r= ∑ ZxZy /(N−1)=¿¿
ZxZy Son positivos y otros son negativos. Estos tienden a cancelarse entre si, lo
cual hace que r tenga una menor magnitud. Sin embargo, en los conjuntos A y C
todos los productos tienen el mismo signo, haciendo que la magnitud de r
aumente. Cuando las parejas de datos ocupan las mismas u opuestas posiciones
dentro de sus propias distribuciones, los productos ZxZy tienen el mismo signo, la
cual produce una mayor magnitud de r
Calculando r utilizando para el conjunto B, utilizando la ecuación para los datos en bruto
¿Qué quiere utilizar la ecuación de los datos en bruto o la los puntajes z?
Sume la constante 5 de los datos X en el conjunto A y calcule r de nuevo, mediante la
ecuación de datos en bruto ¿ha cambiado el valor?
Construya una grafica de dispersión para las parejas de datos.
Sería justo decir que este es un examen confiable
Un grupo de investigadores a diseñado un cuestionario sobre la tensión, consistente en
quince sucesos. Ellos están interesados en determinar si existe una coincidencia entre
108
![Page 109: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/109.jpg)
dos culturas acerca de la cantidad relativa de ajustes que acarrea cada suceso. El
cuestionario se aplica a 300 estadounidenses y 300 italianos. Cada individuo debe utilizar
el evento “matrimonio” como estándar y juzgar los demás eventos en relación con el
ajuste necesario para el matrimonio recibe un valor arbitrario de 50 puntos. Si se
considera un evento requiere de más ajustes que el matrimonio, el evento debe recibir
más de 50 puntos. el número de puntos excedentes depende de la cantidad de ajustes
requeridos. Después de cada sujeto de cada cultura ha asignado de puntos a todos los
eventos, se promedian los puntos de cada evento. Los resultados aparecen en la
siguiente tabla.
EVENTOS ESTADOUNIDENSES ITALIANOS
Muerte de la esposa 100 80
Divorcio 73 95
Separación de la pareja 65 85
Temporada en prisión 63 52
Lesiones personales 53 72
Matrimonio 50 50
Despedido del trabajo 47 40
Jubilación 45 30
Embarazo 40 28
Dificultades sexuales 39 42
Reajustes económicos 39 36
Problemas con la
familia política
29 41
Problemas con el jefe 23 35
Vacaciones 13 16
Navidad 12 10
109
![Page 110: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/110.jpg)
a. Suponga que los datos tienen al menos una escala de intervalo y calcule la
correlación entre los datos de los estadounidenses y la de los italianos
b. Suponga que los datos solo tienen una escala ordinal y calcule la correlación entre
los datos de ambas culturas
INDIVIDUO EXAMEN CON
LÁPIZ Y PAPEL
PSIQUIATRA
A
PSIQUIATRA
B
1 48 12 9
2 37 11 12
3 30 4 5
4 45 7 8
5 31 10 11
6 24 8 7
7 28 3 4
8 18 1 1
9 35 9 6
10 15 2 2
11 42 6 10
12 22 5 3
un Psicólogo ha construido un examen lápiz-papel, a fin de medir la depresión. Para
comparar los datos de los exámenes con los datos de los expertos, 12 individuos “con
perturbaciones emocionales” realizan el examen lápiz-papel. Los individuos son
calificados de manera independiente por los dos psiquiatras, de acuerdo con el grado de
110
![Page 111: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/111.jpg)
depresión determinado para cada uno como resultado de las entrevistas detalladas. Los
datos aparecen a continuación.
Los datos mayores corresponden a una mayor depresión.
a. ¿Cuál es la correlación de los datos de los dos psiquiatras?
b. ¿Cuál es la correlación sobre las calificaciones del examen de lápiz y papel de
cada psiquiatra?
Para este problema, suponga que Ud. Es un psicólogo que labora en el departamento de
recursos humanos de una gran corporación. El presidente de la compañía acaba de
hablar con Ud. Acerca de la importancia de contratar personal productivo en la sección de
manufactura de la empresa y le ha pedido que ayude a mejorar la capacidad de la
institución para hacer esto. Existen 300 empleados en esta sección y cada obrero fabrica
el mismo artículo. Hasta ahora la corporación solo ha recurrido a entrevistas para elegir a
estos empleados. Ud. Busca bibliografía y descubre dos pruebas de desempeño lápiz y
papel, bien estandarizadas y piensa que podrían estar relacionadas con los requisitos de
desempeño de esta sección. Para determinar si alguna de ellas se puede usar como
dispositivo de selección elige a 10 empleados representativos de la sección de la
manufactura, garantizando que una amplio rango de desempeño quede representado en
la muestra y realiza las dos pruebas con cada empleado por semana, promediando
durante los últimos seis meses.
Desempeño
en el
trabajo
Examen 1
Examen 2
1
50
10
25
2
74
19
35
3
62
20
40
4
90
20
49
5
98
21
50
6
52
14
29
7
68
10
32
8
80
24
44
9
88
16
46
10
76
14
35
CORRELACIÓN
4.1.1. TÉCNICAS DE CORRELACIÓN
111
![Page 112: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/112.jpg)
En los capítulos anteriores, ustedes estudiaron las distribuciones de una sola
variable. A continuación abordaremos el estudio de dos variables y no solamente
de una. Particularmente estudiaremos qué sentido tiene afirmar que dos variables
están relacionadas linealmente entre si y cómo podemos medir esta relación
lineal.
4.1.2. RELACIONES LINEALES ENTRE VARIABLES
Supongamos que disponemos de dos pruebas siendo una de ellas una prueba de
habilidad mental y otra una prueba de ingreso a la Universidad. Seleccionemos
cinco estudiantes y presentemos en la tabla Nº 4.1.1 los puntajes obtenidos en
estas dos pruebas.
Tabla Nº 4.1.1
Estudiantes X
Prueba de habilidad
mental
Y
Examen de Admisión
María 18 82
Olga 15 68
Susana 12 60
Aldo 9 32
Juan 3 18
112
![Page 113: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/113.jpg)
La tabla nos dice que si podemos hacer tal suposición ya que los estudiantes con
puntajes altos en la prueba de habilidad mental tienen también un puntaje alto en
el examen de admisión y los estudiantes con puntaje bajo en la prueba de
habilidad mental. Tienen también bajo puntajes en el examen de admisión. En
circunstancia como la presente (cuando los puntajes altos de una variable están
relacionados con los puntajes altos de la otra variable y los puntajes) afirmaríamos
que hay una relación lineal positiva entre las variables, entonces podemos definir
una relación lineal positiva entre ese conjunto de pares valores X y Y, tal la
muestra la tabla N º 4.1.1
Supongamos que en lugar de los resultados de la tabla Nº 4.1.1, hubiéramos
obtenido los puntajes que se muestran en la tabla Nº 4.1.2 ¿podríamos afirmar
que en esta situación los puntajes de la prueba de habilidad mental pueden usarse
para pronosticar los puntajes del examen de admisión? También, aunque en este
caso mostramos una relación contraria a la que ocurre en la realidad ya que los
sujetos con puntajes altos en el test de habilidad mental aparecen con puntajes
bajos en el examen de admisión y los sujetos con puntajes bajos en el test de
habilidad mental presentan los puntajes altos en el examen de admisión, entonces
podemos definir una relación lineal negativa entre un conjunto de pares valores X
y Y (tal como en la tabla Nº 4.1.2) es decir, los puntajes altos de X están
apareados con los puntajes bajos de Y y los puntajes bajos de X están apareados
con los puntajes de Y.
Tabla Nº 4.1.2
Estudiantes X Prueba de habilidad
mental
Y Examen de Admisión
María 18 18
Olga 15 32
Susana 12 60
Aldo 9 68
113
![Page 114: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/114.jpg)
Juan 3 82
Tabla Nº 4.1.3
Estudiantes X Prueba de habilidad
mental
Y Examen de Admisión
María 18 18
Olga 15 82
Susana 12 68
Aldo 9 60
Juan 3 32
Examinemos ahora la tabla Nº 4.1.3. En este casi ya no podemos afirmar que los
puntajes de la prueba de habilidad mental sirvan para pronosticar los puntajes del
examen de admisión, ya que unos puntajes bajos del examen de admisión y
algunos puntajes bajos del test de habilidad mental están apareados con otros
puntajes altos del examen de admisión, entonces en este caso, decimos que no
existe una relación lineal entre las variables X y Y.
4.1.3. DIAGRAMA DE DISPERSIÓN
En las situaciones que se presentan en la vida real no tenemos solamente cinco
parejas de valores para ambas variables, sino muchísimas parejas. Otra forma
alternativa de ver si existe o no relación lineal entre dos variables seria hacer una
grafica de los valores X y Y en un sistema de coordenadas rectangulares, este tipo
de gráfica es conocido con el nombre de diagrama de dispersión, gráfico de
dispersión o nube de puntos. Dibujemos el diagrama que corresponde a la Tabla N
º 4.1.1. Lo haremos haciendo corresponder a cada valor de la variable
independiente X, un valor de la variable dependiente Y, es decir, para la alumna
Susana haremos corresponder du puntaje en la prueba de habilidad mental (12)
con su puntaje de la prueba de admisión (60); al alumno Juan le hacemos
114
![Page 115: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/115.jpg)
corresponder su puntaje del test de habilidad mental (3) con su puntaje del
examen de admisión (18). Luego ubicaremos los cinco pares de puntajes en el
sistema de ejes rectangulares y obtendremos los gráficos Nº 4.1.1 y Nº 4.1.2
Observemos en el gráfico Nª 4.1.1 que la tabla Nª 4.1.1. Es descrita por el
diagrama de dispersión. Vemos en este gráfico que los cinco puntos dan la
sensación de ascender en línea recta de izquierda a derecha. Esto es
característico en datos en los que existe una relación lineal positiva. Aunque estos
cinco datos no configuren una línea recta en forma perfecta. Se puede trazar una
línea recta que describa que estos puntos en forma bastante aproximada
conforme se ve en el gráfico Nª 4.1.2 y por esto decimos que la relación es lineal.
Si ocurre que todos los puntos de la gráfica de dispersión están incluidos en una
sola línea en forma exacta afirmamos que la relación lineal es perfecta. El grado
en que se separan los puntos de una sola línea recta nos da el grado en que la
relación lineal no es perfecta. Así cuando menos puntos se encuentran en una
sola línea decimos que la relación lineal no es perfecta. Así cuando menos puntos
se encuentran en una sola línea decimos que la relación lineal entre las dos
variables es menos fuerte y cuando más puntos queden incluidos en una línea
recta afirmamos que la relación lineal es más fuerte.
GRÁFICO Nª 4.1.1.
115
![Page 116: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/116.jpg)
Usando los datos de una tabla Nº 4.1.2 y utilizando la misma forma de razonar
empleada hasta ahora podemos construir el correspondiente gráfico de dispersión,
tal como se muestra en el gráfico Nº 4.1.3.
Podemos observar en el gráfico Nº 4.1.4. que la nube de puntos de la gráfica
pueden delinearse bien por una línea recta, lo que nos indica que hay una relación
116
![Page 117: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/117.jpg)
lineal entre las dos variables X y Y Vemos también que la línea desciende de
izquierda a derecha (tienen pendiente negativa) por lo que decimos que la relación
lineal entre las dos variables es negativa.
Si tenemos en cuenta la tabla Nº 4.1.3 podemos obtener una figura como se
muestra en la gráfica Nº 4.1.5 Notamos, en esta situación, que resultará inútil
cualquier línea recta que trate describir adecuadamente este diagrama de
dispersión.
Diagrama de Dispersión
GRÁFICO Nº 4.1.4.
117
Y
80
70
60
50
40
30
20
10
2 4 6 8 10 12 14 16 18 20 X
80
70
60
50
40
30
![Page 118: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/118.jpg)
Diagrama de Dispersión aproximado por una línea recta
4.1.4 COEFICIENTE DE CORRELACIONE RECTILINEA DE PEARSON
Con ayuda de las gráficas nos podemos formar una idea si la nube de puntos, o
diagrama de dispersión, representa una reacción lineal y si esta relación lineal es
positiva o negativa, pero con la sola observación de la gráfica no podemos
cuantificar la fuerza de la relación, lo que si conseguiremos haciendo uso del
coeficiente r de Pearson.
El coeficiente de correlación r de Pearson, toma valores comprendidos entre 1 y +
pasando por 0. El número -1 corresponde a una correlación negativa perfecta (los
puntos del diagrama de dispersión deben encontrarse formando perfectamente
una línea recta). El numero +1 corresponde a una correlación positiva perfecta.
(los puntos del diagrama de dispersión deben encontrarse formando
perfectamente una línea recta). El coeficiente de correlación r=0 se obtiene
cuando no existe ninguna correlación entre las variables. Los valores negativos
mayores que -1 indican una correlación negativa y los valores positivos menores
que 1 indican una correlación positiva.
118
80
70
60
50
40
30
![Page 119: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/119.jpg)
Referente a la magnitud de r podemos decir que independientemente del signo,
cuando el valor absoluto de r esté más cercana de 1, mayor es la fuerza de la
correlación, es así que -0,20 y +0.20 son iguales en fuerza (ambos son dos
valores débiles) los valores -0.93 y +0.93 también son iguales en fuerza (ambos
son dos valores fuertes).
Cálculo del Coeficiente r de Pearson utilizando una máquina calculadora
cuando los datos no son muy numerosos.
Dadas dos variables X y Y con sus respectivos valores. En la Tabla podemos
calcular el coeficiente de Pearson con una máquina calculadora mediante la
siguiente fórmula.
r=N ¿¿
Tabla Auxiliar 4.1.4.
(1)x
(2)Y
(3)X^2
(4)Y^2
(5)XY
18 82 324 6724 1476
15 68 225 4624 1020
12 60 144 3600 720
9 32 81 1024 288
3 18 9 324 54
∑X = 57 ∑Y = 260 ∑X2 =783 ∑Y2 =16296 ∑XY =3558
En las columnas (1) y (2) se han escrito los valores de X y Y. En la columna (3) se
han elevado al cuadrado los valores de X. En la columna (4) se han elevado al
cuadrado los valores de Y. En la columna (5) se ha efectuado el producto de cada
pareja de valores X y Y. Aplicando los datos en la fórmula 4.1.1., se tiene:
r=(5 ) (3558 )−(57 )(260)
√ [5 (783 )−(57)2 ] [5 (16 296 )−(260)2 ]
r= 17 790−14 820
√ (3915−3249 )(81 480−67 600)
119
![Page 120: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/120.jpg)
r= 2970
√ (666 )(13 880);r= 2 970
√9244080
r= 29703 040,4
;r=0,98
INTERPRETACIONES DE UN COEFICIENTE DE CORRELACIÓN
¿Qué tan elevado es un coeficiente de correlación dado? Tofo coeficiente de
correlación que no sea cero indica cierto grado de relación entre dos variables.
Pero es necesario examinar más esta materia, porque el grado de intensidad de
relación se puede considerar desde varios puntos de vista. No se puede decir que
un r de 0,50 indique una relación dos veces más fuerte que la indicada por un r de
0, 25. Ni se puede decir tampoco que un aumento en la correlación de r = 0,40 a r
= 0,60 equivalga a un aumento de r = 0,70 a r = 0,90. Es de observar que una
correlación de 0,60 indica una relación tan estrecha como una correlación de +
0,60. La relación difiere solamente en la dirección.
Siempre que éste establecido fuera de toda duda razonable una relación entre dos
variables, el que el coeficiente de correlación sea pequeño puede significar
únicamente que la situación medida está contaminada por algún factor o factores
no controlados. Es fácil concebir una situación experimental en la cual, si se han
mantenido constantes todos los factores que o sean pertinentes, el r podría haber
sido 1 en lugar de 0,20. Por ejemplos: generalmente la correlación entre la
puntuación de aptitud y el aprovechamiento académico es 0,50 puesto que ambos
se miden en una población cuyo aprovechamiento académico también es
influenciable por el esfuerzo, las actitudes, las peculiaridades de calificación de los
profesores, etc. Si se mantuvieran constantes todos os demás factores
determinantes del aprovechamiento y se midieran exactamente la aptitud y las
notas, el r seria 1 en vez de 0,50.
120
![Page 121: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/121.jpg)
Una conclusión práctica respecto a la correlación es que ésta es siempre relativa a
la situación dentro de la cual se obtiene y su magnitud no representa ningún
hecho natural absoluto. El coeficiente de correlación es siempre algo puramente
relativo a las circunstancias en que se ha obtenido y se ha de interpretar a la luz
de esas circunstancias y sólo muy rara vez en algún sentido absoluto.
Además podemos agregar que la interpretación de un coeficiente de correlación
como de medida del grado de relación lineal entre dos variables es una
interpretación matemática pura y está completamente desprovista de
implicaciones de causa y efecto. El hecho de que dos variables tiendan a
aumentar o disminuir al mismo tiempo no implica que obligadamente una tenga
algún efecto directo o indirecto sobre la otra.
A continuación calcularemos con la fórmula antes indicada el coeficiente de
PEARSON de la relación presentada en la tabla.
Cuadro Auxiliar 4.1.5.
(1)x
(2)Y
(3)X^2
(4)Y^2
(5)XY
18 18 324 324 324
15 32 225 1024 480
12 60 144 3600 720
9 68 81 4624 612
3 82 9 6724 246∑X = 57 ∑Y = 260 ∑X2 =783 ∑Y2 =16296 ∑XY =2382
r=(5 ) (2382 )−(57 )(260)
√ [5 (783 )−(57)2 ] [5 (16 296 )−(260)2 ]
r= 11910−14 820
√ (3915−3249 )(81 480−67 600)
r= −2910
√ (666 )(13 880);r= −2910
√9244080
121
![Page 122: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/122.jpg)
r=−29103 040,4
;r=−0,96 Vemos que la correlación es fuerte y negativa.
Ahora calculemos con la misma fórmula de Pearson Nº 4.1.1. El Coeficiente de
Correlación lineal con los datos de la tabla nº 4.1.3.
Cuadro Auxiliar Nº 4.1.6
(1)x
(2)Y
(3)X^2
(4)Y^2
(5)XY
18 18 324 324 324
15 82 225 6724 1230
12 68 144 4624 816
9 60 81 3600 540
3 32 9 1024 96∑X=57 ∑Y=260 ∑X2=783 ∑Y2=16296 ∑XY=3006
r=(5 ) (3006 )−(57 )(260)
√ [5 (783 )−(57)2 ] [5 (16 296 )−(260)2 ]
r= 15 030−14 820
√ (3915−3249 )(81 480−67 600)
r= 210
√ (666 )(13 880);r= 210
√9244080
r= 2103 040,4
;r=0,07 La correlación es muy débil y positiva.
CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS EN
CLASES
122
![Page 123: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/123.jpg)
El presente tema nos conduce a calcular el coeficiente de correlación r, que nos
proporciona información de la fuerza de la relación que existe entre dos
conjuntos.
Ejemplo: calcular el grado de correlación entre las puntuaciones obtenidas en
inventario de hábitos de estudio y los puntajes obtenidos de un examen
matemático, aplicados a un total de 134 alumnos de un colegio de la localidad.
^-^X Hábitos de Y ^\esiudio
Matemáticas^
20 - 30 30 - 40 40 - 50 50 - 60 Total fy
70 -* 803 2 2 7
60 -> 70 1 0 4 5 10
50 ~» 60 2 6 16 3 27
40 50 4 14 19 10 47
30 >-'■» 40 7 15 6 0 28
20 M 30 8 2 0 1 t 1
10 20 1 1 2 4
Total f. 23 40 48 23 134
Podemos notar que el problema no es tan simple, como el casa anterior, dado,
que ahora los datos se han clasificado en una tabla de doble entrada N" 4.1.7.
Este): cuadro muestra, en la primera columna del lado izquierdo los intervalos de
clase 0» la variable Y, los que cubren todos los posibles datos acerca de las
puntuaciones! alcanzadas por los estudiantes en la prueba de Matemática.
Nótese que los in te rva los los crecen de abajo hacia arriba. En la fila superior
se presentan les intervalos <%
Dentro del cuadro en los casilleros interiores o celdas de la tabla, se encuentran
las frecuencias de celda que correspondan a puntajes que pertenecen tanto a un
intervalo de la variable Y como un intervalo de la variable X.
La fórmula que utilizaremos es la siguiente
123
![Page 124: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/124.jpg)
Para obtener los datos que deben aplicarse en la formula vamos a construir el
cuadro auxiliar al mismo tiempo que se explica el significado de los símbolos de
esa formula
Lo primero que hacemos es reemplazar los intervalos horizontales y verticales por
sus respectivas marcas de clase a continuación adicionalmente al cuadro N4.1.7
cinco columnas por el lado derecho, cuyos encabezamientos son : f para la
primera.
1) Para determinar las frecuencias marginales que se deben colocar en la
columna f sumamos las frecuencias de las celdas que están en la misma
fila de la marca de clase 75, obtenemos 3+2+2=7, numero que se escribe
en el primer casillero o celda de la columna f. en la fila de la marca de
clase 65 sumamos 1+4+5=10 numero que se escribe debajo del 7.
2) Ahora vamos a determinar las frecuencias marginales de la variable x: en
la columna encabezada con la marca de clase 25 sumemos verticalmente
las frecuencias 1+2+4+7+8+1=23
3) Centremos nuestra atención en la columna encabezada u, este signo
significa desviación estándar y procedemos a la misma forma en las tablas.
Recuerden que las desviaciones unitarias positivas: +1+2 y negativas : -1-2
y -3 corresponden a los intervalos menores.
4) Luego vamos a determinar las desviaciones unitarias horizontales de la
variable X. el origen de trabajo es la marca de clase 45 que se halla en la
fila superior del cuadro , por esa razón , escribimos cero debajo de la
frecuencia marginal 48.
5) A continuación vamos a determinar los valores que deben colocarse en la
columna encabezada. Para obtener los valores de la cuarta columna
encabezada debemos tomar en cuenta que por lo tanto basta multiplicar
cada valor de la segunda columna por su correspondiente valor de la
tercera columna así se obtiene el respectivo valor de la cuarta columna. En
efecto:
124
![Page 125: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/125.jpg)
(3)(21)=63 (20)(20)=40(+1)(27)=27; 00*00=0; (-1)(-28)=28; (-2)(-22)=44 y (-
3)(-12)=36
La suma 63+40+27+28+44+36=238
Ahora nos fijamos horizontalmente en la tercera fila. Tenemos que (f)(u)=fu
por consiguiente basta multiplicar verticalmente un valor de la primera fila por
su correspondiente valor de la primera fila por su correspondiente valor de la
segunda fila para obtener el respectivo valor de la tercera fila.
(23)(-2)=-46; (40)(-1)=-40; (48)(0)=0 y (23)(+1)=23
Sumando horizontalmente:
(-46)+ (-40)+ (23)=-86+23=-63
Vamos por la cuarta fila vemos que u (fu)= Fu2 luego basta multiplicar cada
elemento de la segunda fila por su correspondiente elemento de la tercera fila
por su correspondiente elemento de la tercera fila para obtener el respectivo
elemento de la cuarta fila así:
(-2)(-46)=9; (-1)(-40)=40; 0*0=0y (+1)(23)=23
Para obtener valores de la quinta columna observamos que hay tres factores
el 1 es la frecuencia f de la celda o casillero que se está considerando el
segundo factor es la desviación unitaria u, el tercer factor es la desviación
unitaria, por lo tanto el procedimiento será el siguiente: tomemos el número 3
que es la frecuencia de la celda determinada por el cruce de los intervalos que
tienen la marcha de la clase 75 horizontalmente y 35 verticalmente.
Para ubicar el tercer factor corremos la vista del numero 3 hacia su derecha
hasta llegar a la columna de las desviaciones unitarias u y ubicamos el
numero +3 formemos el producto de estos tres números: (3)(--1)(+3)=-9
encerrado de un semicírculo lo escribimos en la celda elegida
En la misma fila tomamos la celda siguiente: (2) (0)(+)
Continuando hacia la derecha (2) (+1)(+3)=6
125
![Page 126: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/126.jpg)
X hábitos estudio Y matemática 25 35 45 55 Fy Uy FyUy FyU^2y
suma de los # en semicírculos
75 2 3 2 2 7 3 21 63 -365 1 0 4 5 10 2 20 40 655 2 6 16 3 27 1 27 27 -745 4 14 19 10 47 0 0 0 035 7 15 6 0 28 -1 -28 23 2925 8 2 0 1 11 -2 -22 44 3415 1 0 1 2 4 -3 -12 36 0
∑FxUx = 6
∑FxUx^2= 238
∑FxyUxUy= 59
Fx 23 40 48 23 134Ux -2 -1 0 1 FxUx -46 -40 0 23 ∑FxUx=-63FxUx^2 92 40 0 23 ∑FxUx^2=155
La fórmula del paso (9) lleva el signo ∑para indicar que se deben sumar
horizontalmente los números que están encerrados en los semicírculos de esa
primera fila elegida así: -9+0+6. Este número se escribe en la quita columna.
Trabajemos con la segunda fila: (1) (-2)(+2)= -4 se encierra en un semicírculo.
(0)(-1)(+2)= 0
(4)(0)(+2)= 0
(5)(+1)(+2)= 10
Sumando 0 + 0 + 10 = 10
Ahora con la tercera fila:
(2)(-2)(+1)= -4
(6)(-1)(+1)= -6
126
![Page 127: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/127.jpg)
(16)(0)(+1)= 0
(0)(+1)(+1)= 3
Sumando: (-4) + (-6) + 0 + 3 = -7
Cuarta fila
(-4) + (-2) + 0 = 0 todos los productos vales cero, luego la suma = 0
Quinta fila
(7)(-2)(-1)= 14
(15)(-1)(-1)= 15
(6)(0)(-1)= 0
(0)(+1)(-1)= 0
La suma es: 14+15= 29
(8)(-2)(-2)= 32
(2)(-1)(-2)= 4
(0)(0)(-2)= 0
(1)(+1)(-2)= -2
La suma es: 32 + 4 -2 = 34
Séptima fila:
(1)(-2)(-3)= 6
(1)(0)(-3)= 0
(2)(1)(-3)= -6
Sumando: 6 + 0 – 6 = 0
127
![Page 128: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/128.jpg)
Sumando los valores de la columna quinta.
Reuniendo los resultados anteriores, se tienen los datos para aplicar en la formula
n= 134
∑f xyU xU y= 59
∑f xU x = -63
∑f yU y= 6
∑f xU x2 = 155
∑f yU y2 = 238
r= (134 ) (59 )−(−63 )(6)
√ {(134 ) (155 )− (−63 )2 }{(134 ) (238 )−(62)
r= 7906+378
√(20770−3969 )(39892−36)
r= 0,358
Ejercicio Resuelto N° 2 de Cálculo de Coeficiente de Correlación Entre
Conjuntos de Datos Agrupados
Calcular el coeficiente de correlación lineal de las puntuaciones en matemáticas y
físicas de 100 estudiantes de la Facultad de Ciencias de la Universidad MN
128
![Page 129: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/129.jpg)
X Puntuación matemáticas
Y Puntuación fisica 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 TOTAL90 - 100 0 0 0 2 5 5 1280 - 90 0 0 1 3 6 5 1570 - 80 0 1 2 11 9 2 2560 - 70 2 3 10 3 1 0 1950 - 60 4 7 6 1 0 0 1840 - 50 4 4 4 0 0 0 11TOTAL 10 15 22 20 21 12 100
129
![Page 130: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/130.jpg)
PUNTACIÓN EN MATEMÁTICA
SUMA DE LOS NÚMEROS
ENCERRADOS EN SEMICÍRCULOS EN
CADA FILA
45 55 65 75 85 95 Fy Uy Fy Uy Fy U2y
PU
NT
UA
CIO
N E
NF
ISIS
CA
Y
95 2 5 5 12 2 24 48 54
85 1 3 6 5 15 1 15 15 30
75 1 2 11 9 2 25 0 0 0 0
65 2 3 10 3 1 19 -1 -19 19 2
55 4 7 6 1 18 -2 -36 72 28
45 4 4 3 11 -3 -33 99 36
fx 10 15 22 20 21 12 100 -3 -49 253 150
Ux -2 -1 0 1 2 3 3 Σfy Uy Σfy U2y Σ fxy Ux Uy
FxUx -20 -15 0 20 42 36 63 Σfx Ux
Fx U2x 40 15 0 20 84 10
8
267 Σfx U2x
130
![Page 131: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/131.jpg)
En este problema tenemos que calcular el confidente de correlación lineal r para
dos conjuntos de datos constituidos por los calificativos en una escala de 0 a 100,
en matemáticas y en física para 100 estudiantes de la facultad de Ciencias de
cierta universidad
Los datos se muestran en el cuadro N° 4.1.9 Notemos que a lo largo de la línea
horizontal superior se encuentran los intervalos que contienen los calificativos de
matemáticas desde 40 hasta 100.
Igualmente en la primera columna vertical izquierda, se encuentran los calificativos
para física de los mismos estudiantes, desde el calificativo 40 hasta 100. Notese
que en la columna de los calificativos de física los datos crecen de abajo hacia
arriba y para la fila horizontal superior vemos que los calificativos en matemáticas
crecen izquierda a derecha.
A continuación procederemos a calcular el confidente de correlación r para estos
datos aplicando el mismo método que utilizaremos en el problema anterior.
1) Traslademos los datos del cuadro N° 4.1.9. Llamaremos xy a cualquiera de
las frecuencias de los casilleros interiores del cuadro N° 4.1.9. En el cuadro
N° 4.1.10. podemos observar que se han agregado cinco columnas por el
lado derecho y cuatro filas por la parte interior
Observemos en el cuadro N° 4.1.10 que los intervalos para la puntuación en
matemáticas y para la puntación en física se han remplazado por las marcas de
clase correspondientes. Así en la fila horizontal superior se han remplazado el
primer intervalo 40 50 por su marca de clase45, el segundo intervalo 50 60
por su marca de clase 55 y de esta manera se han remplazado los demás
intervalos por sus marcas de clases en el cuadro N° 4.1.10.
De igual forma para la columna primera de la izquierda vemos que los intervalos
se han remplazado por sus respectivas marcas de clase así para la puntuación en
física el primer intervalo superior 90 100 se han remplazado por su marca de
clase 95, el segundo intervalo superior 80 90 se ha remplazado por su marca
131
![Page 132: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/132.jpg)
de clase 85 y así sucesivamente hasta llegar al intervalo inferior 40 50 que se
ha remplazado por su marca de clase 45.
Ahora vamos a realizar los pasos siguientes
1) Para las frecuencia marginales fy sumemos todos los valores fxy de la
primera fila que tiene la marca de clase 95. De esta forma tenemos: 2+5+5=
12 Para la segunda fila que corresponde a la marca de clase 85
obtenemos: 1+3+6+5= 15 que escribimos en el segundo casillero de fy.
2) Dediquemos nuestra atención a las frecuencias marginales fx. el primer
resultado de fx lo obtenemos sumando las frecuencias fxy para la colunia que
tiene la marca de clase 45, de esta forma tenemos: 2+4= 10 que se escribe
en el primer casillero de fx para el segundo casillero tenemos el número 15
que se obtiene verticalmente de las frecuencias fxy de la columna que tiene
de marca de clase 55. Continuando con las sumas de las f de las demás
columnas llenamos las frecuencias marginales fx.
3) Atendamos la columna Uy la columna Uy tiene en total 6 casilleros
arbitrariamente escogemos uno de estos casilleros como origen de trabajo
y le asignamos el numero 0. Aquí hemos escogido el tercer casillero
contando de arriba hacia abajo. Observamos ahora la primera columna de
la izquierda en donde están las marcas de clase de los puntajes de física.
Aquí observamos que las marcas de clase crecen de abajo hacia arriba
entonces las desviaciones unitarias en la columna Uy crecerán de abajo
hacia arriba entonces del 0 hacia abajo, las desviaciones unitarias son
números negativos que van decreciendo hacia abajo.
Desde el 0 hacia arriba las desviaciones serán positivas y crecientes.
De manera que podemos observar que la columna Uy está conformada por
los siguientes números que crecen del 0 hacia arriba: 1,2 y desde el 0 hacia
abajo decrece: -1,-2,-3.
4) Veamos la fila Ux
132
![Page 133: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/133.jpg)
Notamos que el fila horizontal superior las marcas de clase crecen de
izquierda a derecha de igual forma las desviaciones unitarias crecerán de
izquierda a derecha. Elegiremos como origen de trabajo arbitrariamente uno
del casillero Ux el tercero contando de izquierda a derecha, y vamos
asignando números positivos crecientes hacia la derecha del 0, así
tenemos 1, 2,3 ya hacia la izquierda, a partir del cero, tendremos:-1y-2.
5) Expliquemos la columna fy Uy. Multipliquemos cada valor de fy por su
correspondiente valor de Uy y se obtiene un valor Fy Uy. Por ejemplo el
numero 24 se obtiene multiplicando la frecuencia marginal fy = 12 por su
correspondiente desviación unitaria Uy = 2esto es, 12*2= 24. Para el
segundo casillero multiplicamos 15*1=15; para el tercero 25*0=, así hasta
terminar con 11*(-3)= -33.
6) Observemos la columna Fy U2y. L primera celda de esta columna tiene el
número 48 que se obtiene de multiplicando el valor Uy =2 de la segunda
columna por su correspondiente valor Fy Uy = 24 de la tercera columna, es
decir, 2*24= 48. Para el segundo casillero de la columna fy U2y , tenemos 15
que es igual a 1 por 15. De esta forma continuamos llenando los demás
valores de la columna Fy U2y.
7) Veamos ahora la fila fx ux. El número -20 del primer casillero de esta fila se
obtiene multiplicando la frecuencia marginal fx = 10 por su correspondiente
desviación unitaria Ux = -2 es decir: 10 (-2)= -20.
Para el segundo casillero de FX UX, multiplicamos (-1)*(-15)= 15 y así
sucesivamente 12*3= 36.
8) Veamos Fx U2x. El primer casillero de esta fila es 40 y es el resultado de
multiplicar -2 del primer casillero de la fila Fx Ux por menos 20 de su
correspondiente primer casillero de la fila Ux esto es, (-2)* (-20)= 40. Para el
segundo casillero de fx U2x multiplicamos -1 del segundo casillero de Ux por -
15 de su correspondiente segundo casillero de FX UX, luego obtenemos (-1)
*(-15)=15 .Así continuamos multiplicando los valores de los casilleros Ux por
sus correspondientes valores de la fila Fx Ux hasta llegar a (3) (36)= 108.
133
![Page 134: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/134.jpg)
9) Interesa ahora obtener los números encerrados en semicírculo, por ejemplo
ahora, el numero 4, que corresponde a la marca de clase 75 para la
puntuación en matemáticas y a la marca de clase 95 de la puntuación en
física.
10) Para saber cómo se obtiene este numero 4, corramos nuestra vista hacia
la derecha dirigiéndonos hacia la columna UY y obtenemos el numero 2.
Del numero 4, encerrado en semicírculo, bajemos la vista con dirección a la
fila Ux y obtenemos 1. La frecuencia del casillero donde esta el 4, encerrado
en semicírculo, es fxy = 2. Multiplicando estos 3 factores tendremos fxy Ux Uy =
(2) (1) (2) = 4.
Podemos anunciar la siguiente regla:
Para obtener los valores encerrados en semicírculos en los casilleros interiores del
cuadro N°4..1.10 multiplicamos el valor de la frecuencia fxy del casillero para el cual
estamos haciendo el cálculo, por los valores de las desviaciones unitarias Uy y Ux ,
obtenidas corriendo la vista hacia la derecha hasta columna Uy y también hacia
abajo hasta legar a la fila Ux.
Así por ejemplo, para el casillero que corresponde a las marcas de clase 75 en
matemática y 85 en física, tenemos la frecuencia de la celda Fxy = 3, los otros dos
factores son: Uy =1 y Ux = 1.
Luego (3) x (1) x (1) = 3 que es el valor encerrado en semicírculo.
Para el casillero correspondiente a la marca de clase 55 en matemáticas marca de
clase 45 en física, tenemos:
fxy = 4, Uy = -3, Ux = -1
134
![Page 135: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/135.jpg)
fxy Ux Uy = (4) (-3) (-1) = 12 que es el valor encerrado en semicírculo. Así podemos
proceder para obtener todos los demás valores encerrados en semicírculos.
Sumando las frecuencias marginales de la columna fy, se tiene ∑ fy =100.
Sumando los valores de la tercera columna se obtiene ∑fy Uy = - 49. Sumando los
valores de la cuarta columna, tenemos ∑fy U^2y = 253. La suma de los valores de
la quinta columna:
∑fxy Ux Uy = 150
Para todas las filas, en el último casillero de la derecha se tiene la suma de los
valores de la fila. Así, por ejemplo, ∑fx = 100; ∑fy = 100.
Para la tercera fila: ∑fx Ux = 63
Para la cuarta fila: ∑fx U^2x = 267
Estos totales de filas y columnas reemplazaremos en la fórmula.
r=(100 ) (150 )−(63 )(−49)
√ [100 (267 )−(63)2 ] [100 (253 )−(−49)2 ]
r= 15 000−3 087
√ (26 700−3969 )(25 300−2401)
r= 18087
√ (22731 )(22899);r=18087
22 815
r=0,79 Vemos que el coeficiente de correlación en este caso es 0.79.
Ejercicio Propuesto Nº 1 del Cálculo del Coeficiente de Correlación entre dos
Conjuntos Agrupados de Datos.
135
![Page 136: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/136.jpg)
Supongamos que tenemos 30 sujetos a los que hemos aplicado una prueba de
conocimientos de Psicología General (variable x) y un test de inteligencia (variable
y).
Aplicando los datos tomados del Cuadro Auxiliar en la fórmula tenemos:
Resultado:
r=(30 ) (70 )− (35 )(26)
√ [30(93)−(35)2 ] [30 (78 )−(26)2 ]
r= 2100−910
√ (2790−1225 )(2340−676)
r= 1190
√ (1565 )(1664 );r= 1190
1613,7
r=0,74
Ejemplo propuesto N°2 del cálculo del coeficiente de correlación entre dos
conjunto de datos agrupados. Supongamos que se tienen 50 vendedores de cierta
compañía. Estos vendedores durante un año 1985 han realizado ventas tal como
lo muestra el cuadro N°4.1.13, el que también muestra el número de años de
experiencia que tiene como vendedores.
Para dicho cuando, se pide calcular el coeficiente de correlación lineal r.
0 2 2 4 4 6 6 8 8 10 TOTAL
15 18 1 1
136
Años de experiencia
X
Monto de ventas
![Page 137: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/137.jpg)
12 15 2 3 4 9
9 12 7 3 2 12
6 9 6 9 4 19
3 6 5 2 7
1 3 2 2
TOTAL 2 11 18 12 7 50
Tomando los datos obtenidos n el cuadro Auxiliar N°4.1.14 apliquemos en la
formula N° 4.1.12, se tiene.
r=50 (46 )−(11 )(22)
√ ¿¿
r= 2300−242√(2950−121)(3600−484)
= 2058
√(2829 ) (3116 )
137
![Page 138: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/138.jpg)
r=20582969
=0.6
138
![Page 139: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/139.jpg)
Progresiones lineales simples
4.2.1. Regresión lineal simple
Al comenzar a estudiar las técnicas de correlación afirmamos que
estudiaríamos dos variables y no solamente una. Llamamos a esa ocasión X a
una de las variables Y a la otra. En el tema que nos ocuparemos ahora,
estudiaremos la forma de predecir v valores de Y conociendo primero los
valores de X. Es así que viendo la tabla N 4.2.1, similar a la que utilizamos
cuando estudiamos correlación, conociendo el puntaje en la prueba de
habilidad mental (variable X) para un alumno determinado, podemos anticipar
el puntaje del examen de admisión (variable Y) del mismo alumno.
Consideraremos la relación lineal expresada por el cuadro N4.2.1 si dibujamos
esa relación, obtenemos el grafico N4.2.1. Como podemos observar todos los
puntos se alinean exactamente. En una sola línea recta, la que recibe el
nombre de línea de regresión. Teniendo en cuenta esta línea, podemos
predecir cualquiera d los valores de Y conociendo el valor de X; para X=25,
según la recta, correspondiente de Y=35, para X=20 corresponde Y=30. Etc.
En este caso se trata de una correlación positiva perfecta cuyo coeficiente de
correlación es +1.
Prueba de habilidad
mental X
Examen de Admisión
Y
SUSANA 5 15
IVAN 10 20
LOURDES 15 25
ALDO 20 30
JUAN 25 35
MARIA 30 40
CESAR 35 45
139
![Page 140: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/140.jpg)
OLGA 40 50
Recordemos ahora el grafico N 4.1.2 que dibujamos cuando estudiamos
correlación, en este grafico observamos el diagrama de dispersión aproximado
por una línea recta, la recta que mejor se ajuste a los puntos del diagrama de
dispersión, es decir, en la mejor medida procure dejar igual número de puntos
del diagrama de dispersión por encima de ella que igual número de puntos
debajo, se llama línea de regresión.
ECUACION DE LA REGRESION RECTILINEA
La ecuación que describe la línea de regresión es:
YR=Y+r (S y
S x)x−r (S y
S x)x
Y=mediade la variableY en lamuestra.
GRÁFICO
X = media de la variable X en la muestra.
140
r = 1,00
![Page 141: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/141.jpg)
X = un valor de la variable X
r = coeficiente de Pearson, de la correlación lineal entre las variables X y Y.
SY = desviación estándar de Y en la muestra.
SX = desviación estándar de X en la muestra.
Yr = Valor Y resultado del cálculo de la fórmula.
Veamos cómo podemos predecir los valore de Y a partir de los valores de X.
como el gráfico de este cuadro es una línea recta ascendente sabemos que su
coeficiente de correlación de Pearson r = +1. Además tenemos los siguientes
resultados:
X = 22,5 SX = 11,46 Y= 32,5 SY = 11,46
Estos resultados se pueden calcular a partir de los datos del cuadro.
Apliquemos estos datos a la fórmula, obtenemos la siguiente expresión:
YR=32,5+( 1)( 11,46
11,46 )X−(1 )( 11,4611,46 )22,5(a)
Simplificando términos obtenemos:
Y R=32,5+X−22,5 (b )
Y R=10+X
Escojamos cualquier valor de X, por ejemplo para María x = 30, reemplazando
este valor en (b).
Y R=10+30=40 (c )
Vemos en le cuadro el valor que corresponde a María efectivamente es 40, es
decir podemos usar la ecuación para predecir los valores de Y conociendo los
valores de X.
Esta fórmula de regresión se puede aplicar par dos variables X y Y, entre las
cuales no es obligatorio que exista una correlación lineal perfecta, es decir, no
es obligatorio que el r para la correlación entre X y Y sea siempre igual a 1.
141
![Page 142: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/142.jpg)
Este valor de r para otras aplicaciones de la regresión, puede tomar cualquier
valor distinto de 1.
Ejercicios Resueltos de Regresión Lineal Simple
Al aplicar un test de inteligencia a una muestra representativa constituida por
800 alumnos, se obtuvo la puntuación media de 30,4 puntos, con la desviación
estándar de 12,6 puntos.
La edad media de la muestra fue de 14,5 años, con la desviación estándar de
3,2 años.
El coeficiente de correlación lineal de Pearson entre la variable Y, edad de los
sujetos estudiados y la variable X, rendimiento mental de los mismos sujetos,
fue r = 0,89.
Con estos datos se pide determinar la ecuación de regresión rectilínea de edad
en base del puntaje del rendimiento mental.
¿Qué edad corresponde a los sujetos que alcanzan puntuaciones de:
X1 = 18 Puntos X4 = 50 Puntos
X2 = 25 Puntos X5 = 60 Puntos
X3 = 45 Puntos X6 = 80 Puntos
Datos:
Y = 14,5 SY = 3,2 r = 0, 89
X = 30,4 SX = 12,6
Aplicando estos datos en la fórmula se tiene:
YR=14,5+( 0,89)( 3,2
12,6 )X−(0,89 )( 3,212,6 )30,4
Y R=14,5+0,226 X−6,87
Y R=7,63+0,226 XEs la ecuación de regresión buscada.
142
![Page 143: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/143.jpg)
Respuesta de la 1ra. Pregunta
X1 = 18
YR = 7,63 + 0,226 (18) = 7,63 + 4,07
YR = 11,7 años
Segunda pregunta
X2 = 25
YR = 7,63 + 0,226 (25) = 7,63 + 5,65
YR = 13,28 años
Tercera pregunta
X3 = 45
YR = 7,63 + 0,226 (45) = 7,63 + 10,17
YR = 17,8 años
Cuarta pregunta
X4 = 50
YR = 7,63 + 0,226 (50) = 7,63 + 11,3
YR = 18,93 años
Quinta pregunta
X5 = 60
YR = 7,63 + 0,226 (60) = 7,63 + 13,56
YR = 21,19 años
Sexta pregunta
X6 = 80
143
![Page 144: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/144.jpg)
YR = 7,63 + 0,226 (80) = 7,63 + 18,08
YR = 25,71 años
Este cuadro contiene la primera columna los nombres de los alumnos, en la
segunda están los rangos de esos alumnos en la variable, en la tercera se
hallan los rangos de los alumnos en la variable Y. En la cuarta columna están
las diferencias de los rangos correspondientes de las variables X y Y. en la
quinta columna se colocan las cuadros de las diferencias, ya calculadas.
CUADRO AUXILIAR Nº 4.3.4
ALUMNOS RENGO DE
X
RANGO DE
Y
D=
DIFERENCIA
D2
Rodríguez 3 3 0 0
Fernández 4 5 -1 1
Córdova 2 1 1 1
Flores 1 2 -1 1
Lema 5 4 1 1
APLICANDO LOS DATOS EN LA FORMULA Nº 4.3.1, SE TIENE
[p= −6 (4 )5(52−1)
=1−0.02]P= 0.08
Es una correlación positiva. Su valor es muy alto y poco común puesto que la
práctica enseña que en la correlación de la inteligencia con el rendimiento
escolar en las asignaturas, casi siempre se alcanza un valor próximo a 0.5.
EJEMPLO 2
Supongamos el siguiente cuadro nº 4.3.5. Queremos calcular el coeficiente de
correlación por rangos.
144
![Page 145: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/145.jpg)
CUADRO Nº 4.3.5
EXAMINADOS PRUEBA DE
HABILIDAD MENTAL
X
APTITUD ACADÉMICA
Y
Susana 49 55
Iván 46 50
Lourdes 45 53
Aldo 42 35
Juan 39 48
maría 37 46
cesar 20 29
Olga 15 32
Observamos que los examinados están ordenados con respecto a la prueba de
habilidad mental de mayor a menor; podemos afirmar que la posición o rango
que se podría asignar a Susana es el primero, a Iván le correspondería el
segundo, para Lourdes el tercero tal como se muestra en el cuadro Nº4.3.6.
De igual forma podríamos ordenar la posición o rango de los postulantes según
los resultados de la prueba de aptitud académica Y del examen de admisión, lo
que se muestra en el cuadro Nº4.3.6 es así como Susana también ocupa el
número de orden o rango primero y Lourdes ocupa el segundo lugar o rango
dos en esa prueba, así podemos continuar ordenando los alumnos según su
rango en la pruebe de aptitud académica y terminaremos con cesar que ocupa
el rango 8 en tal prueba.
CORRELACIÓN POR RANGOS
Es el orden que posee o se asignan a cada miembro de un conjunto de de
elementos de acuerdo a una escala ordinal dada. El rango ubica el elemento en
un punto de esa escala.
145
![Page 146: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/146.jpg)
Por ejemplo: podemos establecer un ordenamiento de los alumnos de acuerdo
a los puntajes alcanzados en un examen. Así tenemos en el cuadro Nº 4.3.1
que sigue:
CUADRO Nº 4.3.1
ALUMNOS García león Pérez Ruíz Lazo Lora
PUNTAJES 40 65 52 70 76 56
Ordenándolos de acuerdo a la magnitud del puntaje, establecemos los rangos
siguientes en el cuadro Nº 4.3.1.
CUADRO Nº 4.3.2
ALUMNOS García león Pérez Ruíz Lazo Lora
RANGOS 6 3 5 2 1 4
4.3.2 COEFICIENTE DE CORRELACIÓN POR RANGOS
La correlación por rangos se refiere a la correspondencia en el ordenamiento
de los elementos de dos conjuntos dados. La fuerza de la correlación se mide
por medio del coeficiente por rangos de spearman, cuya fórmula es:
[p=1−6∑ D2
n(n2−1) ]
En donde.
P= letra griega rho, designa el coeficiente de correlación por rangos.
D= diferencias de rangos correspondientes entre si pertenecientes a dos
variables X y Y. Por ejemplo d= X1−Y 1
n= numero de pares correspondientes.
146
![Page 147: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/147.jpg)
EJEMPLOS Nº 1
En la primera columna de la izquierda del cuadro Nº 4.3.3 se presenta un grupo
de 5 estudiantes; en la segunda columna están sus niveles mentales que se
consideran como categorías de la variable X, en la tercera columna se indican
los resultados de una prueba de matemáticas aplicadas al grupo, cuyas
puntuaciones son valores de la variable Y.
CUADRO Nº 4.3.3
ALUMNOS NIVEL MENTAL
X
MATEMÁTICAS
Y
Rodríguez medio 35
Fernández interior al promedio 17
Córdova superior al promedio 48
flores muy superior al
promedio
42
lema muy inferior al promedio 20
Calcular el coeficiente de correlación por rangos.
ESTUDIANTES CLASIFICACION
DE LOS RANGOS
CLASIFICACION DE
LOS RANGOS
D= DIF D2
RANGO X RANGO Y
SUSANA 1 1 0 0
ESTEBAN 2 3 -1 1
LOURDES 3 2 1 1
147
![Page 148: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/148.jpg)
ALDO 4 6 -2 4
JUAN 5 4 1 1
MARIA 6 5 1 1
CESAR 7 8 -1 1
OLGA 8 7 1 1
∑D2 = 10
En la descripción de este cuadro la columna X corresponde a los rangos en las
pruebas de habilidad mental, la columna Y corresponde a los rangos de las
pruebas de los estudiantes de actitud académica. La columna D corresponde a
la diferencia del rango de un elemento de la columna X menos el rango de su
correspondiente elemento en la columna Y. en la columna D2 se halla el
cuadrado de la diferencia anotada en la columna D.
Ahora para medir la correlación entre los resultados de la prueba de habilidad
mental y del examen de admisión, tomamos los datos del cuadro anterior en el
que los datos están transformados en rangos.
Conforme ya mencionamos en el ejemplo 1 la fuerza de la correlación en este
tipo de problemas, se determina por el coeficiente p (rho) de correlación de
rangos de spearman. Aplicamos la formula N° 4,3,1 en donde
N= 8 pares
∑D2 = 10, este número es el resultado de la suma de los números D elevados
al cuadrado que figuran la columna D2.
Vemos que existe una correlación positiva fuerte entre las puntuaciones de la
prueba de la habilidad mental y los puntajes de la actitud académica del
examen de admisión.
Caso de rangos empatados o repetidos
Examinemos el caso N° 4.3.7 y supongamos que en el examen de admisión de
Susana y Esteban obtuvieron el mismo puntaje 55 y por lo tanto a cualquiera
de los dos le corresponde los rangos primero o segundo para romper esta
148
![Page 149: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/149.jpg)
indeterminación, convenimos en asignar a cada uno de ellos el promedio de
ambos
Rangos, o sea 1+2
2= 1.5 entonces tanto Susana como esteban tendrán el
rango
Tratemos ahora los rangos del VI Ciclo vemos que los profesores L Y P están
empleados o igualados en puntaje por lo que a cualquiera de los dos le
corresponde el rango 5 o el rango 6.el rango que le asignemos serán el
resultado de promedio 5 y 6 que son los dos rangos empatados, luego (5+6) / 2
=5.5 será el número que le asignamos como rango.
Los profesores Fy Z tienen en el VI ciclo los rangos 3 y 4 a cualquiera de estos
dos les corresponde el tercer o cuarto lugar. El número que les asignaremos
será (3+4) /2 = 3.5.
Luego elaboramos una columna para los nuevos rangos Y en donde a los
profesores L y P les asignaremos el rango 5.5 y a los profesores F Y Z les
asignaremos el rango 3 Y 5. los profesores J Y K seguirán con los rangos 1 y 2
respectivamente.
En La Columna D se colocan las diferencias X – Y
Nos ocuparemos ahora de la columna D2. En esta columna se encuentran
valores de la columna D elevados al cuadrado, luego sumamos los valores de
la columna D2 y obtenemos ∑D
2 = 17.
Ahora aplicaremos la formula número 4.3.1.
Aquí ∑D
2 = 17.
N= 6
P= 1- = 0.5
149
6 (17)6 (36 -1)
![Page 150: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/150.jpg)
Luego la correlación entre los puntajes asignados a los 6 pro0fesores por el V
ciclo y los puntajes asignados por el VI ciclo es positiva, pero su magnitud no
es ni muy fuerte ni muy débil.
2º EJERCICIO
Cinco niños se someten a una pruebe de habilidad mental y los resultados de
estas se ordenan por rangos en la columna X. también se muestran en la
columna Y los rangos de estos mismos 5 niños respecto al tiempo que gastan
al mirar la tv.? (Ver cuadro Nº 4.3.1)
¿Existe correlación entre el rendimiento mental de los niños y el tiempo que
gastan mirando tv.?
Calculando los nuevos rangos para la columna Y teniendo en cuenta rangos
igualados obtenemos:
ALUMNOS x YA 1 4 o 5B 2 4 o 5C 3 2 o 3D 4 1E 5 2 o 3
¿Existe correlación entre el rendimiento mental de los niños y el tiempo que gastan mirando tv.?
Calculando los nuevos rangos para la columna Y. teniendo en cuenta los rangos iguales obtenemos:
X Y DX - Y
D2
A 1 4.5 -3.5 12.25B 2 4.5 -2.5 6.25C 3 2.5 0.5 0.25D 4 1 3 9
150
![Page 151: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/151.jpg)
E 5 2.5 2.5 6.25ΣD2 = 34.00
Para Obtener Los Rangos Correspondientes A Los Niños A Y B Hemos
Sumado Los Lugares Que Podrían Ocupar Cualquiera De Los Dos Y Que Son
5 Y 4 Y Luego Esta Suma La Dividimos Entre El Numero De Rango Igualados
Que Son Dos, Esto Es: (4+5)/ 2= 4.5 Luego Rango Que Les Corresponda A A
Y B Es 4.5
DE IGUAL FORMA PROCEDEMOS PARA LOS RANGO C Y E obteniendo
para ellos como nuevo rango 2.5.
Ahora añadiremos una nueva columna D, en esta columna escribiremos
diferencia entre uno de los rangos de x menos el correspondiente rango de Y.
Elevamos al cuadrado cada valor de y y escribimos cada resultado en la
columna del cuadrado. Luego sumamos los valores de la columna de D2 y
obtenemos ΣD2 =34.00
P=1−6 (34 )
2 !5 (25−1 )=1−204
120
P= 1 – 1.7=+0.7
Luego obtenemos una correlación negativa cuya magnitud es 0.7 que es un
valor fuerte para este tipo de situación.
EJERCICIO PROPUESTO DE CÁLCULO DE COEFICIENTE DE SPEARMAN
La tabla muestra siete estudiantes que ordenados alfabéticamente obtuvieron
su número de orden según sus calificaciones en teoría y práctica académica en
un curso de lenguaje. Calcular el coeficiente de correlación de SPEARMAN.
ALUMNOS PRACTICA X TEORIA YA 7 6B 4 7
151
![Page 152: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/152.jpg)
C 6 5D 3 2E 5 1F 2 4G 1 3
2º EJERCICIO
El cuadro muestra las correspondientes alturas en centímetros de grupo de
padres y de sus hijos primogénitos.
1) calcular el coeficiente de correlación de espermas
2) calcular también el coeficiente de Pearson
3) son parecidos?
ALTURA PADRE X ALTURA HIJOS Y172 178164 154180 180190 184164 166164 166165 166180 175
RESPUESTA 1 p= 0.89
3º EJERCICIO
En la tabla los cinco siguientes individuos se han colocado por rangos de 1 a 5
sobre X e Y. calcular el coeficiente de correlación.
X YA 2 3B 1 2C 3 1D 5 5E 4 4
RESPUESTA 1 p= 0.7
152
![Page 153: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/153.jpg)
EJERCICIO
El gerente del personal una empresa agroindustrial estudia la relación entre la
variable dependiente Y y la variable independiente X de su personal obrero.
Recoge una muestra aleatoria de 10 trabajadores y se obtuvieron los datos en
dólares por semana.
a) Determinar el diagrama de dispersión
b) De su comentario sobre el valor de la pendiente
La relación es positiva e imperfecta porque al pasar la recta no cruza por
todos los puntos, sin embargo el valor de la pendiente se aproxima a
uno.
c) Estime el gasto que correspondería a un salario semanal de 90USD.
Salario (x)
Gasto (y)
X2 Y2 XY (xi -Ẋ) (xi - Ẋ)^2 (Yi -Ῡ) (Yi -Ῡ)^2
28 25 784 625 700 -17,8 316,84 -13,4 179,56
25 20 625 400 500 25 625 20 400
35 32 1225 1024 1120 35 1225 32 1024
40 37 1600 1369 1480 40 1600 37 1369
45 40 2025 1600 1800 45 2025 40 1600
50 40 2500 1600 2000 50 2500 40 1600
50 45 2500 2025 2250 50 2500 45 2025
35 30 1225 900 1050 35 1225 30 900
70 55 4900 3025 3850 70 4900 55 3025
153
![Page 154: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/154.jpg)
80 60 6400 3600 4800 80 6400 60 3600
ƩX=458 ƩY=384
ƩX2=23784 ƩY2=16168 ƩXY=19550 Ʃ(xi -Ẋ) =412,2
Ʃ(xi - Ẋ)^2=
23316,84
Ʃ(Yi -Ῡ) =345,6
Ʃ(Yi-Ῡ)^2=15722,56
r=n¿¿
r=10 (19550 )− (458 )(384 )
√ [10 (23784 )−(458)2 ]¿¿¿
r= 195 500−175 872
√ [ 237840−209764 ] [161680−147456 ]
r= 19 628
√ [ 28076 ] [14224 ]
r= 19 628
√399 353 024
r= 19 62819 983 ,82
r=0,98
Desviación Estándar (X)
Sx = √∑ ¿¿¿¿¿ Sx = √ 23316,8410
=√2331,4 = 48,28
Ẋ = Ʃ X in
=45810
=45 ,8 Sy = √ 15722 ,5610
=√1572 ,256 = 39, 65
Ῡ = ƩY in
=38410
=38 ,4
Y R= y+r ( SySx )x−r ( SySx
) x Y R=38,4+0 ,98( 39 ,65
48 ,28 )x−0 ,98( 39 ,6548 ,28 )45 ,8
Y R=38,4 +0 ,80 x−0 ,80(45 ,8) 154
![Page 155: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/155.jpg)
Y R=1,54 +0,80 x Y R=1,54 +0,80(90) = 73, 54 gasto de un salario semanal
r=n¿¿
r=6 (260 )−(47)(35)
√¿¿¿
r=1560−1645√¿¿¿
r= −85
√277472490
r= −8516657.51
r = -0.005
155
![Page 156: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/156.jpg)
COMENTARIO.- Vemos que los vehículos de 20 toneladas no tienen relación con los de 40 toneladas, ya que a los de 20 se los utiliza más para las importaciones que los de 40 debido a que son más ligeros al transportar las mercancías.
156
![Page 157: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/157.jpg)
157
![Page 158: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/158.jpg)
158
![Page 159: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/159.jpg)
159
![Page 160: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/160.jpg)
160
![Page 161: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/161.jpg)
PRUEBA DE HIPÓTESIS
Hipótesis Estadística
Se llama hipótesis, a una suposición o conjetura; que se formula, con el propósito de ser verificada. Cuando se establece la veracidad de una hipótesis, se adquiere el compromiso de verificada en base a los datos de la muestra obtenida. La hipótesis estadística es fundamentalmente distinta de una proposición matemática, debido que al decidir sobre su certeza podemos tomar decisiones equivocadas, mientras que en la proposición matemática podemos afirmar categóricamente si es verdadera o falsa.
Hipótesis Nula
Es una hipótesis que afirma lo contrario de lo que se quiere probar. En ella se supone que el parámetro de la población que se está estudiando, tiene determinado valor. A la hipótesis nula, se le representa con el símbolo Ho, y se formula con la intención de rechazarla.
Ejemplo: Para decidir que una moneda está cargada, suponemos lo contrario, es decir, que la moneda es legal, esto es, que tiene igual probabilidad o proporción de salir cara, que de salir sello. Llamamos P (proporción poblacional de cara) y Q (proporción poblacional de sello), P +Q = 1 (proporción del total o 100% de los casos); pero la moneda es legal, entonces esperamos que P = Q, reemplazando P por Q, P + P = 1, 2P = 1 y P = 0.5, es decir, la proporción poblacional de éxito (cara), para todas las monedas legales es 0.5. Sobre esta base, durante la ejecución del experimento, aceptamos que actúan únicamente las leyes del azar, descartando la influencia de cualquier otro factor.
Hipótesis Alternativa
Es una hipótesis diferente de la hipótesis nula. Expresa lo que realmente creemos es factible, es decir, constituye la hipótesis de investigación. Se le designa por el símbolo H a. En el ejemplo citado, la hipótesis alternativa sería: H a: P ≠ 0.5, es decir, P > 0.5 o P < 0.5, si es que queremos realmente
averiguar que la moneda no es legal.
Concepto de significación en una Prueba Estadística
Suponiendo que está formulada una hipótesis y que al realizar un experimento para someterla a prueba encontramos que el estadístico de la muestra, difiere marcadamente del valor del parámetro que establece la hipótesis nula H 0, en ese caso, decimos que la diferencias encontradas son significativas y estamos
161
![Page 162: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/162.jpg)
en condiciones de rechazar la hipótesis nula H 0 o, al menos no aceptarla en base a la muestra obtenida.
En realidad estamos determinando, si la diferencia, entre el valor del parámetro establecido en H 0 y el valor del estadístico obtenido en la muestra, se debe tan
solo al error de muestreo (en este caso aceptamos H 0); o si la diferencia es tan grande que el valor obtenido por el estadístico de la muestra, no es fruto del error de muestreo, en este caso rechazamos H 0.
Prueba de Hipótesis
Se le llama también ensayo de hipótesis o dócima de hipótesis. Son procedimientos que se usan para determinar, se es razonable o correcto, aceptar que el estadístico obtenido en la muestra, puede provenir de la población que tiene parámetro, el formulado en H 0.
Como resultado de la prueba de hipótesis, aceptamos o rechazamos H 0. Si
aceptamos H 0, convenimos en que el error de muestreo (el azar), por sí solo, puede dar lugar al valor al estadístico que origina la diferencia entre éste y el parámetro. Si rechazamos H 0, convenimos que la diferencia es tan grande, que no es fruto del error de muestreo (al azar) y concluimos que el estadístico de la muestra no proviene de una población que tenga el parámetro estudiado.
El mecanismo para rechazar la hipótesis H 0, es el siguiente: suponemos como
válida la hipótesis nula H 0, la que afirma que el parámetro tiene cierto valor
(supongamos el caso de la media poblacional entonces H 0: ʯ = ʯ0. Tomamos una muestra y calculamos el estadístico de la muestra (para el caso de la media el estadístico es la media muestral xv ). Como suponemos que H 0 es cierta, podemos suponer que la muestra proviene de la población que tiene como parámetro el de H 0 (es decir, ʯ0 no serán muy diferentes) y la probabilidad de que dicha diferencia muestral pequeña aparezca, será grande. Si en cambio tomamos una muestra de una población que no tiene como parámetro ʯ0, en dicho caso el valor de xv - ʯ0, será grande, (xv será muy
distinto que ʯ0), es decir, dicha diferencia será significativa, y la probabilidad de obtener dicha diferencia muestral al muestrear, será pequeña. Necesitamos un estándar, es decir, un valor tal que, al comparar con él la probabilidad de obtener una diferencia entre xv y ʯ0, nos permita aceptar o rechazar H 0. Llamemos a este valor α el nivel de significación. Este será tal que, si la probabilidad de la diferencia entre xv y ʯ0 es muy pequeña (menor que α),
rechazaremos H 0 y la muestra aleatoria no proviene de la población con
parámetro ʯ0; si la probabilidad de la diferencia entre xv - ʯ0 es grande (mayor
162
![Page 163: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/163.jpg)
que α) aceptamos H 0 y la muestra aleatoria proviene de la población con
parámetro ʯ0.
Cuando se toma la decisión de rechazar o aceptar la hipótesis H 0, se corre el riesgo de equivocarse (recuerde que nos hemos referido a la probabilidad de obtener una diferencia entre xv y ʯ0 y no de un hecho establecido), es decir, de cometer errores.
Estos posibles errores son:
Error tipo I
Consiste en rechazar la hipótesis H 0, cuando en realidad no debería ser rechazada, por ser verdadera. La probabilidad de cometer el error tipo I, se llama alfa (α).
Error tipo II
Consiste en no rechazar a hipótesis Ho, cuando debería ser rechazada por ser
falsa. La probabilidad de cometer el error tipo II, se llama beta (β).
Se debe procurar que la probabilidad de los errores tipo I y tipo II, sean las más
pequeñas posibles, sin embrago, para un tamaño de muestra dado, el querer
disminuir un tipo de error, trae consigo, incrementar el otro tipo de error. La
única forma de disminuir ambos errores, es aumentar el tamaño de la muestra.
Nivel de significación de una Prueba Estadística.
En relación a la comprobación de una hipótesis dada, se llama nivel de
significación, a la probabilidad a de cometer el error tipo I, al rechazar la
hipótesis nula Ho.
Los niveles de significación más usados en la práctica son: de 0.05 (5%) y de
0.01 (1%).
El nivel de significación de 5% se interpreta de la siguiente manera: en 100
casos, cabe esperar, que en 5 de ellos se cometa una decisión equivocada, al
rechazar la hipótesis Ho, cometiendo, en consecuencia, un error de tipo I.
163
![Page 164: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/164.jpg)
Pasos de una Prueba de Hipótesis
1o Formular la Ho y la H1
2o Determinar si la prueba es unilateral o bilateral.
3o Asumir el nivel de significación de la prueba.
4oDeterminar la distribución muestral que se usara en la prueba.
5o Elaborar el esquema de la prueba.
6o Calcular el estadístico de la prueba.
7o Tomar la decisión, para esto, se comparan el esquema de la parte.
5o, con el estadístico del paso 6o.
Ejemplo de una prueba de hipótesis utilizando los pasos anteriores.
Se realiza el experimento aleatorio de lanzar 50 veces una moneda,
obteniéndose 34 veces el resultado cara. Al nivel de significación de 5%, se
quiere averiguar si la moneda está cargada.
1) Ho: P= 0.5, la moneda no está cargada.
H1: P≠ 0.5 la moneda está cargada (P>0.5 ó P<0.5).
2) La prueba debe ser bilateral o de dos colas, porque hay dos
posibilidades en la H1:
a) Si se obtiene muchas veces cara, entonces la moneda está cargada
de un lado (P>0.5).
b) Si se obtiene pocas veces cara, entonces la moneda está cargada
del otro lado (P<0.5).
3) Asumimos el nivel de significación de 5%, con lo que estamos
aceptando de que con la probabilidad de 0.05, puede ocurrir que se
rechace Ho, a pesar de ser verdadera; cometiendo por lo tanto el error
de tipo I. la probabilidad de no rechazar Ho, será de 0.95.
4) Determinar la distribución muestral que se utilizara en la prueba.
164
![Page 165: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/165.jpg)
Tenemos por dato muestral la proporción 3450
, el parámetro de Ho, es la
proporción poblacional P; entonces utilizaremos la distribución muestral
de proporciones para describir la variación de las muestras por el error d
muestreo. Tamaño de muestra n= 50> 30. (Muestra grande)
aproximaremos la distribución muestral de proporciones, mediante la
distribución normal, porque n=50> 30.
5) Esquema de la prueba: En la distribución normal de probabilidades
estandarizadas, para el nivel de significación de 5%, el nivel de
confianza será de 95%, entonces los coeficientes críticos o coeficientes
de confianza para la prueba bilateral serán: -1.96 1.96, es decir -1.96 ≤ z
≤ 1.96.
El esquema correspondiente es:
165
![Page 166: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/166.jpg)
Si al realizar el experimento y calcular el puntaje estandarizado Z, encontramos
que Z cae fuera del intervalo -195 ≤ z ≥ 1.96, esto indicara que se debe
rechazar H˳
Si por el contrario Z cae dentro del intervalo ya mencionado, eso indicara que
no debemos rechazar H˳
Vemos que hay dos regiones e rechazo, por eso la prueba se llama prueba
bilateral o de dos colas.
6) Cálculo de Z. utilizando la fórmula 5.3.2
166
![Page 167: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/167.jpg)
Z= Xi−U pσ
Donde Xi corresponde en este caso a la producción de la muestra: p`
U p: es la medida de la distribución muestral de proporciones, igual a la
proporción poblacional P de H˳
σ : es la desviación estándar de la distribución muestral de proporciones,
llamada también error estándar de la proporción: σ p`
Z= p−pσp
167
![Page 168: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/168.jpg)
Ejemplo de Prueba de una Cola o Unilateral.
Un laboratorio afirma que uno de sus productos tiene 905 de efectividad para
curar una enfermedad. En una muestra de 200 persona de aliviaron 160.
Determinar que a afirmación no es cierta, es decir, la medicina cura meno del
90% de los casos. Sea el nivel de significación 0.05.
1) .- H˳: P = 0.90 P, proporción poblacional de éxito.
H1: P < 0.90 Es lo que queremos probar.
2) .- Habrá una sola región de rechazo o región crítica y es aquella en la
que la proporción de personas curadas por la medicina es menor que
0.90; luego se trata de una prueba unilateral, o de una sea cola; en esta
caso de cola izquierda, que es la dirección a la que apunta la
desigualdad de H1.
3) Asumiendo el nivel de significación de 5% (0.05), en la distribución
normal de probabilidades estandarizada se tiene el coeficiente critico de
Z= -1.65.
4) Como el dato es una proporción muestral, y en Ho hay una proporción
poblacional, usaremos la distribución muestral de proporciones.
5) El esquema de la prueba es:
168
![Page 169: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/169.jpg)
Z= p−pσp
´P = Proporción de la muestra = 160200
=0.8
P = Proporción de la población P = 0.9
169
![Page 170: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/170.jpg)
Grados de libertad: el termino libertad se refiere a libertad para variar y recoger datos de la muestra. Analicemos la fórmula para la desviación estándar corregida
s=√∑ (Xi−μ )2
n−1
Para calcular la desviación estándar es necesario estimar la media poblacional û mediante x= u, es decir se eta estimando un parámetro poblacional por lo tanto por grados de libertad serán n-1. Al querer calcular la desviación estándar ha disminuido en uno la libertad de escoger los datos, por haber estimado un parámetro, la media poblacional.
En la prueba de student de diferencia de medidas, se estimaran dos medias poblacionales de cada una de las dos poblaciones de las cuales se toman los datos, para calcular las dos medias. Los grados de libertad serán n1+n2-2 donde n1 es el tamaño de la muestra 1, tomada de la población 1 y n2 es el tamaño de la muestra tomada de la población 2.
Los grados de libertad están representados por la siguiente formula
Gl=n-k
N: numero de observaciones independientes
K: numero de parámetros estimados
Distribución de Student
Cuando:
i) el tamaño de la muestra es pequeño y este es menor que 30
ii) la población de donde se obtienen los datos está distribuida normalmente
iii) se desconoce la desviación estándar de la población entonces haremos uso de la distribución de Student
La distribución de Student está representada por el estadístico t:
t= x−us
√n−1
170
![Page 171: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/171.jpg)
El estadístico z de la distribución normal era
z= x−uσ
√n
En el denominador de t tenemos s, que varía de muestra en muestra. En el denominador de z tenemos o , la desviación estándar de la población que es una constante; t sigue una distribución de Student con n-1 grados de libertad, los valores de t se pueden encontrar en la tabla correspondiente en el apéndice de este libro. Existe un valor específico para cada grado de libertad asociado con un determinado nivel de significación.
La grafica de la distribución de Student es mas aplanada que la distribución normal Z.
Ejemplo de prueba de una media utilizando la distribución de student
Se aplico un test de inteligencia a una muestra de 15 alumnos de un salón de clase de cierto Colegio y se determino un CI promedio de 105.4 con una desviación estándar de 5.3. Se saber que al estandarizar el mencionado test en los colegios secundarios de la localidad, se hallo un CI medio de 101. Asumiendo un nivel de significación de 1% probar que el rendimiento mental del grupo de 15 alumnos, es más alto que el promedio de estandarización del test.
U= rendimiento mental medio de estandarización = 101
X= rendimiento mental medio de la muestra = 105,4
1) formulación de la hipótesis
171
Distribución normal
Distribución de student
![Page 172: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/172.jpg)
H0:µ = 101, no existe diferencias significativas en el rendimiento mental, de la
muestra X y de la población
H1: µ= >101
2) prueba unilateral de cola derecha, de acuerdo con H1,
3) Nivel De Significación Asumido: 1% = 0.01
4) Distribución aplicable para la prueba
Considerando que los datos son la media de la muestra X y la media
poblacional µ, se debe reutilizar la distribución maestral de medias, además
como n <30 (muestra pequeña) y se desconoce 0 (desviación estándar de la
población) se empleara la distribución de student, ya que ese sabe los valores
de CI siguen una distribución normal.
5) Esquema grafico de la prueba
El nivel de significación es a = 0.01
Los grados de libertad son:
Gi= n-1 = 15 – 1=14g. de lib
En la tabla de distribución de student, con 14gl, a = 0.01 y prueba de 1 cola,
encontramos el t crítica: tc =2.624
172
![Page 173: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/173.jpg)
6) Cálculo del estadístico de la prueba
Datos
X= 105.4 ; µ = 101 ; s= 5.3 ; n= 15
7) toma de decisiones
Observamos que t=3.11 se ubica en la región de rechazo por tanto se descarta
que µ = 101 y se acepta la alternativa µ > 101 es decir el grupo de 15 alumnos
tiene rendimiento mental mayor que el promedio de estandarización.
Ejemplo:
173
![Page 174: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/174.jpg)
Una tableteadora de un laboratorio farmacéutico produce comprimidos de cierto
medicamento, con un peso medio de 2grs. Por comprimido. Para determinar si
la maquina sigue en buenas condiciones de producción, se tomó una muestra
de 10 tabletas cuyos pesos en gramos son: 2.04; 1.96; 2.00; 1.98: 2.02; 2.01;
1.97; 1.94; 2.03; 2.01, asumiendo un nivel de significación de 0.01, verificar que
la maquina no está en
Buenas condiciones de producción.
Llamemos:
µ: el peso medio de las tabletas producidas por la máquina.
1) Formulación de hipótesis
H0: µ= 2, la maquinas se halla en buenas condiciones.
H1: µ ≠ 2, la maquina no se halla en buenas condiciones
2) Prueba bilateral porque en H1 hay dos posibilidad
µ>2 o µ< 2
3) Nivel de significación , s4e asume el 1% = 0.01
4) Distribución de probabilidad apropiada para la prueba.
Considerando que las hipótesis se refieren a medios poblacionales, que se
da como dato el valor de la media población µ= 2grs, y que se puede
calcular la media de la muestra, utilizaremos la distribución muestral de las
medias para efectuar la prueba. Siendo la muestra pequeña (n= 10) y la
desviación de student o de la población desconocida, no es aplicable la
distribución normal y por tanto recurridos a la distribución de student,
asumiendo que la población.
174
![Page 175: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/175.jpg)
175
![Page 176: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/176.jpg)
Ejercicio.
Un laboratorio afirma que uno de sus productos tiene el 90% de efectividad
para curar una enfermedad. En una muestra de 200 personas se aliviaron 160.
Determinar que la afirmación no es cierta, es decir que la medicina cura menos
del 90% de los casos. Si el nivel de significancia (error de estimación) es del
0,05
1.- HALLAR H0 Y HA
H 0U=90 %U=0,9
H 0U<90 %U <0,9
2.- DETERMINAR LA CAMPANA DE GAUSS
Es unilateral de una cola
3.- DETERMINAR EL VALOR DE CONFIANZA
Nivel de confianza=95 %
Error deestimaci ón=0,05
Z=±1,65
4.- DETERMINAR EL VALOR DE n
N 1=200n>30
Utilizala prueba dehip ó tesis
5.- GRAFICAR LA CAMPANA DE GAUSS
176
![Page 177: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/177.jpg)
6.- CALCULAR EL VALOR DE Z
P=160200
= 0,80
P=PROBABILIDAD DE LA POBLACIÓN
P=0,9
QX=ERROR DEESTIMACIÓN
QX=√ pqn
QX=√ (0,9 )(0,1)200
Qx=0,02
Z=P−PQx
Z=0.8−0,90,02
Z=−5
177
![Page 178: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/178.jpg)
7.- rechazo de la hipótesis nula y aceptación de la hipótesis alternativa, porque
los medicamentos curan menos del 90% a los pacientes.
Ejercicio.
Una muestra de 80 alambres de acero producidos por la Fábrica A, da una
resistencia media a la rotura de 1230lobras con una desviación estándar de
120 libras. Una muestra de 100 alambres de acero producidos por la Fábrica B
da una resistencia media a la rotura de 1190 libras con una desviación
estándar de 90 libras. ¿Hay una diferencia real en la resistencia media de las
dos marcas de alambre de acero, si el nivel de confianza es el 95%?
1.- DETERMINAR LA HO Y LA HA.
Ho: U1 = U2
Ha: U1 U2
2.- DETERMINAR LA CAMPANA DE GAUSS
La campana de gauss es bilateral de 2 colas
3.- DETERMINAR EL VALOR DE CONFIANZA
Nivel de significancia o E.E. = 0,05
Z =1,96 valor estandarizado
4.- DETERMINAR QUÉ TIPO DE MUESTRA SE UTILIZA
178
![Page 179: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/179.jpg)
n 1 = 80 n > 30
n 2 = 100 n > 30 Prueba de Hipótesis
5.- CONSTRUIR LA CAMPANA DE GAUSS
6.- CALCULAR EL PUNTAJE Z
x 1 = 1230 S1 = 120
x 2 = 1190 S2 = 90
Z= X 1−X2
√ S 12
n1+ S22
n2
Z= 1230−1190
√ 1202
80+ 902
100
Z= 40
√180+81
Z= 40
√261
Z= 4016,155
Z=42,4760
√261
179
![Page 180: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/180.jpg)
7.- Rechazo la hipótesis nula y acepto la hipótesis alternativa. La rotura de los
alambres de la Fábrica A es diferente a la rotura de los alambres de la Fábrica
B.
Ejercicio.
Los salarios diarios de una industria particular tiene una distribución normal con
media de 23,20 dólares y una desviación estándar de 4,50 dólares. Si una
compañía de esta industria emplea 40 trabajadores, les paga un promedio de
21,20 dólares. ¿Puede se acusada esta compañía de pagar salarios inferiores
con un nivel de significancia del 1%?
1.- DETERMINAR LA HO Y LA HA.
Ho: U = 23,20
Ha: U > 23,20
2.- DETERMINAR LA CAMPANA DE GAUSS
La campana de gauss es de una cola
3.- NIVEL DE CONFIANZA = 99%
Nivel de significancia o E .E .=0,01
Z=−2,33
4.- DETERMINAR QUÉ TIPO DE MUESTRA SE UTILIZA
n=40n>30
180
![Page 181: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/181.jpg)
40>30Prueba de Hipótesis
5.- CONSTRUIR LA CAMPANA DE GAUSS
6.- CALCULAR EL PUNTAJE Z
Z=
X−Us
√n
Z=
21,20−23,204,50
√40
Z=
−24,50
√40
Z=
−24,506,32
Z=−2,811
7.- Rechazo la hipótesis nula y acepto la hipótesis alternativa. No está pagando
a los trabajadores lo que les corresponde entonces debe entrar a un juicio para
resolver este inconveniente.
Ejercicio.
181
![Page 182: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/182.jpg)
Según una encuesta realizada se afirma que la exportación de petróleo crudo
tiene el 95% de efectividad para comercializarse en el mercado internacional.
En una muestra de 45 países a los que se envía el petróleo ecuatoriano, se
reflejaron que 35 países los más grandes importadores de petróleo tienen
ventas elevadas. Determinar que la afirmación no es cierta, es decir que la
exportación de petróleo se comercializa en menos del 95%. Si se tiene un nivel
de significancia del 0,05.
1. Ho: U = 95%
Ha: U < 95%
2. La campana de Gauss es de una cola
3. α = 95%
Error de Estimación: 0,05
Z = -1,65
4. n = 45 n > 30 Prueba de Hipótesis
5. Construir Campana de Gauss
6. z= P−PQp
z=0,78−0,950,032
182
![Page 183: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/183.jpg)
z=−5,31
P=3545
P=0,78
Qx=√ pqn
Qx=√ (0,95 )(0,05)45
Qx=0,032
7. Rechazo la hipótesis nula y acepto la hipótesis alternativa.
Las exportaciones de petróleo que el Ecuador realiza a diferentes países
se comercializan en más del 95%, por lo que el país puede continuar
realizando sus exportaciones al exterior.
DISTRIBUCIÓN T-STUDENT
En probabilidad y estadística, la distribución t-Student es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño.
Una variable aleatoria se distribuye según el modelo de t-Student con n grados de libertad, donde n es un entero positivo, si su función de densidad es la siguiente:
f(t)=
Γ ( n+12
)
Γ (n2)√nΠ
(1+t2
n)−1
2(n+1 )
, -∞<t <+∞ , Γ ( p )=∫
0
∞
x p−1e−xdx siendo p>0
La gráfica de esta función de densidad es simétrica respecto del eje de ordenadas, con independencia del valor de n, y de forma semejante a la distribución normal.
Propiedades:
1. La media es 0 y su varianza
nn−2 , n>2.
2. La gráfica de la función de densidad es en forma de campana.
183
![Page 184: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/184.jpg)
3. Los datos están más disperso que la curva normal estándar.
4. A medida que n aumenta, la gráfica se aproxima a la normal N(0,1).
5. La gráfica es muy parecida a la de la normal estándar diferenciándose en que las colas de t están por encima de la normal, y el centro se encuentra por debajo del de la normal.
6. Cuando los grados de libertad son altos, los valores de t coinciden con los de la normal.
Ejercicio:
La empresa de transporte pesado TRANSURGIR de la ciudad de Tulcán adquirió camines nuevos que cargan un peso aproximado a 15 toneladas cada uno para determinar si esta afirmación es verdad se tomo una muestra de 7 camiones con repletos de carga cuya carga pesaba; 15,04tonn, 14,96tonn, 15tonn, 14,98tonn, 15,2tonn, 15,1tonn y 14,96tonn. Asumiendo un nivel de significancia de 0,01 verificar que los camiones si cumplen con el peso establecido.
Ho: u=15tonn
Ha: u≠2 u es diferente de dos
1) Bilateral
2) 99% 0,01 gl=n-1gl= 10-1= 9t=±3,250
3) n˂30 T-student
4) GRAFICA
184
![Page 185: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/185.jpg)
S=√∑¿¿¿
5)x= X – u
S
√n−1.
x=15,034 – 150,082
√7−1.
1,030,34
0,0822,44.
=0,340,33.
=1,03
6) Aceptamos la hipótesis nula y rechazamos la hipótesis alternativa ya que el peso que puede transportar cada camión se encuentra en la zona de aceptación.
185
Xi (Xi-X) (Xi-X)2
15,04 0,0060,000032
653
14,96 -0,0740,005518
367
15 -0,0340,001175
51
14,98 -0,0540,002946
939
15,2 0,1660,027461
224
15,1 0,0660,004318
367
14,96 -0,0740,005518
367
105,24
-0,00000000000000888
17841970,046971
429
![Page 186: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/186.jpg)
UNIVERSIDAD POLITÉCNICA ESTATAL DEL
CARCHI
FACULTAD DE COMERCIO INTERNACIONAL, INTEGRACIÓN, ADMINISTRACIÓN Y ECONOMIA
EMPRESARIAL
Carrera: Escuela de Comercio Exterior y Negociación Internacional
“ESTADISTICA INFERENCIAL”
ING. Jorge Pozo
INTEGRANTES: Jesenia Pozo
186
![Page 187: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/187.jpg)
CURSO: Sexto “B”
TULCÁN, MARZO 2012
TEMA: Prueba de hipótesis
PROBLEMA. El desconocimiento de la prueba de hipótesis y su aplicación en problemas del contexto del comercio exterior.
OBJETIVO GENERAL:
Realizar la toma de decisiones sobre el análisis de la prueba de
hipótesis basado en modelos y procedimientos.
Objetivos Específicos:
Aplicar correctamente la Prueba de Hipótesis en la estadística inferencial
Resolver problemas de comercio exterior y problema del contexto
Conocer correctamente el procedimiento de la Prueba de Hipótesis y
cómo influye en diversos problemas planteados los cuales pueden ser
solucionados.
Justificación.-
El presente trabajo es de gran importancia ya que a través de esta
investigación se puede identificar los diferentes problemas que están tanto
relacionados con el contexto y la vida diaria , en lo que se refiere a proyectos
empresariales y ver la factibilidad de dichos procedimientos.
187
![Page 188: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/188.jpg)
En lo cual se presentara una información la cual permitirá verificar la muestra y
como los parámetros influyen en la toma de decisiones en los problemas del
contexto del comercio exterior
La prueba de hipótesis es muy importante para los estudiantes del comercio
exterior ya que esto es un pasó para la formulación de la tesis en la cual se
verificara si es factible o no el proyecto planteado
Pero como toda hipótesis también es importante para la vida en la aplicación
de diferentes casos de la vida en la cual se tenga que tomar decisiones
MARCO TEÓRICO.
PRUEBA DE HIPÓTESIS
La estadística Inferencial, es el proceso por el cual se deducen (infieren)
propiedades o características de una población a partir de una muestra
significativa. Uno de los aspectos principales de la inferencia es la estimación
de parámetros estadísticos. Por ejemplo, para averiguar la media, µ, de las
estaturas de todos los soldados de un remplazo, se extrae una muestra y se
obtiene su media, 0. La media de la muestra (media maestral), 0, es un
estimador de la media poblacional, µ. Si el proceso de muestreo está bien
realizado (es decir, la muestra tiene el tamaño adecuado y ha sido
seleccionada aleatoriamente), entonces el valor de µ, desconocido, puede ser
inferido a partir de 0.(Katherine, 2008)
La estadística inferencial es el proceso de usar la información de una muestra
para describir el estado de una población. Sin embargo es frecuente que
usemos la información de una muestra para probar un reclamo o conjetura
sobre la población. El reclamo o conjetura se refiere a una hipótesis. El
proceso que corrobora si la información de una muestra sostiene o refuta el
reclamo se llama prueba de hipótesis (Tenorio Bahena, Jorge, 2006).
188
![Page 189: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/189.jpg)
Los términos prueba de hipótesis y probar una hipótesis s utilizan
indistintamente. La prueba de hipótesis comienza como una afirmación, o
suposición sobre un parámetro de la población, como la media poblacional
(Tamayo y Tamayo, Mario, 2010).
Una prueba de hipótesis consiste en contratar dos hipótesis estadísticas. Tal
contraste involucra la toma de decisión acerca de las hipótesis. La decisión
consiste en rechazar o no una hipótesis a favor de otra. (Lincoln L., 2008)
Hipótesis Nula (Ho).- Se refiere siempre a un valor específico del parámetro
de la población, no a una estadística de muestra. La letra H significa hipótesis y
el subíndice cero no hay diferencia por lo general hay un “no” en la hipótesis
nula que indica que “no hay cambio” podemos rechazar o aceptar “Ho”. (Pick,
Susan y López, Ana Luisa., 2009).
Hipótesis Alternativa (Ha).- Es cualquier hipótesis que sea diferente de la
nula es una afirmación que se acepta si los datos muéstrales proporcionan
189
![Page 190: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/190.jpg)
evidencia suficiente de que la hipótesis nula es falsa, se le conoce también
como hipótesis de investigación el planteamiento de hipótesis alternativa nunca
contiene un signo de igualdad con respecto al valor especificado del parámetro
(Pick, Susan y López, Ana Luisa., 2009).
Nivel de Significancia: Probabilidad de rechazar la hipótesis nula cuando es
verdadera. Se le denota mediante la letra griega α, también es denominada
como nivel de riesgo, este término es más adecuado ya que se corre el riesgo
de rechazar la hipótesis nula, cuando en realidad es verdadera. Este nivel esta
bajo el control de la persona que realiza la prueba (Lincoln L., 2008).
Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de
significación indicará la probabilidad de no aceptarla, es decir, estén fuera de
área de aceptación. El nivel de confianza (1-α), indica la probabilidad de
aceptar la hipótesis planteada, cuando es verdadera en la población.
La distribución de muestreo de la estadística de prueba se divide en dos
regiones, una región de rechazo (conocida como región crítica) y una región de
no rechazo (aceptación). Si la estadística de prueba cae dentro de la región de
aceptación, no se puede rechazar la hipótesis nula.
La región de rechazo puede considerarse como el conjunto de valores de la
estadística de prueba que no tienen posibilidad de presentarse si la hipótesis
nula es verdadera. Por otro lado, estos valores no son tan improbables de
190
![Page 191: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/191.jpg)
presentarse si la hipótesis nula es falsa. El valor crítico separa la región de no
rechazo de la de rechazo.
Tipos de errores.- Cualquiera sea la decisión tomada a partir de una prueba
de hipótesis, ya sea de aceptación de la Ho o de la Ha, puede incurrirse en
error:
Un error tipo I se presenta si la hipótesis nula Ho es rechazada cuando es
verdadera y debía ser aceptada. La probabilidad de cometer un error tipo I se
denomina con la letra alfa α
Un error tipo II, se denota con la letra griega β se presenta si la hipótesis nula
es aceptada cuando de hecho es falsa y debía ser rechazada.
En cualquiera de los dos casos se comete un error al tomar una decisión
equivocada.
En la siguiente tabla se muestran las decisiones que pueden tomar el
investigador y las consecuencias posibles.
191
![Page 192: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/192.jpg)
Para que cualquier ensayo de hipótesis sea bueno, debe diseñarse de forma
que minimice los errores de decisión. En la práctica un tipo de error puede
tener más importancia que el otro, y así se tiene a conseguir poner una
limitación al error de mayor importancia. La única forma de reducir ambos tipos
de errores es incrementar el tamaño de la muestra, lo cual puede ser o no ser
posible.
La probabilidad de cometer un error de tipo II denotada con la letra griega beta
β, depende de la diferencia entre los valores supuesto y real del parámetro de
la población. Como es más fácil encontrar diferencias grandes, si la diferencia
entre la estadística de muestra y el correspondiente parámetro de población es
grande, la probabilidad de cometer un error de tipo II, probablemente sea
pequeña.
El estudio y las conclusiones que obtengamos para una población cualquiera,
se habrán apoyado exclusivamente en el análisis de una parte de ésta. De la
probabilidad con la que estemos dispuestos a asumir estos errores, dependerá,
por ejemplo, el tamaño de la muestra requerida. Las contrastaciones se apoyan
en que los datos de partida siguen una distribución normal
Existe una relación inversa entre la magnitud de los errores α y β: conforme a
aumenta, β disminuye. Esto obliga a establecer con cuidado el valor de a para
las pruebas estadísticas. Lo ideal sería establecer α y β.En la práctica se
establece el nivel α y para disminuir el Error β se incrementa el número de
observaciones en la muestra, pues así se acortan los limites de confianza
respecto a la hipótesis planteada. La de las pruebas estadísticas es rechazar la
hipótesis planteada. En otras palabras, es deseable aumentar cuando ésta es
verdadera, o sea, incrementar lo que se llama poder de la prueba (1- β) La
aceptación de la hipótesis planteada debe interpretarse como que la
información aleatoria de la muestra disponible no permite detectar la falsedad
de esta hipótesis.
192
![Page 193: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/193.jpg)
Ejemplo.
EJEMPLO 1:
Para evaluar el nivel mental de los ingresantes de la Universidad se
estandarizo la habilidad mental encontrándose un C.I. (coeficiente intelectual)
promedio de 101,2 con una desviación estándar de 13,8. Aplicada de la prueba
a una muestra de 60 ingresantes de esta universidad se calculó que el C.I.
promedio es de 106,4 con una desviación estándar de 16,4. ¿El nivel mental de
los ingresantes es superior al término medio?
Variable de estudio: La habilidad mental de los X estudiantes.
µ = rendimiento mental promedio de los ingresantes.
X = rendimiento promedio de la muestra.
Solución:
1) Ho: µ= 101,2
Ha: µ > 101,2
2) Prueba unilateral de acuerdo a Ha.
3) Realizar la prueba de los niveles de significación de 5% y 1%.
4) Se admite que la variable aleatoria de la prueba es la media de los
coeficientes de inteligencia Xi.
5) Como n > 30 podemos usar una distribución normal de probabilidades
para calcular los valores críticos y elaborar el esquema grafico de la
prueba 99%.
6) Calculo estadístico de la prueba.
193
![Page 194: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/194.jpg)
Z= Xi−µQ
Q=QxQ
√n= 13
√60=1,78
Z=106,4−101,21,78
=2,92
7) Toma de decisiones:
A los niveles de significancia de 0,05 ^ 0,01 observamos que el estadístico Z=
2,92 se ubica en la zona de rechazo, esta significancia que la prueba es muy
significativa luego rechazamos la Ho: µ= 101,2 y no rechazamos que el nivel
mental de los ingresantes es superior al término medio.
Ejercicios.
El banco de préstamos estudia la relación entre ingreso (X) y de ahorros (Y)
mensuales Una muestra aleatoria de sus clientes reveló los siguientes datos en
dólares:
X 350 400 450 500 950 850 700 900 600Y 100 110 130 160 350 350 250 320 130
Determinar la ecuación lineal de las dos variables, Trace el diagrama de
dispersión en el plano cartesiano, Estime el ingreso que corresponde a un
ahorro semanal de 90 dólares, Si el ahorro es de 200 dólares que gasto puede
realizar el obrero en dicha semana, Si el ingreso es de 350 dólares cual es el
salario.
Desarrollo
Como primer paso empezamos realizando la tabla de las dos variables
194
![Page 195: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/195.jpg)
Ingresos Ahorros N X Y X Y X2 Y2 (xi-x)2 (yi-y)2
1 350 100 35000 122500 10000 80275,89 12345,432 400 110 44000 160000 12100 54442,89 10223,233 450 130 58500 202500 16900 33609,89 6578,834 500 160 80000 250000 25600 17776,89 2612,235 950 350 332500 902500 122500 100279,89 19290,436 850 350 297500 722500 122500 46945,89 19290,437 700 250 175000 490000 62500 4444,89 1512,438 900 320 288000 810000 102400 71112,89 11857,039 600 130 78000 360000 16900 1110,89 6578,83∑ 5700 1900 1388500 4020000 491400 410000 90288,89
X=∑ x1
n=5700
9=633.33
Y=∑ y1
n=1900
9=211.11
r=n∑ xy−∑ x∑ y
√¿¿¿
r=9 (1388500 )−(5700)(1900)
√¿¿¿
r= 1666500
√3690000∗812600=1666500
1731616=0.96
sx=√∑ ¿¿¿¿
sx=√ 4100009
=213.44→desviacion standar
s x2=¿
sy=√∑ ¿¿¿¿
sy=√ 90288,899
=100,16→desviacionstandar
s y2=¿
195
![Page 196: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/196.jpg)
Yr= y+r ( sysx ) x−r ( sysx ) x
Yr=211.11+0.96 ( 100,16213,44 ) x−0.96 ( 100,16
213,44 )633,33
Yr=211,11+0,45 x−285,31Yr=−74,2+0,45x
b=n∑ xy−∑ x∑ y
n∑ x2−¿¿¿
b=9 (1388500 )−(5700)(1900)
9 ( 4020000 )−(5700 )
b=12496500−1083000036180000−32490000
b=16665003690000
b=0.45
a= y−bx
a=211.11−0.45 (633.33)
a=¿-73.89
Ecuación lineal de las dos variables.
y=a+bx y=−73,89+0.45 x
Diagrama de dispersión en el plano cartesiano
196
![Page 197: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/197.jpg)
300 400 500 600 700 800 900 10000
50100150200250300350400
YLinear (Y)
Axis Title
Axis Title
Ingreso que corresponde a un ahorro semanal de 90 dólares.
y=−73,89+0.45 x
197
![Page 198: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/198.jpg)
y=−73.89+0.45 (90 )=−33.3Si el ahorro es de 200 dólares que gasto puede
realizar el obrero en dicha Semana.
y=−73.89+0.45 x
y=−73.89+0.45 (200 )=16.11
Si el ingreso es de 350 dólares cual es el salario.
y=−73.89+0.45 x
350=−73.89+0.45 x
350+73.890.45
=x
x=941.98
PASOS DE UNA PRUEBA DE HIPOTESIS
Primer paso formular la hipótesis nula y la hipótesis alternativa
Hipótesis nula
Ho = β=0
La hipótesis alternativa
Ha= β<0; β>0
Segundo paso determinar si la prueba es unilateral o bilateral
Bilateral
Tercer paso Asumir el nivel se significación de la prueba
95% ± 1,96
Cuarto paso determinar la distribución maestral que se usara en la
prueba
n<30
Como n es menor que 30 utilizaremos la T de estudent
198
![Page 199: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/199.jpg)
Quinto paso elaborar el esquema de la prueba
-1.96 +1.96
Sexto paso calcular el estadístico de la prueba
z= Pm−poQp
z=0.05−0
9 z=5.55
Q=√ SX 2+SY 2
n
Q=√ 45556,63+10032,109
Q=216.03
QP=√ PQn
QP=√ 0(216.03)9
QP=0
Pm= pn
Pm=0.459
Pm=0.05
Un comerciante mayorista encargo un estudio para determinar la relación
entre los gastos de publicidad semanal por radio y las ventas de sus
199
![Page 200: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/200.jpg)
productos. En el estudio se obtuvieron los siguientes resultados.
Semana 2 3 4 5 6 7 8 9 10 11Gasto de Publicidad ($)
30 20 40 30 50 70 60 80 70 80
Venta ($) 300 250 400 - 550 750 630 930 700 840
En la quinta semana por diversos motivos no se pudo hacer el estudio
Determine la ecuación de regresión de ventas sobre gastos de publicidad
N x Y X2 Y2 X Y (xi-x)2 (yi-y)2
1 30 300 900 90000 9000 136,11 21267,362 20 250 400 62500 5000 469,44 38350,693 40 400 1600 160000 16000 2,78 2100,694 50 550 2500 302500 27500 69,44 10850,695 70 750 4900 562500 52500 802,78 92517,366 60 630 3600 396900 37800 336,11 33917,367 80 930 6400 864900 74400 1469,44 234417,368 70 700 4900 490000 49000 802,78 64600,699 80 840 6400 705600 67200 1469,44 155367,36 500 5350 31600 3634900 338400 5558,33 653389,58
DESARROLLO
X=∑ x1
n=500
9=55,55
Y=∑ y1
n=5350
9=594,44
r=n∑ xy−∑ x∑ y
√¿¿¿
r=9¿¿
200
![Page 201: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/201.jpg)
r= 370600
√(34400)(4091600)
r= 370600375168,02
=1.00
SX=√∑ ¿¿¿¿
sx=√ 3822,229
=20,61→desviacion standar
s x2=¿
sy=√∑ ¿¿¿¿
sy=√ 454622,229
=224,75→desviacionstandar
s y2=(224,75)=50512,56→varianza
Yr=594,44+0.99( 224,7520,61 )x−0.99 ( 224,75
20,61 )55,55
Yr=594,44+10,79 x−599,71
Yr=−5,27+10,79 x
b=n∑ xy−∑ x∑ y
n∑ x2−¿¿¿
b=9 (338400 )−(500)(5350)
9 (31600 )−(250000 )
b=3045600−2675000284400−250000
b=370600334400
201
![Page 202: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/202.jpg)
b=1.10
a= y−bx
a=594.44−1.10(55.56)
a=¿ 533.32
Ecuación lineal de las dos variables.
y=a+bx
y=−8,77+10.86 x
Diagrama de dispersión en el plano cartesiano
200 400 600 800 1000 1200 14000
10
20
30
40
50
60
70
80
Series2
PASOS DE UNA PRUEBA DE HIPOTESIS
Primer paso formular la hipótesis nula y la hipótesis alternativa
Hipótesis nula
Ho = β=0
La hipótesis alternativa
Ha= β<0; β>0
Segundo paso determinar si la prueba es unilateral o bilateral
202
![Page 203: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/203.jpg)
Bilateral
Tercer paso Asumir el nivel se significación de la prueba
95% ± 1,96
Cuarto paso determinar la distribución muestral que se usara en la
prueba
n<30
Como n es menor que 30 utilizaremos la T de estudent
Quinto paso elaborar el esquema de la prueba
-1.96 +1.96
Sexto paso calcular el estadístico de la prueba
z= Pm−poQp
z=0.12−0
9 z=0.013
Q=√ SX 2+SY 2
n
Q=√ 424,77+50512,569
Q=77.69
QP=√ PQn
203
![Page 204: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/204.jpg)
QP=√ 0(77.69)9
QP=0
Pm= pn
Pm=1.109
Pm=0.12
En cuánto estimaría las ventas de la quinta semana
Se obtuvieron los siguientes datos para determinar la relación entre cantidad de fertilizante y producción de papa por hectárea.
Sacos de Fertilizante por hectárea 3 4 5 6 7 8 9 10 11 12Rendimiento en Quintales 45 48 52 55 60 65 68 70 74 76
Encuentre la ecuación de regresión de la cosecha sobre el fertilizante, por el
método de mínimos cuadrados.
Y=a+bx
x=∑ xi
n=
7510
=7,5 y=∑ yi
n=
61310
=61,3
x Y XY X2 (xi−x ) ¿3 45 135 9 -4,5 20,254 48 192 16 -3,5 12,255 52 260 25 -2,5 6,256 55 330 63 -1,5 2,257 60 420 49 -0,5 0,258 65 520 64 0,5 0,259 68 612 81 1,5 2,2510 70 700 100 2,5 6,2511 74 814 121 3,5 12,2512 76 912 144 4,5 20,25
∑ x=75 ∑ y=613 ∑ xy=¿4895¿∑ x2=672 ∑ (xi−x )=672 ∑ (xi−x )282,50
![Page 205: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/205.jpg)
a=Y−b x
a=61,3−2,72(7,5)
a=61,3−20,4=40,9
b=n∑ xiyi−∑ xi∑ yi
n∑ xi2−¿¿¿
b=10 ( 4895 )−(75 )(613)
10(672)−¿¿
b=48950−459756720−5625
b=29751095
=2,72
Y=a+bx
Y=40,9+2,72 x
r=n∑ xy−∑ x∑ y
√¿¿¿
r=9¿¿
r= 370600
√(34400)(4091600)
r= 370600375168,02
=0.99
Estime la cosecha si se aplica 12 sacos de fertilizantes.
205
![Page 206: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/206.jpg)
10 20 30 40 50 60 70 80 900
100200300400500600700800900
1000
Ahorros YLinear (Ahorros Y)
Axis Title
Axis Title
Determina el coeficiente de determinación. De su comentario sobre este
valores
Yr=−5,27+10,79 xyr= -5,27 + 10,79(30)yr= 318,43
Estime la cosecha si se aplica 12 sacos de fertilizantes ¿Cuánto es el error o
residual
y=34,07+3,63 xy=34,07+3,63 (12 )=77.63-76=1.63 es el error.
El número de horas de estudio invertidas y las calificaciones finales en un
curso de matemáticas de una muestra 10 alumnos ha dado los siguientes
resultados:
Alumno A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 Horas de estudio 14 16 22 20 18 16 18 22 10 8Calificación 12 13 15 15 17 11 14 16 8 5
206
N X Y X2 Y2 XY (X1-X )2 (Y1-Y )2
A1 14 12 196 144 168 5,8 0,4A2 16 13 256 169 208 0,2 0,2A3 22 15 484 225 330 31,4 5,8A4 20 15 400 225 300 13,0 5,8A5 18 17 324 289 306 2,6 19,4A6 16 11 256 121 176 0,2 2,6A7 18 14 324 196 252 2,6 2,0A8 22 16 484 256 352 31,4 11,6A9 10 8 100 64 80 41,0 21,2
A10 8 5 64 25 40 70,6 57,8∑164 ∑126 ∑2888 ∑1714 ∑221
2∑198,4 ∑126,4
![Page 207: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/207.jpg)
Determinar la recta de regresión de la calificación sobre el número de horas de
estudios invertidos. Interprete la ecuación de regresión.
X=∑ Yn
=12,6
Y=∑ Xn
=16,4
Sxy=∑ xy
n−Y X
Sxy=221210
−(12,6 ) (16,4 )
Sxy=14,56
Sx=√∑ (X1−X) ²
n
Sx=√ 198,410
Sx=19,84
Sy=√∑ (Y 1−Y )2
n
Sy=√ 126,410
Sy=12,64
S x2=∑ x2
n−X 2
Sx ²=288810
−(16,4)2
Sx ²=19,84
207
![Page 208: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/208.jpg)
b=SXYSx ²
b=14,5619,84
b=0,734
a=Y−b X
a=12,6−(0,734 ) (16,4 )
a=0,565
Ecuación lineal de las dos variables.
y=a+bx
y=1.55+0.67 x
r=n∑ xy−∑ x∑ y
√¿¿¿
r=10¿¿
r= 1456
√(1984 )(1264)
r= 14561583.60
=¿ 0.92
Diagrama de dispersión en el plano cartesiano
208
![Page 209: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/209.jpg)
0 200 400 600 800 1000 1200 14000
10
20
30
40
50
60
70
80
Series2
PASOS DE UNA PRUEBA DE HIPOTESIS
Primer paso formular la hipótesis nula y la hipótesis alternativa
Hipótesis nula
Ho = β=0
La hipótesis alternativa
Ha= β<0; β>0
Segundo paso determinar si la prueba es unilateral o bilateral
Bilateral
Tercer paso Asumir el nivel se significación de la prueba
99% ± 2.58
Cuarto paso determinar la distribución muestral que se usara en la
prueba
n<30
Quinto paso elaborar el esquema de la prueba
209
![Page 210: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/210.jpg)
-2.58 +2.58
Sexto paso calcular el estadístico de la prueba
z= Pm−poQp
z=0.073−0
0 z=0.013
Q=√ SX 2+SY 2
n
Q=√ 19.84+12.6410
Q=1.40
QP=√ PQn
QP=√ 0(1.40)10
QP=0
Pm= pn
Pm=0.7310
Pm=0.073
210
![Page 211: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/211.jpg)
Una muestra de 60 de las 350 agencias de ventas de automóviles de una
importadora registrada en un mes con X (autos vendidos por agencia), Y
(ventas en miles de dólares) ha dado los siguientes resultados:
x=10 , y=10 , ∑ x2=7000 ,∑ y2=42000 , ∑ xy=8000
Determine la ecuación de regresión:
Y=a+bX
sxy=∑ xy
n−x y
sxy=800060
−10∗20=−66.67
s x2=∑ x2
n−¿
s x2=700060
−¿
b= sxy
s x2=−66.67
16.67=−4
a= y−bx
a=20−(−4 ) (10 )=60
Ecuación
y=a+bx
y=60−4 x
Calcule el coeficiente de terminación ¿Qué porcentaje de la variación total
es explicada por la regresión?
211
![Page 212: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/212.jpg)
y=∑ y
n
∑ y= y n
∑ y=20∗60=1200
x=∑ x
n
∑ x=xn
∑ x=10∗60=600
r=n∑ xy−∑ x∑ y
√¿¿¿
r=60 (8000 )−(600)(1200)
√¿¿¿
r= −240000254358.44
=−0,94
Los contadores con frecuencia estiman los gastos generales basados en
el nivel de producción. En la tabla que sigue se da la información
recabada sobre gastos generales y las unidades producidas en 10 plantas
y se desea estimar una ecuación de regresión para estimar gastos
generales futuros.
Gastos generales ($) 300 1000 1100 1200 600 800 900 500 400 200
Unidades producidas 15 45 55 75 30 40 45 20 18 10
N x Y X2 Y2 X Y (xi-x)2 (yi-y)2
1 300 15 90000 225 4500 160000,00 412,092 1000 45 1000000 2025 45000 90000,00 94,093 1100 55 1210000 3025 60500 160000,00 388,09
212
![Page 213: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/213.jpg)
4 1200 75 1440000 5625 90000 250000,00 1576,095 600 30 360000 900 18000 10000,00 28,096 800 40 640000 1600 32000 10000,00 22,097 900 45 810000 2025 40500 40000,00 94,098 500 20 250000 400 10000 40000,00 234,099 400 18 160000 324 7200 90000,00 299,2910 200 10 40000 100 2000 250000.00 640.09sumatoria 7000 353 6000000 16249 309700 1100000,0
03788,10
Determine la ecuación de regresión y haga un análisis del coeficiente de
regresión.
X=∑ X i
N
X=7 00010
X=700
Y=∑Y i
N
Y=35310
Y=35,3
SXY=∑ XY
n– X∗Y
SXY=309 700
10−(700)(35,3)
SXY=30 970−24 710
SXY=6260
SX=√∑ (X i−X )2
N
213
![Page 214: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/214.jpg)
SX=√ 1100 00010
SX=331,66
SX 2=109 998,36
b=SXY
SX 2
b= 6 260109 998,36
b=0,06
a=Y−b X
a=35,3−0,06(700)
a=−6,7
Y=a+bx
Y=−6,7+0,06 x
Diagrama de dispersión en el plano cartesiano
214
![Page 215: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/215.jpg)
0 200 400 600 800 1000 1200 14000
10
20
30
40
50
60
70
80
Series2
PASOS DE UNA PRUEBA DE HIPOTESIS
Primer paso formular la hipótesis nula y la hipótesis alternativa
Hipótesis nula
Ho = β=0
La hipótesis alternativa
Ha= β<0; β>0
Segundo paso determinar si la prueba es unilateral o bilateral
Bilateral
Tercer paso Asumir el nivel se significación de la prueba
99% ± 2.58
Cuarto paso determinar la distribución muestral que se usara en la
prueba
n<30
Quinto paso elaborar el esquema de la prueba
215
![Page 216: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/216.jpg)
-2.58 +2.58
Sexto paso calcular el estadístico de la prueba
z= Pm−poQp
z=0.073−0
0 z=0.013
Q=√ SX 2+SY 2
n
Q=√ 19.84+12.6410
Q=1.40
QP=√ PQn
QP=√ 0(1.40)10
QP=0
Pm= pn
Pm=0.7310
Pm=0.073
La calificación de un grupo de estudiantes en el examen parcial (x) y en
el examen final (y), fueron las siguientes.
216
![Page 217: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/217.jpg)
x y x y X y x y12 15 18 20 15 17 13 148 10 12 14 12 15 10 13
10 12 10 12 11 12 12 1513 14 12 10 12 13 13 149 12 14 16 11 12 12 13
14 15 9 11 10 13 16 1811 16 10 13 14 12 15 17
a) Determinar la ecuación de regresión lineal de Y en X
X y xy X2 Y2 (xi-x) (xi-x)2 (yi-y) (yi-y)2
12 15 180 144 225 0 0 -1 18 10 80 64 100 4 17 4 15
10 12 120 100 144 2 4 2 313 14 182 169 196 -1 1 0 09 12 108 81 144 3 9 2 3
14 15 210 196 225 -2 4 -1 111 16 176 121 256 1 1 -2 518 20 360 324 400 -6 35 -6 3812 14 168 144 196 0 0 0 010 12 120 100 144 2 4 2 312 10 120 144 100 0 0 4 1514 16 224 196 256 -2 4 -2 59 11 99 81 121 3 9 3 8
10 13 130 100 169 2 4 1 115 17 255 225 289 -3 9 -3 1012 15 180 144 225 0 0 -1 111 12 132 121 144 1 1 2 312 13 156 144 169 0 0 1 111 12 132 121 144 1 1 2 310 13 130 100 169 2 4 1 114 12 168 196 144 -2 4 2 313 14 182 169 196 -1 1 0 010 13 130 100 169 2 4 1 112 15 180 144 225 0 0 -1 113 14 182 169 196 -1 1 0 012 13 156 144 169 0 0 1 116 18 288 256 324 -4 15 -4 1715 17 255 225 289 -3 9 -3 10338 388 4803 4222 5528 142 151
x=∑ xi
n
217
![Page 218: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/218.jpg)
x=33828
=12
y=∑ yi
n
y=38828
=14
b=n∑ xiyi−∑ xi∑ yi
n∑ X i2−¿¿¿
b=28 ( 4803 )− (338 )(388)
28(4222)−(338)2
b=134484−131144118216−114244
b=0,85
a=Y−b Xa=14−0,85 (12 )=3,80
Y=a+bxy=3,8+0,85 x
El gerente de personal de la empresa P&C quiere estudiar la relación
entre el ausentismo y la edad de sus trabajadores. Tomo una muestra
aleatoria de 10 trabajadores de la empresa y encontró los siguientes
datos.
Edad (año) 25 46 58 37 55 32 4
1
50 23 60
Ausentismo (días
por año)
18 12 8 15 10 13 7 9 16 6
a) Use el método de mínimos cuadrados para hallar la ecuación muestral
que relaciona las dos variables.
218
![Page 219: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/219.jpg)
Edad (años)
Ausentismo
x Y X Y X2 Y2 (xi-x) (xi-x)2 (yi-y) (yi-y)2
25 18 450 625 324 -17,7 313,29 6,6 43,5646 12 552 2116 144 3,3 10,89 0,6 0,3658 8 464 3364 64 15,3 234,09 -3,4 11,5637 15 555 1369 225 -5,7 32,49 3,6 12,9655 10 550 3025 100 12,3 151,29 -1,4 1,9632 13 416 1024 169 -10,7 114,49 1,6 2,5641 7 287 1681 49 -1,7 2,89 -4,4 19,3650 9 450 2500 81 7,3 53,29 -2,4 5,7623 16 368 529 256 -19,7 388,09 4,6 21,1660 6 360 3600 36 17,3 299,29 -5,4 29,16
427 114 4452 19833 1448 1600,1 148,4
y=a+b x
b=n∑ xi y i−∑ x∑ y
n∑ x2−¿¿
x=∑ xi
n
x=42710
=42.7
y=∑ yi
n
y=11410
=11.4
b=10 ( 4452 )−( 427 )(114 )
10 (19833)−(427)2 =¿
b= 44520−48678198330−182329
=¿
b=−415816001
=−0.26
a= y−bxa=11.4−(−0.26 ) 42.7=22.502 [email protected]=22.502−0.26 x=ecuacion lineal .
219
![Page 220: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/220.jpg)
b) Calcule el coeficiente de determinación. De su comentario sobre el
ajuste de la línea de regresión a los datos de la muestra.
r=n∑ xy−∑ x∑ y
√¿¿¿r=10¿¿
r= 4158
√(16001)(1484)
r= 41584872.93
=0.85
En la gráfica se puede observar que se obtiene una regresión lineal negativa y
los puntos de dispersión no se encuentran tan dispersos a la línea.
En un estudio para determinar la relación entre edad (X) y presión
sanguínea (Y) una muestra aleatoria de 9 mujeres ha dado los
siguientes resultados.
x 54 40 70 35 62 45 55 50 38
y 148 123 155 115 150 126 152 144 114
a) Encuentre la ecuación de regresión de Y en X y estime la presión sanguínea
para una mujer de 75 años.
220
![Page 221: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/221.jpg)
b) Utilizando t-Student pruebe la hipótesis B=0.9, contra la hipótesis B > 0,9 al
nivel de significación a=0.05
c) Pruebe la hipótesis nula Ho: p=0,9 contra H1: p > 0.9
Número Edad(X) Presión (Y) X2 Y2 X*Y (X-X)2 (Y-Y)2
1 54 148 2916 21904 7992 16,90 136,11
2 40 123 1600 15129 4920 97,79 177,78
3 70 155 4900 24025 10850 404,46 348,44
4 35 115 1225 13225 4025 221,68 455,11
5 62 150 3844 22500 9300 146,68 186,78
6 45 126 2025 15876 5670 23,90 106,78
7 55 152 3025 23104 8360 26,12 245,44
8 50 144 2500 20736 7200 0,01 58,78
9 38 114 1444 12996 4332 141,35 498,78
449 1227 23479 169495 62649 1078,89 2214,00
X=∑ Yn
=49,88
Y=∑ Xn
=136,33
Sxy=∑❑
❑
xy
n−x y
Sxy=626499
−(49,88 ) (136,33 )
Sxy=6961−6800,14=160,86
Sx=❑√∑❑❑ (X1−X ) ²
n
221
![Page 222: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/222.jpg)
Sx=❑√ 1078,899
Sx=10,95
Sy=❑√∑❑
❑
(Y 1−Y )2
n
Sy=❑√ 22149
Sy=15,68
S x2=∑❑
❑
x2
n−X 2
Sx ²=234799
−(49,88)2
Sx ²=2608,77−2488.01=120,76
b=SXYSx ²
b=171,696120,76
b=1.42
a=Y−b X
a=136,33− (1.42 ) ( 49,88 )
a=65,50
Ecuación lineal de las dos variables.
222
![Page 223: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/223.jpg)
y=a+bx
y=1.42+65,50x
r=n∑
❑
❑
xy−∑❑
❑
x∑❑
❑
y
❑√¿¿¿
r=9¿¿
r= 12918❑√(9710)(19926)
r=0,928
Diagrama de dispersión en el plano cartesiano
0 200 400 600 800 1000 1200 14000
10
20
30
40
50
60
70
80
Series2
PASOS DE UNA PRUEBA DE HIPOTESIS
Primer paso formular la hipótesis nula y la hipótesis alternativa
Hipótesis nula
Ho = β=0
La hipótesis alternativa
223
![Page 224: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/224.jpg)
Ha= β<0; β>0
Segundo paso determinar si la prueba es unilateral o bilateral
Bilateral
Tercer paso Asumir el nivel se significación de la prueba
99% ± 2.58
Cuarto paso determinar la distribución muestral que se usara en la prueba
n<30
Quinto paso elaborar el esquema de la prueba
-2.58 +2.58
Sexto paso calcular el estadístico de la prueba
z= Pm−poQp
z=0.073−0
0 z=0 .013
Q=❑√ SX2+SY 2
n
Q=❑√ 120,76+2469
224
![Page 225: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/225.jpg)
Q=1.90
QP=❑√ PQn
QP=❑√ 0 (1.90)9
QP=0
Pm= pn
Pm=0.739
Pm=0.08
En un estudio para determinar la relación entre edad (X) y presión
sanguínea (Y) una muestra aleatoria de 9 mujeres ha dado los
siguientes resultados:
X 54 40 70 35 62 45 55 50 38Y 148 123 155 115 150 126 152 144 114
a) Halle la ecuación de regresión de Y en X y estime la presión sanguínea
para una mujer de 75 años.
b) Utilizando t-Student pruebe la hipótesis β=0.9, contra la hipótesis β>0.9
al nivel de significación α=0,05.
c) Pruebe la hipótesis Ho : ρ=0.9 contra H 1: ρ>0.9
a) Determinar la ecuación lineal de las dos variables.
Desarrollo
225
![Page 226: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/226.jpg)
X Y X Y X2 Y2 (xi-x) (xi-x)2 (yi-y) (yi-y)2
54 148 7992 2916 21904 4,11 16,90 11,67 136,1140 123 4920 1600 15129 -9,89 97,79 -13,33 177,7870 155 10850 4900 24025 20,11 404,46 18,67 348,4435 115 4025 1225 13225 -14,89 221,68 -21,33 455,1162 150 9300 3844 22500 12,11 146,68 13,67 186,7845 126 5670 2025 15876 -4,89 23,90 -10,33 106,7855 152 8360 3025 23104 5,11 26,12 15,67 245,4450 144 7200 2500 20736 0,11 0,01 7,67 58,7838 114 4332 1444 12996 -11,89 141,35 -22,33 498,78
449 1227 62649 23479 169495 0,00 1078,89 0,00 2214
Primer caso
Yr=Y +r ( sysx ) x−r ( sysx ) x
X=∑ x1
n= 449
9=49,89
Y=∑ y1
n=1227
9=136.33
r=n∑ xy−∑ x∑ y
√¿¿¿
r=9 (62649 )−(449)(1227)
√¿¿¿
r= 12918
√9710∗19926= 12918
13909,76=0.93
sx=√∑ ¿¿¿¿
sx=√ 1078,899
=10.94 →desviacion standar
s x2=¿
sy=√∑ ¿¿¿¿
226
![Page 227: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/227.jpg)
sy=√ 22149
=15,68→desviacionstandar
s y2=¿
Yr= y+r ( sysx ) x−r ( sysx ) x
Yr=136.33+0.93( 15,6810,94 ) x−0.93 ( 15,68
10,94 )49,89
Yr=136,33+1,33x−66,35
Yr=69,98+1,33x
Para una persona de 75 años vamos a encontrar la presión sanguínea.
Yr=69,98+1,33(70)
Yr=169,73
El gerente de ventas de una cadena de tiendas obtuvo información de
los pedidos por internet y del número de ventas realizadas por esa
modalidad. Como parte de su presentación en la próxima reunión de
vendedores al gerente le gustaría dar información específica sobre la
relación entre el número de pedidos y el número de ventas realizadas.
TIENDA 1 2 3 4 5 6 7 8 9 10
NÚMERO DE PEDIDOS
50 56 60 68 65 50 79 35 4215
NÚMERO DE VENTAS
45 55 50 65 60 40 75 30 3812
a) Use el método de mínimos cuadrados para expresar la relación entre
estas dos variables.
227
![Page 228: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/228.jpg)
b) Haga un análisis de los coeficientes de regresión.
c) ¿Proporcionan los datos suficiente evidencia para indicar que las
unidades producidas aportan información para producir los gastos
generales?
d) Realice un análisis de la bondad del ajuste de la ecuación de regresión
lineal.
e) ¿Qué puede usted concluir acerca de la correlación poblacional entre
gastos generales y unidades producidas?
Desarrollo
TIENDA
NÚMERO DE
PEDIDOS
NÚMERO DE
VENTAS
XY X2 X-X (X-X)2
Y2 Y-X (Y-X)2
1 50 45 2250 2500 -2 4 2025 -2 42 56 55 3080 3136 4 16 3025 8 643 60 50 3000 3600 8 64 2500 3 94 68 65 4420 4624 16 256 4225 18 3245 65 60 3900 4225 13 169 3600 13 1696 50 40 2000 2500 -2 4 1600 -7 497 79 75 5925 6241 27 729 5625 28 7848 35 30 1050 1225 -17 289 900 -17 2899 42 38 1596 1764 -10 100 1444 -9 81
10 15 12 180 225 -37 1369 144 -35 1225TOTAL 520 470 2740
13004
00 3000 2508
80 2998
X=52010
=52
Y=47010
=47
r=n∑ xy−∑ x∑ y
√¿¿¿
r=10(27401)−(520)(470)
√¿¿¿
228
![Page 229: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/229.jpg)
r= 274010−244400
√(300400−270400)(250880−220 900)
r= 29610
√(30000)(29980)
r= 29610
√899400000
r= 29610
√29989,99833
r=0,987
SX=√∑ ¿¿¿¿
sx=√ 300010
=17,32→desviacion standar
s x2=¿
sy=√∑ ¿¿¿¿
sy=√ 299810
=17,31→desviacion standar
s y2=(17,31)=299,64→varianza
b=n∑ xy−∑ x∑ y
n∑ x2−¿¿¿
b=10 (27401 )−(520)(470)
10 (30040 )−(520 )
b=274010−244400300400−270400
b=2961030000
b=0,987
a= y−bx
229
![Page 230: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/230.jpg)
a=47−0,987 (52)
a=¿ -4,324
Ecuación lineal de las dos variables.
y=a+bx
y=−4,324+0,987 x
PASOS DE UNA PRUEBA DE HIPOTESIS
1. Formular la hipótesis nula y la hipótesis alternativa
Hipótesis nula
Ho = β=0
La hipótesis alternativa
Ha= β<0; β>0
2. Determinar si la prueba es unilateral o bilateral
Bilateral
3. Asumir el nivel se significación de la prueba
95% ± 1,96
4. Determinar la distribución muestral que se usara en la prueba
n<30
Como n es menor que 30 utilizaremos la T de estudent
5. Elaborar el esquema de la prueba
230
![Page 231: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/231.jpg)
-1.96 +1.96
6. Calcular el estadístico de la prueba
z= Pm−poQp
z=0.0987−0
10 z=9,87∗10−3 (0,00987)
Q=√ SX 2+SY 2
n
Q=√ 299,98+299,6410
Q=7,74
QP=√ PQn
QP=√ 0(7,74)10
QP=0
Pm= pn
Pm=0,98710
Pm=0,0987
En este caso la hipótesis nula se acepta. Es decir si existe relación entre el
número de pedidos y las ventas que se realizan en las tiendas.
Con los siguientes datos muestrales
Coeficiente de inteligencia: IQ 135 115 95 100 110 120 125 130 140
231
![Page 232: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/232.jpg)
Notas de un examen 16 13 12 12 14 14 15 15 18
a) Halle la ecuación de regresión muestral
b) Interprete la pendiente de parcial.
c) Utilizando t-Student pruebe la hipótesis 𝛃 = 0, contra la hipótesis 𝛃>0 al
nivel de significación α=0,05. ¿Se puede aceptar que 𝛃=1?
d) El grado de asociación entre las dos variables.
e) Utilizando t-Student pruebe la hipótesis p=0 contra la hipótesis p>0 al
nivel de significación α= 0,05
Coeficiente de iteligencia IQ (X)
Notas de un exámen (Y)
XY X2 Y 2 X i−X (X ¿¿i−X )2¿
135 16 2160 18225 256 16,11 259,57115 13 1495 13225 169 -3,89 15,12
95 12 1140 9025 144 -23,89 570,68100 12 1200 10000 144 -18,89 356,79110 14 1540 12100 196 -8,89 79,01120 14 1680 14400 196 1,11 1,23125 15 1875 15625 225 6,11 37,35130 15 1950 16900 225 11,11 123,46140 18 2520 19600 324 21,11 445,68
1070 129 15560 129100 1879 1888,89
X=Σ X i
n
X=10709
=118,89
Y=ΣY i
n
Y=1299
=14,33
232
![Page 233: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/233.jpg)
SXY=ΣXYn
−XY
SXY=155609
−(118,89×14,33)
SXY=25,195
SX=√ Σ(X i−X )2
n
SX=√ 1888,899
SX=14,487
SX2=209,876
b=SXY
SX2
b= 25,195209,876
b=0,12
a=Y−b X
a=14,33−0,12(118,89)
a=0,0632
Y=a+bx
Y=0,0632+0,12x
233
![Page 234: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/234.jpg)
1) Ho= 0
Ha>0
2) Es unilateral con cola derecha
3) NC= 95%
Nivel de significación α=0,05
Z= 1,65
4) n < 30 9 < 30 t—Student
5)
r=n∑ xy−∑ x∑ y
√¿¿¿
r=9 (15560 )−(1070)(129)
√¿¿¿
r=0,9357
X Y XY X2 Y2 X1-X (X1-X Y1-Y (Y1-Y )2
234
Zona de aceptación
Zona de rechazo
Z= 1,65
![Page 235: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/235.jpg)
)2
0 64 0 0 4096 -1,0 1,0 -10,8 117,01 69 69 1 4761 0,0 0,0 -5,8 33,82 94 188 4 8836 1,0 1,0 19,2 368,10 55 0 0 3025 -1,0 1,0 -19,8 392,61 60 60 1 3600 0,0 0,0 -14,8 219,52 92 184 4 8464 1,0 1,0 17,2 295,30 70 0 0 4900 -1,0 1,0 -4,8 23,21 80 80 1 6400 0,0 0,0 5,2 26,92 89 178 4 7921 1,0 1,0 14,2 201,20 84 0 0 7056 -1,0 1,0 9,2 84,41 82 82 1 6724 0,0 0,0 7,2 51,62 99 198 4 9801 1,0 1,0 24,2 584,90 73 0 0 5329 -1,0 1,0 -1,8 3,31 76 76 1 5776 0,0 0,0 1,2 1,42 95 190 4 9025 1,0 1,0 20,2 407,40 77 0 0 5929 -1,0 1,0 2,2 4,81 56 56 1 3136 0,0 0,0 -18,8 354,02 80 160 4 6400 1,0 1,0 5,2 26,90 50 0 0 2500 -1,0 1,0 -24,8 615,81 50 50 1 2500 0,0 0,0 -24,8 615,82 89 178 4 7921 1,0 1,0 14,2 201,20 70 0 0 4900 -1,0 1,0 -4,8 23,21 65 65 1 4225 0,0 0,0 -9,8 96,32 90 180 4 8100 1,0 1,0 15,2 230,60 64 0 0 4096 -1,0 1,0 -10,8 117,01 67 67 1 4489 0,0 0,0 -7,8 61,12 80 160 4 6400 1,0 1,0 5,2 26,9
∑27 ∑2020
∑2221
∑45 ∑156310
∑0,0 ∑18,0
∑0,0 ∑5184,1
Determine la ecuación de regresión de gastos sobre ingresos
Y=∑ YN
=74,81
X=∑ XN
=1
r=n∑ xy−∑ x∑ y
√¿¿¿
235
![Page 236: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/236.jpg)
r=27 (2221 )−(27 )(2020)
√ [27 ( 45 )−(27)2 ] [27 (156310)−(2020)2 ]
r= 54278247,75
=0,66
DESVIACIÓN
Sx=√∑ ( X1−X )2
n
Sx=√ 1827
Sx=0,81
Sy=√∑ (Y 1−Y )2
n
Sy=√ 5184,127
Sy=13,86
ECUACIÓN
Y R=Y +r ( S ySx ) x−r ( SySx ) x
Y R=74,81+0.66 ( 13,860,81 ) x−0.66( 13,86
0,81 )1
Y R=74,81+11,167 x−11,16
Y R=63,648+11,167 x
236
![Page 237: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/237.jpg)
0 0.5 1 1.5 2 2.50
20
40
60
80
100
120
Nivel Socioeconomico
Gast
os e
n ed
ucac
ión
ANEXOS
Las cantidades de un compuesto químico (Y) que se disuelve en 100
gramos de agua a diferentes temperaturas (X) se registraron en la tabla
que sigue:
X (ºC) Y gramos0
1530456075
101527334650
81223304052
101425324353
91624354254
111826344555
a) Encuentre la ecuación de regresión de Y en X
b) Estime la varianza de la regresión poblacional
c) Determine el coeficiente de regresión estandarizado beta
237
![Page 238: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/238.jpg)
d) Calcule el error estándar de la pendiente b. Además desarrolle un
intervalo de confianza del 95% para β. ¿Se puede aceptar que β=0.6?
e) Determine un intervalo de confianza del 95% para la cantidad promedio
de producto químico que se disolverá en 100 gramos de agua a 50ºC.
f) Determine un intervalo de predicción del 95% para la cantidad de
producto químico que se disolverá en 100 gramos de agua a 50ºC.
Desarrollo:
X (°C) Y gramos01530456075
101527334650
81223304052
101425324353
91624354254
111826344555
11,81525
32,843,252,8
225 180,6
X (°C) Y gramos XY X2 Y 2
(X i−X )2 (Y i−Y )2
0 11,8 0 0 139,24 1406,25 139,2415 15 225 225 225 225 22530 25 750 900 625 900 62545 32,8 1476 2025 1075,84 2025 1075,8460 43,2 2592 3600 1866,24 3600 1866,2475 52,8 3960 5625 2787,84 5625 2787,84
∑ 225 ∑ 180,6 ∑ 9003 ∑ 12375 ∑ 6719,16 ∑ 13781,25 ∑ 6719,16
x=∑ 225
6=37,5
y=∑ 180,6
6=30,1
r=N (∑ XY )− (∑ X ) (∑Y )
√ [N (∑ X2 )−(∑ X )2 ] [N (∑ Y 2 )−(∑ Y )2 ]
r=6 (9003 )−(225 ) (180,6 )
√ [6 (12375 )−(225 )2 ] [6 (6719,16 )−(180,6 )2 ]
238
![Page 239: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/239.jpg)
r= 54018−40635
√ [ (74250−50625 ) ( 40314,96−32616,36 ) ]
r= 13383
√ (23625 ) (7698,6 )
r= 13383
√181879425
r= 1338313486,27
r=0,992
SEGUNDO MÉTODO
y= y+r ( SySx ) x−r ( SySx )
y=30,1+ (0,992 )( 33,4647,93 ) x−(0,992 )( 33,46
47,93 )y=30,1+ (0,992 ) (0,70 ) x− (0,992 ) (0,70 )
y=30,80+0,70 x
y=−29,4+0,70 x
Sy=√∑ ( xi−x)2
n=√ 6719,16
6=√1119,86=33,46
Sx=√∑ ( yi− y )2
n=√ 13781,25
6=√2296,88=47,93
Primer paso formular la hipótesis nula y la hipótesis alternativa
Hipótesis nula
Ho = β=0.6
La hipótesis alternativa
Ha= β<0.6; β>0.6
239
![Page 240: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/240.jpg)
Segundo paso determinar si la prueba es unilateral o bilateral
Bilateral
Tercer paso Asumir el nivel se significación de la prueba
95% ± 1.96
Cuarto paso determinar la distribución muestral que se usará en la prueba
n>30
Quinto paso elaborar el esquema de la prueba
-1.96 +1.96
Un estudio en el departamento de investigación de logística acerca de la
aceptabilidad de la creación de la empresa de transporte pesado se ha
aplicado una encuesta a las diferentes entidades de transporte,
exportadores, importadores de la localidad, obteniéndose los resultados
que presenta la siguiente tabla.
CREAR EMPRESA DE TRANSPORTE PESADO
Grado de perjuicio
Transportistas Empresas de transporte
Exportadores Importadores
TOTAL
Aceptable 220 230 75 40 565No 150 250 50 30 480
240
![Page 241: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/241.jpg)
aceptableTOTAL 370 480 125 70 1045
El nivel de significancia es de α=0.10 determinar las variables de la
aceptabilidad de la creación de la empresa de transporte pesado y el lugar de
la creación de la empresa.
1). H 0 : la aceptabilidad y el lugar de la creación de la empresa de transporte
pesado.
H 1: Existe aceptabilidad en la localidad.
2). La prueba es unilateral y la cola es derecha.
3). Asumimos el nivel de significancia de α=0.10
4). Utilizaremos la distribución muestral de Chi-Cuadrado porque las dos
variables son cualitativas.
5). Esquema de la prueba
gl=(c−1 ) (F−1 )
gl=( 4−1 ) (2−1 )=3
gl=3
α=0.10
x2=(n−1)S2
σ2
x2(3)=(6−1)1052
1452
x2(3)=2,62
6). Calculo del estadístico de la prueba
x2=∑ ij(Oij−Eij )
2
Eij
241
2,62
![Page 242: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/242.jpg)
CREAR EMPRESA DE TRANSPORTE PESADO
Grado de perjuicio
Transportistas Empresas de transporte
Exportadores Importadores TOTAL
Aceptable
220
230 75 40 565
No aceptable
150
250 50 30 480
TOTAL370
480 125 70 1045
Una empresa bananera ECUABANANO realiza exportaciones hacia
América Latina, sin embargo está considerando ampliar el destino de
sus exportaciones hacia Norte América, debido a que las exportaciones
han crecido notablemente en los dos anteriores años se han presentado
los siguientes datos:
Sur América Centro américa
México Total
2010 5000 7000 8500 205002011 6500 8000 9500 24000Total 11500 15000 18000 44500
(valor en cajas)
El nivel de significancia es de α=0.10 determinar las variables de la
aceptabilidad de la ampliación de las exportaciones de ECUABANANO hacia
norte américa.
Desarrollo:
1). H 0 : les aceptable la ampliación de las exportaciones de ECUABANANO
Ha : No Existe aceptabilidad de la ampliación de las exportaciones de
ECUABANANO
242
200,0 259,5 67,5 37,85
169,9 220,4 57,42
32,15
![Page 243: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/243.jpg)
2). La prueba es unilateral y la cola es derecha.
3). Asumimos el nivel de significancia de α=0.10
4). Utilizaremos la distribución muestral de Chi-Cuadrado porque las dos
variables son cualitativas.
5). Esquema de la prueba
gl=(c−1 ) (F−1 )
gl=( 4−1 ) (2−1 )=3
gl=3
α=0.10
¿(6−1)1052
1452
x2(3)=6,251
6). Calculo del estadístico de la prueba
x2=∑ ij(Oij−Eij )
2
Eij
7. Se acepta la Ha debido a que está en zona de rechazo, es decir que esta
bananera no debería ampliar las exportaciones en el 2012 y 2013, debe
asegurar el crecimiento d exportaciones para poder tomar esta decisión.
243
6,251
Grado de perjuicio
Importadores
Exportadores
Transportistas TOTAL
Aceptable
5000
8500 20500
No aceptable
6500
9500 24000
TOTAL 11500 15000 18000 44500
5297,75 6910,11 8292,13
6202,25 8089,89 9707,86
![Page 244: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/244.jpg)
En una empresa exportadora en un nuevo proceso artesanal de
fabricación de cierto artículo que está implantado, se ha considerado
que era interesante ir anotando periódicamente el tiempo medio (medido
en minutos) que se utiliza para realizar una pieza (variable Y) y el
número de días desde que empezó dicho proceso de fabricación
(variable X). Con ello, se pretende analizar cómo los operarios van
adaptándose al nuevo proceso, mejorando paulatinamente su ritmo de
producción conforme van adquiriendo más experiencia en él. A partir de
las cifras recogidas, que aparecen en la tabla adjunta, se decide ajustar
una función exponencial que explique el tiempo de fabricación en
función del número de días que se lleva trabajando con ese método.
X Y10 3520 2830 2340 2050 1860 1570 13
Tiempo en min. (X)
N° de días (Y)
XY X2
10 35 350 100 -30 900
20 28 560 400 -20 40030 23 690 900 -10 10040 20 800 1.600 0 050 18 900 2.500 10 10060 15 900 3.600 20 40070 13 910 4.900 30 900
∑ X=¿¿ 280
∑Y=¿¿152
∑ XY=¿¿5.110
∑ X2=¿¿14.000
0 ∑ (Xi−X )2=¿¿2.800
a) Determinar la ecuación lineal de las dos variables
X=∑ Xi
n
244
![Page 245: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/245.jpg)
X=2807
X=40
Y=∑Yi
n
Y=1527
Y=21,71
S∗Y=∑ XY
n−X Y
S∗Y=5.1107
−(40)(21,71)
S∗Y=730−868,4
S∗Y=−138,4
Sx=√∑ (Xi−X )2
n
Sx=√ 2.8007
Sx=20 S x2=400
b=S∗Y
Sx2
b=−138,4400
b=−0,35
a=Y−b X
245
![Page 246: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/246.jpg)
a=40−(−0,35∗21,71)
a=47,59
Ecuación
Y=a+bx
Y=47,59−0,35x
b) Trace el diagrama de dispersión en el plano cartesiano
0 10 20 30 40 50 60 70 800
5
10
15
20
25
30
35
40
Tiempo en minutos (X)
N° d
e dí
as (Y
)
c) ¿Qué tiempo se predeciría para la fabricación del artículo cuando
se lleven 100 días?
Y=47,59−0,35x
100=47,59−0,35 x
100−47,59−0,35
=−x
x=149,74 minutos
d) ¿Qué tiempo transcurriría hasta que el tiempo de fabricación que se
prediga sea de 10 minutos?
Y=47,59−0,35x
246
![Page 247: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/247.jpg)
Y=47,59−0,35 (10 )
Y=44,09días
En la comercialización de manzanas, una empresa exportadora envía
semanalmente lotes de 50 cajas al exterior, cada caja tiene un peso
aproximado de 20 kilos. Las cajas son previamente almacenadas. Para
el control de calidad se
examinan al azar, si en alguna caja encuentran por lo menos una
manzana malograda, esta es calificada mala. Para que pase el control
mediante la inspección de la muestra no debe haber caja malograda, si
solo ex is te una ca ja es ta será cambiada , s i hay más de 1
en las 5 inspeccionadas, inspeccionaran las cincuenta cajas. Según las
estadísticas pasadas de un total de 40 envíos, registro lo siguiente: Se
puede afirmar que la variable número de cajas malogradas en la
muestra de 5 sigue una distribución Binomial?.
manzanas rojas verdes ambosGrandes 3 5 5 13Medianas 5 4 8 17pequeñas 7 9 6 22
total 15 18 19 52
1)
H0: La variable número de cajas sigue una distribución Binomial.
Ha: No siguen una Binomial.
2) La prueba es unilateral y de una cola derecha
3) Nivel de significación 0.10
4) Utilización del chi cuadrado
5) Esquema de la prueba
247
![Page 248: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/248.jpg)
Gl = (c-1) (f-1)
= (3-1) (3-1)
= 4
α = 0.10
En la tabla de chi cuadrada obtenemos
X2 (4) = 7.779
6) Calculo del estadístico de la prueba
x2=∑ij
(Oij−E ij)2
E ij
Calculo de las pruebas esperadas.
E11=(15∗13)
52=3.75
E12=(18∗13 )
52=4.5
E13=(19∗13 )
52=4.75
E21=(15∗17 )
52=4.90
E22=(18∗17 )
52=5.88
E23=(19∗17 )
52=6.21
E31=(15∗22 )
52=6.35
E32=(18∗22 )
52=7.62
248
![Page 249: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/249.jpg)
E33=(19∗22 )
52=8.04
manzanas Rojas verdes ambosGrandes 3.75 4.5 4.75
133 5 5Medianas 4.90 5.88 6.21
175 4 8pequeñas 6.35 7.62 8.04
227 9 6total
15 18 19 52
X2=(3−3.75)2
3.75+
(5−4.5)2
4.5+(5−4.75)2
4.75+(5−4.90)2
4.90+
(4−5.88)2
5.88+(8−6.21)2
6.21+(7−6.35)2
6.35+(9−7.62)2
7.62+(6−8.04 )2
8.04
x2= 0.15+ 0.06+ 0.01+ 0.002+0.60+0.52+ 0.07+ 0.25+ 0.52
x2=2.182
ZA ZR
2.182 7.779
249
![Page 250: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/250.jpg)
ZA= aceptamos la hipótesis nula porque La variable número de cajas
sigue una distribución Binomial.
En un estudio realizado en Tulcán acerca si es factible la creación de la
Zona Franca en la ciudad, para la cual se aplicó una encuesta a las
personas que se dedican al comercio exterior según su actividad,
obteniéndose los resultados que se presentan a continuación:
Actividad de Comercio ExteriorFactibilidad Importadores Exportadores Agentes de
AduanaTotal
Si 18 20 38 76No 12 8 14 34
Total 30 28 52 110
Al nivel de significación α= 0.05, determinar que las variables factibilidad de
creación de Zona Franca y actividad de comercio exterior son independientes.
a)
Ho= factibilidad de creación de Zona Franca y la actividad de comercio exterior
son independientes;
H1=existe dependencia entre las dos variables.
b) La prueba es unilateral y de cola derecha.
c) Asumimos el nivel de significación de α= 0.05
d) Utilizaremos la distribución muestral de Chi-cuadrado porque las dos
variables son cualitativas
e)
gl= (C-1)(F-1)
gl= (3-1)(2-1) = 2
α= 0.05
250
![Page 251: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/251.jpg)
x2(2)=5.991
f)
Actividad de Comercio ExteriorFactibilidad Importadores Exportadores Agentes de
AduanaTotal
Si E11 E12 E13 76No E21 E22 E23 34
Total 30 28 52 110
E11=30×76
110=20,73
E12=28×76
110=19,35
E13=52×76
110=35,93
E21=30×34
110=9,27
E22=28×34
110=8,65
E23=52×34
110=16,07
Ei 20,73 19,35 35,93Oi 18 20 38
9,27 8,65 16,0712 8 14
x2=∑ (Ci−Ei )2
Ei
x2=(18−20,73)2
20,73+(20−19,35)2
19,35+(38−35,93)2
35,93+(12−9,27 )2
9,27+(8−8,65)2
8,65+(14−16,07)2
16,07
x=1,62
251
![Page 252: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/252.jpg)
g) Vemos que el valor se encuentra en la zona de aceptación por lo tanto
aceptamos la Ho.
Un grupo de estudiantes quiere determinar si la creación de una
empresa de alquiler de contenedores para el trasporte de mercancías
entre Colombia y Ecuador, se obtiene los siguientes datos.
EMPRESA DE ALQUILER DE CONTENEDORES
Grado de
perjuicio
Transportistas
Empresas de transporte
Exportadores
Importadores
TOTAL
Están de
acuerdo
392 222 331 123 1068
No Están
de acuerdo
122 324 122 323 891
TOTAL 514 546 453 446 1959
El nivel de significancia es de α=0.05 determinar las variables de la
aceptabilidad de la creación de la empresa.
1). H 0 : la aceptabilidad de la creación de la empresas.
H 1: Existe aceptabilidad.
2). La prueba es unilateral y la cola es derecha.
3) Asumimos el nivel de significancia de α=0.05
4) Utilizaremos la distribución maestral de Ji-Cuadrado porque las dos variables
son cualitativas.
5) Esquema de la prueba
gl=(c−1 ) (F−1 )
252
![Page 253: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/253.jpg)
gl=( 4−1 ) (2−1 )=3
gl=3
6) Calculo del estadístico de la prueba
x2=∑ ij(Oij−Eij )
2
Eij
EMPRESA DE DE ALQUILER DE CONTENEDORESGrado de perjuicio Transportistas
Empresas de transporte
Exportadores Importadores TOTAL
Están de acuerdo
392
222
331 123
1068
No Están de acuerdo
122 324
122
323
891
TOTAL 514 546 453 446 1959
x2=∑ (o−E)2
E
x2=6,62
253
297,66280.22 246.96
206,03
243,14
233,77 248,33 202,85
6,62 7,815
![Page 254: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/254.jpg)
El concesionario Imbauto realiza una importación consistente en
vehículos marca Toyota RAN, dicha empresa encargo un estudio para
determinar la relación entre los gastos de publicidad semanal por
televisión y la venta de los vehículos. En el estudio se obtuvieron los
siguientes resultados.
Semanas Gasto publicidad Ventas
123456789
200150300290350270400350400
29500147505900073750885001327504425044250177000
Semana Volumen Valorx Y xy
1 200 29500 5900000 40000 870250000 -101,1 10223,23 -44250 1958062500,002 150 14750 2212500 22500 217562500 -151,1 22834,23 -59000 3481000000,003 300 59000 17700000 90000 3481000000 -1,1 1,23 -14750 217562500,004 290 73750 21387500 84100 5439062500 -11,1 123,43 0 0,005 350 88500 30975000 122500 7832250000 48,9 2390,23 14750 217562500,006 270 132750 35842500 72900 17622562500 -31,1 967,83 59000 3481000000,007 400 44250 17700000 160000 1958062500 98,9 9779,23 -29500 870250000,008 350 44250 15487500 122500 1958062500 48,9 2390,23 -29500 870250000,009 400 177000 70800000 160000 31329000000 98,9 9779,23 103250 10660562500,00
2710 663750 218005000 874500 70707812500 58488,89 21756250000,00
ሺݔ െݔ�ሻଶ െݕ�ത ሺ െݕ�ሻଶ
x = ∑xin
= 2710
9 = 301,11
y = ∑ yin
= 663750
9 = 73750
Prime Método
yr= y+r ( sysx )x−r ( sysx
) x
254
![Page 255: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/255.jpg)
yr=73750+0,51( 49166,6789,61 ) x−0,51( 49166,67
89,61 )301,11
yr=73750+0,51 (548,67 ) X−0,51 (548,67 )301,11
y r=73750+¿279,82x – 84257,11
yr=¿-10507,11 + 279,82 x
r= n∑ xy−¿¿¿
r= 9 (218005000 )−(2710 )(663750)√¿¿¿
r= 163.282.500
√ [(7870500)−(7344100) ] [(6,3637)−(4,4056)]
r= 163282500
√ [526400 ] [ 0,0000000000195 ]
r= 163282500
321048921,5
r= 0,51
sx=√∑¿¿¿
sx=√ 58488,899
Sx= 80,61
s x2=6498,77
a) Determinar la ecuación lineal de las 2 variables
yr=¿-10507,11 + 279,82 x
b) Trace un diagrama de dispersión en el plano cartesiano.
255
sy=√∑¿¿¿
sy=√ 217562500009
Sy= 49166,67
![Page 256: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/256.jpg)
100 150 200 250 300 350 400 4500
20000400006000080000
100000120000140000160000180000200000
YLinear (Y)
Axis Title
Axis Title
c) Estime el gasto que corresponde a una venta semanal de 28750$
yr=¿-10507,11 + 279,82 x
y=−10507,11+279,82(28750)
y=−10507,11+8044825
y=8.034 .317,89
d) Si la venta es de $26027,72 que gasto puede realizar dicho obrero
en la semana
yr=¿-10507,11 + 279,82 x
yr=¿-10507,11 + 279,82 (26027,72)
y=−10507,11+¿7283076,61
y=7.272 .569,50
e) Si el gasto es de $450 cuál es su venta.
y r=¿-10507,11 + 279,82 x
450=−10507,11+279,82x
450+10507,11279,82
= x
256
![Page 257: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/257.jpg)
X= 39,16
Si la vida media de operación de una pila de linterna es de 24 horas y
está distribuida normalmente con una desviación de 3 horas. ¿Cuál es la
probabilidad de que una muestra aleatoria de 100 pilas tenga una media
que se desvíe por más de 30 minutos del Promedio?
SOL UCIÓN
Z= X−u∅√n
Omed= ∅√n
P (X>24.5horas )=4.85
µ=30horas deduracion
σ = 3 horas n= 100 pilas
Z=1.6
P=0.5−0.4515=4.85 %
Establecer la relación entre el número de pólizas de seguros contratados
durante la semana anterior “X” y el número de vehículos con seguro que
salieron con mercancía de exportación desde el Ecuador “Y”. Calcular la
ecuación.
X Y XY X2 X−X ¿ Y2 Y−Y ¿
10 12 120 100 - 37,73 144,00 - 51,02
257
![Page 258: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/258.jpg)
6,14
7,14
12 13 156 144 -4,14
17,16 169,00 -6,14
37,73
15 15 225 225 -1,14
1,31 225,00 -4,14
17,16
16 19 304 256 -0,14
0,02 361,00 -0,14
0,02
18 20 360 324 1,86
3,45 400,00 0,86
0,73
20 25 500 400 3,86
14,88 625,00 5,86
34,31
22 30 660 484 5,86
34,31 900,00 10,86
117,88
∑ X=¿¿113
∑Y=¿¿134
∑ XY=¿¿2325
∑ X2=¿¿1933
∑ ¿¿108,86 ∑Y 2=¿¿2824,00
∑ ¿¿258,86
X=∑ Xi
n
X=1137
X=16,14
Y=∑Yi
n
Y=1347
Y=19,14
sx=√∑ ¿¿¿¿
sx=√ 108,867
sx=3,94
s2 x=15,55
sy=√∑ ¿¿¿¿
sy=√ 258,867
sy=6,08
s2 y=36,98
r=N ¿¿
258
![Page 259: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/259.jpg)
r=7 (2325 )−(113 )(134)
√ [7 (1933 )−(12769)] [7 (2824 )−(17956)]
r=16275−15142
√(762)(1812)
r=0,964213766
Primera forma de cálculo
Y R=Y +r ( sysx )X−r ( sysx )X
Y R=19,14+0,964213766( 6,083,94 )X−0,964213766 ( 6,08
3,94 )(16,14)
Y R=19,14+1,49 X−24,01
Y R=−4,87+1,49 X
CONCLUSIONES.
La hipótesis nula afirma lo contrario de lo que se quiere probar.
259
![Page 260: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/260.jpg)
Una hipótesis estadística es una proposición o conjetura con respecto a
una o más poblaciones. Estas aseveraciones o suposiciones pueden ser
con respecto a uno o varios parámetros, ó con respecto a la forma de las
respectivas distribuciones de probabilidad. También es posible
considerar una hipótesis estadística como una proposición sobre la
distribución de probabilidad de una variable aleatoria ya que emplea
distribuciones de probabilidad para representar poblaciones.
Una prueba de hipótesis consiste en contrastar dos hipótesis
estadísticas. Tal contraste involucra la toma de decisión acerca de las
hipótesis. La decisión consiste en rechazar o no una hipótesis en favor
de la otra. Una hipótesis estadística se denota por “H” y son dos: - Ho:
hipótesis nula - H1: hipótesis alternativa Partes de una hipótesis 1-La
hipótesis nula “Ho” 2-La hipótesis alternativa “H1” 3-El estadístico de
prueba 4-Errores tipo I y II 5-La región de rechazo (crítica) 6-La toma de
decisión 1
La prueba de hipótesis estadística es que cuantifica el proceso de toma
de decisiones.
La evidencia estadística no permite aceptar la aceptar la hipótesis nula.
La hipótesis alternativa expresa realmente es factible.
RECOMENDACIONES.
Saber identificar una hipótesis nula para así poder resolver la prueba de
hipótesis y poder sacar una conclusión con los resultados obtenidos
acerca del problema o hipótesis nula a resolver.
Construir un modelo de decisión para de esta manera poder sacar una
solución y una conclusión acerca de un problema determinado.
El modelo es una representación simplificada de la situación real, no
necesita estar completo o exacto en todas las relaciones, se concentra
en las relaciones fundamentales e ignora las irrelevantes este es
entendido con mayor facilidad que un suceso empírico (observado), por
lo tanto permite que el problema sea resuelto con mayor facilidad y con
un mínimo de esfuerzo y pérdida de tiempo.
260
![Page 261: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/261.jpg)
El modelo puede ser usado repetidas veces para problemas similares, y
además puede ser ajustado y modificado, ddiferenciar entre hipótesis
nula e hipótesis alternativa, seguir el proceso de resolución a cabalidad,
en los problemas a investigar.
CRONOGRAMA DE ACTIVIDADES:
ACTIVIDAD JUNIO Lunes Miércoles Viernes Lunes
Organización del Tema X Investigación del Tema X Análisis del Tema X Documentación del Tema X
Bibliografía.
Lincoln L. (2008). INTRODUCCION A LA ESTADISTICA ED. CECSA. Argentina: .
Pick, Susan y López, Ana Luisa. (2009). RESOLUCION TOTAL DE PROBABILIDAD Y ESTADISTICA. México: Ed. Trillas S.A.
Tamayo y Tamayo, Mario. (2010). EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA. México: Ed. Limusa S.A.
Tenorio Bahena, Jorge. (2006). NVESTIGACIÓN DOCUMENTA. MÉXICO: Ed. Mac Graw - Hill.
ANEXOS
La empresa Aduanor desea investigar como están los márgenes de sus
importaciones y sus exportaciones para lo cual realiza un estudio como van sus
movimientos comerciales con los siguientes datos;
261
![Page 262: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/262.jpg)
Meses X Y X*Y
1 8642 16011 74680707,24 256336430,5 138359625,3 10822049,33 6864116,17
2 12389 9853 153475923,3 97087520,89 122068001,2 208896,23 12512237,78
3 14015 18999 196433959,9 360979480,3 266286741,6 4343062,95 31459712,47
4 19892 19130 395701212,2 365965317,2 380542927,5 63373567,10 32943649,09
5 24025 26309 577193417,5 692178214,1 632076505,6 146249396,40 166893218,78
6 21683 25374 470165498,9 643839876 550192054,2 95097830,78 143602734,37
7 17769 18576 315735584,1 345067776 330076015,2 34075958,71 26888744,78
8 13354 13456 178318098,8 181063936 179685772,5 2022344,71 4281,85
9 11409 12978 130167791 168428484 148067429,6 272879,12 170209,19
10 16717 17986 279457420 323496196 300671602,3 22900930,49 21118030,50
11 12795 13465 163707675 181306225 172282386 745358,83 5540,69
12 18357 19844 336966232 393784336 364269164,2 41282573,94 41646834,05
143177,86 160686,77 3272003520 4009533792 2747355072,7 356465985,33 421338904,48
Determine la ecuación de regresión y haga un análisis del coeficiente de
regresión.
X=∑ X i
N
X=143177,8612
X=¿11931,49
Y=∑Y i
N
Y=160686,7712
Y=¿13390,56
SXY=∑ XY
n– X∗Y
262
![Page 263: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/263.jpg)
SXY=∑ 2747355072,7
12– 11931,49∗13390,56
Sx= 5450,28
Sy= 5925,50
r=
0,4870
0,537072,78
Yr= 78,16
Ҩ= 2324,10
Sxy= 69176895,93
5000 10000 15000 20000 250000
5000
10000
15000
20000
25000
30000
Series2
263
![Page 264: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/264.jpg)
Según el Servicio Nacional de Aduanas del Ecuador se puede afirmar que
la balanza de pagos del presente año será igual a la balanza de pagos de
los próximos años por lo cual afirman que su respuesta tendrá un 90% de
efectividad, para lo cual se ha tomado en cuenta como muestra de 60
datos de meses anteriores, de los cuales se han analizado 50 al azar, el
nivel de significancia es de 0,05
1.-
2.- 1 cola
3.- = 90% ЄЄ=0,10 Z= - +1,65
4.- n> 30 PRUEBA DE HIPOTESIS
5.-
264
Ho= balanza de pagos presente es igual a la de los demás años.
Ha=balanza de pagos presente es diferente de los demás años.
Z.A Z.RZ.R
![Page 265: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/265.jpg)
6.- Z=P¿−PQx
P❑=5060
=0,833 P= 0,90
Q p=√ pqn
Q p=√ 0,9∗0,160
= 0,04 Z=0,8−0,90,04
= -2,5
7.- La hipótesis nula se rechaza debido y se acepta la hipótesis alternativa que
manifiesta que la Balanza Comercial para el próximo año será diferente a la de
los demás años.
Una empresa está interesada en lanzar un nuevo producto al mercado.
Tras realizar una campaña publicitaria, se toma la muestra de 1 000
habitantes, de los cuales, 25 no conocían el producto. A un nivel de
significación del 1% ¿apoya el estudio las siguientes hipótesis?
Más del 3% de la población no conoce el nuevo producto.
Menos del 2% de la población no conoce el nuevo producto
Datos:
n = 1000 x = 25
Dónde:
x = ocurrencias n = observaciones
265
1,96-1,96
![Page 266: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/266.jpg)
= proporción de la muestra
= proporción propuesta
Solución:
a = 0,01
Una empresa que importa calzado afirma que su producto tiene el 90% de
acogida en mercados extranjeros. En una muestra de 100 mercados lo
venden 50. Determinar que la afirmación no es cierta, es decir que el
producto es acogido por el 90%. Si el nivel de significancia es igual a 0.05.
1)
Ho = µ = 90% ; µ = 0.9
Ha = µ < 90% ; µ < 0.9
2) La campana es de 1 cola.
3)
266
![Page 267: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/267.jpg)
NC = α = 95%
EE = 0.05 Z = -1.65
4)
n = 100 n > 30
5)
6)
Z=P −PQx
=0.5−0.90.02
=−5
P = 50100
=0.5
p=0.9
Qx=√ pqn
=√ (0.09 )(0.1)100
=0.02
7) El -5 está en zona de rechazo los productos en el extranjero, más el 90% de
mercados.
Rechazo la Ho y acepto la Ha.
Los salarios diarios de una empresa de comercialización de productos
lácteos. Tiene una distribución normal con una media de 24.20 USD y una
desviación estándar de 5 USD, si una compañía de esta empresa emplea
35 trabajadores les paga una promedio de 22 USD ¿puede ser acusada
267
Aceptación
Rechazo
-1.65
![Page 268: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/268.jpg)
esta empresa de pagar un salario inferiores con un nivel de significancia
del 1%?
1)
Ho = µ = 24.20
Ha = µ < 24.20
2) La campana es de 1 cola.
3)
NC = α = 99%
EE = 0.01 Z = -2.33
4) n > 30 35 > 30 prueba de hipótesis
5)
6)
Z= X −µs
√n
Z=22−24.205
√35
p=−2.60
7) Rechazo la Ho y acepto la Ha.
268
Aceptación
Rechazo
-2.33
![Page 269: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/269.jpg)
La empresa no está pagando lo justo a los trabajadores contratados por lo que
podría tener problemas ante la ley de trabajadores.
PRUEBA CHI - CUADRADO
Pruebas Paramétricas. Se llama así a las pruebas de hipótesis que cumplen
tres requisitos fundamentales:
1. La variable de la prueba debe ser la variable cuantitativa.
2. Los datos se obtienen por muestreo estadístico.
3. Los datos deben ajustarse a determinadas distribuciones estadísticas.
Ejemplos.
1. La prueba basada en la distribución normal de probabilidades.
269
![Page 270: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/270.jpg)
2. La prueba de student.
Pruebas No Paramétricas.- llamadas también pruebas de distribución libre.
Son aquellas que:
1. La variable de la prueba puede ser cualitativa o cuantitativa.
2. Los datos se obtienen por muestreo estadístico.
3. Son independientes de cualquier distribución de probabilidad.
Ejemplo.
La prueba de Chi – Cuadrado (también llamada prueba Ji –Cuadrado).
Las pruebas paramétricas son mas poderosas. Sin embargo cuando la variable
es cualitativa, sólo se puede usar las pruebas no paramétricas.
El Estadístico Chi – Cuadrado
En un estadístico que sirve de base para una prueba no paramétrica
denominada prueba chi – cuadrado que se utiliza especialmente para variables
cualitativas, esto es, variables que carecen de unidad y por lo tanto sus valores
no pueden expresarse numéricamente. Los valores de estas variables son
categorías que sólo sirven para clasificar los elementos del universo del
estudio. También puede utilizarse para variables cuantitativas,
transformándolas, previamente, en variables cualitativas ordinales.
El estadísticos chi- cuadrado se define por
x2=(n−1 ) S2
a2
En donde:
n= número de elementos de la muestra.
n-1= número de grados de libertad
s2= varianza de la muestra
a2= varianza de la población
270
![Page 271: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/271.jpg)
Desarrollaremos un ejemplo numérico con la finalidad de fijar el concepto de
Chi – cuadrado.
Ejemplo:
En un estudio de la capacidad de aprendizaje de matemáticas, en los niños de
una población, se tomó una muestra representativa de 40 niños. Se les aplicó
una prueba de diagnostico del aprendizaje en matemáticas y con los datos
obtenidos se calculó la varianza s2=8.4, conociendo que la varianza poblacional
es de α2= 12,37, calcular el valor del estadístico chi-cuadrados.
Datos:
n= 40 S2= 8,4 a2= 12,37
x2=(40−1 )8,4
12,37
x2=26,48
Ahora vamos a elaborar el concepto de DISTRIBUCIÓN MUESTRAL DEL
ESTADÍSTICO CHI- CUADRADO.
Supongamos que se realiza los pasos siguientes:
1. De una población de N elementos se extrae todas las muestras posibles
del mismo tamaño n.
2. Con los datos de cada muestra se calcula el estadístico chi – cuadrado.
3. Con todos los valores de Chi – cuadrado se forma una distribución de
frecuencias; éstas se denomina distribución muestral del Chi-cuadrado.
Esta distribución muestral se representa gráficamente en un sistema de
coordenadas, colocando en el eje de abscisas los valores del estadístico Chi-
cuadrado.
Cuadrado en el eje vertical se colocan las frecuencias de cada valor del chi-cuadrado.
271
![Page 272: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/272.jpg)
El área encerrada bajo la curva y el eje horizontal es igual a uno y representar la probabilidad de que Chi-cuadrado tome valores mayores que 0.
El área rayada situada a la derecha de la ordenada levantada en la abscisa x2
(gl), representa la probabilidad ∝ de cometer el error tipo l en la prueba de chi-cuadrado. Esta probabilidad ∝ es el nivel de significación de la prueba. El valor x2 (gl) se llama valor crítico del chi-cuadrado y se determina por medio de una tabla especial, que representa al final del libro el aprendizaje de tablas.
Antes de entrar en el manejo de la tabla debemos tener encuentra que para una probabilidad dad, por ejemplo ∝=0.05, al aumentar el número de grados de libertada también aumenta el valor crítico de Chi-cuadrado; esto se ilustra en las tres figuras siguientes:
272
![Page 273: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/273.jpg)
Este crecimiento del valor crítico se debe a que el aumentar el número de grados de libertad, la curva de la distribución muestral de Chi-cuadrado tiende a tomar una forma más extendida y por tanto el punto crítico se desplaza hacia la derecha.
Descripción y manejo de la tabla.- La tabla de valores críticos de x2 se encuentra en el apéndice. En la línea horizontal superior encabezando en cada
columna se hayan los valores de .
En la primera columna de la izquierda están los grados de libertad. Los ejemplos siguientes el manejo de la tabla.
1. Ejemplo:
∝=0.05 y gl= 4 g de l
A partir de gl=4g de l, dirigimos una visual hacia la derecha hasta cortar a la
visual que baja por ∝=0.05; en la intersección se encuentra el valor crítico
∝=9.488 .
2. Ejemplo:
Si ∝=5 %=0.05 y gl=6 gdel
Hallamos x2 (6)=12.592
3. Ejemplo:
Si ∝=5 %=0.05 y gl=10gde l
273
![Page 274: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/274.jpg)
Encontramos x2 (10) = 18.307
Con estos 9 valores de la variable de estudio X, vamos a elaborar el cuadro de
frecuencias observadas correspondientes a las 10 categorías establecidas.
Cuadro 11. 3. 2
Intervalos Conteo Frecuencias
Observadas
Menos de 6,26 a 6, 26 IIII - I 6
6 , 26 a 11,62 IIII - I 6
11,62 a 15,51 III 3
15,51 a 18,80 IIII 5
18,80 a 21,96 IIII 4
21,96 a 25,12 IIII - IIII 10
25,12 a 28,41 III 3
28,41 a 32,30 IIII 4
32,30 a 37,66 IIII 4
37,66 a más. IIII 5
A continuación debemos realizar la clasificación y conteo de los 50 datos, es
decir, colocar a cada uno de ellos dentro de su categoría representándolo por
una tarja. La suma de las tarjas de cada clase da la frecuencia observada de
esta clase.
Para facilitar el cálculo del estadístico chi-cuadrado mediante la fórmula
indicada
(X 2=∑ (Oi−E i)2
Ei
)
Agregamos las frecuencias observadas y esperadas en celdas tal como se
presenta a continuación. Recordemos que se fijo la frecuencia esperada de 5
en cada intervalo, luego:
274
![Page 275: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/275.jpg)
Frecuencia observada O, y frecuencia esperada E, en la Prueba Chi-cuadrado
de Bondad de Ajuste.
Ei 5 5 5 5 5 5 5 5 5 5Oi 6 6 3 5 4 10 3 4 4 5
X2 (7 )= (6−5 )2
5+
(6−5 )2
5+
(3−5 )2
5+
(5−5 )2
5+
(4−5 )2
5+(10−5)2
5+
(3−5 )2
5+
(4−5 )2
5+
(4−5 )2
5+
(5−5 )2
5
X2(7)=38+5=7,6
7) Toma de decisiones
Observamos que este valor de Chi-cuadrado, en el esquema grafico (figura
11.3.5) se ubica en la regresión de aceptación, luego aceptamos H o esto es,
que la muestra se obtiene de una población distribuida normalmente.
Problema
De una investigación demográfica se conoce que los habitantes de ciertos
países se distribuyen en la forma siguiente: 0- 20 años, 25%; 21 – 40 años,
35%; 41 -61 años, 25%; 61 -80 años, 10%; 81 – 100 años, 5%.
Después de transcurridos varios años se quiso probar que la distribución
poblacional de las edades no ha cambiado para lo que se selecciono una
muestra respectiva de 1000 personas y se observo que las frecuencias de las 5
categorías fueron: 0- 20 años, 200; 21 – 40 años, 300; 41 -61 años, 300; 61 -80
años, 100; 81 – 100 años, 100.
1) H o la distribución actual por edades es igual a la del año de ejecución
del censo
H 1 La distribución actual por edades no es igual a la del año de
ejecución
2) La prueba es unilateral y de cola derecha
3) Nivel de significación a= 0.10
275
![Page 276: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/276.jpg)
77.14
7.779
4) Se utiliza la distribución CHI – CUADRADO
ESQUEMA DE LA PRUEBA
Existen k= 5 celdas, tenemos gl = K-1 = 5-1=4 grados de libertad a =
0.10 en la tabla de CHI – CUADRADO obtenemos
x2 ( 4 )=7.779
5) CALCULO DEL ESTADÍSTICO DE LA PRUEBA
200 300 300 100 100
Las frecuencias observadas nos las proporcionan con la muestra aleatoria de
los 1.000 habitantes.
CALCULO DE LAS FRECUENCIAS ESPERADAS
276
5100250350250
![Page 277: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/277.jpg)
E1 = 1.000 X 25% = 250 E2 = 1.000 X 35% = 350
E3 = 1.000 X 25% = 250 E4 = 1.000 X 105% = 100
E5 = 1.000 X 5% = 50
CALCULO DEL ESTADISTICO CHI – CUADRADO
x2 ( 4 )=∑I=1
5 (Oi−Ei)2
E i
x2 ( 4 ) = (200−250)
250
2
+ (300−350)
350
2
+(300−250)
250
2
+(100−100)
100
2 +(100−50)50
2
x2 ( 4 ) = 10+7.14+10+0+50
x2 ( 4 )= 77.14
6) TOMA DE DECISIONES
Vemos que el estadístico calculado CHI – CUADRADO (77.14) es mayor
que el valor critico encontrado en la tabla (7.779) vemos que 77.14 cae
en la región de rechazo por lo tanto rechazamos H o y aceptamos H 1, es
decir la distribución actual por edades no es igual a la de la investigación
demográfica.
CORRECCIÓN DE YATES
277
![Page 278: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/278.jpg)
Cuando el número de grados de libertad es igual a la unidad, es necesario
realizar una corrección por continuidad durante el cálculo del estadístico de la
prueba. Esta corrección se denomina de yates y consiste en disminuir en 0.05
al valor absoluto de la diferencia ¿ entre las frecuencias observadas y as
frecuencias esperadas.
El ejemplo siguiente ilustra la aplicación de esta corrección.
PROBLEMA
En el año de 1960, la proporción de hombres y mujeres de cierta institución de
enseñanza superior, fue de 75% y 25%, respectivamente. Con la finalidad de
verificar si el transcurso del tiempo había originado algún cambio en las
proporciones de estudiantes de ambos sexos, en el año de 1970 se tomó una
muestra aleatoria de 100 alumnos de 1º ciclo, obteniendo 60 hombres y 40
mujeres. Con estos datos realizar la verificación por medio de la prueba de CHI
– CUADRADO, asumiendo el nivel de significación de a= 5%.
1) H o la distribución de hombres y mujeres en el año de 1970 también es
de 75% y de 25% respectivamente
H 1 La distribución de hombres y mujeres en el año de 1970 no es del
75% ni del 25% respectivamente
2) La prueba es universal y de cola derecha
3) Nivel de significación a= 0.05
4) Emplearemos la distribución muestral de CHI – CUADRADO
278
![Page 279: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/279.jpg)
11.21
3.841
5) ESQUEMA DE LA PRUEBA
Existen 2 categorías entonces K= 2 y gl = K – 1 =2-1=1 a= 0.05 con
estos datos vamos a la tabla de CHI – CUADRADO y obtenemos x2 (1 )
3.841.
6) CALCULO DEL ESTADÍSTICO DE LA PRUEBA
60 40
OBTENCIÓN DE LOS VALORES ESPERADOS
Valor esperado para los hombres: 100 x 75% = 75
Valor esperado para las mujeres: 100 x 25% = 25
279
2575
![Page 280: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/280.jpg)
CACULO DEL ESTADÍSTICO DE LA PRUEBA
Como gl = 1 utilizaremos la corrección de yates
x2 (1 ) (|O1−E1|−0.5¿¿¿2)
E1
+(|O2−E2|−0.5¿¿¿2)
E2
x2 (1 ) (|60−75|−0.5¿¿¿2 )75
+(|40−25|−0.5¿¿¿2 )
25
x2 (1 ) (|−15|−0.5¿¿¿2 )
751
+(|−15|−0.5¿¿¿2 )
25
x2 (1 ) (15−0.05¿¿¿2 )
75+
(15−0.05¿¿¿2 )25
x2 (1 ) =2.8+8.41= 11.21
7) TOMA DE DESICIONES
Como el valor de CHI – CUADRADO es de 11.21, mayor que el valor
CHI – CUADRADO afirmamos que 11.21 cae en la región de rechazo,
luego rechazamos la H o por lo tanto afirmamos que la distribución de
hombres y mujeres no es del 75% ni del 25% respectivamente.
En un estudio realizado en el departamento de investigación del ESAN acerca del perjuicio étnico hacia el negro. En los universitarios de lima se aplico
Lugar de residenciaGrado de perjuicio
Barriadas Barrios populares
intermedios
Barrios residenciales
total
Alto 32 225 50 307Bajo 28 290 79 397Total 60 515 129 704
280
![Page 281: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/281.jpg)
Una encuesta a los universitarios según su lugar de procedencia, obteniendo los resultados que presenta la siguiente tabla
Al nivel de significación Q=0.05, determinar que las variables perjuicio étnico hacia el negro y lugar de residencia son independientes
1. Ho: el perjuicio étnico y el lugar de residencia son independientes
H1: existe dependencia entre las variables.
2. La prueba es unilateral y la cola derecha 3. Asumimos el nivel de significación de Q= 0.054. Utilizaremos la distribución muestral de chi-cuadrado porque las dos
variables son cualitativas.5. Esquema de la prueba
Gl =(C-1) (F-1) 1.1.3.4
Gl =(3-1) (2-1) = 2 11.3.4
Gl= 2
Q= 0.05
X2 = (2) = 5.991
C= # de columnas
F= # de filas
6. Calculo del estadístico de la prueba x= 3.54 5.991Formula
x2=∑ij
❑
(Qij−EijEij )2
X2= 3.54
Ya conocemos las frecuencias observadas para determinar las frecuencias esperadas emplearemos la misma tabla, manteniendo invariables de frecuencias marginales de dos variables
281
![Page 282: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/282.jpg)
¿(32−26.16)2
26.16+(25−224.58)2
224.58+(50−56.25)2
56.25+
(28−33.84 )233.84
+(79−72.78 ) 2
72.75=3 .5 4
Lugar de ResidenciaGrado de perjuicio
Barriadas Barrios populares
(intermedios)
Barrios residenciales
total
Alto E11 E12 E13 307Bajo E21 E22 E23 397Total 60 515 129 704
Cuando las variables X y Y son independientes, las frecuencias de cada celda son igual al productos de las frecuencias marginales correspondientes dividido por el tamaño de la muestra.
E11=60∗307704
=26.16
E12=515∗307704
=224.58
E13=129∗307704
=56.25
E21=60∗397704
=33.84
E22=515∗397704
=290.42
E23=129∗397704
=72.75
282
72.75
79
33.84
28
290.42
290
224.58
225
26.16
32
56.25
50
![Page 283: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/283.jpg)
Las frecuencias esperadas y las asociadas determinan las frecuencias observadas anteriormente
UNIVERSIDAD POLITÉCNICA ESTATAL DEL
CARCHI
283
![Page 284: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/284.jpg)
FACULTAD DE COMERCIO INTERNACIONAL, INTEGRACIÓN, ADMINISTRACIÓN Y ECONOMIA
EMPRESARIAL
Carrera: Escuela de Comercio Exterior y Negociación Internacional
“ESTADISTICA INFERENCIAL”
ING. Jorge Pozo
INTEGRANTES: Jesenia Pozo
CURSO: Sexto “B”
TULCÁN, MARZO 2012
284
![Page 285: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/285.jpg)
TEMA: Estadístico Chi - Cuadrado
PROBLEMA: El escaso conocimiento del Estadístico Chi – Cuadrado no ha
permitido a los estudiantes resolver problemas
OBJETIVOS
OBJETIVO GENERAL:
Aplicar los conocimientos del Estadístico Chi – Cuadrado para resolver
problemas de Comercio Exterior
OBJETIVO ESPECIFICO:
Investigar del Estadístico Chi – Cuadrado para resolver problemas de
Comercio Exterior
Conocer del Estadístico Chi – Cuadrado para resolver problemas de
Comercio Exterior
Analizar el Estadístico Chi – Cuadrado para resolver problemas de
Comercio Exterior
JUSTIFICACION El presente trabajo se lo ha realizado con el fin de obtener
información acerca del Estadístico Chi – Cuadrado para de esta manera
contribuir en nuestro conocimiento y de esta forma tener claro los ámbitos de
aplicación para resolver problemas que puedan existir en el Comercio Exterior.
El Estadístico Chi – Cuadrado nos permite hacer cálculos y determinar de esta
manera la factibilidad de un proyecto a través de un resultado expresado en
porcentajes para de esta manera lograr determinar los puntos clave del
proyecto o tema de investigación y así lograr obtener un buen resultado. El
tema del Estadístico Chi – Cuadrado nos permite aplicarlo en el Comercio
exterior al momento que se quiera la saber la diferencia entre dos variables
como por ejemplo en una empresa fabricadora que tan productiva esta la
maquinaria.
285
![Page 286: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/286.jpg)
MARCO TEORICO
PRUEBA CHI-CUADRADO
Pruebas paramétricas: Se llaman así a las pruebas de hipótesis que cumplen
tres requisitos fundamentales
La variable de la prueba debe ser variable cuantitativa
Los datos se obtiene por muestreo estadístico
Los datos deben ajustarse a determinadas distribuciones estadísticas
Pruebas no paramétricas.- Llamadas también pruebas de distribución libre.
Son aquellas en que:
La variable de la prueba puede ser cualitativa o cuantitativa
Los datos se obtiene por muestreo estadístico
Son independientes de cualquier distribución de probabilidad.
EL ESTADISITICO CHI- CUADRADO
Es un estadístico que sirve de base para una prueba no paramétrica
denominada Prueba de Chi- Cuadrado que se utiliza especialmente para
variables cualitativas, esto es, variables que carecen de unidad y por lo tanto
sus valores no pueden expresarse numéricamente. Los valores de estas
variables son categorías que solo sirven para clasificar los elementos del
universo de estudio. También puede utilizarse para variables cuantitativas,
transformándolas, previamente, en variables cualitativas ordinales.
Pruebas chi-cuadrado de ajuste e independencia
Las pruebas chi-cuadrado son un grupo de contrastes de hipótesis que sirven
para comprobar afirmaciones acerca de las funciones de probabilidad (o
densidad) de una o dos variables aleatorias.
Estas pruebas no pertenecen propiamente a la estadística paramétrica pues no
establecen suposiciones restrictivas en cuanto al tipo de variables que admiten,
286
![Page 287: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/287.jpg)
ni en lo que refiere a su distribución de probabilidad ni en los valores y/o el
conocimiento de sus parámetros.
Se aplican en dos situaciones básicas:
a) Cuando queremos comprobar si una variable, cuya descripción parece
adecuada, tiene una determinada función de probabilidad. La prueba
correspondiente se llama chi-cuadrado de ajuste.
b) Cuando queremos averiguar si dos variables (o dos vías de
clasificación) son independientes estadísticamente. En este caso la
prueba que aplicaremos ser la chi-cuadrado de independencia o chi-
cuadrado de contingencia.
Chi-cuadrado de ajuste
En una prueba de ajuste la hipótesis nula establece que una variable X tiene
una cierta distribución de probabilidad con unos determinados valores de los
parámetros. El tipo de distribución se determina, según los casos, en función
de: La propia definición de la variable, consideraciones teóricas al margen de
esta y/o evidencia aportada por datos anteriores al experimento actual.
A menudo, la propia definición del tipo de variable lleva implícitos los valores de
sus parámetros o de parte de ellos; si esto no fuera así dichos parámetros se
estimarán a partir de la muestra de valores de la variable que utilizaremos para
realizar la prueba de ajuste.
287
![Page 288: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/288.jpg)
EJERCICIOS
1. Un jugador quiere probar que es legal el dado con el que juega. Tiro el
dado 120 veces y obtuvo la siguiente distribución de frecuencias de las
caras restantes.
Resultado 1 2 3 4 5 6Frecuencia
15 25 33 17 16 14
a) Enuncie la hipótesis de la prueba y determine las frecuencias esperadas
b) Describa la estadística de la prueba
c) Determine la región crítica de la prueba al nivel de significación del 5%.
d) ¿A qué conclusión llega usando el nivel de significación 0.05?
e) Determine la probabilidad P
Resolución
1.- Hₒ = El dado es legal
Hₐ = El dado no es igual
2.- La prueba es unilateral e de una sola cola a la derecha
3.- Nivel de significación 0.05
4.- Se utiliza la distribución de chi-cuadrado
5.- Esquema de la prueba
gl = k-1=6-1=5
gl= 11.070
6.- x ²=∑(Ơ ¡−€ ¡ )
€ ¡
x ²=(15−20 ) ²
20+
(25−20 ) ²20
+(33−20 ) ²
20+
(17−20 ) ²20
+(16−20 )²
20+
(14−20 ) ²20
=14
288
![Page 289: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/289.jpg)
7.- Decisión: rechazamos hipótesis nula y aceptamos hipótesis alternativa.
2. El gerente de ventas de una compañía P&C afirma que todos sus
vendedores realizan el mismo número de visitas durante el mismo
periodo de tiempo. Una muestra aleatoria de 5 registros de los
vendedores en una semana dada revelo el siguiente número de visitas.
Vendedor A B C D ENúmero de visitas 23 29 25 23 30
Con el nivel de significación de 0.05. ¿ es razonable aceptar la
afirmación del gerente?
Resolución
1.- Hₒ = Mismo número de visitas
Hₐ = Diferentes visitas
2.- La prueba es unilateral e de una sola cola a la derecha
3.- Nivel de significación 0.05
4.- Se utiliza la distribución de chi-cuadrado
5.- Esquema de la prueba
gl = k-1=5-1=4
gl= 9.49
6.- x ²=∑(Ơ ¡−€ ¡ )
€ ¡
x ²=(23−26 ) ²
26+
(29−26 ) ²26
+(25−26 )²
26+
(23−26 ) ²26
+(30−26 ) ²
26=1.69
7.- Decisión: rechazamos hipótesis nula y aceptamos hipótesis alternativa.
289
![Page 290: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/290.jpg)
3. El gerente de personal de la compañía REXA quiere probar la hipótesis
que hay diferencias significativas de tardanzas de los diferentes días de
la semana. De los registros de asistencia obtuvo la siguiente tabla de
tardanzas de un personal para cada uno de los días de la semana:
Días Lunes Martes Miércoles Jueves ViernesTardanzas 58 39 75 48 80
¿Se puede aceptar la hipótesis del gerente con un nivel de significación de 0.05?
1._
H0 = EXISTEN DIFERENCIAS SIGNIFICATIVAS DE TARDANZAS.
Ha= NO EXISTEN DIFERENCIAS SIGNIFICATIVAS DE TARDANZAS.
2._ Una sola cola hacia la derecha
3._ Nivel de significancia 0.05
4._ Prueba Chi Cuadrado
5._ Esquema prueba
Gl=5 celdas
Gl= k- 1=5-1=4
Gl=(x2) (4) = 9.49
6._ x2= € (0i - £i)2
X2 = (58−60)60
+ (39−60)
60 +
(75−60)60
+ (48−60)
60 +
(80−60)60
=
20.233
7._ Se rechaza la Hipótesis Nula.
290
9.49
![Page 291: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/291.jpg)
4. De una muestra de turistas que se hospedan en el hotel EL PALMER se
recogió sus opiniones acerca de los servicios del hotel, resultando los
siguientes datos.
Pésima Mala Regular Buena Muy buena
Excelente
Turistas 20 25 40 54 56
Pruebe con un nivel de significancia del 5% la hipótesis nula de que no hay
diferencias significativas entre las opiniones de los turistas.
1._
H0 = No hay diferencia significativa de las opiniones del turista
Ha= Si hay opiniones significativas del turista.
2._ Una sola cola hacia la derecha
3._ Nivel de significancia 0.05
4._ Prueba Chi Cuadrado
5._ Esquema prueba
Gl=5 celdas
Gl= k- 1=5-1=4
Gl=(x2) (4) = 9.49
6._ x2= € (0i - £i)2
X2 = (20−39)39
+ (25−39)
39 +
(40−39)39
+ (54−39)
39 +
(56−39)39
=
27.4873
7._ Se rechaza la Hipótesis Nula.
291
9.49
![Page 292: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/292.jpg)
5. En un día dado se observó el número de conductores que escogieron
cada una de las 10 casetas de pago de peaje ubicadas a la salida al sur.
Los datos se registraron en la siguiente tabla:
Caseta # 1 2 3 4 5 6 7 8 9 10
# de conductores 58
0
70
0
73
0
745 720 710 660 655 67
0
49
0
¿Presentan estos datos suficiente evidencia para concluir que hay casetas
preferidas? Utilice el nivel de significancia del 5%
1.-
2.- 1 cola unilateral
3.- Nivel de confianza = 90% Error Estimado=0,10
gl= 3-1= 2 RC= 5,999
4.- n> 30 CHI CUADRADO
5.-
6.-
292
Z.R
5,999
Z.A
Ho= los pagos con cheque, efectivo o tarjeta tienen relación
Ha= los pagos con cheque, efectivo o tarjeta no tienen relación
120 180 100110 210 80
![Page 293: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/293.jpg)
E1=400 * 30% =120
E2= 400* 45% =180
E3= 400* 255 = 100
X2=(110−120)2
120+(210−180)2
180+(100−80)2
100=9,83
7- se rechaza la hipótesis ya que los pagos con cheque, efectivo o tarjeta no
tiene relación por este motivo es que se rechaza esta hipótesis.
6. Un ejecutivo de hipermercado “TOD” afirma que las compras se pagan
30% con cheque, 45% con efectivo y 25% con tarjeta de crédito. En una
muestra aleatoria de 400 compradores se encontró que 110 de ellos
pagan con cheque, 210 con efectivo, y 80 con tarjeta. ¿Puede usted
concluir con la significación de 0,05, que la afirmación del ejecutivo es
razonable?
1.-
2.- 1 cola unilateral
3.- Nivel de confianza = 95% Error Estimado=0,05
gl= 10-1= 9 RC= 16,92
4.- n> 30 CHI CUADRADO
293
Ho= hay preferencia de casetas
Ha= no hay preferencia de casetas
![Page 294: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/294.jpg)
5.-
6.-
E1=400 * 30% =120
E2= 400* 45% =180
E3= 400* 255 = 100
X2=(580−666)2
666+(700−666)2
666+(730−666)2
666+(745−666)2
666+(720−666)2
666+(710−666)2
666+(660−666)2
666+
(655−666)2
666+(670−666)2
666+(490−666)2
666=82,41
7. se rechaza la hipótesis nula ya que los conductores no tiene preferencia por
las casetas de peaje sino que deciden por alguna que ya este bacía o en la que
haya menor número de autos para sí poder seguir de forma más rápida a su
destino final.
9. Un investigador escogió una muestra aleatoria de 192 familias con 4 hijos y
encontró la siguiente distribución de frecuencias del número de hijos varones:
294
Z.A Z.R
16,92
120 180 100110 210 80
![Page 295: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/295.jpg)
VALORES OBSERVADOS
Número de varones 0 1 2 3 4 Total
Número de familias 18 42 64 40 28 ∑ 192
El quiere probar la hipótesis de que los nacimientos de varones y mujeres son
igualmente probables. Esto es, quiere probar que la distribución de estos datos se
aproxima a una distribución binomial.
Enuncie las hipótesis de la prueba y obtenga las frecuencias esperadas
Describa la estadística de la prueba
Determine la región crítica de la prueba al nivel de significación del 5%.
¿A qué conclusión llega usando el nivel de significación de 0.05?
Determine el nivel de significación de la prueba. (Calcule probabilidad: P)
1. Ho: Los nacimientos de varones y mujeres son igualmente probables.
Ha: Los nacimientos de varones y mujeres no son igualmente probables.
2. La prueba es unilateral y de cola derecha
3. α = 5% = 0.05
gl = (f – 1 )(c - 1) = (2 – 1)(5 - 1) = 4
4. Valor chi – cuadrado x2 (4) = 9,488
5. Esquema de la prueba
α = 5% = 0.05
gl = 4
2959,488
![Page 296: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/296.jpg)
6. Cálculo del estadístico de la prueba
Ei 38.4 38.4 38.4 38.4 38.4
Oi 18 42 64 40 28
Cálculo de las frecuencias esperadas
Ei=1925
=38.4
x2 ( 4 )=∑ (Oi−EI )2
Ei=[ (18−38.4 )2
38.4+
(42−38.4 )2
38.4+
(64−38.4 )2
38.4+
(40−38.4 )2
38.4+
(28−38.4 )2
38.4 ]=10.83+0.33+17.06+0.06+2.81=31.09
7. Toma de decisiones
Aceptamos la Ha y rechazamos la Ho.
Esto significa que los nacimientos de varones y mujeres no son igualmente
probables.
296
![Page 297: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/297.jpg)
10. Se lanzaron 200 veces 5 monedas y en cada tirada se contaron el número de
caras. Los resultados de este experimento son los siguientes:
Número de caras 0 1 2 3 4 5 Total
Número de tiradas 3 15 55 60 40 27 200
Frec. Esperadas (Ei) 33,33 33,33 33,33 33,33 33,33 33,33 200
Oi – Ei -30.33 -18.33 21.67 26.67 6.67 -6.33
(Oi – Ei)2 919.91 335.99 469.59 711.29 44.49 40.07
(Oi – Ei)2 / Ei 27.60 10.08 14.09 21.34 1.33 1.20 75.61
Pruebe la hipótesis de que la distribución del número de caras se ajusta a una
distribución binomial. Use el nivel de significación del 1%.
Ei=200n
=2006
=33,33
1. Ho: la distribución del número de caras se ajusta a una distribución binomial.
Ha: la distribución del número de caras no se ajusta a una distribución
binomial.
2. La prueba es unilateral y de cola derecha
3. Nivel de significación α = 1% = 0,01
4. Se utilizará la Distribución Muestral de Chi - cuadrado
5. Esquema de la prueba
gl = k – 1 = 6 – 1 = 5
α = 1% = 0,01
x2 (5) = 15.086
297
![Page 298: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/298.jpg)
6. Cálculo del Estadístico de la Prueba
x2 (5 )=∑ (Oi−EI )2
Ei=¿
7. Toma de decisiones
Aceptamos la Ha y rechazamos la Ho. La distribución del número de caras se
ajusta a una distribución binomial.
CONCLUSIONES
El chi-cuadrado permite determinar la aprobación o rechazo de dos
hipótesis planteadas
El chi-cuadrado sirven para comprobar afirmaciones acerca de las
funciones de probabilidad (o densidad) de una o dos variables
aleatorias.
RECOMENDACIONES
Es de mucha importancia, que como estudiantes de la carrera de
comercio exterior conozcamos todo lo relacionado con El chi-cuadrado
para que exista una correcta aplicación en los ejercicios propuestos y
podamos determinar la dependencia que existe entre dos variables.
La utilización correcta de las formulas del chi-cuadrado y por ende son
aplicadas en empresas de Comercio exterior ya que permite un mejor
298
15.086
![Page 299: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/299.jpg)
análisis para que se resuelva de manera correcta los problemas de una
empresa.
Bibliografía
HOWAR B. CHRISTENSEN. (1990). ESTADISTICA PASO A PASO. En H. B.
CHRISTENSEN, ESTADISTICA (págs. 557-590). TRILLAS: TRILLAS.
JOHNSON, R. (1990). Análisis descriptívo y presentación de datos bivariados.
En ESTADÍSTICA ELEMENTAL (pág. 82 ~ 112). Belmont: Wadsworth
Publishing Company Inc.
ANEXOS
1. Un estudio en el departamento de investigación de logística acerca de la
aceptabilidad de la creación de la empresa de transporte pesado se ha
aplicado una encuesta a las diferentes entidades de transporte,
exportadores, importadores de la localidad, obteniéndose los resultados
que presenta la siguiente tabla.
CREAR EMPRESA DE TRANSPORTE PESADO
Grado de perjuicio
Transportistas
Empresas de transporte
Exportadores
Importadores
TOTAL
Aceptable 220 230 75 40 565No
aceptable150 250 50 30 480
TOTAL 370 480 125 70 1045
El nivel de significancia es de α=0.10 determinar las variables de la
aceptabilidad de la creación de la empresa de transporte pesado y el lugar de
la creación de la empresa.
299
![Page 300: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/300.jpg)
1). H 0 : la aceptabilidad y el lugar de la creación de la empresa de transporte
pesado.
H 1: Existe aceptabilidad en la localidad.
2). La prueba es unilateral y la cola es derecha.
3). Asumimos el nivel de significancia de α=0.10
4). Utilizaremos la distribución muestral de Chi-Cuadrado porque las dos
variables son cualitativas.
5). Esquema de la prueba
gl=(c−1 ) (F−1 )
gl=( 4−1 ) (2−1 )=3
gl=3
α=0.10
x2=(n−1)S2
σ2
x2(3)=(6−1)1052
1452
x2(3)=2,62
6). Calculo del estadístico de la prueba
x2=∑ ij(Oij−Eij )
2
Eij
CREAR EMPRESA DE TRANSPORTE PESADO
Grado de Transportista Empresas de Exportadore Importadore TOTA
300
2,62
![Page 301: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/301.jpg)
perjuicio s transporte s s LAceptable
220
230 75 40 565
No aceptable
150
250 50 30 480
TOTAL370
480 125 70 1045
2. Una empresa bananera ECUABANANO realiza exportaciones hacia
América Latina, sin embargo está considerando ampliar el destino de
sus exportaciones hacia Norte América, debido a que las exportaciones
han crecido notablemente en los dos anteriores años se han presentado
los siguientes datos:
Sur América Centro américa
México Total
2010 5000 7000 8500 205002011 6500 8000 9500 24000Total 11500 15000 18000 44500
(valor en cajas)
El nivel de significancia es de α=0.10 determinar las variables de la
aceptabilidad de la ampliación de las exportaciones de ECUABANANO hacia
norte América.
Desarrollo:
1). H 0 : les aceptable la ampliación de las exportaciones de ECUABANANO
Ha : No Existe aceptabilidad de la ampliación de las exportaciones de
ECUABANANO
2). La prueba es unilateral y la cola es derecha.
3). Asumimos el nivel de significancia de α=0.10
4). Utilizaremos la distribución muestral de Chi-Cuadrado porque las dos
variables son cualitativas.
301
32,1557,42
220,4
200,0
169,9
37,8567,5259,5
![Page 302: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/302.jpg)
5). Esquema de la prueba
gl=(c−1 ) (F−1 )
gl=( 4−1 ) (2−1 )=3
gl=3
α=0.10
¿(6−1)1052
1452
x2(3)=6,251
6). Calculo del estadístico de la prueba
x2=∑ ij(Oij−Eij )
2
Eij
7. Se acepta la Ha debido a que está en zona de rechazo, es decir que esta
bananera no debería ampliar las exportaciones en el 2012 y 2013, debe
asegurar el crecimiento d exportaciones para poder tomar esta decisión.
3. En la comercialización de manzanas, una empresa exportadora envía
semanalmente lotes de 50 cajas al exterior, cada caja tiene un peso
aproximado de 20 kilos. Las cajas son previamente almacenadas. Para
el control de calidad se
examinan al azar, si en alguna caja encuentran por lo menos una
302
6,251
Grado de perjuicio
Importadores
Exportadores
Transportistas TOTAL
Aceptable
5000
8500 20500
No aceptable
6500
9500 24000
TOTAL 11500 15000 18000 44500
9707,868089,896202,25
8292,135297,75 6910,11
![Page 303: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/303.jpg)
manzana malograda, esta es calificada mala. Para que pase el control
mediante la inspección de la muestra no debe haber caja malograda, si
solo ex is te una ca ja es ta será cambiada , s i hay más de 1
en las 5 inspeccionadas, inspeccionaran las cincuenta cajas. Según las
estadísticas pasadas de un total de 40 envíos, registro lo siguiente: Se
puede afirmar que la variable número de cajas malogradas en la
muestra de 5 sigue una distribución Binomial?.
manzanas rojas verdes ambosGrandes 3 5 5 13Medianas 5 4 8 17pequeñas 7 9 6 22
total 15 18 19 52
7)
H0: La variable número de cajas sigue una distribución Binomial.
Ha: No siguen una Binomial.
8) La prueba es unilateral y de una cola derecha
9) Nivel de significación 0.10
10)Utilización del chi cuadrado
11)Esquema de la prueba
Gl = (c-1) (f-1)
= (3-1) (3-1)
= 4
α = 0.10
En la tabla de chi cuadrada obtenemos
X2 (4) = 7.779
303
![Page 304: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/304.jpg)
12)Calculo del estadístico de la prueba
x2=∑ij
(Oij−E ij)2
E ij
Calculo de las pruebas esperadas.
E11=(15∗13)
52=3.75
E12=(18∗13 )
52=4.5
E13=(19∗13 )
52=4.75
E21=(15∗17 )
52=4.90
E22=(18∗17 )
52=5.88
E23=(19∗17 )
52=6.21
E31=(15∗22 )
52=6.35
E32=(18∗22 )
52=7.62
E33=(19∗22 )
52=8.04
manzanas Rojas verdes ambosGrandes 3.75 4.5 4.75
133 5 5Medianas 4.90 5.88 6.21
175 4 8pequeñas 6.35 7.62 8.04
304
![Page 305: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/305.jpg)
227 9 6total
15 18 19 52
X2=(3−3.75)2
3.75+
(5−4.5)2
4.5+(5−4.75)2
4.75+(5−4.90)2
4.90+
(4−5.88)2
5.88+(8−6.21)2
6.21+(7−6.35)2
6.35+(9−7.62)2
7.62+(6−8.04 )2
8.04
x2= 0.15+ 0.06+ 0.01+ 0.002+0.60+0.52+ 0.07+ 0.25+ 0.52
x2=2.182
13)
ZA ZR
2.182 7.779
ZA= aceptamos la hipótesis nula porque La variable número de cajas
sigue una distribución Binomial.
4. En un estudio realizado en Tulcán acerca si es factible la creación de la
Zona Franca en la ciudad, para la cual se aplicó una encuesta a las
305
![Page 306: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/306.jpg)
personas que se dedican al comercio exterior según su actividad,
obteniéndose los resultados que se presentan a continuación:
Actividad de Comercio ExteriorFactibilidad Importadores Exportadores Agentes de
AduanaTotal
Si 18 20 38 76No 12 8 14 34
Total 30 28 52 110
Al nivel de significación α= 0.05, determinar que las variables factibilidad de
creación de Zona Franca y actividad de comercio exterior son independientes.
1-
Ho= factibilidad de creación de Zona Franca y la actividad de comercio exterior
son independientes;
H1=existe dependencia entre las dos variables.
2 La prueba es unilateral y de cola derecha.
3 Asumimos el nivel de significación de α= 0.05
4 Utilizaremos la distribución muestral de Chi-cuadrado porque las dos
variables son cualitativas
gl= (C-1)(F-1)
gl= (3-1)(2-1) = 2
α= 0.05
x2(2)=5.991
5
Actividad de Comercio Exterior
306
![Page 307: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/307.jpg)
Factibilidad Importadores Exportadores Agentes de Aduana
Total
Si E11 E12 E13 76No E21 E22 E23 34
Total 30 28 52 110
E11=30×76
110=20,73
E12=28×76
110=19,35
E13=52×76
110=35,93
E21=30×34
110=9,27
E22=28×34
110=8,65
E23=52×34
110=16,07
Ei 20,73 19,35 35,93Oi 18 20 38
9,27 8,65 16,0712 8 14
x2=∑ (Ci−Ei )2
Ei
x2=(18−20,73)2
20,73+(20−19,35)2
19,35+(38−35,93)2
35,93+(12−9,27 )2
9,27+(8−8,65)2
8,65+(14−16,07)2
16,07
x=1,62
7-Vemos que el valor se encuentra en la zona de aceptación por lo tanto
aceptamos la Ho.
307
![Page 308: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/308.jpg)
5. Un grupo de estudiantes quiere determinar si la creación de una
empresa de alquiler de contenedores para el trasporte de mercancías
entre Colombia y Ecuador, se obtiene los siguientes datos.
EMPRESA DE ALQUILER DE CONTENEDORES
Grado de
perjuicio
Transportistas
Empresas de transporte
Exportadores
Importadores
TOTAL
Están de
acuerdo
392 222 331 123 1068
No Están
de acuerdo
122 324 122 323 891
TOTAL 514 546 453 446 1959
gl=3
6) Calculo del estadístico de la prueba
x2=∑ ij(Oij−Eij )
2
Eij
EMPRESA DE DE ALQUILER DE CONTENEDORESGrado de perjuicio Transportistas
Empresas de transporte
Exportadores Importadores TOTAL
Están de acuerdo
392
222
331 123
1068
No Están de acuerdo
122 324
122
323
891
308
202,85248,33233,77
243,14
206,03
246.96280.22297,66
![Page 309: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/309.jpg)
TOTAL 514 546 453 446 1959
x2=∑ (o−E)2
E
x2=6,62
309
7,8156,62
![Page 310: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/310.jpg)
310
![Page 311: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/311.jpg)
TEMA: Aplicación de los estadísticos en el programa SPSS
PROBLEMA: El escaso conocimiento de la Aplicación de Estadísticos en
programas SPSS no ha permitido a los estudiantes resolver problemas
OBJETIVOS
OBJETIVO GENERAL:
Aplicar los estadísticos en el programa SPSS que permita resolver
problemas de comercio exterior
OBJETIVO ESPECIFICO:
Investigar la aplicación de los Estadísticos en el programa SPSS para
resolver problemas de Comercio Exterior
Conocer la aplicación de los Estadísticos en el programa SPSS
Analizar la aplicación de Estadísticos en el programa SPSS para
resolver problemas de Comercio Exterior.
JUSTIFICACION
Con esta investigación se quiere conocer los programas que hoy en la
actualidad permiten aplicar problemas y ejercicios que surgen en el comercio
exterior, en este caso queremos interpretar los diferentes estadísticos que
manejamos dentro de la estadística inferencial, utilizando el programa SPSS
17, el cual permite calcular resultados de una forma más rápida y precisa.
Con la aplicación de los estadísticos en este programa buscamos que la forma
para tomar y analizar resultados, sea más factible para la persona que requiere
de esta información.
En este proyecto esta detallado cada paso que se deberá tomar al momento de
calcular los diferentes estadísticos de manera que sea entendible y practico.
311
![Page 312: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/312.jpg)
MARCO TEÓRICO
SPSS STADISTIC
SPSS es un programa estadístico informático muy usado en las ciencias
sociales y las empresas de investigación de mercado. Originalmente SPSS fue
creado como el acrónimo de Statistical Package for the Social Sciences aunque
también se ha referido como "Statistical Product and Service Solutions" (Pardo,
A., & Ruiz, M.A., 2002, p. 3). Sin embargo, en la actualidad la parte SPSS del
nombre completo del software (IBM SPSS) no es acrónimo de nada.
Como programa estadístico es muy popular su uso debido a la capacidad de
trabajar con bases de datos de gran tamaño. En la versión 12 es de 2 millones
de registros y 250.000 variables. Además, de permitir la recodificación de las
variables y registros según las necesidades del usuario. El programa consiste
en un módulo base y módulos anexos que se han ido actualizando
constantemente con nuevos procedimientos estadísticos. Cada uno de estos
módulos se compra por separado.
Actualmente, compite no sólo con software licenciados como lo son SAS,
MATLAB, Statistica, Stata, sino también con software de código abierto y libre,
de los cuales el más destacado es el Lenguaje R. Recientemente ha sido
desarrollado un paquete libre llamado PSPP, con una interfaz llamada PSPPire
que ha sido compilada para diversos sistemas operativos como Linux, además
de versiones para Windows y OS X. Este último paquete pretende ser un clon
de código abierto que emule todas las posibilidades del SPSS.
CORRELACIÓN LINEAL
El análisis de correlación se dirige sobre todo a medir la fuerza de una relación
entre variables. El coeficiente de correlación lineal, r, es la medida de la fuerza
de la relación lineal entre dos variables. La fortaleza de la relación se determina
312
![Page 313: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/313.jpg)
mediante la magnitud del efecto que cualquier cambio en una variable ejerce
sobre la otra. (JOHNSON, 1990)
Si X o Y son las dos variables en cuestión, un diagrama de la dispersión
muestra la localización de los puntos (X,Y) sobre un sistema rectangular de
coordenadas. Si todos los puntos del diagrama de dispersión parecen estar en
una recta, como la figura 14(a) y 14(b) la correlación se llama lineal. (SPIEGEL,
1992)
REGRESIÓN LINEAL
Fases del modelo de regresión lineal
La recta de regresión y el coeficiente de correlación tienen sentido en tanto en
cuanto son instrumento para inferir la relación de las variables en la población.
El conocimiento exacto del coeficiente de correlación solo es posible si
analizamos la totalidad de la población. Sin embargo, a la hora de evaluarlo,
nos encontramos con el problema habitual de tener que inferirlo desde la
estimación que proporcionan los datos de una muestra.
La recta de regresión lineal y=a+bx, es una estimación de la recta de regresión
lineal de la población y=α+ßx. Los parámetros α y ß son evaluados a partir de
los datos de una muestra, y es fundamental tener unas garantías de que los
valores a y b estimados no difieren significativamente de los parámetros
poblacionales α y ß.
El proceso que se sigue en la construcción del modelo de regresión se
compone de tres fases o etapas. En la primera fase, se comprueba si la
relación entre las variables que componen el modelo está de acuerdo con la
propia forma del modelo.
La segunda fase consiste en la estimación de los parámetros de acuerdo con el
criterio elegido (en nuestro caso, el método de mínimos cuadrados).
La última fase es fundamental para el investigador, que debe comprobar si las
inferencias o pronósticos que se pueden hacer de la relación encontrada entre
las variables se ajustan a los datos. (VARGAS, 1995).
313
![Page 314: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/314.jpg)
PRUEBA DE HIPÓTESIS
La prueba de hipótesis comienza con una suposición, llamada hipótesis, que
hacemos acerca de un parámetro de población. Después recolectamos datos
de muestra, producimos estadísticas muéstrales y usamos esta información
para decidir qué tan probable es que nuestro parámetro de población hipotético
sea correcto. Digamos que suponemos un cierto valor para una medida de
población, para probar validez de esa suposición recolectamos datos de
muestra y determinamos la diferencia entre el valor hipotético y el valor real de
la media de la muestra. Después juzgamos si la diferencia obtenida es
significativa o no. Mientras más pequeña sea la diferencia, mayor será la
probabilidad de que nuestro valor hipotético para la media sea correcto.
Mientras mayor sea la diferencia, más pequeña será la probabilidad. (LEVIN,
2010)
T DE STUDENT
En probabilidad y estadística, la distribución T - Student es una distribución de
probabilidad que surge del problema de estimar la media de una población
normalmente distribuida cuando el tamaño de la muestra es pequeño.
Una variable aleatoria se distribuye según el modelo de T - Student con n
grados de libertad.
Propiedades:
7. La gráfica de la función de densidad es en forma de campana.
8. Los datos están más dispersos que la curva normal estándar.
9. A medida que n aumenta, la gráfica se aproxima a la normal N (0,1).
10.La gráfica es muy parecida a la de la normal estándar diferenciándose
en que las colas de t están por encima de la normal, y el centro se
encuentra por debajo del de la normal.
11.Cuando los grados de libertad son altos, los valores de t coinciden con
los de la normal.
314
![Page 315: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/315.jpg)
CHI- CUADRADO
Es un estadístico que sirve de base para una prueba no paramétrica
denominada prueba de chi cuadrado que se utiliza especialmente para
variables cualitativas, esto es, variables que carecen de unidad y por lo tanto
sus valores no pueden expresarse numéricamente. Los valores de estas
variables son categorías que solo sirven para clasificar los elementos del
universo del estudio. También puede utilizarse para variables cuantitativas,
transformándolas, previamente, en variables cualitativas ordinales.
El estadístico Chi- Cuadrado se define por:
x2=(n−1)s2
σ2
En donde:
n=número de elementos de la muestra
n-1= números de grados de libertad.
s2 =varianza de la muestra
σ 2 = varianza de la población
VARIANZA
Cuando es necesario hacer comparaciones entre tres o más medias
muéstrales para determinar si provienen de poblaciones iguales utilizamos la
técnica de análisis de varianza. Esta técnica se realiza utilizando la distribución
de probabilidad F vista anteriormente. Para el uso de esta técnica es necesario
seguir los siguientes supuestos:
1) Las poblaciones siguen una Distribución de Probabilidad Normal
315
![Page 316: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/316.jpg)
2) Las poblaciones tienen desviaciones estándar (σ) iguales
3) Las muestras se seleccionan de modo independiente
La técnica del análisis de varianza descompone la variación total en dos
componentes de variación llamados variación debida a los tratamientos y
variación aleatoria.
INSTALACIÓN DEL SPSS
PASOS PARA DESCARGAR EINSTALAR EL SPSS
1. Prender el computador
2. Descargar el programa spss
3. Entrar en la pagina 4 shared
4. Clic en archivos y poner el nombre del programa y buscar
5. Clic en descargar spss
6. Clic en descargar archivo esperar algunos segundo
7. Clic en descargar archivo
8. Asegurarse de no estar conectado a internet: durante la instalación el
programa
Para desconectar el acceso a la red hacer clic en Inicio
9. Panel de control
10.Conexiones de red.
11.Luego hacer clic con el botón secundario del mouse en el ícono de la
placa de red y hacer clic en "Desactivar".
316
![Page 317: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/317.jpg)
12.) Ir a la carpeta donde se ubica el archivo "SPSS 17 Setup.exe" y hacer
doble clic en el mismo.
13.Se abrirá una ventana que muestra el progreso de la instalación.
14.Se abre otra ventana. Seleccionar "Licencia de usuario individual" y
hacer clic en "Siguiente >". En la siguiente ventana hacer clic en "Acepto
los términos del contrato de licencia" y hacer clic en "Siguiente >". En la
ventana de "Información de última hora" hacer clic en "Siguiente >".
15.Se abre una nueva ventana
a) Completar los campos "Nombre de usuario" y "Organización" con los
datos que se desee.
b) Ir a la carpeta donde se ubica el archivo "keygen.exe" y hacer doble clic
en el mismo.
317
![Page 318: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/318.jpg)
c) Atención: antes de continuar, tener en cuenta que los códigos mostrados
aquí pueden diferir de los que muestra el programa en su computadora
(se recomienda utilizar solamente los códigos mostrados en el programa
que se utiliza al instalar y no los mostrados aquí
16.Se abre una ventana para ingresar licencia y registro de SPSS. Hacer
clic en "Aceptar".
17.Se abre una nueva ventana.
a) Seleccionar "Conseguir una licencia para mi producto ahora".
18.Clic en siguiente
19. Introducir el código de autorización que está debajo del botón
"Generate" del keygen mencionado en 5b. Hacer clic en "Siguiente >".
Aparece una ventana que indica un error en la conexión a internet.
Hacer clic en "Siguiente >".
20.Clic en siguiente para que se instale el programa
21.Luego clic en inicio programas spss Aparece una ventana que indica las
licencias de las que se dispone. Hacer clic en "Siguiente >".
22.Se abre una nueva ventana.
a) Seleccionar "Conseguir una licencia para mi producto ahora".
23.Luego se introduce la licencia del producto
24.Clic en siguiente
25.Para pasar el idioma del programa a español
26.Abrir un archivo .sav o alguno de la carpeta Samples. En el menú "Edit"
hacer clic en el botón "Options..."
En la pestaña "General", en el área "Output", en la sección "Language" hacer
clic la lista desplegable (el triángulo que apunta hacia abajo) y hacer clic en
"Spanish".
318
![Page 319: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/319.jpg)
Repetir el paso 19 en la sección "User Interface" y hacer clic en "OK".
27.Para reconectar el acceso a la red hacer clic en Inicio / Panel de control /
Conexiones de red. Luego hacer clic con el botón secundario del mouse
en el ícono de la placa de red y hacer clic en "Activar".
319
![Page 320: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/320.jpg)
UTILIZACIÓN DEL SPSS
1.- Abrir el programa SPSS,
2.- Menú inicio y clic en el icono que aparece del programa con el nombre de
SPSS.
3.- A continuación se desplegara la ventana SPSS, con un cuadro de dialogo,
hacer clic en la opción “introducir datos” y luego clic en aceptar.
320
CLIC EN INICIO
CLIC EN EL ICONO DEL PROGRAMA SPSS
![Page 321: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/321.jpg)
SELECCIÓN DE DATOS
Después de haber abierto la venta del SPSS procedemos a ingresar los dtos
para lo cual se debe tener un archivo donde se encuentren nuestros datos y
hacemos lo siguiente:
1.- Clic en archivo, luego clic en abrir y en datos
2.- Aparecerá un cuadro de dialogo donde selecciona la ubicación en donde se
encuentra el archivo.
321
![Page 322: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/322.jpg)
3.- Selecciona el formato del archivo a ser introducido en este caso será Excel.
4.- Busca el archivo para introducir los datos en el SPSS. Damos clic el archivo
de los datos y clic en abrir.
322
Clic en archivo
Clic en el archivo
![Page 323: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/323.jpg)
5.- En el cuadro de dialogo que indica el tipo de archivo seleccionado, escoge
el formato y presiona clic en aceptar.
6.- Automáticamente se desplegaran los datos y sus variables
323
Clic en aceptar
![Page 324: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/324.jpg)
7.- Damos clic en vista de variables y en la columna de decimales lo coloca en
cero, la medida en escalar y el tipo numérico para que se pueda calcular los
datos requeridos,.
CÁLCULO DE CORRELACIÓN EN EL SPSS
Se calculara la relación que existe entre las exportaciones en toneladas
con las exportaciones en valor FOB.
1.- Hacer clic en análisis
2.- Elige la opción correlación en el menú que se despliega y luego escoge la
opción bivariadas. Mirar el grafico que esta a continuación.
324
Clic en vista de variables
En la columna de tipo clic en numérico.
En la columna de medida clic en escalar.
En la columna de decimales clic en colocar en cero
![Page 325: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/325.jpg)
3.- Mira el cuadro de dialogo con las dos variables propuestas.
4.- Luego se procede a traspasar cada variable.
325
Clic en la variable con la que estamos trabajando y la pasamos con la flecha que aparece
![Page 326: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/326.jpg)
5.- Luego has click en aceptar y se desplegaran los datos y tablas optenidas a
traves de programa. Estos resultados estaran en la otra pagina del programa.
326
![Page 327: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/327.jpg)
CÁLCULO DE REGRESIÓN EN EL SPSS
Se podrá calcula la ecuación para correlación donde la ecuación nos
servirá para hacer proyecciones al futuro.
1.- Clic en analizar, en el menú que se despliega elige la opción regresión y
después la opción lineal,
2.- En el cuadro que aparece se determinará la variable dependiente e
independiente, y colocarlas en el espacio que aparece en el cuadro de dialogo.
327
![Page 328: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/328.jpg)
3.- Despliega el cuadro de dialogo en la opción “estadísticos”
4.- Elige las opciones de “estimaciones” y “intervalo de confianza”.
5.- Clic en continuar.
328
![Page 329: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/329.jpg)
6.- Elige la opción “gráficos”
7.- Selecciona “histogramas” y “gráfico de prob. normal”, para obtener el cálculo
de la gráfica de los datos.
8.- Has clic en aceptar si ya realizaste los pasos anteriores para obtener el
resultado de la Regresión.
329
![Page 330: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/330.jpg)
9.- En la hoja siguiente observa el cálculo siguiente:
330
![Page 331: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/331.jpg)
331
![Page 332: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/332.jpg)
10.- Gráfica de dispersión.
CÁLCULO DE PRUEBA DE HIPÓTESIS EN EL SPSS
Calcularemos la relación existente entre las exportaciones en valor FOB y
las exportaciones en toneladas en donde determinamos la aprobación o
rechazo de la hipótesis nula o hipótesis alternativa
332
![Page 333: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/333.jpg)
Pasos de una prueba de hipótesis
En la prueba de hipótesis que goza de aceptación general figuran siete pasos:
1.- Formular la hipótesis nula HO,
De manera que pueda determinarse exactamente α, la probabilidad de
cometer un error tipo 1. (Esto equivale a determinar el parámetro de población
que interesa y proponer la validez de un valor para él) (Signo =)
Ho = las exportaciones en valor FOB son iguales a las exportaciones en
toneladas
1.1.- Formular la hipótesis alternativa Ha
De manera que el rechazo de la hipótesis nula signifique aceptar la hipótesis
alternativa. (Signo > o <)
Al formular estas dos hipótesis, se determinan el parámetro y el valor
propuesto;
Ha = las exportaciones en valor FOB son diferentes a las exportaciones en
toneladas
2.- Determinar si la prueba es unilateral o bilateral
3.- Asumir el nivel de significación
4.- Determinar la distribución muestral que se usara en la prueba
5.- Elaborar el esquema de la prueba
6.- Calcular el estadístico de la prueba
7.- Tomar la decisión, para esto, se comparan el esquema de la parte 5, con el
estadístico del paso 6
Cálculo en SPSS
333
![Page 334: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/334.jpg)
1.- Has clic en la opción analizar.
2.- Selecciona la opción “comparar medias” y “prueba T para muestras
relacionadas”.
3.- En el cuadro siguiente, aparecen las dos variables con las cuales se está
trabajando.
4.- Presiona el botón con la flecha para traspasar las variables al cuadro vacío.
334
![Page 335: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/335.jpg)
5.- luego de haber insertado las variables, haz clic en opciones.
6.- Haz clic en el cuadro de dialogo en las opciones excluir casos según
análisis.
7.- en el intervalo de confianza pon el porcentaje con el que vas a trabajar.
335
Clic en opciones
![Page 336: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/336.jpg)
8.- Haz clic en aceptar para que se desplieguen los cálculos de regresión.
9.- Observa los cálculos de regresión en la siguiente hoja del programa SPSS.
336
Establecemos el intervalo de confianza
Clic en continuar
Clic en aceptar
![Page 337: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/337.jpg)
CÁLCULO DE CHI CUADRADO EN EL SPSS
Se ha realizado una encuesta a 17 persona vinculadas con el comercio
exterior acerca de acuerdo al nivel que tienen de ceptaciooon con la
restriccion que puso el gobierno a la importaciómn de celulares.
Ho= la dependencia que existe entre las empresas vinculadas con el comercio
exterior y el nivel de acuerdo sobre el porcentaje a la importacion de celulares
Ha = no exite dependencia entre las empresas vinculadas con el comercio
exterior y el nivel de acuerdo sobre el porcentaje a la importacion de celulares.
CALCULO EN EL SPSS DEL CHI CUADRADO
1. Ingresamos los datos al SPSS en este caso deben ser tablas de
contingencia para poder analizar.
337
![Page 338: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/338.jpg)
2. Nos ubicamos en la barra de herramientas y damos clic en analizar,
estadísticos descriptivos y tablas de contingencia.
338
![Page 339: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/339.jpg)
3. Se nos desplegara un cuadro de dialogo en el cual aparecerán nuestras
variables.
4. Determinaremos que variable ira en las filas y que variable ira en las
columnas y las pasaremos con las flechas que tiene el cuadro de
dialogo.
5. Damos clic en exacta para determinar el nivel de confianza.
6. Clic en continuar
339
Clic en exacta
![Page 340: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/340.jpg)
7. Clic en estadísticos para colocar el estadístico chi cuadrado
8. Clic en continuar
9. A continuación damos clic en casillas donde nos aparece otro cuadro de
dialogo y hacemos clic en observadas, esperadas y en porcentajes.
340
Clic en estadisticos
Clic en continuar
![Page 341: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/341.jpg)
10.Clic en continuar y aceptar.
A continuación nos aparecerá otra hoja del SPSS donde nos mostrara los
resultados obtenidos y podremos observar si aceptamos la hipótesis nula o si la
rechazamos y aceptamos la hipótesis alternativa.
CÁLCULO DE LA VARIANZA EN EL SPSS
Podremos calcular el grado de dispersión que tienen los datos
1.- Se selecciona la opción analizar y escoge la opción frecuencias.
341
Clic en continuar
![Page 342: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/342.jpg)
2.- En el cuadro de dialogo que aparece traslada las variable dependiente a la
derecha.
342
![Page 343: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/343.jpg)
3.- Haz clic en la opción “estadísticos”.
4.- En esta ventana haz clic en varianza y luego clic en continuar
343
![Page 344: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/344.jpg)
5.- Observa los resultados en la hoja de cálculo del SPSS
CÁLCULO DE LA T STUDENT EN EL SPSS
Podemos calcular la aceptación o rechazo de una hipótesis siempre y
cuando la cantidad de datos no supere los 30 donde las exportaciones en
valor FOB y entoneladas de un año son las variables.
Ho = las exportaciones en valor FOB son iguales a las exportaciones en
toneladas
Ha = las exportaciones en valor FOB son diferentes a las exportaciones en
toneladas
344
![Page 345: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/345.jpg)
1.- Elige la opción analizar, donde se despliega otra ventana y selecciona
prueba T para una muestra.
2.- En el cuadro de dialogo Traslada la variable hacia la ventana derecha.
3.- Haz clic en continuar.
345
![Page 346: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/346.jpg)
4.- Observa los resultados en la hoja de cálculo del SPSS.
346
![Page 347: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/347.jpg)
CONCLUSIONES:
Como vemos los estadísticos como correlación lineal, regresión lineal, prueba
de hipótesis, t de Student, Chi- cuadrado, varianza, nos permiten determinar las
relaciones de las variables poblacionales, sean estas cualitativas o cuantitativa,
para las cualitativas tenemos el chi- cuadrado que permite determinar variables
que carecen de unidad.
Cada uno de los estadísticos nos ayudan a determinar la situación de las
variables en las cuales existen problemas o desconocimiento de la realidad del
entorno en estudio, principalmente muestral, a medida que aplicamos los
estadísticos correctamente, los datos que nos bota cada permitirá aclarar
dudas o lo que se desconoce de ciertos aspectos en el campo empresarial,
económico, financiero, social, educacional, en fin de cualquier área que se
desee investigar el comportamiento de las variables ya sean cualitativas o
cuantitativas y la posterior toma de decisiones.
Seguir todos y cada uno de los pasos hasta llegar a insertar todos los datos en
el software, esto nos ayudara a ubicarlos correctamente en su pantalla
principal para continuar con una aplicación correcta de la investigación o del
estudio de las variables.
Los diferentes programas para la resolución e interpretación de variables
estadísticas principalmente el SPSS, nos permiten descubrir el comportamiento
de cada una de las variables, con las cuales necesitamos determinar o
investigar cual es la situación actual o futura. Mediante los datos recopilados
para la investigación el SPSS ayudara a la rápida resolución estadística para
una posterior toma de decisiones.
SPSS es el programa apropiado para la correcta resolución e interpretación de
las variables, dependiendo de los datos a calcular debemos aplicar el
estadístico adecuado e inmediatamente obtendremos la gráfica requerida, lo
que nos ayudara a tomar decisiones acertadas basadas en un estudio
comprobado por el SPSS.
347
![Page 348: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/348.jpg)
RECOMENDACIONES:
Es importante aplicar muy correctamente cada uno de estos estadísticos que
nos ayudaran a definir el comportamiento de las variables ya sean cualitativas
o cuantitativas para una posterior toma de decisiones.
Del como apliquemos las variables en cada estadístico, dependerá el éxito del
problema o la investigación que pretendemos descubrir o resolver, es por eso
que debemos dar a cada variable su correspondiente estadístico y de seguro
tomaremos la decisión más acertada al interpretar los datos y descubrir el
comportamiento de las variables.
Al realizar o aplicar estadísticos en el software apropiado (SPSS), debemos
llevar cada uno de los pasos indicados y que no existan fallos en la inserción
de datos y proseguir con los cálculos correspondientes.
Emplear apropiadamente el software SPSS en la interpretación de variables
muestrales estadísticas mediante un histograma, para la correcta toma de
decisiones, y de seguro éxito en nuestro proyecto o investigación que estamos
dando resolución.
Es recomendable que todos y cada uno de los datos estén clasificados entre
las variables a determinar, ya sea por género, país, actividad, etc. Esto ayudara
al programa a desarrollarse con más facilidad y a obtener los resultados más
exactos de nuestra investigación.
ANÁLISIS
Es importante conocer el uso de sistemas informáticos para el cálculo de la
estadística inferencial ya que nos permite determinar resultados de una manera
más rápida y precisa y a la vez buscar formas de solución tanto a problemas
como la factibilidad de un proyecto como también a problemas de relación con
otras variables, además, a través de la utilización de los programas estadísticos
348
![Page 349: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/349.jpg)
nos podemos ahorrar tiempo y tener datos más precisos y solamente con
saber usar el SPSS y saber aplicar los estadísticos correctamente.
Es importante tener en cuenta que antes que nada debemos aprender a
realizar los cálculos estadísticos de manera manual para posteriormente
realizarlos en el programa y así lograr interpretar su significado
349
![Page 350: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/350.jpg)
ANEXOS
Correlaciones
Correlaciones
EXPORTACIO
NES FOB
EXPORTACIO
NES
TONELADAS
EXPORTACIONES FOB Correlación de Pearson 1 .317*
Sig. (bilateral) .043
N 41 41
EXPORTACIONES
TONELADAS
Correlación de Pearson .317* 1
Sig. (bilateral) .043
N 41 41
*. La correlación es significante al nivel 0,05 (bilateral).
Regresión
Variables introducidas/eliminadasb
Model
o
Variables
introducidas
Variables
eliminadas
Método
1 EXPORTACIO
NES FOBa
. Introducir
a. Todas las variables solicitadas introducidas.
b. Variable dependiente: EXPORTACIONES
TONELADAS
Resumen del modelob
Model
o
R R cuadrado R cuadrado
corregida
Error típ. de la
estimación
1 .317a .101 .078 152421.164
a. Variables predictoras: (Constante), EXPORTACIONES FOB
b. Variable dependiente: EXPORTACIONES TONELADAS
ANOVAb
Modelo Suma de
cuadrados
gl Media
cuadrática
F Sig.
1 Regresión 1.014E11 1 1.014E11 4.366 .043a
350
![Page 351: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/351.jpg)
Residual 9.061E11 39 2.323E10
Total 1.007E12 40
a. Variables predictoras: (Constante), EXPORTACIONES FOB
b. Variable dependiente: EXPORTACIONES TONELADAS
Coeficientesa
Modelo Coeficientes no estandarizados Coeficientes
tipificados
B Error típ. Beta t Sig.
1 (Constante) 2058480.667 106316.321 19.362 .000
EXPORTACIONES FOB .139 .066 .317 2.090 .043
a. Variable dependiente: EXPORTACIONES TONELADAS
Coeficientesa
Modelo Intervalo de confianza de 99,0%
para B
Límite inferior Límite superior
1 (Constante) 1770585.299 2346376.035
EXPORTACIONES FOB -.041 .318
a. Variable dependiente: EXPORTACIONES TONELADAS
351
![Page 352: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/352.jpg)
Estadísticos sobre los residuosa
Mínimo Máximo Media Desviación
típica
N
Valor pronosticado 2169559.00 2352589.25 2274989.22 50356.849 41
Residual -292126.719 323109.656 .000 150503.841 41
Valor pronosticado tip. -2.094 1.541 .000 1.000 41
Residuo típ. -1.917 2.120 .000 .987 41
a. Variable dependiente: EXPORTACIONES TONELADAS
Gráficos
352
![Page 353: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/353.jpg)
Prueba T
Estadísticos de muestras relacionadas
Media N Desviación típ. Error típ. de la
media
Par 1 EXPORTACIONES
TONELADAS
2274989.22 41 158704.815 24785.528
EXPORTACIONES FOB 1560876.00 41 363037.841 56696.985
Correlaciones de muestras relacionadas
N Correlación Sig.
Par 1 EXPORTACIONES
TONELADAS y
EXPORTACIONES FOB
41 .317 .043
353
![Page 354: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/354.jpg)
Prueba de muestras relacionadas
Diferencias relacionadas
Media Desviación típ. Error típ. de la
media
Par 1 EXPORTACIONES
TONELADAS -
EXPORTACIONES FOB
714113.220 347017.015 54194.953
Prueba de muestras relacionadas
Diferencias relacionadas
99% Intervalo de confianza para
la diferencia
Inferior Superior
Par 1 EXPORTACIONES
TONELADAS -
EXPORTACIONES FOB
567545.177 860681.262
Prueba de muestras relacionadas
t gl Sig. (bilateral)
Par 1 EXPORTACIONES
TONELADAS -
EXPORTACIONES FOB
13.177 40 .000
Tablas de contingencia
Resumen del procesamiento de los casos
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
EXPORTACIONES
TONELADAS *
EXPORTACIONES FOB
41 95.3% 2 4.7% 43 100.0%
354
![Page 355: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/355.jpg)
Pruebas de chi-cuadrado
Valor gl Sig. asintótica
(bilateral)
Chi-cuadrado de Pearson 1640.000a 1600 .238
Razón de verosimilitudes 304.513 1600 1.000
Asociación lineal por lineal 4.027 1 .045
N de casos válidos 41
a. 1681 casillas (100,0%) tienen una frecuencia esperada inferior a 5. La
frecuencia mínima esperada es ,02.
Frecuencias
Estadísticos
EXPORTACIO
NES
TONELADAS
EXPORTACIO
NES FOB
N Válidos 41 41
Perdidos 2 2
Varianza 2.519E10 1.318E11
Tabla de frecuencia
EXPORTACIONES TONELADAS
Frecuencia Porcentaje Porcentaje
válido
Porcentaje
acumulado
Válidos 1944753 1 2.3 2.4 2.4
2029567 1 2.3 2.4 4.9
2062106 1 2.3 2.4 7.3
2082129 1 2.3 2.4 9.8
2087716 1 2.3 2.4 12.2
2094673 1 2.3 2.4 14.6
2109277 1 2.3 2.4 17.1
2111688 1 2.3 2.4 19.5
2126750 1 2.3 2.4 22.0
2129090 1 2.3 2.4 24.4
2131598 1 2.3 2.4 26.8
2135589 1 2.3 2.4 29.3
355
![Page 356: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/356.jpg)
2159617 1 2.3 2.4 31.7
2200673 1 2.3 2.4 34.1
2207587 1 2.3 2.4 36.6
2213808 1 2.3 2.4 39.0
2263398 1 2.3 2.4 41.5
2266774 1 2.3 2.4 43.9
2268435 1 2.3 2.4 46.3
2275843 1 2.3 2.4 48.8
2276219 1 2.3 2.4 51.2
2276238 1 2.3 2.4 53.7
2291789 1 2.3 2.4 56.1
2309041 1 2.3 2.4 58.5
2325590 1 2.3 2.4 61.0
2329229 1 2.3 2.4 63.4
2345900 1 2.3 2.4 65.9
2352703 1 2.3 2.4 68.3
2356567 1 2.3 2.4 70.7
2371979 1 2.3 2.4 73.2
2374973 1 2.3 2.4 75.6
2386512 1 2.3 2.4 78.0
2391048 1 2.3 2.4 80.5
2395715 1 2.3 2.4 82.9
2427325 1 2.3 2.4 85.4
2440271 1 2.3 2.4 87.8
2471923 1 2.3 2.4 90.2
2502616 1 2.3 2.4 92.7
2516369 1 2.3 2.4 95.1
2555781 1 2.3 2.4 97.6
2675699 1 2.3 2.4 100.0
Total 41 95.3 100.0
Perdidos Sistema 2 4.7
Total 43 100.0
EXPORTACIONES FOB
Frecuencia Porcentaje Porcentaje
válido
Porcentaje
acumulado
Válidos 800798 1 2.3 2.4 2.4
356
![Page 357: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/357.jpg)
873693 1 2.3 2.4 4.9
993825 1 2.3 2.4 7.3
1018148 1 2.3 2.4 9.8
1113441 1 2.3 2.4 12.2
1167336 1 2.3 2.4 14.6
1212690 1 2.3 2.4 17.1
1237432 1 2.3 2.4 19.5
1249447 1 2.3 2.4 22.0
1286133 1 2.3 2.4 24.4
1328430 1 2.3 2.4 26.8
1334448 1 2.3 2.4 29.3
1359233 1 2.3 2.4 31.7
1360062 1 2.3 2.4 34.1
1369489 1 2.3 2.4 36.6
1392258 1 2.3 2.4 39.0
1397918 1 2.3 2.4 41.5
1467517 1 2.3 2.4 43.9
1469969 1 2.3 2.4 46.3
1489381 1 2.3 2.4 48.8
1514772 1 2.3 2.4 51.2
1576829 1 2.3 2.4 53.7
1613436 1 2.3 2.4 56.1
1621543 1 2.3 2.4 58.5
1690476 1 2.3 2.4 61.0
1726282 1 2.3 2.4 63.4
1772258 1 2.3 2.4 65.9
1827860 1 2.3 2.4 68.3
1831303 1 2.3 2.4 70.7
1856081 1 2.3 2.4 73.2
1863189 1 2.3 2.4 75.6
1868972 1 2.3 2.4 78.0
1974010 1 2.3 2.4 80.5
1975163 1 2.3 2.4 82.9
2009483 1 2.3 2.4 85.4
2021540 1 2.3 2.4 87.8
2032005 1 2.3 2.4 90.2
2053808 1 2.3 2.4 92.7
2060096 1 2.3 2.4 95.1
2064843 1 2.3 2.4 97.6
2120319 1 2.3 2.4 100.0
357
![Page 358: Portafolio de estadistica](https://reader038.fdocumento.com/reader038/viewer/2022102712/5591b0c21a28ab26518b46fe/html5/thumbnails/358.jpg)
Total 41 95.3 100.0
Perdidos Sistema 2 4.7
Total 43 100.0
Prueba T
Estadísticos para una muestra
N Media Desviación típ. Error típ. de la
media
EXPORTACIONES
TONELADAS
12 2279029.33 171968.265 49642.962
EXPORTACIONES FOB 12 1155254.08 203515.472 58749.856
Prueba para una muestra
Valor de prueba = 0
t gl Sig. (bilateral) Diferencia de
medias
EXPORTACIONES
TONELADAS
45.908 11 .000 2279029.333
EXPORTACIONES FOB 19.664 11 .000 1155254.083
Prueba para una muestra
Valor de prueba = 0
99% Intervalo de confianza para
la diferencia
Inferior Superior
EXPORTACIONES
TONELADAS
2124847.90 2433210.77
EXPORTACIONES FOB 972788.40 1337719.77
358