Ejercicios resueltos Inferencia Estadistica
description
Transcript of Ejercicios resueltos Inferencia Estadistica
1
EJERCICIOS DE APLICACIÓN ESTADISTICA INFERENCIAL
I. Los salarios percibidos por un grupo de empleados de una empresa, el mes recién pasado, se resumen en archivo1 de Excel, que se adjunta. Se requiere tabular la información utilizando seis (6) intervalos de clases de la misma amplitud, con el objeto de verificar se estos salarios se ajustan a un modelo de probabilidad normal.
1. a) Para realizar el contraste de bondad de ajuste, se decide probar los métodos de contrastes,
todos al nivel 5%: Contraste Ji – cuadrado/ Kolmgorov – Liliefords/ Asimetría / Curtosis / Jarque-Bera
b) Diseñar la tabla de frecuencias apropiada para el (los) contraste (s) c) Dibujar un histograma (o un polígono) de frecuencias para verificar la tendencia a la
distribución normal d) Estimar los parámetros de la distribución normal e) Formular el contraste de bondad de ajuste f) Realizar el contraste, con todos los test de bondad de ajuste g) Concluir si efectivamente la variable se ajusta al modelo formulado en la hipótesis nula.
2. Son ingresos tipo A cuando éste está bajo el primer quintil. Son ingresos tipo B cuando éste se
ubica desde el segundo quintil hasta el cuarto quintil y son ingresos tipo C cuando éste se ubica sobre el cuarto quintil. a) Determine si existe asociación entre el género del empleado y el tipo de ingreso.
3. Determine si la proporción de varones es superior en el grupo de los más jóvenes respecto del
grupo de mayor edad.
4. Realizar un análisis del ingreso según tramos de edad que responda a las dos siguientes hipótesis:
a) El ingreso promedio de los varones es de al menos 820 mil b) El ingreso promedio de los varones en nada se diferencia del ingreso medio de las mujeres.
II. LAS SIGUIENTES PREGUNTAS SE CONTESTAN SEGÚN LOS DATOS DEL ARCHIVO2.
1.- Analice si es posible utilizar un modelo de regresión lineal que permite estimar la cantidad de
energía generada a partir de la velocidad del viento para cada condición climática.
2.- Para cada condición climática analice si la contribución marginal de la velocidad del viento en la
generación de energía es del orden de 3 KW/(Km/h).
2
I. ARCHIVO 1 1.
TEST DE KOLMGOROV – LILIEFORDS
Previo a esto es necesario definir la variable de estudio:
X: Los salarios percibidos por un grupo de empleados de una empresa (en miles de pesos)
a) Tabla 1.1
b) Gráfica 1.1
1 Límite inferior del intervalo 2 Límite superior del intervalo 3 FO: Frecuencia observada 4 FOR: Frecuencia relativa 5 FOR ACUM o FORA: Frecuencia relativa acumulada 6 FER ACUM o FERA; Valor esperado de la distribución normal 7 ABS(FORA-FERA): Valor absoluto de la diferencia de FORA y FERA
4
41
165179
96
15
0
20
40
60
80
100
120
140
160
180
200
661,47 – 711,25 711,25 – 761,03 761,03 – 810,81 810,81– 860,59 860,59 – 910,37 910,37 – 960,15
Frecuencia por intervalo
INTERVALOS LIM INF1 LIM SUP2 FO3 FOR4 FOR ACUM5 FER ACUM6 ABS(FORA-FERA)7
1 661,470 711,250 4 0,008 0,008 0,00899871 0,000998708
2 711,250 761,030 41 0,082 0,09 0,09440335 0,004403354
3 761,030 810,810 165 0,33 0,42 0,39644353 0,023556469
4 810,810 860,590 179 0,358 0,778 0,7849412 0,006941204
5 860,590 910,370 96 0,192 0,97 0,96715582 0,002844179
6 910,370 960,150 15 0,03 1 0,99808661 0,001913391
TOTAL 500 1
3
c) A partir de la muestra se obtienen los siguientes datos:
Tabla 1.2
Promedio de la muestra 823,240
Desviación estándar de la muestra 47,33946546
Número de datos 500
d) Prueba de hipótesis
Ho: La muestra procede de una población que se distribuye normal H1: La muestra no procede de una población que se distribuye normal
e) Tabla 1.3
ESTIMADOR KOSMOGOROV
Dn8 0,023556469
Dn Tabla9 0,039623125
Decisión No se rechaza Ho
CONCLUSIÓN: Para un nivel de significancia del 5% y dada la evidencia muestral, es altamente
probable que la muestra proceda de una población que distribuya normal.
8 Para calcular el valor Dn se utilizó el valor máximo de la columna ABS(FORA-FERA) de la tabla 1.1
9 El valor Dn Tabla es el valor 0,886√500
⁄ (muestras n>30) correspondiente a la tabla 9 [de los materiales
de clase (corrección de Lilliefors para Normalidad] ya que la media y la varianza no fueron dadas
4
ASIMETRÍA
Definiendo la variable de estudio:
X: Los salarios percibidos por un grupo de empleados de una empresa (en miles de pesos)
Tabla 2.1
Ho: Los salarios percibidos por los empleados provienen de una distribución normal H1: Los salarios percibidos por los empleados no provienen de una distribución normal Es preciso definir el coeficiente de asimetría y utilizar un nivel de significancia del 5%:
�̂�1 =𝑚3
𝑚2
32⁄
; 𝑚3 =(𝑥𝑖−�̅�)3
𝑛; 𝑚2 =
(𝑥𝑖−�̅�)2
𝑛
𝑚3 = −4205,1081
𝑚2 = 2236,54294
�̂�1 = −0,03975679
𝑍𝑜𝑏𝑠 =�̂�1
√6
𝑛
= −0,36292817
𝑍1−𝛼 =1,645
𝐶𝑜𝑚𝑜; 𝑍𝑜𝑏𝑠 < 𝑍1−𝛼; 𝐻𝑜 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎
Conclusión:
Para un nivel de significancia del 5% y dada la evidencia muestral es altamente probable
que los datos provengan de una población normal
Promedio de la muestra 823,2396141
Desviación estándar de la muestra 47,33946546 Número de datos 500
5
CURTOSIS
Definiendo la variable de estudio:
X: Los salarios percibidos por un grupo de empleados de una empresa (en miles de pesos)
Tabla 3.1
Ho: Los salarios percibidos por los empleados provienen de una distribución normal H1: Los salarios percibidos por los empleados no provienen de una distribución normal Es preciso definir el coeficiente de curtosis y utilizar un nivel de significancia del 5%:
�̂�2 =𝑚4
𝑚22
− 3; 𝑚2 =(𝑥𝑖−�̅�)2
𝑛; 𝑚4 =
(𝑥𝑖−�̅�)4
𝑛
𝑚4 = 13901771,06
𝑚2 = 2236,54294
�̂�2 = −0,22082656
𝑍𝑜𝑏𝑠 = |�̂�2
√24
𝑛
| = 1,00793074
𝑍1−𝛼 =1,645
𝐶𝑜𝑚𝑜; 𝑍𝑜𝑏𝑠 < 𝑍1−𝛼; 𝐻𝑜 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎
Conclusión:
Para un nivel de significancia del 5% y dada la evidencia muestral es altamente probable
que los datos provengan de una población normal
Promedio de la muestra 823,2396141
Desviación estándar de la muestra 47,33946546 Número de datos 500
6
JARQUE-BERA Definiendo la variable de estudio: X: Los salarios percibidos por un grupo de empleados de una empresa (en miles de pesos) Tabla 4.1
Ho: Los salarios percibidos por los empleados provienen de una distribución normal H1: Los salarios percibidos por los empleados no provienen de una distribución normal Es preciso definir el coeficiente de asimetría y curtosis, utilizar un nivel de significancia del 5%:
�̂�2 =𝑚4
𝑚22
− 3; 𝑚2 =(𝑥𝑖−�̅�)2
𝑛; 𝑚4 =
(𝑥𝑖−�̅�)4
𝑛
�̂�1 =𝑚3
𝑚2
32⁄
; 𝑚3 =(𝑥𝑖−�̅�)3
𝑛; 𝑚2 =
(𝑥𝑖−�̅�)2
𝑛
𝑚4 = 13901771,06 𝑚3 = −4205,1081
𝑚2 = 2236,54294 𝑚2 = 2236,54294
�̂�2 = −0,22082656 �̂�1 = −0,03975679
El estadístico de prueba de Jarque-Bera se define:
𝐵 = 𝑛 [�̂�1
2
6+
�̂�22
24] = 1,147641238
𝑋2𝑜𝑏𝑠 = 5,99146455
𝐵 < 𝑋2𝑜𝑏𝑠; 𝐻𝑜 𝑠𝑒𝑟á 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎
Conclusión:
Para un nivel de significancia del 5% y dada la evidencia muestral es altamente probable
que los datos provengan de una población normal
Promedio de la muestra 823,2396141
Desviación estándar de la muestra 47,33946546 Número de datos 500
7
JI- BONDAD DE AJUSTE
Previo a esto es necesario definir la variable de estudio:
X: Los salarios percibidos por un grupo de empleados de una empresa (en miles de pesos)
a) Tabla 5.1
INTERVALOS LIM INF LIM SUP n Pi Ei
1 661,470 721,206 7 0,016 8
2 721,206 780,942 89 0,170 85
3 780,942 840,678 223 0,458 229
4 840,678 900,414 159 0,305 152
510 900,414 960,150 22 0,052 26
TOTAL 500 1 500
b) A partir de la muestra se obtienen los siguientes datos:
Tabla 5.2
Promedio de la muestra 823,240
Desviación estándar de la muestra
47,33946546
Número de datos 500
∑(𝒏𝒊 − 𝑬𝒊)𝟐
𝑬𝒊
1,24764539
c) La hipótesis Ho: La muestra procede de una población que se distribuye normal H1: La muestra no procede de una población que se distribuye normal
10 Se utilizan 5 intervalos en vez de 6, ya que si se utilizaban 6 el primer intervalo tenía un valor Ei<5
7
89
223
159
22
0
50
100
150
200
250
661,47 - 721,206 721,206 - 780,942 780,942 - 840,678 840,678 - 900,414 900,414 - 960,15
Frecuencia
Frecuencia
8
d)
𝑾 =∑(𝑛𝑖 − 𝐸𝑖)2
𝐸𝑖= 1,24764539
e) 𝑋2
𝑜𝑏𝑠(5 − 1 − 2) = 5,991 Ya que
𝑾 < 𝑋2𝑜𝑏𝑠
𝐻𝑜 no se rechaza
CONCLUSIÓN: Para un nivel de significancia del 5% y dada la evidencia muestral es
altamente probable que los datos provengan de una población normal
9
2.
a) TEST DE INDEPENDENCIA
Datos tabulados por quintil y por tipo de ingreso
Ho: El salario no depende del sexo H1: El salario si depende del sexo
LIM INF LIM SUP
I Quintil 661,470 781,927
II Quintil 782,256 808,414
III Quintil 808,585 836,328
IV Quintil 836,435 864,398
V Quintil 864,586 960,150
MUJERES HOMBRES
TIPO A 0 100 100
TIPO B 200 100 300
TIPO C 0 100 100
200 300
Tabla de frecuencias esperadas
MUJERES HOMBRES
TIPO A 40 60 100
TIPO B 120 180 300
TIPO C 40 60 100
200 300 500
Estadístico W
𝑊11 = ∑(𝑂𝑖 − 𝐸𝑖)2
𝐸𝑖= 222,222
A un nivel de significancia del 5%, el valor de
𝑋2𝑜𝑏𝑠((2 − 1) × (3 − 1)) = 𝑋2
𝑜𝑏𝑠(2; 0,95) Como
𝑊 > 𝑋2𝑜𝑏𝑠
Ho será rechazada CONCLUSIÓN: Para un nivel de significancia del 5%, con la evidencia muestra con la que se cuenta es posible decir que el ingreso en esta empresa depende del sexo.
11 𝑶𝒊 :Valor observado de la muestra
𝑬𝒊: Frecuencia esperada
10
3.
o X: Salario de empleados de una empresa o 𝑝𝑥: Porcentaje de hombres en el grupo de edad más joven o 𝑞𝑥: Porcentaje de mujeres en el grupo de edad más joven o 𝑝𝑦: Porcentaje de hombres en el grupo de mayor edad
o 𝑞𝑦: Porcentaje de mujeres en el grupo de mayor edad
(1°) LA HIPÓTESIS: Ho: 𝑝𝑥 − 𝑝𝑦 ≤ 0
H1: 𝑝𝑥 − 𝑝𝑦 > 0
(2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: [1,645; ∞+) RNR: (−∞; 1,645[ (3°) Z OBSERVADO:
𝑍𝑂𝐵𝑆 =�̂�𝑥 − �̂�𝑦
√�̂�𝑐 × �̂�𝑐
𝑛𝑥+
�̂�𝑐 × �̂�𝑐𝑛𝑦
= 0
(4°) DECISIÓN: Ya que 0 ∈ RNR: (−∞; 1,645[ Ho no se rechaza (5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que el porcentaje de varones en el grupo de mayor edad supere o iguale al porcentaje de hombres en el tramo más joven de la empresa.
�̂�𝒙 0,4
�̂�𝒙 0,6
�̂�𝒚 0,4
�̂�𝒚 0,6
�̂�𝒄 0,4
�̂�𝒄 0,6
𝒏𝒙 60
𝒏𝒚 330
11
4.
a) Definiendo las variables
X: Salario de empleados de una empresa
Entre 25 y 30 años
�̅� 810,6552286
𝑺𝑿 65,34222029
𝒏𝑿 36
(1°) LA HIPÓTESIS: Ho: 𝜇𝑥 ≥ 810 H1: 𝜇𝑥 < 810 (2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; −𝟏, 𝟔𝟗 ] RNR: ] − 𝟏, 𝟔𝟗 ; ∞+) (3°) T OBSERVADO:
𝑇𝑂𝐵𝑆 =�̅� − 𝜇0
√𝑆𝑥
2
𝑛𝑥
= 0,06
(4°) DECISIÓN:
𝒀𝒂 𝑞𝑢𝑒 0,06 ∈ 𝑹𝑵𝑹: ] − 𝟏, 𝟔𝟗 ; ∞+) Ho no se rechaza
(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que el promedio del sueldo de los varones en el grupo de edad Entre 25 y 30 años de la empresa sea al menos 810 mil pesos
12
Entre 30 y 40 años
�̅� 818,5718839
𝑺𝑿 55,83101098
𝒏𝑿 66
(1°) LA HIPÓTESIS: Ho: 𝜇𝑥 ≥ 810 H1: 𝜇𝑥 < 810 (2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; −𝟏, 𝟔𝟕 ] RNR: ] − 𝟏, 𝟔𝟕 ; ∞+) (3°) T OBSERVADO:
𝑇𝑂𝐵𝑆 =�̅� − 𝜇0
√𝑆𝑥
2
𝑛𝑥
= 1,25
(4°) DECISIÓN:
Ya que 1,25 ∈ RNR: ] − 𝟏, 𝟔𝟕 ; ∞+) Ho no se rechaza
(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que el promedio del sueldo de los varones en el grupo de edad Entre 30 y 40 años de la empresa sea al menos 810 mil pesos
13
Más de 40 años
�̅� 830,5063611
𝑺𝑿 55,45906017
𝒏𝑿 198
(1°) LA HIPÓTESIS: Ho: 𝜇𝑥 ≥ 810 H1: 𝜇𝑥 < 810 (2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; −𝟏, 𝟔𝟓 ] RNR: ] − 𝟏, 𝟔𝟓 ; ∞+) (3°) T OBSERVADO:
𝑇𝑂𝐵𝑆 =�̅� − 𝜇0
√𝑆𝑥
2
𝑛𝑥
= 5,20
(4°) DECISIÓN:
Ya que 5,20 ∈ RNR: ] − 𝟏, 𝟔𝟓 ; ∞+) Ho no se rechaza
(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que el promedio del sueldo de los varones en el grupo de edad Más de 40 años de la empresa sea al menos 810 mil pesos
14
b)
Entre 25 y 30 años
�̅� 810,6552286
𝑺𝑿 65,34222029
𝒏𝑿 36
�̅� 813,822038
𝑺𝒀 26,70580087
𝒏𝒀 24
Primero hay que comprobar a través de una prueba igualdad de varianzas: (1°) LA HIPÓTESIS:
Ho: 𝜎𝑥
2
𝜎𝑦2 = 1
H1: 𝜎𝑥
2
𝜎𝑦2 ≠ 1
(2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; 0,48 ] ∪ [ 2,20 ; ∞+) RNR: ]0,48 ; 2,20 [ (3°) F OBSERVADO:
𝐹𝑂𝐵𝑆 =𝑆𝑥
2
𝑆𝑦2
×1
𝑘12= 5,99
(4°) DECISIÓN:
𝒀𝒂 𝑞𝑢𝑒 5,99 ∈ 𝑹𝑹: Ho se rechaza
(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que exista diferencias entre las varianzas del primer tramo etario
12 K; es el valor que toma Ho: 𝜎𝑥
2
𝜎𝑦2 = 1, en este caso 1
15
Hecha la prueba es posible realizar prueba para diferencia de medias (1°) LA HIPÓTESIS: Ho: 𝜇𝑥 − 𝜇𝑦 = 0
H1: 𝜇𝑥 − 𝜇𝑦 ≠ 0
(2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; −2,01 ] ∪ [ 2,01 ; ∞+) RNR: ] − 2,01 ; 2,01 [ (3°) T OBSERVADO:
𝑇𝑂𝐵𝑆 =�̅� − �̅� − 𝑘13
√𝑆𝑋
2
𝑛𝑋+
𝑆𝑌2
𝑛𝑌
= −0,26
(4°) DECISIÓN:
𝒀𝒂 𝑞𝑢𝑒 − 0,26 ∈ 𝑹𝑵𝑹 Ho no se rechaza
(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que el promedio del sueldo de los varones y de las mujeres en el grupo de edad Entre 25 y 30 años de la empresa no presente diferencias
13 K; es el valor que toma Ho: 𝜇𝑥 − 𝜇𝑦 = 0, en este caso 0
16
Entre 30 y 40 años
818,5718839
55,83101098
66
816,3727249
26,85826533
44
Primero hay que comprobar a través de una prueba igualdad de varianzas: (1°) LA HIPÓTESIS:
Ho: 𝜎𝑥
2
𝜎𝑦2 = 1
H1: 𝜎𝑥
2
𝜎𝑦2 ≠ 1
(2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; 0,59 ] ∪ [ 1,76 ; ∞+) RNR: ] 0,59 ; 1,76 [ (3°) F OBSERVADO:
𝐹𝑂𝐵𝑆 =𝑆𝑥
2
𝑆𝑦2
×1
𝑘= 4,32
(4°) DECISIÓN:
𝒀𝒂 𝑞𝑢𝑒 4,32 ∈ 𝑹𝑹: Ho se rechaza
(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que exista diferencias entre las varianzas del segundo tramo etario
17
Hecha la prueba es posible realizar prueba para diferencia de medias (1°) LA HIPÓTESIS: Ho: 𝜇𝑥 − 𝜇𝑦 = 0
H1: 𝜇𝑥 − 𝜇𝑦 ≠ 0
(2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; −1,98 ] ∪ [ 1,98 ; ∞+) RNR: ] − 1,98 ; 1,98 [ (3°) T OBSERVADO:
𝑇𝑂𝐵𝑆 =�̅� − �̅� − 𝑘
√𝑆𝑋
2
𝑛𝑋+
𝑆𝑌2
𝑛𝑌
= 0,28
(4°) DECISIÓN:
𝒀𝒂 𝑞𝑢𝑒 0,28 ∈ 𝑹𝑵𝑹 Ho no se rechaza
(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que el promedio del sueldo de los varones y de las mujeres en el grupo de edad Entre 30 y 40 años de la empresa no presente diferencias
18
Más de 40 años
830,5063611
55,45906017
198
822,1067135
26,34467242
132
Primero hay que comprobar a través de una prueba igualdad de varianzas: (1°) LA HIPÓTESIS:
Ho: 𝜎𝑥
2
𝜎𝑦2 = 1
H1: 𝜎𝑥
2
𝜎𝑦2 ≠ 1
(2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; 0,73 ] ∪ [ 1,38 ; ∞+) RNR: ] 0,73 ; 1,38 [ (3°) F OBSERVADO:
𝐹𝑂𝐵𝑆 =𝑆𝑥
2
𝑆𝑦2
×1
𝑘= 4,43
(4°) DECISIÓN:
𝒀𝒂 𝑞𝑢𝑒 4,43 ∈ 𝑹𝑹: Ho se rechaza
(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que existan diferencias entre las varianzas del grupo Más de 40 años
19
Hecha la prueba es posible realizar prueba para diferencia de medias (1°) LA HIPÓTESIS: Ho: 𝜇𝑥 − 𝜇𝑦 = 0
H1: 𝜇𝑥 − 𝜇𝑦 ≠ 0
(2°) LA REGION DE RECHAZO: Con 𝜶 = 0,05 RR: (−∞; −1,97 ] ∪ [ 1,97 ; ∞+) RNR: ] − 1,97 ; 1,97 [ (3°) T OBSERVADO:
𝑇𝑂𝐵𝑆 =�̅� − �̅� − 𝑘
√𝑆𝑋
2
𝑛𝑋+
𝑆𝑌2
𝑛𝑌
= 1,84
(4°) DECISIÓN:
𝒀𝒂 𝑞𝑢𝑒 1,84 ∈ 𝑹𝑵𝑹 Ho no se rechaza
(5°) CONCLUSIÓN: Con un nivel de significancia del 5%, con la evidencia muestral que se presenta, es altamente probable que el promedio del sueldo de los varones y de las mujeres en el grupo de edad Más de 40 años de la empresa no presente diferencias
20
II. ARCHIVO 2 1. a) PARA LA CONDICIÓN 1: DESPEJADO
Analice si es posible utilizar un modelo de regresión lineal que permite estimar la cantidad de energía generada a partir de la velocidad del viento para cada condición climática.
LA HIPÓTESIS
Ho: No existe o no es posible establecer correlación lineal entre la velocidad del viento y la cantidad de energía generada cuando la condición climática es despejado H1: Existe o es posible establecer correlación lineal entre la velocidad del viento y la cantidad de energía generada cuando la condición climática es despejado. Para la condición despejado Excel arrojó la siguiente partida:
Por lo que planteando el estadístico 𝑇𝑜𝑏𝑠, se obtiene el valor
𝑇𝑜𝑏𝑠 = |𝜋 × √𝑛 − 2
√1 − 𝜋2| = 5,055965719
𝑇
(𝑛−2;1−𝛼2)
= 2,364624252
𝐶𝑜𝑚𝑜; 𝑇𝑜𝑏𝑠 > 𝑇
(𝑛−2;1−𝛼2)
; 𝐻𝑜 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎
Valor P:
𝐸𝑙 𝑣𝑎𝑙𝑜𝑟 𝑝 𝑝𝑎𝑟𝑎 𝑇𝑜𝑏𝑠 𝑒𝑠 0,000734986
0,000734986 < 𝛼∗
𝐻𝑜 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎 CONCLUSIÓN: Dada la evidencia muestral, es posible establecer con condición climática despejado
una correlación lineal entre la velocidad del viento y la cantidad de energía generada.
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,886019583
Coeficiente de determinación R^2 0,785030701
R^2 ajustado 0,754320801
Error típico 5,984835239
Observaciones 9
Coeficientes Error típico Estadístico t
Intercepción -0,651877246 20,86241957 -0,031246483
Velocidad (Km/h) 2,791630414 0,552145835 5,055965719
21
b) PARA LA CONDICIÓN 2: PARCIAL NUBLADO
LA HIPÓTESIS Ho: No existe o no es posible establecer correlación lineal entre la velocidad del viento y la cantidad de energía generada cuando la condición climática es parcial nublado H1: Existe o es posible establecer correlación lineal entre la velocidad del viento y la cantidad de energía generada cuando la condición climática es parcial nublado.
Para la condición parcial nublado Excel arrojó la siguiente partida:
Coeficientes Error típico Estadístico t
Intercepción 22,35877642 9,369469867 2,38634381
Velocidad (Km/h) 2,254372945 0,183558619 12,28148783
Por lo que planteando el estadístico 𝑇𝑜𝑏𝑠, se obtiene el valor
𝑇𝑜𝑏𝑠 = |𝜋 × √𝑛 − 2
√1 − 𝜋2| = 12,28148783
𝑇(𝑛−2;1−
𝛼2)
= 2,032244509
𝐶𝑜𝑚𝑜; 𝑇𝑜𝑏𝑠 > 𝑇
(𝑛−2;1−𝛼2)
; 𝐻𝑜 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎
Valor P:
𝐸𝑙 𝑣𝑎𝑙𝑜𝑟 𝑝 𝑝𝑎𝑟𝑎 𝑇𝑜𝑏𝑠 𝑒𝑠 0,0000000000000236
0,0000000000000236 < 𝛼∗
𝐻𝑜 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎
CONCLUSIÓN: Dada la evidencia muestral, es posible establecer con condición parcial nublado una correlación lineal entre la velocidad del viento y la cantidad de energía generada.
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,90335602
Coeficiente de determinación R^2 0,816052098
R^2 ajustado 0,810641866
Error típico 4,563739431
Observaciones 36
22
c) PARA LA CONDICIÓN 3: NUBLADO LA HIPÓTESIS
Ho: No existe o no es posible establecer correlación lineal entre la velocidad del viento y la cantidad de energía generada cuando la condición climática es nublado H1: Existe o es posible establecer correlación lineal entre la velocidad del viento y la cantidad de energía generada cuando la condición climática es nublado. Para la condición parcial nublado Excel arrojó la siguiente partida:
Coeficientes Error típico Estadístico t
Intercepción 21,5342806 13,33560171 1,614796323 Velocidad (Km/h) 2,314077377 0,211087881 10,96262544
Por lo que planteando el estadístico 𝑇𝑜𝑏𝑠, se obtiene el valor
𝑇𝑜𝑏𝑠 = |𝜋 × √𝑛 − 2
√1 − 𝜋2| = 10,96262544
𝑇(𝑛−2;1−
𝛼2)
= 2,160368656
𝐶𝑜𝑚𝑜; 𝑇𝑜𝑏𝑠 > 𝑇
(𝑛−2;1−𝛼2)
; 𝐻𝑜 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎
Valor P:
𝐸𝑙 𝑣𝑎𝑙𝑜𝑟 𝑝 𝑝𝑎𝑟𝑎 𝑇𝑜𝑏𝑠 𝑒𝑠 0,000000030663
0,0000000000000236 < 𝛼∗
𝐻𝑜 𝑑𝑒𝑏𝑒 𝑠𝑒𝑟 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑑𝑎
CONCLUSIÓN: Dada la evidencia muestral, es posible establecer con condición nublado una correlación lineal entre la velocidad del viento y la cantidad de energía generada.
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,949940592
Coeficiente de determinación R^2 0,902387128
R^2 ajustado 0,894878445
Error típico 3,122930882
Observaciones 15
23
a) PARA LA CONDICIÓN 1: DESPEJADO Es posible trazar el intervalo:
Límite inferior 1,486012982 Límite superior 4,097247846
Conclusión: Dada la evidencia muestral al 5% de significancia, es altamente probable que la contribución marginal de la velocidad del viento en la generación de energía sea del orden de 3 KW/(Km/h).
b) PARA LA CONDICIÓN 2: PARCIAL NUBLADO Es posible trazar el intervalo:
Límite inferior 1,881336949 Límite superior 2,627408941
Conclusión: Dada la evidencia muestral al 5% de significancia, es altamente probable que la contribución marginal de la velocidad del viento en la generación de energía no sea del orden de 3 KW/(Km/h).
c) PARA LA CONDICIÓN 3: NUBLADO Es posible trazar el intervalo:
Límite inferior 1,858049735 Límite superior 2,770105019
Conclusión: Dada la evidencia muestral al 5% de significancia, es altamente probable que la
contribución marginal de la velocidad del viento en la generación de energía no sea del orden de 3 KW/(Km/h).
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior
95%
Intercepción -
0,651877246 20,86241957 -0,031246483 0,975945215 -
49,98366052 48,67990602
Velocidad (Km/h) 2,791630414 0,552145835 5,055965719 0,001469971 1,486012982 4,097247846
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior
95%
Intercepción 22,35877642 9,369469867 2,38634381 0,022727191 3,317722732 41,39983012 Velocidad (Km/h) 2,254372945 0,183558619 12,28148783 4,72368E-14 1,881336949 2,627408941
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior
95%
Intercepción 21,5342806 13,33560171 1,614796323 0,130353465 -
7,275535343 50,34409654 Velocidad (Km/h) 2,314077377 0,211087881 10,96262544 6,13253E-08 1,858049735 2,770105019
24
ANEXO DATOS
Archivo 1:
Salarios del
mes
Homb
res
Muje
res
Homb
res
Muje
res
Homb
res
Muje
res
Homb
res
Muje
res
Homb
res
Homb
res
Entre 25 y
30 años
661,4
70
782,2
56
763,6
88
796,0
03
808,5
85
824,9
35
836,4
35
849,9
87
864,5
86
889,1
72
692,7
08
782,4
31
764,6
12
796,2
76
808,8
73
825,3
20
836,6
65
850,0
11
864,8
84
889,1
75
703,5
56
782,4
98
765,1
17
796,4
65
809,0
14
825,4
18
836,7
83
850,1
86
865,0
66
889,4
27
705,5
21
782,9
42
765,5
77
796,6
31
809,0
78
825,4
19
836,8
00
850,6
27
865,1
61
889,5
11
712,0
83
783,3
24
766,2
31
796,7
05
809,2
93
825,4
82
837,2
32
850,7
97
865,1
63
889,5
87
713,3
43
783,5
88
766,5
26
797,3
31
809,5
68
826,0
86
837,2
50
851,0
11
866,0
14
889,8
36
Entre30 y
40 años
717,9
67
783,9
41
766,9
34
797,5
28
809,7
51
826,5
55
837,4
53
851,1
29
866,4
08
890,2
45
721,7
84
784,0
73
768,4
44
798,1
22
809,7
85
826,6
56
837,7
97
851,8
62
866,6
65
890,4
23
728,2
24
784,0
75
769,1
56
798,4
44
809,8
83
826,7
65
837,8
78
853,5
69
867,3
43
890,9
31
730,1
60
784,4
40
769,3
54
798,6
62
810,5
65
826,9
35
838,1
06
853,6
58
867,5
09
891,0
03
732,1
04
784,6
50
769,7
83
798,7
12
811,1
71
827,1
54
838,1
37
853,8
54
868,2
08
891,3
45
732,2
73
785,2
68
770,1
40
798,7
40
811,2
27
827,3
21
838,2
11
854,1
80
868,4
93
892,0
77
733,8
26
785,2
98
770,9
57
799,1
54
811,6
96
827,6
37
838,3
29
854,4
43
868,9
59
892,5
55
25
735,1
65
785,3
27
771,2
75
800,1
44
811,9
09
827,9
68
839,4
06
854,7
17
869,0
00
893,2
73
735,2
10
785,4
34
771,8
02
800,4
15
812,3
28
828,1
88
839,5
53
854,8
81
869,7
57
893,3
37
736,0
97
785,7
05
772,2
17
800,6
09
812,4
22
828,5
93
839,5
69
855,2
67
870,2
93
893,8
35
736,8
09
785,7
95
772,2
19
800,6
61
812,8
56
828,5
96
839,7
31
855,2
75
870,3
27
894,0
94
Más de 40
años
739,3
47
786,1
96
772,6
31
800,9
63
812,8
91
828,7
04
839,8
68
855,4
65
870,3
69
894,4
11
739,7
90
786,3
35
772,6
39
801,3
34
813,0
39
828,7
86
840,1
71
855,5
24
870,5
71
894,8
53
740,1
79
787,7
00
772,6
54
801,6
57
813,2
17
829,0
44
841,0
08
855,6
24
870,5
90
895,6
25
741,6
11
787,8
01
772,7
71
801,9
10
813,2
24
829,0
52
841,4
07
855,8
45
871,6
58
895,6
92
742,3
46
788,2
48
772,9
43
802,2
77
813,6
33
829,1
08
842,0
44
857,3
05
872,0
04
895,7
58
745,1
18
788,6
01
773,1
39
802,7
03
813,6
51
829,3
88
842,3
73
857,3
14
872,2
29
896,4
63
747,3
91
788,7
31
774,4
36
803,3
86
813,7
44
829,6
15
842,5
65
857,3
28
872,3
52
896,5
14
748,1
11
789,0
82
774,6
49
803,4
32
813,9
67
830,0
63
842,7
78
857,3
82
872,6
99
896,5
66
748,2
92
789,3
51
774,7
74
803,4
39
814,2
53
830,3
28
842,8
40
857,4
42
872,8
72
898,3
22
749,2
80
789,6
63
775,7
42
803,7
60
815,0
35
830,4
00
842,9
36
857,6
49
873,5
27
899,4
79
749,3
17
790,0
85
775,9
49
803,8
96
815,1
11
830,5
12
843,1
61
858,1
26
874,5
24
900,0
25
26
749,5
27
790,0
95
776,1
10
804,2
63
815,9
80
830,6
02
843,2
79
858,6
98
876,2
59
901,9
29
751,8
66
790,1
35
776,2
29
804,3
41
816,1
24
830,6
57
843,3
46
858,7
75
876,2
99
901,9
56
752,0
49
790,1
84
776,4
28
804,6
43
816,1
46
830,7
39
843,4
76
858,8
30
876,6
16
902,3
19
753,2
16
790,4
06
776,4
97
804,6
96
816,8
62
831,6
87
843,6
17
858,8
99
876,7
43
904,7
53
753,4
00
790,9
83
778,0
46
804,8
09
817,5
05
831,7
91
843,7
51
859,0
14
878,7
08
906,7
01
753,4
01
791,5
25
778,1
76
805,0
72
817,8
79
832,6
38
844,2
16
859,4
01
879,5
82
908,6
01
754,4
13
792,4
41
778,2
77
805,1
94
818,0
51
832,7
22
845,3
44
859,4
63
879,6
60
909,6
67
755,4
08
792,4
67
778,6
90
805,2
80
818,4
01
833,1
46
846,0
31
859,4
71
880,4
51
910,6
05
755,4
65
793,2
33
778,7
69
805,7
40
818,6
22
833,2
83
846,2
39
860,0
68
880,7
35
911,3
06
755,6
41
793,2
91
778,7
82
805,8
85
819,0
31
833,2
95
846,4
77
860,1
19
881,2
16
911,8
82
755,8
76
793,2
91
779,2
11
806,0
18
819,4
27
833,4
79
846,6
34
860,1
83
883,3
53
912,8
77
757,2
97
793,3
33
779,3
68
806,6
06
819,6
31
833,8
42
846,7
40
860,8
05
883,6
14
913,4
82
758,8
01
793,5
93
780,0
03
806,6
68
819,9
39
834,6
73
846,7
86
860,9
43
883,7
38
913,8
06
758,9
76
793,6
25
780,0
30
806,7
84
820,2
24
834,9
56
847,2
76
861,4
02
883,8
56
915,3
89
759,1
08
793,6
32
780,0
87
807,1
61
820,2
92
835,3
42
847,3
87
861,5
07
884,5
35
918,3
99
27
759,3
11
793,7
62
780,3
24
807,2
23
820,8
04
835,3
44
847,5
45
862,0
31
886,7
89
924,0
31
760,7
75
794,5
51
780,4
17
807,3
61
821,5
89
835,7
34
847,6
83
862,0
89
886,8
55
926,1
72
762,0
53
794,6
35
780,9
22
807,8
11
822,1
70
835,7
77
848,2
86
862,2
48
886,9
49
933,6
20
762,6
95
795,3
17
781,1
79
807,8
56
822,7
25
835,8
29
848,5
32
862,4
42
887,1
93
934,7
53
763,0
62
795,3
65
781,3
14
808,1
25
823,3
07
836,1
62
848,6
13
863,4
09
887,5
33
934,9
51
763,0
72
795,6
10
781,6
23
808,1
50
824,5
95
836,2
19
849,2
34
863,6
05
887,7
85
936,6
85
763,5
52
795,9
09
781,9
27
808,4
14
824,6
48
836,3
28
849,8
60
864,3
98
888,9
40
960,1
50
28
Archivo 2:
Velocidad (Km/h) Energía (KW) Condición (*)
30,9 88,8 1
54,7 147,5 2
49,4 135 2
52,2 132,3 2
45,4 124,8 2
62,2 167,3 3
54,1 139 2
59,5 154,4 3
52,3 142,4 2
44,7 120,1 2
55,6 142,6 2
55,5 154,5 2
45,3 126,7 2
51,4 140 2
56,3 144,7 2
36,4 90,2 1
51,7 142,5 2
33,3 96 1
53,9 147,9 2
52,3 137,7 2
50,2 134,2 2
62,8 163,3 3
48,5 138,6 2
57,1 149,5 2
63,3 172,4 3
60,6 157,9 3
57,3 155,1 2
57,1 152,8 2
63,4 171,2 3
50,4 130,3 2
52,8 137,2 2
46,7 117,8 2
35,6 93,3 1
63,1 169,8 3
51,5 136,8 2
38,6 111,7 1
44,9 127 2
74,9 193,2 3
29
45 122,5 2
64,4 167,8 3
49,8 145,4 2
45,3 127,6 2
55,6 147,7 2
54,7 143,7 2
59,1 162,9 3
42,3 116,3 1
41 118,1 1
61,8 163,3 3
44,7 123,3 2
42,3 114,3 2
66,8 177,7 3
49,3 140,6 2
51 139,5 2
60,4 160,1 3
52,3 142,2 2
59 158 3
50,2 130 2
39,7 115,4 1
40,7 109,3 1
64,6 172,6 3
(*): Se refiere a la condición climática (1: Despejado; 2: Parcial Nublado; 3: Nublado)
Obs:
1.- Si la velocidad del viento es inferior a 50 Km/h se clasifica en normal 2.- Si la velocidad del viento es superior o mayor a 50 Km/h se clasifica como exce-sivo
3.- Si la producción de energía es inferior a 120 kw se clasifica como baja
4.- Si la producción de energía está entre 120 kw y 160 kw se clasifica como normal
5.- Si la producción de energía es superior a 160 kw se clasifica como máxima