Prueba de Hipótesis
-
Upload
osbertodiaz -
Category
Documents
-
view
9 -
download
2
description
Transcript of Prueba de Hipótesis
PRUEBA DE HIPOTESIS
� Una hipótesis estadística es una información acerca de los parámetros de una población.
� Para probar una hipótesis hay que diseñar un procedimiento para tomar muestras y calcular el estadístico procedimiento para tomar muestras y calcular el estadístico de prueba apropiado con el objeto de rechazar o no la hipótesis
� En ingeniería de Mantenimiento generalmente estamos interesados en que los equipos y sistemas puedan ser modelados por una distribución de probabilidad en particular
� Cuando se realizan predicciones de la confiablidad, se siguen procedimientos estadísticos llamados bondad de ajuste.
La bondad de ajuste consiste en realizar una hipótesis
PRUEBA DE HIPOTESIS
� La bondad de ajuste consiste en realizar una hipótesis sobre la naturaleza de la distribución que se ajusta a los datos recolectados de equipos y sistemas, y a veces sobre los valores de los parámetros que la definen.
� Supongamos que tenemos n observaciones de tiempos de falla de una población de elementos identicos. Supongamos tambien que dicha población puede ser expresada a traves de una distribución de probabilidad de falla cualesquiera.
� Supongamos tambien que dicha población puede ser expresada a través de una distribución de probabilidad de falla cualesquiera (exponencial, normal, weibull, etc.)
H µ µ= =
PRUEBA DE HIPOTESIS
1 2
1 1 2
oH
H
µ µµ µ
= == ≠
Hipótesis Nula
Hipótesis Alternativa
� Al efectuar una prueba de hipotesis pueden ocurrir dos tipos de errores:
( )_ _ ( _ / _ _ )o oP error tipo I P rechazar H H es verdaderaαβ
= == =
PRUEBA DE HIPOTESIS
� El procedimiento general de la prueba de hipótesis consiste en especificar un valor para , la probabilidad de error tipo I, llamado a menudo nivel de significancia de La prueba, para después diseñar un procedimiento que asegure un valor pequeño para la probabilidad de error tipo II
( _ _ ) ( _ _ / _ _ )o oP error tipo II P No rechazar H H es falsaβ = =
α
� Existen test estadísticos variados para calificar la calidad de los ajustes de la curva de distribución hipotética de una muestra. En este curso de analizarán:
� Test de Bartlet
PRUEBA DE HIPOTESIS
� Test de Bartlet
� Test de Mann
� Test de lillierforts
� Test de kolmogorov - Smirnorv
� Estos test contemplan varias etapas a seguir:
� Etapa 1: Graficar los datos de la muestra, es decir el histograma de falla.
Etapa 2: Calcular en la distribución de probabilidad
PRUEBA DE HIPOTESIS
� Etapa 2: Calcular en la distribución de probabilidad hipotética, el llamado valor del test y compararlo con el llamado valor critico.
� Etapa 3: Si el valor del test es menor que el valor critico entonces la distribución hipotética es considerada un buen ajuste y la hipótesis no es rechazada. Si por el contrario es valor del test es mayor que el valor critico la hipótesis es rechazada
Test de Bartlet para el modelo exponencial• El estadígrafo de Bartlet se utiliza para comprobar la hipótesis de distribución exponencial• Ho= La distribución de probabilidad es exponencial• H1 = La distribución de probabilidad no es exponencial
1 rT − ∑ t =
DISTRIBUCIONES DE PROBABILIDAD
Test de Bartlet
( )( )
1
12 ln ln
11
6
r
ii
Tr t
r rBr
r
r
=
− =
++
∑
1
i
r
ii
t
r
T t=
==
=∑
Tiempos entre fallas
Numero total de fallas
Br = estadígrafo de distribución chi-cuadrado ( ) con r-1 grados de libertad2x
Si Br esta incluido en el intervalo , con un nivel de significación la hipótesisde distribución exponencial no puede ser rechazada
[ ]1,,2
21,,
21
2 , −−− rr XX αα α
EJEMPLO DE TEST DE BARTLETEn la tabla siguiente se muestran las horas de operación antes de fallar de un montacargas de la empresa Otinsa. Se desea determinar si estos datos pueden ser simulados por la distribución de probabilidad exponencial
Horas antes de fallar
DISTRIBUCIONES DE PROBABILIDAD
Test de Bartlet
Horas antes de fallar
11
19
28
15
5
49
2
7
EJEMPLO DE APLICACIÓN DISTRIBUCION EXPONENCIAL (Con t.)
2min =X
49max=X
47249minmax =−=−= XXRango
1 3.33 8 4K Log= + = 1275.114
47 ≅==I
DISTRIBUCIONES DE PROBABILIDAD
Test de Bartlet
Intervalos (horas) Fr f (t)
2 - 14 4 0.50
15 - 27 2 0.25
28 - 40 1 0.125
41 - 53 1 0.125
0.5
0.25
0.125 0.125
0
0.1
0.2
0.3
0.4
0.5
0.6
O2 - 14 15 - 27 28 - 40 41 - 53F
recu
enci
a re
lati
va (%
)
Intervalos de Clase (horas)
Grafica de f(t) montacargas
DISTRIBUCIONES DE PROBABILIDAD
Test de Bartlet
8
1
8
8
136
ln 19.5226
ii
r
T t
t
=
=
= =
=
∑
∑
( ) ( ) ( )
( )( ) ( )
1
ln 19.5226
136 12 8 ln 19.5226
8 8 6.28625.2936
1.18751 81
6 8
ii
t
Br
=
=
− = = = +
+
∑
[ ]1,,2
21,,
21
2 , −−− rr XX αα 0.05α =0.975, 7
0.025, 7
2
2
1.69
16.013
X
X
=
=
Tabla de Chi-cuadrado
Dado que el estadígrafo de Bartelt Br=5.294, se encuentra en el intervalo ( 1.69, 16.013) la hipótesis de la distribución exponencial no puede ser rechazada, es decir se los tiempos de falla pueden ser modelados por la distribución exponencial
Test de Mann para el modelo Weibull• El estadígrafo de Bartlet se utiliza para comprobar la hipótesis de distribución Weibull• Ho= La distribución de probabilidad es Weibull• H1 = La distribución de probabilidad no es Weibull
DISTRIBUCIONES DE PROBABILIDAD
Test de Mann
( )1r x x− − ∑
r = Numero total de fallas( )( )
( )
11
121
1
1
ri i
iri
ri i
ii
MS
M
x x
x x
−+
= +
−+
=
−
=−
∑
∑1
i
i i
r
t
x Lnt
S
====
Numero total de fallas
Tiempos de fallas
Valor critico de tabla de Mann obtenido de la tabla
Si el valor calculado de S, se compara con el valor critico de la tabla de Mann , con un valor de significancia , si se cumple que , entonces se acepta la hipótesis de que los tiempos de falla de los tiempos de falla considerados siguen la Ley de la Distribución de Weibull, con un nivel de significancia
1Sα
1S S≤ α
DISTRIBUCIONES DE PROBABILIDADTest de Mann
EJEMPLO DE APLICACIÓN DEL TEST DE MANN
� El gerente de mantenimiento de una planta eléctrica desea determinar el modelo de distribución de probabilidad de falla que mejor simula un motor diesel. Para este propósito disponen de los tiempos de operación en horas del equipo hasta fallar: 6,16,23,163,282,215,2,46,503,92,12,46,20
Intervalos de clase (horas)
Frecuencia de clase
2 – 102 9
103 – 203 1
203 – 303 2
304 – 404 0
404 – 504 1 0123456789
10
2 - 102 103 - 203 204 - 304 305 - 405 405 - 505
Fre
cuen
cia
de
Cla
se
Intervalos de Clase (horas)
Histograma de Frecuencia Motor Diesel
DISTRIBUCIONES DE PROBABILIDADTest de Mann
1 2 0.693147 1.040555 1.098612 1.055794
2 6 1.791759 0.543556 0.693147 1.275208
3 12 2.484906 0.380417 0.287682 0.756228
4 16 2.772588 0.301300 0.223144 0.740640
iit
iLnt iM ( )1i iLnt Lnt+ − ( )1i i
i
Lnt LntM
+ −
4 16 2.772588 0.301300 0.223144 0.740640
5 20 2.995732 0.256437 0.139762 0.545014
6 23 3.135494 0.229515 0.693147 3.020050
7 46 3.828641 0.213966 0 0
8 46 3.828641 0.207205 0.693147 3.345223
9 92 4.521788 0.209131 0.571962 2.734946
10 163 5.093750 0.222667 0.276888 1.243507
11 215 5.370638 0.258323 0.271269 1.050115
12 282 5.641907 0.363582 0.578683 1.591616
13 503 6.220590
DISTRIBUCIONES DE PROBABILIDADTest de Mann
13
0.05
r
α==
( )121
6.620184i i
Mx x+ −
∑( )
( )
11
ri i
irM
x x−+ −
∑
( )8
121
1
6.6201840.381
17.358341ii
i i
ii
MS
Mx x
=
+
=
= = =
−
∑
∑
( )( )
121
1
1
iri
ri i
ii
MS
Mx x
= +
−+
=
=−
∑
∑
1 0.95α− =13n =
1 0.72S =Valor critico de tabla de Mann obtenido de la tabla
1S S≤La hipótesis de la distribución de probabilidad de weibull no puede ser rechazada, es decir se acepta la hipótesis de la distribución de weibull.
Test de Liliefors para normalidad� En esta prueba se parte de la base aleatoria de que la muestra es
aleatoria y que f(t) es continua
� Ho= La distribución de probabilidad es normal (Gauss)
DISTRIBUCIONES DE PROBABILIDADTest de Lilliefors
� Ho= La distribución de probabilidad es normal (Gauss)
� H1= La distribución de probabilidad no es normal (Gauss)
Procedimiento:
a) Estandarización: Para determinar el estadígrafo primero hay que estandarizar los tiempos de falla:
xtZ
µσ− =
1
n
ii
x
x
nµ ==
∑ ( )2
1
1
n
i xi
x
n
µσ =
−=
−
∑ ( ) ijS jn
=
S= distribución empírica
Ji= Valor ordinal de t
Test de Liliefors para normalidadb) Estadigrafo de prueba:
F(t)= La función distribución de probabilidad acumulada hipotética
S(J)= La función distribución de probabilidad acumulada emperica.
DISTRIBUCIONES DE PROBABILIDADTest de Lilliefors
S(J)= La función distribución de probabilidad acumulada emperica.
Se obtiene la máxima diferencia absoluta.
c) Regla de decision
se obtiene de la tabla de Lilliefors con y n= tamaño de la muestra.
la hipótesis no puede ser rechazada, es decir se acepta
se rechaza la hipótesis
( ) ( )T F t S j= −
(1 )W α− (1 )α−
(1 )T W α−≻
(1 )T W α−≺
Ejemplo de aplicación� Se desea determinar si los tiempos de falla de una válvula de proceso siguen
una distribución normal. Para este propósito se tienen los tiempos de falla expresados en horas: 126, 130, 128, 129, 131, 127, 135, 118, 138, 129, 123. tome un valor de significancia de 0.05
DISTRIBUCIONES DE PROBABILIDADTest de Lilliefors
tome un valor de significancia de 0.05
Intervalos de clase (horas) Frecuencia
118 - 123 2
124 - 129 5
130 - 135 3
136 - 141 10
1
2
3
4
5
6
118 - 123 124 - 129 130 - 135 136 - 141
Histograma de Falla Valvula de Proceso
Ejemplo de aplicación128.55
5.39xµ
σ=
=J ( ordinal) Tiempos (horas) Z F(t) S(J)
1 118 -1.9573 0.0250 0.0909 0.0659
2 123 -1.0296 0.1515 0.1818 0.0303
( ) ( )T F t S j= −
horas
horas
DISTRIBUCIONES DE PROBABILIDADTest de Lilliefors
3 126 -0.4730 0.3192 0.2727 0.0465
4 127 -0.2875 0.3854 0.3636 0.0223
5 128 -0.1020 0.4602 0.4545 0.0057
6 129 0.0834 0.4681 0.5454 0.0773
7 129 0.0834 0.4681 0.6363 0.1682
8 130 0.2690 0.6064 0.7272 0.1208
9 131 0.4545 0.6736 0.8181 0.1445
10 135 1.1966 0.8849 0.9090 0.0241
11 138 1.7532 0.9505 1.0000 0.0495
DISTRIBUCIONES DE PROBABILIDADTest de Lilliefors
0.05α=
(1 ) 0.95 0.249W Wα− = =(1 ) 0.95 0.249W Wα− = =
Ejemplo de aplicación
� La mayor diferencia de T=0.1682 cuando t=129 horas
� Tomando , con n=11 (tabla de Lilliefors)
0.05α= (1 ) 0.95 0.249W Wα− = =
DISTRIBUCIONES DE PROBABILIDADTest de Lilliefors
Lilliefors)
� por lo tanto la hipótesis de la distribución normal no puede ser rechazada, es decir se acepta la hipótesis
0.95T W≺
Test de Kolmogorov - Smirnov� En esta prueba se parte de la base aleatoria de que la muestra es
aleatoria y que f(t) es continua
� Ho= La distribución de probabilidad es la hipotética
DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov
� Ho= La distribución de probabilidad es la hipotética
� H1= La distribución de probabilidad no es la hipotética
Procedimiento:
a) Determinar la distribución de probabilidad acumulada hipotética F(t)
b) Determinar la distribución de probabilidad acumulada empírica
( ) ijS jn
= S= distribución empírica
Ji= Valor ordinal de t
Test de Kolmogorov – Smirnov b) Estadígrafo de prueba:
F(t)= La función distribución de probabilidad acumulada hipotética
S(J)= La función distribución de probabilidad acumulada emperica.
DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov
S(J)= La función distribución de probabilidad acumulada emperica.
Se obtiene la máxima diferencia absoluta.
c) Regla de decision
se obtiene de la tabla de Kolmogorov y n= tamaño de la muestra.
la hipótesis no puede ser rechazada, es decir se acepta
se rechaza la hipótesis
( ) ( )T F t S j= −
Kα α
T Kα≻
T Kα≺
EJEMPLO DE TEST KOLMOGOROV - SMIRNOVEn la tabla siguiente se muestran las horas de operación antes de fallar de un montacargas de la empresa Otinsa. Se desea determinar si estos datos pueden ser simulados por la distribución de probabilidad Exponencial o Weibull
Horas antes de fallar
DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov
Horas antes de fallar
11
19
28
15
5
49
2
7
Ho= La distribución de probabilidad es exponencialH1= La distribución de probabilidad no es exponencial
2min =X
49max=X
47249minmax =−=−= XXRango
1 3.33 8 4K Log= + = 1275.114
47 ≅==I
DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov
Intervalos (horas) Fr f (t)
2 - 14 4 0.50
15 - 27 2 0.25
28 - 40 1 0.125
41 - 53 1 0.125
0.5
0.25
0.125 0.125
0
0.1
0.2
0.3
0.4
0.5
0.6
O2 - 14 15 - 27 28 - 40 41 - 53F
recu
enci
a re
lati
va (%
)
Intervalos de Clase (horas)
Grafica de f(t) montacargas
Ordinal (i) Tiempo (horas)Tiempo (horas) R(t) LnLn R(t)R(t)
1 22 0.9167 --0.0869750.086975
METODO ANALITICO
1.- Ordenar en forma ascendente y Ln R(t)
DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov
1 22 0.9167 --0.0869750.086975
2 55 0.7977 --0.22600.2260
3 77 0.6786 --0.38770.3877
4 1111 0.5596 --0.58050.5805
5 1515 0.4405 --0.81980.8198
6 1919 0.3215 --1.13471.1347
7 2828 0.2024 --1.59751.5975
8 4949 0.0834 --2.48412.4841
2. Aplicar la regresión lineal para el calculo del MTBF
)(ln.)(ln..∑ ∑ ∑− tRttRtn
METODO ANALITICO
Resumen Estadístico de la regresión lineal8=n
1368
1
=∑=i
it
Sustituyendo:
DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov
( ) ( ) 052061.01363970.8
)3172.7).(136()7105.210).(8(2 −=
−−−−=− λ
( ) ( )22.
)(ln.)(ln..
∑∑∑ ∑ ∑
−
−=−
ii
i
ttn
tRttRtniλ
1=i
∑=
−=8
1
3172.7)(i
itLnR
39708
1
2 =∑ it
7105.210)(.8
1
−=∑ tLnRt i
20.191 ==λ
MTBF horas
19.2( ) 1t
F t e
−= − iiSN
=Ordinal (i) Tiempo Tiempo (horas)(horas)
( ) iF t S−
19.2( ) 1t
F t e
−= −Función acumulada exponencial Función acumulada empíricai
iSN
=0.05α =
DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov
1 22 0.051 0.1250.125 0.0740.074
2 55 0.229 0.2500.250 0.0.120.0.12
3 77 0.305 0.3750.375 0.0700.070
4 1111 0.436 0.5000.500 0.0640.064
5 1515 0.565 0.6250.625 0.0600.060
6 1919 0.628 0.7500.750 0.1120.1127 2828 0.767 0.8750.875 0.1080.108
8 4949 0.922 1.0001.000 0.0780.078
0.112T = 0.05 0.457K =
0.05T K≺
DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov
0.05
La hipótesis Ho no puede ser rechazada, por lo tantos los datos de la muestra pueden ser simulados por la distribución de probabilidad exponencial
Ho= La distribución de probabilidad es WeibullH1= La distribución de probabilidad no es Weibull
Horas antes de fallar
11
DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov
11
19
28
15
5
49
2
7
2min =X
49max=X
47249minmax =−=−= XXRango
1 3.33 8 4K Log= + = 1275.114
47 ≅==I
DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov
Intervalos (horas) Fr f (t)
2 - 14 4 0.50
15 - 27 2 0.25
28 - 40 1 0.125
41 - 53 1 0.125
0.5
0.25
0.125 0.125
0
0.1
0.2
0.3
0.4
0.5
0.6
O2 - 14 15 - 27 28 - 40 41 - 53F
recu
enci
a re
lati
va (%
)
Intervalos de Clase (horas)
Grafica de f(t) montacargas
RESOLUCION UTILIZANDO EL METODO ANALITICO
Ordinal Tiempo F(t) R(t) Ln t Ln(Ln(1/R(t)))
1 22 0.0833 0.9167 0.6931 -2.4421
2 55 0.2023 0.7977 1.6094 -1.4871
DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov
3 77 0.3214 0.6786 1.9459 -0.9474
4 1111 0.4404 0.5596 2.3978 -0.5435
5 1515 0.5595 0.4405 2.7725 -0.1983
6 1919 0.6785 0.3215 2.9444 0.1264
7 2828 0.7976 0.2024 3.3322 0.4684
8 4949 0.9166 0.0834 3.8918 0.9099
Aplicando regresión lineal
( ) bLntLntn
tRLnLnLnt
tRLnLnLntn
i
ii
=−
−
=∑∑
∑ ∑ ∑22.
))(
1.)
)(1
(..
β
Resumen Estadístico
13
1
19.5871ii
Lnt=
=∑
13 1( ) 4.1137Ln Ln
= − ∑
2
(8)( 2.3031) (19.5871)( 4.1137)1.07
(8)(55.2124) (19.5871)β − − −= =
−
8n =
DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov
1
1( ) 4.1137
( )i
Ln LnR t=
= −
∑
132
1
55.2124i
Lnt=
=∑
13
1
1. ( ) 2.3083
( )ii
Lnt Ln LnR t=
= −
∑
3.13402.9289
1.0700Lnα −= =
−
2.9289 18.707eα = =
Sustituyendo en la ecuaciones de la regresión lineal
2
(55.2124).( 4.1137) ( 2.3083)(19.5871). 3.1340
(8)(55.2124) (19.5871)Lnβ α − − −− = = −
−
horas
( )a
LntLntn
LnttR
LnLnLnttR
LnLnLnt
Lni
ii
=−
−
=−∑ ∑
∑ ∑ ∑∑22
2
.
.)(
1(.
)(
1(.
. αβ
Ordinal (i) Tiempo Tiempo (horas)(horas)
1.070
18.70( ) 1t
F t e
−= −i
iSN
= ( ) iF t S−
1.070
18.70( ) 1t
F t e
−= −Función acumulada Weibull Función acumulada empíricai
iSN
=0.05α =
DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov
(horas)(horas)
1 22 0.087 0.1250.125 0.0380.038
2 55 0.216 0.2500.250 0.0340.034
3 77 0.294 0.3750.375 0.0810.081
4 1111 0.432 0.5000.500 0.0680.068
5 1515 0.546 0.6250.625 0.0790.079
6 1919 0.637 0.7500.750 0.1130.1137 2828 0.785 0.8750.875 0.0900.090
8 4949 0.939 1.0001.000 0.0610.061
18.70( ) 1F t e = −i
iSN
= ( ) iF t S−
0.113T = 0.05 0.457K =
0.05T K≺
DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov
0.05
La hipótesis Ho no puede ser rechazada, por lo tantos los datos de la muestra pueden ser simulados por la distribución de probabilidad Weibull
Cual de las dos distribuciones de probabilidad (Exponencial, Weibull) es la masrecomendada para ajustar los datos de la muestra?La que posea menor valor de T, es decir para este caso la distribución deprobabilidad Exponencial