Prueba de Hipótesis

45
PRUEBA DE HIPOTESIS

description

Prueba de Hipótesis 1. Autor: Henry Villarroel

Transcript of Prueba de Hipótesis

PRUEBA DE HIPOTESIS

PRUEBA DE HIPOTESIS

� Una hipótesis estadística es una información acerca de los parámetros de una población.

� Para probar una hipótesis hay que diseñar un procedimiento para tomar muestras y calcular el estadístico procedimiento para tomar muestras y calcular el estadístico de prueba apropiado con el objeto de rechazar o no la hipótesis

� En ingeniería de Mantenimiento generalmente estamos interesados en que los equipos y sistemas puedan ser modelados por una distribución de probabilidad en particular

� Cuando se realizan predicciones de la confiablidad, se siguen procedimientos estadísticos llamados bondad de ajuste.

La bondad de ajuste consiste en realizar una hipótesis

PRUEBA DE HIPOTESIS

� La bondad de ajuste consiste en realizar una hipótesis sobre la naturaleza de la distribución que se ajusta a los datos recolectados de equipos y sistemas, y a veces sobre los valores de los parámetros que la definen.

� Supongamos que tenemos n observaciones de tiempos de falla de una población de elementos identicos. Supongamos tambien que dicha población puede ser expresada a traves de una distribución de probabilidad de falla cualesquiera.

� Supongamos tambien que dicha población puede ser expresada a través de una distribución de probabilidad de falla cualesquiera (exponencial, normal, weibull, etc.)

H µ µ= =

PRUEBA DE HIPOTESIS

1 2

1 1 2

oH

H

µ µµ µ

= == ≠

Hipótesis Nula

Hipótesis Alternativa

� Al efectuar una prueba de hipotesis pueden ocurrir dos tipos de errores:

( )_ _ ( _ / _ _ )o oP error tipo I P rechazar H H es verdaderaαβ

= == =

PRUEBA DE HIPOTESIS

� El procedimiento general de la prueba de hipótesis consiste en especificar un valor para , la probabilidad de error tipo I, llamado a menudo nivel de significancia de La prueba, para después diseñar un procedimiento que asegure un valor pequeño para la probabilidad de error tipo II

( _ _ ) ( _ _ / _ _ )o oP error tipo II P No rechazar H H es falsaβ = =

α

� Existen test estadísticos variados para calificar la calidad de los ajustes de la curva de distribución hipotética de una muestra. En este curso de analizarán:

� Test de Bartlet

PRUEBA DE HIPOTESIS

� Test de Bartlet

� Test de Mann

� Test de lillierforts

� Test de kolmogorov - Smirnorv

� Estos test contemplan varias etapas a seguir:

� Etapa 1: Graficar los datos de la muestra, es decir el histograma de falla.

Etapa 2: Calcular en la distribución de probabilidad

PRUEBA DE HIPOTESIS

� Etapa 2: Calcular en la distribución de probabilidad hipotética, el llamado valor del test y compararlo con el llamado valor critico.

� Etapa 3: Si el valor del test es menor que el valor critico entonces la distribución hipotética es considerada un buen ajuste y la hipótesis no es rechazada. Si por el contrario es valor del test es mayor que el valor critico la hipótesis es rechazada

Test de Bartlet para el modelo exponencial• El estadígrafo de Bartlet se utiliza para comprobar la hipótesis de distribución exponencial• Ho= La distribución de probabilidad es exponencial• H1 = La distribución de probabilidad no es exponencial

1 rT − ∑ t =

DISTRIBUCIONES DE PROBABILIDAD

Test de Bartlet

( )( )

1

12 ln ln

11

6

r

ii

Tr t

r rBr

r

r

=

− =

++

1

i

r

ii

t

r

T t=

==

=∑

Tiempos entre fallas

Numero total de fallas

Br = estadígrafo de distribución chi-cuadrado ( ) con r-1 grados de libertad2x

Si Br esta incluido en el intervalo , con un nivel de significación la hipótesisde distribución exponencial no puede ser rechazada

[ ]1,,2

21,,

21

2 , −−− rr XX αα α

EJEMPLO DE TEST DE BARTLETEn la tabla siguiente se muestran las horas de operación antes de fallar de un montacargas de la empresa Otinsa. Se desea determinar si estos datos pueden ser simulados por la distribución de probabilidad exponencial

Horas antes de fallar

DISTRIBUCIONES DE PROBABILIDAD

Test de Bartlet

Horas antes de fallar

11

19

28

15

5

49

2

7

EJEMPLO DE APLICACIÓN DISTRIBUCION EXPONENCIAL (Con t.)

2min =X

49max=X

47249minmax =−=−= XXRango

1 3.33 8 4K Log= + = 1275.114

47 ≅==I

DISTRIBUCIONES DE PROBABILIDAD

Test de Bartlet

Intervalos (horas) Fr f (t)

2 - 14 4 0.50

15 - 27 2 0.25

28 - 40 1 0.125

41 - 53 1 0.125

0.5

0.25

0.125 0.125

0

0.1

0.2

0.3

0.4

0.5

0.6

O2 - 14 15 - 27 28 - 40 41 - 53F

recu

enci

a re

lati

va (%

)

Intervalos de Clase (horas)

Grafica de f(t) montacargas

DISTRIBUCIONES DE PROBABILIDAD

Test de Bartlet

8

1

8

8

136

ln 19.5226

ii

r

T t

t

=

=

= =

=

( ) ( ) ( )

( )( ) ( )

1

ln 19.5226

136 12 8 ln 19.5226

8 8 6.28625.2936

1.18751 81

6 8

ii

t

Br

=

=

− = = = +

+

[ ]1,,2

21,,

21

2 , −−− rr XX αα 0.05α =0.975, 7

0.025, 7

2

2

1.69

16.013

X

X

=

=

Tabla de Chi-cuadrado

Dado que el estadígrafo de Bartelt Br=5.294, se encuentra en el intervalo ( 1.69, 16.013) la hipótesis de la distribución exponencial no puede ser rechazada, es decir se los tiempos de falla pueden ser modelados por la distribución exponencial

DISTRIBUCIONES DE PROBABILIDAD

Test de Bartlet

0.975, 72 1.69X =

0.025, 72 16.013X =

Test de Mann para el modelo Weibull• El estadígrafo de Bartlet se utiliza para comprobar la hipótesis de distribución Weibull• Ho= La distribución de probabilidad es Weibull• H1 = La distribución de probabilidad no es Weibull

DISTRIBUCIONES DE PROBABILIDAD

Test de Mann

( )1r x x− − ∑

r = Numero total de fallas( )( )

( )

11

121

1

1

ri i

iri

ri i

ii

MS

M

x x

x x

−+

= +

−+

=

=−

∑1

i

i i

r

t

x Lnt

S

====

Numero total de fallas

Tiempos de fallas

Valor critico de tabla de Mann obtenido de la tabla

Si el valor calculado de S, se compara con el valor critico de la tabla de Mann , con un valor de significancia , si se cumple que , entonces se acepta la hipótesis de que los tiempos de falla de los tiempos de falla considerados siguen la Ley de la Distribución de Weibull, con un nivel de significancia

1Sα

1S S≤ α

1 α−

1S

DISTRIBUCIONES DE PROBABILIDADTest de Mann

EJEMPLO DE APLICACIÓN DEL TEST DE MANN

� El gerente de mantenimiento de una planta eléctrica desea determinar el modelo de distribución de probabilidad de falla que mejor simula un motor diesel. Para este propósito disponen de los tiempos de operación en horas del equipo hasta fallar: 6,16,23,163,282,215,2,46,503,92,12,46,20

Intervalos de clase (horas)

Frecuencia de clase

2 – 102 9

103 – 203 1

203 – 303 2

304 – 404 0

404 – 504 1 0123456789

10

2 - 102 103 - 203 204 - 304 305 - 405 405 - 505

Fre

cuen

cia

de

Cla

se

Intervalos de Clase (horas)

Histograma de Frecuencia Motor Diesel

DISTRIBUCIONES DE PROBABILIDADTest de Mann

1 2 0.693147 1.040555 1.098612 1.055794

2 6 1.791759 0.543556 0.693147 1.275208

3 12 2.484906 0.380417 0.287682 0.756228

4 16 2.772588 0.301300 0.223144 0.740640

iit

iLnt iM ( )1i iLnt Lnt+ − ( )1i i

i

Lnt LntM

+ −

4 16 2.772588 0.301300 0.223144 0.740640

5 20 2.995732 0.256437 0.139762 0.545014

6 23 3.135494 0.229515 0.693147 3.020050

7 46 3.828641 0.213966 0 0

8 46 3.828641 0.207205 0.693147 3.345223

9 92 4.521788 0.209131 0.571962 2.734946

10 163 5.093750 0.222667 0.276888 1.243507

11 215 5.370638 0.258323 0.271269 1.050115

12 282 5.641907 0.363582 0.578683 1.591616

13 503 6.220590

1 α−

1S

DISTRIBUCIONES DE PROBABILIDADTest de Mann

13

0.05

r

α==

( )121

6.620184i i

Mx x+ −

∑( )

( )

11

ri i

irM

x x−+ −

( )8

121

1

6.6201840.381

17.358341ii

i i

ii

MS

Mx x

=

+

=

= = =

( )( )

121

1

1

iri

ri i

ii

MS

Mx x

= +

−+

=

=−

1 0.95α− =13n =

1 0.72S =Valor critico de tabla de Mann obtenido de la tabla

1S S≤La hipótesis de la distribución de probabilidad de weibull no puede ser rechazada, es decir se acepta la hipótesis de la distribución de weibull.

Test de Liliefors para normalidad� En esta prueba se parte de la base aleatoria de que la muestra es

aleatoria y que f(t) es continua

� Ho= La distribución de probabilidad es normal (Gauss)

DISTRIBUCIONES DE PROBABILIDADTest de Lilliefors

� Ho= La distribución de probabilidad es normal (Gauss)

� H1= La distribución de probabilidad no es normal (Gauss)

Procedimiento:

a) Estandarización: Para determinar el estadígrafo primero hay que estandarizar los tiempos de falla:

xtZ

µσ− =

1

n

ii

x

x

nµ ==

∑ ( )2

1

1

n

i xi

x

n

µσ =

−=

∑ ( ) ijS jn

=

S= distribución empírica

Ji= Valor ordinal de t

Test de Liliefors para normalidadb) Estadigrafo de prueba:

F(t)= La función distribución de probabilidad acumulada hipotética

S(J)= La función distribución de probabilidad acumulada emperica.

DISTRIBUCIONES DE PROBABILIDADTest de Lilliefors

S(J)= La función distribución de probabilidad acumulada emperica.

Se obtiene la máxima diferencia absoluta.

c) Regla de decision

se obtiene de la tabla de Lilliefors con y n= tamaño de la muestra.

la hipótesis no puede ser rechazada, es decir se acepta

se rechaza la hipótesis

( ) ( )T F t S j= −

(1 )W α− (1 )α−

(1 )T W α−≻

(1 )T W α−≺

DISTRIBUCIONES DE PROBABILIDADTest de Lilliefors

Ejemplo de aplicación� Se desea determinar si los tiempos de falla de una válvula de proceso siguen

una distribución normal. Para este propósito se tienen los tiempos de falla expresados en horas: 126, 130, 128, 129, 131, 127, 135, 118, 138, 129, 123. tome un valor de significancia de 0.05

DISTRIBUCIONES DE PROBABILIDADTest de Lilliefors

tome un valor de significancia de 0.05

Intervalos de clase (horas) Frecuencia

118 - 123 2

124 - 129 5

130 - 135 3

136 - 141 10

1

2

3

4

5

6

118 - 123 124 - 129 130 - 135 136 - 141

Histograma de Falla Valvula de Proceso

Ejemplo de aplicación128.55

5.39xµ

σ=

=J ( ordinal) Tiempos (horas) Z F(t) S(J)

1 118 -1.9573 0.0250 0.0909 0.0659

2 123 -1.0296 0.1515 0.1818 0.0303

( ) ( )T F t S j= −

horas

horas

DISTRIBUCIONES DE PROBABILIDADTest de Lilliefors

3 126 -0.4730 0.3192 0.2727 0.0465

4 127 -0.2875 0.3854 0.3636 0.0223

5 128 -0.1020 0.4602 0.4545 0.0057

6 129 0.0834 0.4681 0.5454 0.0773

7 129 0.0834 0.4681 0.6363 0.1682

8 130 0.2690 0.6064 0.7272 0.1208

9 131 0.4545 0.6736 0.8181 0.1445

10 135 1.1966 0.8849 0.9090 0.0241

11 138 1.7532 0.9505 1.0000 0.0495

HENRY VILLARROEL

HENRY VILLARROEL

HENRY VILLARROEL

HENRY VILLARROEL

DISTRIBUCIONES DE PROBABILIDADTest de Lilliefors

0.05α=

(1 ) 0.95 0.249W Wα− = =(1 ) 0.95 0.249W Wα− = =

Ejemplo de aplicación

� La mayor diferencia de T=0.1682 cuando t=129 horas

� Tomando , con n=11 (tabla de Lilliefors)

0.05α= (1 ) 0.95 0.249W Wα− = =

DISTRIBUCIONES DE PROBABILIDADTest de Lilliefors

Lilliefors)

� por lo tanto la hipótesis de la distribución normal no puede ser rechazada, es decir se acepta la hipótesis

0.95T W≺

Test de Kolmogorov - Smirnov� En esta prueba se parte de la base aleatoria de que la muestra es

aleatoria y que f(t) es continua

� Ho= La distribución de probabilidad es la hipotética

DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov

� Ho= La distribución de probabilidad es la hipotética

� H1= La distribución de probabilidad no es la hipotética

Procedimiento:

a) Determinar la distribución de probabilidad acumulada hipotética F(t)

b) Determinar la distribución de probabilidad acumulada empírica

( ) ijS jn

= S= distribución empírica

Ji= Valor ordinal de t

Test de Kolmogorov – Smirnov b) Estadígrafo de prueba:

F(t)= La función distribución de probabilidad acumulada hipotética

S(J)= La función distribución de probabilidad acumulada emperica.

DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov

S(J)= La función distribución de probabilidad acumulada emperica.

Se obtiene la máxima diferencia absoluta.

c) Regla de decision

se obtiene de la tabla de Kolmogorov y n= tamaño de la muestra.

la hipótesis no puede ser rechazada, es decir se acepta

se rechaza la hipótesis

( ) ( )T F t S j= −

Kα α

T Kα≻

T Kα≺

α

α

EJEMPLO DE TEST KOLMOGOROV - SMIRNOVEn la tabla siguiente se muestran las horas de operación antes de fallar de un montacargas de la empresa Otinsa. Se desea determinar si estos datos pueden ser simulados por la distribución de probabilidad Exponencial o Weibull

Horas antes de fallar

DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov

Horas antes de fallar

11

19

28

15

5

49

2

7

Ho= La distribución de probabilidad es exponencialH1= La distribución de probabilidad no es exponencial

2min =X

49max=X

47249minmax =−=−= XXRango

1 3.33 8 4K Log= + = 1275.114

47 ≅==I

DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov

Intervalos (horas) Fr f (t)

2 - 14 4 0.50

15 - 27 2 0.25

28 - 40 1 0.125

41 - 53 1 0.125

0.5

0.25

0.125 0.125

0

0.1

0.2

0.3

0.4

0.5

0.6

O2 - 14 15 - 27 28 - 40 41 - 53F

recu

enci

a re

lati

va (%

)

Intervalos de Clase (horas)

Grafica de f(t) montacargas

Ordinal (i) Tiempo (horas)Tiempo (horas) R(t) LnLn R(t)R(t)

1 22 0.9167 --0.0869750.086975

METODO ANALITICO

1.- Ordenar en forma ascendente y Ln R(t)

DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov

1 22 0.9167 --0.0869750.086975

2 55 0.7977 --0.22600.2260

3 77 0.6786 --0.38770.3877

4 1111 0.5596 --0.58050.5805

5 1515 0.4405 --0.81980.8198

6 1919 0.3215 --1.13471.1347

7 2828 0.2024 --1.59751.5975

8 4949 0.0834 --2.48412.4841

2. Aplicar la regresión lineal para el calculo del MTBF

)(ln.)(ln..∑ ∑ ∑− tRttRtn

METODO ANALITICO

Resumen Estadístico de la regresión lineal8=n

1368

1

=∑=i

it

Sustituyendo:

DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov

( ) ( ) 052061.01363970.8

)3172.7).(136()7105.210).(8(2 −=

−−−−=− λ

( ) ( )22.

)(ln.)(ln..

∑∑∑ ∑ ∑

−=−

ii

i

ttn

tRttRtniλ

1=i

∑=

−=8

1

3172.7)(i

itLnR

39708

1

2 =∑ it

7105.210)(.8

1

−=∑ tLnRt i

20.191 ==λ

MTBF horas

19.2( ) 1t

F t e

−= − iiSN

=Ordinal (i) Tiempo Tiempo (horas)(horas)

( ) iF t S−

19.2( ) 1t

F t e

−= −Función acumulada exponencial Función acumulada empíricai

iSN

=0.05α =

DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov

1 22 0.051 0.1250.125 0.0740.074

2 55 0.229 0.2500.250 0.0.120.0.12

3 77 0.305 0.3750.375 0.0700.070

4 1111 0.436 0.5000.500 0.0640.064

5 1515 0.565 0.6250.625 0.0600.060

6 1919 0.628 0.7500.750 0.1120.1127 2828 0.767 0.8750.875 0.1080.108

8 4949 0.922 1.0001.000 0.0780.078

α

0.112T = 0.05 0.457K =

0.05T K≺

DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov

0.05

La hipótesis Ho no puede ser rechazada, por lo tantos los datos de la muestra pueden ser simulados por la distribución de probabilidad exponencial

Ho= La distribución de probabilidad es WeibullH1= La distribución de probabilidad no es Weibull

Horas antes de fallar

11

DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov

11

19

28

15

5

49

2

7

2min =X

49max=X

47249minmax =−=−= XXRango

1 3.33 8 4K Log= + = 1275.114

47 ≅==I

DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov

Intervalos (horas) Fr f (t)

2 - 14 4 0.50

15 - 27 2 0.25

28 - 40 1 0.125

41 - 53 1 0.125

0.5

0.25

0.125 0.125

0

0.1

0.2

0.3

0.4

0.5

0.6

O2 - 14 15 - 27 28 - 40 41 - 53F

recu

enci

a re

lati

va (%

)

Intervalos de Clase (horas)

Grafica de f(t) montacargas

RESOLUCION UTILIZANDO EL METODO ANALITICO

Ordinal Tiempo F(t) R(t) Ln t Ln(Ln(1/R(t)))

1 22 0.0833 0.9167 0.6931 -2.4421

2 55 0.2023 0.7977 1.6094 -1.4871

DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov

3 77 0.3214 0.6786 1.9459 -0.9474

4 1111 0.4404 0.5596 2.3978 -0.5435

5 1515 0.5595 0.4405 2.7725 -0.1983

6 1919 0.6785 0.3215 2.9444 0.1264

7 2828 0.7976 0.2024 3.3322 0.4684

8 4949 0.9166 0.0834 3.8918 0.9099

Aplicando regresión lineal

( ) bLntLntn

tRLnLnLnt

tRLnLnLntn

i

ii

=−

=∑∑

∑ ∑ ∑22.

))(

1.)

)(1

(..

β

Resumen Estadístico

13

1

19.5871ii

Lnt=

=∑

13 1( ) 4.1137Ln Ln

= − ∑

2

(8)( 2.3031) (19.5871)( 4.1137)1.07

(8)(55.2124) (19.5871)β − − −= =

8n =

DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov

1

1( ) 4.1137

( )i

Ln LnR t=

= −

132

1

55.2124i

Lnt=

=∑

13

1

1. ( ) 2.3083

( )ii

Lnt Ln LnR t=

= −

3.13402.9289

1.0700Lnα −= =

2.9289 18.707eα = =

Sustituyendo en la ecuaciones de la regresión lineal

2

(55.2124).( 4.1137) ( 2.3083)(19.5871). 3.1340

(8)(55.2124) (19.5871)Lnβ α − − −− = = −

horas

( )a

LntLntn

LnttR

LnLnLnttR

LnLnLnt

Lni

ii

=−

=−∑ ∑

∑ ∑ ∑∑22

2

.

.)(

1(.

)(

1(.

. αβ

Ordinal (i) Tiempo Tiempo (horas)(horas)

1.070

18.70( ) 1t

F t e

−= −i

iSN

= ( ) iF t S−

1.070

18.70( ) 1t

F t e

−= −Función acumulada Weibull Función acumulada empíricai

iSN

=0.05α =

DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov

(horas)(horas)

1 22 0.087 0.1250.125 0.0380.038

2 55 0.216 0.2500.250 0.0340.034

3 77 0.294 0.3750.375 0.0810.081

4 1111 0.432 0.5000.500 0.0680.068

5 1515 0.546 0.6250.625 0.0790.079

6 1919 0.637 0.7500.750 0.1130.1137 2828 0.785 0.8750.875 0.0900.090

8 4949 0.939 1.0001.000 0.0610.061

18.70( ) 1F t e = −i

iSN

= ( ) iF t S−

α

0.113T = 0.05 0.457K =

0.05T K≺

DISTRIBUCIONES DE PROBABILIDADTest de Kolmogorov - Smirnov

0.05

La hipótesis Ho no puede ser rechazada, por lo tantos los datos de la muestra pueden ser simulados por la distribución de probabilidad Weibull

Cual de las dos distribuciones de probabilidad (Exponencial, Weibull) es la masrecomendada para ajustar los datos de la muestra?La que posea menor valor de T, es decir para este caso la distribución deprobabilidad Exponencial