Post on 01-Oct-2018
EYP2214 Estadística para Construcción Civil 1
Inferencia Estadística
El campo de la inferencia estadística está formado por los métodos utilizados para tomar
decisiones o para obtener conclusiones sobre una población. Estos métodos utilizan la
información contenida en una muestra de la población para obtener conclusiones. La
inferencia estadística puede dividirse en dos grandes áreas: estimación de parámetros y
prueba de hipótesis.
EYP2214 Estadística para Construcción Civil 2
Ejemplo de un problema de estimación de parámetros :
Supóngase que un ingeniero de estructuras analiza la resistencia a la tensión de un
componente empleado en la carrocería de un automóvil. Puesto que la variabilidad existe
de manera natural en la resistencia a la tensión entre distintos componentes, debido a
diferencias en los lotes de la materia prima, en el proceso de fabricación y en los
procedimientos de medición (por ejemplo), el ingeniero está interesado en estimar la
resistencia a la tensión promedio de los componentes.
EYP2214 Estadística para Construcción Civil 3
Una aplicación muy importante de la estadística es obtener estimaciones puntuales de
parámetros tales como la media y la varianza de la población. El objetivo de la
estimación puntual es seleccionar un número, con base en los datos de la muestra, que sea
el valos más plausible de θ . El valor numérico de alguna estadística de la muestra es el
que será utilizado como estimación puntual.
En general, si X es una variable aleatoria con distribución de probabilidad )(xf ,
caracterizada por el parámetro no conocido θ , y si nXX ,...,1 es una muestra aleatoria de
X de tamaño n , entonces la estadística ),...,(ˆ1 nXXh=θ recibe el nombre de estimador
puntual de θ . Nótese que θ es una variable aleatoria, ya que es una función de variables
aleatorias.
EYP2214 Estadística para Construcción Civil 4
Definición
Un estimador es una medida estadística que especifica cómo utilizar los datos de la
muestra para estimar un parámetro desconocido de la población.
Propiedades de los Estimadores :
Estimadores Insesgados
Un estimador debe estar “próximo” en algún sentido al valor verdadero del parámetro
desconocido. De manera formal, se dice que θ es un estimador insesgado de θ si el valor
esperado de θ es igual a θ . Esto equivale a afirmar que la media de la distribución de
probabilidad de θ (o la media de la distribución de muestreo de θ ) es igual a θ .
EYP2214 Estadística para Construcción Civil 5
Definición
Un estimador θ es un estimador insesgado para estimar a θ si
θθ )ˆ( =E
Si el estimador no es insesgado, entonces la diferencia
θθ −)ˆ(E
es conocida como sesgo del estimador θ .
Ejemplo 1
Supóngase que X es una variable aleatoria con media µ y varianza 2σ . Sea nXX ,...,1
una muestra aleatoria de tamaño n tomada de una población representada por X .
Demuéstrese que la media muestral X y la varianza muestral 2S son estimadores
insesgados de µ y 2σ , respectivamente.
EYP2214 Estadística para Construcción Civil 6
En ocasiones existen varios estimadores insesgados del parámetro de la población
muestral. Puesto que no hay un estimador insesgado único, no es posible depender
exclusivamente de esta propiedad para seleccionar el estimador. Se necesita un método
para seleccionar uno de entre varios estimadores insesgados.
Varianza y error cuadrático medio de un estimador puntual
Supóngase que 1θ y 2θ son estimadores insesgados de θ . Esto indica que la distribución
de cada estimador está centrada en el verdadero valor de θ . Sin embargo, las varianzas de
estas distribuciones pueden ser diferentes. Cuando se elige uno de entre varios
estimadores, un principio lógico de estimación es seleccionar el estimador que tenga la
menor varianza.
EYP2214 Estadística para Construcción Civil 7
Definición
Si se consideran todos los estimadores insesgados de θ , el que tiene la menor varianza
recibe el nombre de estimador insesgado de varianza mínima.
Otro método es el error cuadrático medio.
Definición (Error Cuadrático Medio)
El error cuadrático medio de un estimador θ del parámetro θ está definido como
2)ˆ()ˆ( θθθ −= EECM
Obs.
El error cuadrático medio puede reescribirse de la siguiente manera:
2)sesgo()ˆ()ˆ( += θθ VarECM
EYP2214 Estadística para Construcción Civil 8
El error cuadrático medio es un criterio importante para comparar dos estimadores. Sean
1θ y 2θ dos estimadores del parámetro θ , y )ˆ( 1θECM y )ˆ( 2θECM los errores cuadráticos
medios de 1θ y 2θ . Entonces, la eficiencia relativa de 2θ con respecto a 1θ se define
como
)ˆ(
)ˆ(
2
1
θθ
ECM
ECM
si la eficiencia relativa es menor que uno, entonces puede concluirse que 1θ es un
estimador más eficiente de θ que 2θ , en el sentido que tiene un error cuadrático medio
más pequeño.
EYP2214 Estadística para Construcción Civil 9
Ejemplo 2
Supóngase que se desea estimar la media µ de una población. Se tiene una muestra
aleatoria de n observaciones nXX ,...,1 y se quiere comparar dos estimadores posibles de
µ : la media muestral X y una observación de la muestra, por ejemplo iX . ¿Cuál
estimador se utilizaría, y por qué?
Ejemplo 3
Supóngase que 51,..., XX representa una muestra aleatoria de alguna población para la
cual µ=)( iXE y 2)( σ=iXVar , 5,...,1=i . Se proponen como estimadores de µ a los
siguientes: )(5
1ˆ ),2(2
1ˆ ),(2
1ˆ ,ˆ51451351211 XXXXXXXX ++==+=+== θθθθ .
¿Cuál estimador se utilizaría, y por qué?
EYP2214 Estadística para Construcción Civil 10
Método de Máxima Verosimilitud
Uno de los métodos para obtener un estimador puntual de un parámetro es el método de
máxima verosimilitud. Tal como su nombre lo implica, el estimador será el valor del
parámetro que maximiza la función de verosimilitud.
Supóngase, por ejemplo, que una caja contiene cuatro pelotas, de las cuales un número
desconocido θ son blancas y )4( θ− no son blancas. Se extraen al azar dos pelotas y se
cuenta X , el número de pelotas blancas en la muestra. La distribución de probabilidad de
X está dada por
−−
===
2
42
4
)()(xx
xpxXP
θθ
EYP2214 Estadística para Construcción Civil 11
Ahora supóngase que se observa que 1=X . ¿Qué valor de θ hará máxima la
probabilidad de este evento?. De acuerdo con la distribución anterior se tienen que
0)41(2
1)31(
3
2)21(
2
1
6
3
2
41
3
1
1
)11(
0)01(
==
==
==
==
==
==
θ
θ
θ
θ
θ
p
p
p
p
p
EYP2214 Estadística para Construcción Civil 12
Por lo tanto, 2=θ hace máxima la probabilidad de la muestra observada, así que se
escogería este valor, 2, como el estimador de máxima verosimilitud de θ , dado que se ha
observado que 1=X .
Definición
Supóngase que X es una variable aleatoria con distribución de probabilidad ),( θxf ,
donde θ es un parámetro desconocido. Sean nxx ,...,1 los valores observados en una
muestra aleatoria de tamaño n . La función de verosimilitud de la muestra es
),(),(),()( 21 θθθθ nxfxfxfL ⋅⋅⋅=
Nótese que la función de verosimilitud es ahora una función del parámetro desconocido
θ . El estimador de máxima verosimilitud de θ es el valor de θ que maximiza la
función de verosimilitud )(θL .
EYP2214 Estadística para Construcción Civil 13
Nota :
El método de máxima verosimilitud puede emplearse en situaciones donde esxisten
varios parámetros desconocidos (por ejemplo, kθθθ ,,, 21 ), que es necesario estimar. En
tales casos, la función de verosimilitud es una función de los k parámetros desconocidos
kθθθ ,,, 21 , y los estimadores de máxima verosimilitud ˆ iθ se obtienen al igualar a cero
las k derivadas parciales kiL ik ,,2,1 ,),,,( 21 =∂∂ θθθθ , y resolver el sistema de
ecuaciones resultante.
Ejemplo 4
Supóngase que en una sucesión de n intentos Bernoulli independientes, se observan Y
éxitos. Determinar el estimador de máxima verosimilitud de p , la probabilidad de éxito
en cualquier intento dado.
EYP2214 Estadística para Construcción Civil 14
Ejemplo 5
Supóngase que se observan n mediciones independientes de vida útil nXXX ,,, 21 , de
componentes de los que se sabe que sus vidas útiles siguen un modelo Weibull
representado por
0 ,)( /1
>= −−
xex
xf x θγγ
θγ
Suponiendo que se conoce γ , determinar el estimador de máxima verosimilitud de θ .
Ejemplo 6
Sea nXXX ,,, 21 una muestra aleatoria de tamaño n con distribución normal, media µ
y varianza 2σ , donde µ y 2σ son desconocidas. Determinar el estimador de máxima
verosimilitud de µ y 2σ .
EYP2214 Estadística para Construcción Civil 15
Observaciones :
1. Los estimadores de máxima verosimilitud no son necesariamente insesgados.
2. El estimador de máxima verosimilitud es insesgado para n grande. Esto implica que el
estimador de máxima verosimilitud θ es, de manera aproximada, el estimador
insesgado de varianza mínima de θ para n grande ( ∞→n ).
3. Los estimadores de máxima verosimilitud también tienen una propiedad de invarianza.
Esto es, si kθθθ ˆ,,ˆ,ˆ21 , son los estimadores de máxima verosimilitud de los parámetros
kθθθ ,,, 21 , entonces el estimador de máxima verosimilitud de cualquier función
),,,( 21 kh θθθ de estos parámetros, es la misma función )ˆ,,ˆ,ˆ( 21 kh θθθ de los
estimadores kθθθ ˆ,,ˆ,ˆ21 .
EYP2214 Estadística para Construcción Civil 16
Ejemplo 7
Sea X una variable aleatoria igual al número de clientes que solicitan información a una
empresa constructora durante un día. Se quiere saber el número esperado de clientes que
solicitan información en un día y para esto se tomó una muestra aleatoria durante 50 días
de la cantidad de clientes que llegaron por día, obteniéndose:
Además se sabe que la función de probabilidad de esta variable aleatoria es Poisson(λ ).
En base a los datos, encuentre el estimador de máxima verosimilitud de la probabilidad
de que no hayan clientes en un día.
Número de clientes por día 0 1 2 3 4 Cantidad de días observados 17 22 7 3 1
EYP2214 Estadística para Construcción Civil 17
Distribuciones de Muestreo
La distribución de muestreo de una estadística depende de la distribución de la población,
del tamaño de la muestra y del método utilizado para seleccionar ésta.
Definición
La distribución de probabilidad de una estadística recibe el nombre de distribución de
muestreo. Por ejemplo, la distribución de probabilidad de X se conoce como
distribución de muestreo de la media.
EYP2214 Estadística para Construcción Civil 18
Distribución de Muestreo de la Media
Supóngase que se toma una muestra aleatoria de tamaño n de una población normal con
media µ y varianza 2σ . Cada observación de esta muestra (por ejemplo, nXXX ,,, 21 )
es una variable aleatoria distribuida normal e independientemente, con media µ y
varianza 2σ . Entonces se tiene que la media muestral X tiene una distribución normal
con media µ y varianza n/2σ (es decir, )/,( ~ 2 nNX σµ ).
Si se muestrea una población que tiene una distribución de probabilidad desconocida, la
distribución de muestreo de la media muestral seguirá siendo aproximadamente normal
con media µ y varianza n/2σ , si el tamaño de la muestra n es grande. Éste es uno de los
teoremas más útiles en estadística; se le conoce como teorema central del límite.
EYP2214 Estadística para Construcción Civil 19
Teorema central del límite
Si nXXX ,,, 21 es una muestra aleatoria de tamaño n tomada de una población con
media µ y varianza finita 2σ , y si X es la media muestral entonces la forma límite de la
distribución de
n
XZ
/σµ−=
cuando ∞→n , es la distribución normal estándar.
Ejemplo 8
Una compañía de electrónica fabrica resistores que tienen una resistencia promedio de
Ω00 y una desviación estándar de Ω0 . La distribución de la resistencia es normal.
Encuéntrese la probabilidad de que al tomar una muestra de 25=n resistores, la
resistencia promedio de éstos será menor que Ω95 (Rpta. 0.0062).
EYP2214 Estadística para Construcción Civil 20
Definición
El error estándar de una estadística es la desviación estándar de su distribución de
muestreo. Si el error estándar involucra parámetros desconocidos cuyos valores pueden
estimarse, la sustitución de estas estimaciones en el error estándar da como resultado un
error estándar estimado.
Obs.
El error estándar da alguna idea sobre la precisión de la estimación. Por ejemplo, si la
media muestral X se utiliza como estimador puntual de la media poblacional µ , el error
estándar de X mide cuán precisamente X estima a µ .
EYP2214 Estadística para Construcción Civil 21
Ejemplo 9
Un artículo publicado en el Journal of Heat Transfer (Trans. ASME, Ses. C, 96, 1974, pág.
59) describe un nuevo método para medir la conductividad térmica del hierro Armco. Al
utilizar una temperatura de 00 F y una potencia de entrada de 550 W, se obtienen las diez
mediciones siguientes de conductividad térmica (en Btu/hr-ft-F):
41.60 41.48 42.34 41.95 41.86 42.18 41.72 42.26 41.81 42.04
Una estimación puntual de la conductividad térmica promedio a 00 F y 550 W es la media
muestral, X =41.924 Btu/hr-ft-F. El error estándar de la media muestral es nX /σσ = , y
dado que σ es desconocido, puede reemplazarse por la desviación estándar muestral
284.0=s para obtener el error estándar estimado de X como == nX /ˆ σσ
0898.010/284.0 == , el cual es alrededor de 0.2% de la media muestral, lo que implica que
se ha obtenido una estimación puntual relativamente precisa de la conductividad térmica.
EYP2214 Estadística para Construcción Civil 22
Distribuciones importantes en inferencia estadística
Distribución Chi-Cuadrado
Sean kZZZ ,,, 21 variables aleatorias distribuidas normal e independientemente, con
media 0=µ y varianza 12 =σ . Entonces, la variable aleatoria
222
21 kZZZX +++=
tiene la función de densidad de probabilidad
0 para ,)2/(2
1)( 2/1)2/(
2/>
Γ= −− xex
kxf xk
k
y se dice que sigue una distribución chi-cuadrado con k grados de libertad, lo
que se abrevia 2)(kχ .
EYP2214 Estadística para Construcción Civil 23
Propiedades : kX =E y kX 2Var =
Propiedad de aditividad de la distribución chi-cuadrado
Sean pYYY ,,, 21 variables aleatorias chi-cuadrado independientes con pkkk ,,, 21
grados de libertad, respectivamente. Entonces
pYYYY +++= 21
sigue una distribución chi-cuadrado con grados de libertad igual a
∑==
p
iikk
1
Ejemplo 10
Supóngase que nXXX ,,, 21 es una muestra aleatoria tomada de una distribución
normal, con media µ y varianza 2σ . Entonces 2
2)1(
σSn −
está distribuida como 2)1( −nχ .
EYP2214 Estadística para Construcción Civil 24
Distribución t
Sea Z una variable aleatoria con distribución )1,0(N y V una variable aleatoria con
distribución chi-cuadrado con k grados de libertad. Si Z y V son independientes, la
variable aleatoria
kV
ZT
/=
tiene la función de densidad de probabilidad
[ ][ ] ∞<<∞−
+⋅
Γ+Γ= + x
kxkk
kxf
k
1)/(
1
)2/(
2/)1()(
2/)1(2π
y se dice que sigue la distribución t con k grados de libertad, lo que se abrevia como kt .
Propiedades : 0E =X , y 2 para )2/(Var >−= kkkX .
EYP2214 Estadística para Construcción Civil 25
Ejemplo 11
Supóngase que nXXX ,,, 21 es una muestra aleatoria tomada de una distribución
normal, con media µ y varianza 2σ . Entonces nS
XT
/
µ−= sigue una distribución )1( −nt .
Distribución F
Sean W e Y variables aleatorias independientes con distribución chi-cuadrado con
grados de libertad u y v respectivamente. Entonces el cuociente
vY
uWF
/
/=
tiene la función de densidad de probabilidad :
EYP2214 Estadística para Construcción Civil 26
∞<<
+
Γ
Γ
+Γ
= +
−
x
xv
uvu
xv
uvu
xfvu
uu
0 ,
1 22
2)(2/)(
1)2/(2/
y se dice que sigue la distribución F con u y v grados de libertad. Usualmente, esto se
denota como ),( vuF .
Propiedades
2 para )2/(E >−= vvvX , y
4 ,)4()2(
)2(2Var
2
2
>−−
−+= vvvu
vuvX
EYP2214 Estadística para Construcción Civil 27
Relaciones importantes
1. Si ),(~ qpFX entonces ),(~/ pqFX .
2. Si qtX ~ entonces ),1(2 ~ qFX .
Ejemplo 11
Supóngase que se tienen dos poblaciones normales con varianzas 21σ y 2
2σ ,
respectivamente. Se toman dos muestras aleatorias independientes de tamaños 1n y 2n de
las poblaciones 1 y 2, respectivamente, y sean 21S y 2
2S las varianzas muestrales.
Entonces, el cuociente
22
22
21
21
/
/
σσ
S
SF =
tiene una distribución )12,11( −− nnF .