Modelos de distribuciones discretas y...
Transcript of Modelos de distribuciones discretas y...
Modelos de distribuciones discretas y continuas
Estadıstica I — curso 2008–2009
Ignacio Cascos FernandezDepartamento de Estadıstica
Universidad Carlos III de Madrid
1. Distribuciones discretas
Aquellas que estan asociadas a variables aleatorias discretas.
Distribucion degenerada. Una variable aleatoria X es degenerada en unvalor real a ∈ R si toma dicho valor con probabilidad 1, es decir P (X = a) =1, su media y varianza son entonces obvias a partir de resultados del temaanterior,
E[X] = a ; var[X] = 0.
1.1. Proceso de Bernoulli
1.1.1. Modelos principales asociados al proceso de Bernoulli
Distribucion de Bernoulli, B(1, p). Una variable aleatoria X sigue dis-tribucion de Bernoulli de parametro p ∈ (0, 1) y se denota X ∼ B(1, p) sidescribe el numero de exitos en una realizacion de un experimento que tie-ne probabilidad de exito p (probabilidad de fracaso 1− p). Toma valores en{0, 1}.
P (X = 1) = p ; P (X = 0) = 1− p ;
E[X] = p ; var[X] = p(1− p).
1
Distribucion Binomial, B(n, p). Una variable aleatoria X sigue distri-bucion Binomial de parametros n ∈ N y p ∈ (0, 1) y se denota X ∼ B(n, p)si describe el numero de exitos en n realizaciones independientes de un ex-perimento que tiene probabilidad de exito p (probabilidad de fracaso 1− p).Puede tomar cualquier valor en {0, 1, . . . , n}.
Si k ∈ {0, 1, . . . , n}, se cumple
P (X = k) =
(n
k
)pk(1− p)n−k ;
E[X] = np ; var[X] = np(1− p).
Propiedad. Las distribuciones binomiales son reproductivas de parametron, es decir, dadas dos variables aleatorias X ∼ B(n1, p) e Y ∼ B(n2, p)independientes, se cumple X + Y ∼ B(n1 + n2, p).
A partir de este resultado es inmediato que una variable aleatoria X ∼B(n, p) puede descomponerse en una suma de n variables aleatorias indepen-dientes de Bernoulli de parametro p.
Distribucion Geometrica o de Pascal, Ge(p). Una variable aleatoria Xsigue distribucion Geometrica de parametro p ∈ (0, 1) y se denota X ∼ Ge(p)si describe el numero de realizaciones independientes de un experimento ne-cesarias hasta obtener el primer exito, siendo p la probabilidad de exito enuna realizacion del experimento (probabilidad de fracaso 1−p). Puede tomarcomo valor cualquier numero natural, {1, 2, . . .}.
Si k ∈ {1, 2, . . .}, se cumple
P (X = k) = (1− p)k−1p ;
E[X] =1
p; var[X] =
1− pp2
.
1.1.2. Otros modelos asociados al proceso de Bernoulli
Distribucion Binomial Negativa, BN(r, p). Una variable aleatoria Xsigue distribucion Binomial Negativa de parametros r ∈ N y p ∈ (0, 1) y sedenota X ∼ BN(r, p) si describe el numero de fracasos de un experimentoantes del r-esimo exito, siendo las realizaciones del experimento indepen-dientes y en cada una de ellas p la probabilidad de exito (probabilidad de
2
fracaso 1 − p). Puede tomar cualquier valor entero mayor o igual que cero,{0, 1, 2, . . .}.
Si k ∈ {0, 1, 2, . . .}, se cumple
P (X = k) =
(r + k − 1
r − 1
)pr(1− p)k ;
E[X] =r(1− p)
p; var[X] =
r(1− p)p2
.
Distribucion Hipergeometrica, H(N, n,D/N). Una variable aleatoriaX sigue distribucion Hipergeometrica de parametros N ∈ N, n ∈ N conn ≤ N y D/N con D ∈ N, D ≤ N y se denota X ∼ H(N, n,D/N) sidescribe el numero de individuos que tienen una cierta caracterıstica en nobservaciones sin reemplazamiento en una poblacion de N individuos de entrelos que D tienen la caracterıstica (N −D no tienen la caracterıstica). Puedetomar cualquier valor entero mayor o igual que max{0, n+D−N} y menoro igual que mın{n,D}.
Si max{0, n+D −N} ≤ k ≤ mın{n,D}, se cumple
P (X = k) =
(Dk
)(N−Dn−k
)(Nn
) ;
E[X] = nD
N; var[X] = n× D
N× N −D
N× N − nN − 1
.
1.2. Proceso de Poisson
Distribucion de Poisson, P(λ). Una variable aleatoria X sigue distribu-cion de Poisson de parametro λ > 0 y se denota X ∼ P(λ) si representa elnumero de eventos ocurridos independientemente y a velocidad constante ocon intensidad constante en un tiempo o region fija. Puede tomar cualquiervalor entero mayor o igual que cero, {0, 1, 2, . . .}.
Si k ∈ {0, 1, 2, . . .}, se cumple
P (X = k) =λk
k!e−λ ;
E[X] = λ ; var[X] = λ.
Propiedad. Las distribuciones de Poisson son reproductivas, es decir, da-das X ∼ P(λ1) e Y ∼ P(λ2) independientes, se cumple X+Y ∼ P(λ1 +λ2).
3
2. Distribuciones continuas
Aquellas que estan asociadas a variables aleatorias continuas.
Distribucion Uniforme, U(a, b). Una variable aleatoria X sigue distribu-cion uniforme de parametros a < b y se denota X ∼ U(a, b) si toma valoresen el intervalo (a, b) segun la siguiente funcion de densidad,
fX(x) =
{1b−a si x ∈ (a, b)
0 si x /∈ (a, b); FX(x) =
0 si x < ax−ab−a si a ≤ x < b
1 si x ≥ b;
E[X] =a+ b
2; var[X] =
(b− a)2
12.
2.1. Proceso de Poisson
Distribucion Exponencial, Exp(λ). Una variable aleatoria X sigue dis-tribucion exponencial de parametro λ > 0 y se denota X ∼ Exp(λ) si tomavalores positivos segun la siguiente funcion de densidad,
fX(x) =
{λe−λx si x > 0
0 si x ≤ 0; FX(x) =
{0 si x < 0
1− e−λx si x ≥ 0;
E[X] =1
λ; var[X] =
1
λ2.
Propiedad. Las distribucion exponencial no tiene memoria, es decir dadaX ∼ Exp(λ) y t1, t2 > 0,
P (X > t1 + t2|X > t1) = P (X > t2).
4
2.2. Distribucion Normal
Distribucion Normal, N(µ, σ). Una variable aleatoria X sigue distribu-cion normal de media µ y desviacion tıpica σ y se denota X ∼ N(µ, σ) sitoma valores en toda la recta real, segun la siguiente funcion de densidad,
fX(x) =1
σ√
2πe−
(x−µ)2
2σ2 .
No podemos dar de forma explıcita ninguna primitiva de esta funcion, porlo tanto la funcion de distribucion solo podemos describirla como FX(x) =∫ x−∞ fX(t)dt.
E[X] = µ ; var[X] = σ2.
Llamamos normal tipificada o estandar a la normal de media 0 y desvia-cion tıpica 1, N(0, 1).
Propiedad. Dados a, b ∈ R y X una variable aleatoria tal que X ∼N(µ, σ), entonces la variable aleatoria aX + b sigue distribucion normal, masconcretamente
aX + b ∼ N(aµ+ b, |a|σ).
Utilizando esta propiedad podemos tipificar cualquier variable aleatoria nor-mal, se cumple X−µ
σ∼ N(0, 1).
Propiedad. Si X ∼ N(0, 1) y FX es su funcion de distribucion, por lasimetrıa de la distribucion normal, se cumple que para cualquier x ∈ R,FX(−x) = 1− FX(x).
Propiedad. La suma de dos variables aleatorias normales independientessigue distribucion normal. Ası, si X ∼ N(µ1, σ1) e Y ∼ N(µ2, σ2) son inde-pendientes, entonces
X + Y ∼ N(µ1 + µ2,
√σ2
1 + σ22
).
Teorema Central del Lımite. Si X1, X2, . . . , Xn son n variables aleato-rias independientes e identicamente distribuidas con media µ y desviaciontıpica σ, entonces, entonces
∑ni=1Xi se aproxima a una N(nµ, σ
√n), equiva-
lentemente∑n
i=1Xi/n se aproxima a una N(µ, σ/√n). La aproximacion es
buena si n ≥ 30.
5
Correccion por continuidad. Si aplicamos el Teorema Central del Lımitea variables aleatorias discretas con valores enteros, mientras que X1 + X2 +. . . + Xn es discreta (y toma valores enteros), la normal es continua. Ası,para aproximar la probabilidad de X1 + X2 + . . . + Xn ≤ a donde a ∈ N,calculamos FN(nµ,σ
√n)(a+ 1/2).
Aproximacion Binomial-Normal. Si n ≥ 30 y np(1− p) > 5, podemosaproximar una binomial B(n, p) por una normal N(np,
√np(1− p)). Observa
que una binomial se puede construir como suma de variables de Bernoulliindependientes.
Aproximacion Poisson-Normal. La distribucion de Poisson surge comolımite e la Binomail cuando el numero de experimentos tiende a infinito.Por tanto, si λ > 5, podemos aproximar una Poisson P(λ) por una normalN(λ,
√λ).
2.3. Distribuciones relacionadas con la normal
Distribucion χ2 de Pearson, χ2n. Si X1, X2, . . . , Xn son n variables alea-
torias independientes con distribucion N(0, 1), entonces
Y = X21 +X2
2 + . . .+X2n
sigue distribucion chi-cuadrado de Pearson con n grados de libertad, Y ∼χ2n. Una variable aleatoria con distribucion chi-cuadrado solo toma valores
positivos.E[Y ] = n ; var[Y ] = 2n.
Distribucion t de Student, tn. Si X e Y son dos variables aleatoriasindependientes, de tal modo que X sigue una distribucion normal estandare Y sigue distribucion chi-cuadrado con n grados de libertad, entonces
Z =X√Y/n
sigue distribucion t con n grados de libertad, Z ∼ tn. Una variable aleatoriacon distribucion t toma valores en toda la recta real.
E[X] = 0 ; var[X] =n
n− 2si n ≥ 3.
6
Distribucion F de Fisher-Snedecor, Fn1,n2. Si X e Y son dos variablesaleatorias independientes, de tal modo que X sigue una distribucion chi-cuadrado con n1 grados de libertad e Y sigue distribucion chi-cuadrado conn2 grados de libertad, entonces
Z =X/n1
Y/n2
sigue distribucion F con n1 y n2 grados de libertad, Z ∼ Fn1,n2 . Una variablealeatoria con distribucion F solo toma valores positivos.
7