Modelos de distribuciones discretas y...

Modelos de distribuciones discretas y continuas

Estadıstica I — curso 2008–2009

Ignacio Cascos FernandezDepartamento de Estadıstica

Universidad Carlos III de Madrid

1. Distribuciones discretas

Aquellas que estan asociadas a variables aleatorias discretas.

Distribucion degenerada. Una variable aleatoria X es degenerada en unvalor real a ∈ R si toma dicho valor con probabilidad 1, es decir P (X = a) =1, su media y varianza son entonces obvias a partir de resultados del temaanterior,

E[X] = a ; var[X] = 0.

1.1. Proceso de Bernoulli

1.1.1. Modelos principales asociados al proceso de Bernoulli

Distribucion de Bernoulli, B(1, p). Una variable aleatoria X sigue dis-tribucion de Bernoulli de parametro p ∈ (0, 1) y se denota X ∼ B(1, p) sidescribe el numero de exitos en una realizacion de un experimento que tie-ne probabilidad de exito p (probabilidad de fracaso 1− p). Toma valores en{0, 1}.

P (X = 1) = p ; P (X = 0) = 1− p ;

E[X] = p ; var[X] = p(1− p).

1

Distribucion Binomial, B(n, p). Una variable aleatoria X sigue distri-bucion Binomial de parametros n ∈ N y p ∈ (0, 1) y se denota X ∼ B(n, p)si describe el numero de exitos en n realizaciones independientes de un ex-perimento que tiene probabilidad de exito p (probabilidad de fracaso 1− p).Puede tomar cualquier valor en {0, 1, . . . , n}.

Si k ∈ {0, 1, . . . , n}, se cumple

P (X = k) =

(n

k

)pk(1− p)n−k ;

E[X] = np ; var[X] = np(1− p).

Propiedad. Las distribuciones binomiales son reproductivas de parametron, es decir, dadas dos variables aleatorias X ∼ B(n1, p) e Y ∼ B(n2, p)independientes, se cumple X + Y ∼ B(n1 + n2, p).

A partir de este resultado es inmediato que una variable aleatoria X ∼B(n, p) puede descomponerse en una suma de n variables aleatorias indepen-dientes de Bernoulli de parametro p.

Distribucion Geometrica o de Pascal, Ge(p). Una variable aleatoria Xsigue distribucion Geometrica de parametro p ∈ (0, 1) y se denota X ∼ Ge(p)si describe el numero de realizaciones independientes de un experimento ne-cesarias hasta obtener el primer exito, siendo p la probabilidad de exito enuna realizacion del experimento (probabilidad de fracaso 1−p). Puede tomarcomo valor cualquier numero natural, {1, 2, . . .}.

Si k ∈ {1, 2, . . .}, se cumple

P (X = k) = (1− p)k−1p ;

E[X] =1

p; var[X] =

1− pp2

.

1.1.2. Otros modelos asociados al proceso de Bernoulli

Distribucion Binomial Negativa, BN(r, p). Una variable aleatoria Xsigue distribucion Binomial Negativa de parametros r ∈ N y p ∈ (0, 1) y sedenota X ∼ BN(r, p) si describe el numero de fracasos de un experimentoantes del r-esimo exito, siendo las realizaciones del experimento indepen-dientes y en cada una de ellas p la probabilidad de exito (probabilidad de

2

fracaso 1 − p). Puede tomar cualquier valor entero mayor o igual que cero,{0, 1, 2, . . .}.

Si k ∈ {0, 1, 2, . . .}, se cumple

P (X = k) =

(r + k − 1

r − 1

)pr(1− p)k ;

E[X] =r(1− p)

p; var[X] =

r(1− p)p2

.

Distribucion Hipergeometrica, H(N, n,D/N). Una variable aleatoriaX sigue distribucion Hipergeometrica de parametros N ∈ N, n ∈ N conn ≤ N y D/N con D ∈ N, D ≤ N y se denota X ∼ H(N, n,D/N) sidescribe el numero de individuos que tienen una cierta caracterıstica en nobservaciones sin reemplazamiento en una poblacion de N individuos de entrelos que D tienen la caracterıstica (N −D no tienen la caracterıstica). Puedetomar cualquier valor entero mayor o igual que max{0, n+D−N} y menoro igual que mın{n,D}.

Si max{0, n+D −N} ≤ k ≤ mın{n,D}, se cumple

P (X = k) =

(Dk

)(N−Dn−k

)(Nn

) ;

E[X] = nD

N; var[X] = n× D

N× N −D

N× N − nN − 1

.

1.2. Proceso de Poisson

Distribucion de Poisson, P(λ). Una variable aleatoria X sigue distribu-cion de Poisson de parametro λ > 0 y se denota X ∼ P(λ) si representa elnumero de eventos ocurridos independientemente y a velocidad constante ocon intensidad constante en un tiempo o region fija. Puede tomar cualquiervalor entero mayor o igual que cero, {0, 1, 2, . . .}.

Si k ∈ {0, 1, 2, . . .}, se cumple

P (X = k) =λk

k!e−λ ;

E[X] = λ ; var[X] = λ.

Propiedad. Las distribuciones de Poisson son reproductivas, es decir, da-das X ∼ P(λ1) e Y ∼ P(λ2) independientes, se cumple X+Y ∼ P(λ1 +λ2).

3

2. Distribuciones continuas

Aquellas que estan asociadas a variables aleatorias continuas.

Distribucion Uniforme, U(a, b). Una variable aleatoria X sigue distribu-cion uniforme de parametros a < b y se denota X ∼ U(a, b) si toma valoresen el intervalo (a, b) segun la siguiente funcion de densidad,

fX(x) =

{1b−a si x ∈ (a, b)

0 si x /∈ (a, b); FX(x) =

0 si x < ax−ab−a si a ≤ x < b

1 si x ≥ b;

E[X] =a+ b

2; var[X] =

(b− a)2

12.

2.1. Proceso de Poisson

Distribucion Exponencial, Exp(λ). Una variable aleatoria X sigue dis-tribucion exponencial de parametro λ > 0 y se denota X ∼ Exp(λ) si tomavalores positivos segun la siguiente funcion de densidad,

fX(x) =

{λe−λx si x > 0

0 si x ≤ 0; FX(x) =

{0 si x < 0

1− e−λx si x ≥ 0;

E[X] =1

λ; var[X] =

1

λ2.

Propiedad. Las distribucion exponencial no tiene memoria, es decir dadaX ∼ Exp(λ) y t1, t2 > 0,

P (X > t1 + t2|X > t1) = P (X > t2).

4

2.2. Distribucion Normal

Distribucion Normal, N(µ, σ). Una variable aleatoria X sigue distribu-cion normal de media µ y desviacion tıpica σ y se denota X ∼ N(µ, σ) sitoma valores en toda la recta real, segun la siguiente funcion de densidad,

fX(x) =1

σ√

2πe−

(x−µ)2

2σ2 .

No podemos dar de forma explıcita ninguna primitiva de esta funcion, porlo tanto la funcion de distribucion solo podemos describirla como FX(x) =∫ x−∞ fX(t)dt.

E[X] = µ ; var[X] = σ2.

Llamamos normal tipificada o estandar a la normal de media 0 y desvia-cion tıpica 1, N(0, 1).

Propiedad. Dados a, b ∈ R y X una variable aleatoria tal que X ∼N(µ, σ), entonces la variable aleatoria aX + b sigue distribucion normal, masconcretamente

aX + b ∼ N(aµ+ b, |a|σ).

Utilizando esta propiedad podemos tipificar cualquier variable aleatoria nor-mal, se cumple X−µ

σ∼ N(0, 1).

Propiedad. Si X ∼ N(0, 1) y FX es su funcion de distribucion, por lasimetrıa de la distribucion normal, se cumple que para cualquier x ∈ R,FX(−x) = 1− FX(x).

Propiedad. La suma de dos variables aleatorias normales independientessigue distribucion normal. Ası, si X ∼ N(µ1, σ1) e Y ∼ N(µ2, σ2) son inde-pendientes, entonces

X + Y ∼ N(µ1 + µ2,

√σ2

1 + σ22

).

Teorema Central del Lımite. Si X1, X2, . . . , Xn son n variables aleato-rias independientes e identicamente distribuidas con media µ y desviaciontıpica σ, entonces, entonces

∑ni=1Xi se aproxima a una N(nµ, σ

√n), equiva-

lentemente∑n

i=1Xi/n se aproxima a una N(µ, σ/√n). La aproximacion es

buena si n ≥ 30.

5

Correccion por continuidad. Si aplicamos el Teorema Central del Lımitea variables aleatorias discretas con valores enteros, mientras que X1 + X2 +. . . + Xn es discreta (y toma valores enteros), la normal es continua. Ası,para aproximar la probabilidad de X1 + X2 + . . . + Xn ≤ a donde a ∈ N,calculamos FN(nµ,σ

√n)(a+ 1/2).

Aproximacion Binomial-Normal. Si n ≥ 30 y np(1− p) > 5, podemosaproximar una binomial B(n, p) por una normal N(np,

√np(1− p)). Observa

que una binomial se puede construir como suma de variables de Bernoulliindependientes.

Aproximacion Poisson-Normal. La distribucion de Poisson surge comolımite e la Binomail cuando el numero de experimentos tiende a infinito.Por tanto, si λ > 5, podemos aproximar una Poisson P(λ) por una normalN(λ,

√λ).

2.3. Distribuciones relacionadas con la normal

Distribucion χ2 de Pearson, χ2n. Si X1, X2, . . . , Xn son n variables alea-

torias independientes con distribucion N(0, 1), entonces

Y = X21 +X2

2 + . . .+X2n

sigue distribucion chi-cuadrado de Pearson con n grados de libertad, Y ∼χ2n. Una variable aleatoria con distribucion chi-cuadrado solo toma valores

positivos.E[Y ] = n ; var[Y ] = 2n.

Distribucion t de Student, tn. Si X e Y son dos variables aleatoriasindependientes, de tal modo que X sigue una distribucion normal estandare Y sigue distribucion chi-cuadrado con n grados de libertad, entonces

Z =X√Y/n

sigue distribucion t con n grados de libertad, Z ∼ tn. Una variable aleatoriacon distribucion t toma valores en toda la recta real.

E[X] = 0 ; var[X] =n

n− 2si n ≥ 3.

6

Distribucion F de Fisher-Snedecor, Fn1,n2. Si X e Y son dos variablesaleatorias independientes, de tal modo que X sigue una distribucion chi-cuadrado con n1 grados de libertad e Y sigue distribucion chi-cuadrado conn2 grados de libertad, entonces

Z =X/n1

Y/n2

sigue distribucion F con n1 y n2 grados de libertad, Z ∼ Fn1,n2 . Una variablealeatoria con distribucion F solo toma valores positivos.

7

Modelos de distribuciones discretas y...

Documents

Transcript of Modelos de distribuciones discretas y...