censuratrunc.pdf

32
7/21/2019 censuratrunc.pdf http://slidepdf.com/reader/full/censuratruncpdf 1/32

Transcript of censuratrunc.pdf

Page 1: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 1/32

Page 2: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 2/32

Modelos Censurados y Truncados   Introducción

Introducción

Se dice que la variable dependiente de un modelo está  censurada  sila información referente a dicha variable no está disponible, pero

aquella correspondiente a las variables independientes si lo está.En contraste, si ambas clases de datos no están disponibles para undeterminado grupo de personas, se dice que los datos estántruncados.

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 2 / 32

Page 3: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 3/32

Modelos Censurados y Truncados   Introducción

Introducción

Algunos ejemplos de datos censurados son:

1   Observamos los salarios de mujeres que trabajan, pero no el salario de

reserva de aquellas que no trabajan.2   Hacemos una encuesta para estudiar la compra de bienes durables. Se

puede calcular sólo el gasto de aquellos que optaron por comprar elbien, pero se desconoce el máximo que habrían estado dispuestos apagar aquellos que no compraron un auto.

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 3 / 32

Page 4: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 4/32

Modelos Censurados y Truncados   Introducción

Introducción

Un ejemplo de datos truncados es:

1   Una encuesta menciona que el ingreso promedio es de S/.1500 al mes.

Sin embargo, únicamente se recogieron datos de aquellos jefes de hogarque tenían ingresos superiores a S/.1000. Por consiguiente, elpromedio no es representativo de la población completa, puesto queparte de ella ha sido ignorada en los cálculos. En este caso, estamoshablando de una media  condicional.

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 4 / 32

M d l C d T d I d i

Page 5: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 5/32

Modelos Censurados y Truncados   Introducción

Introducción

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 5 / 32

M d l C d T d T i t

Page 6: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 6/32

Modelos Censurados y Truncados   Truncamiento

Densidad de una variable aleatoria truncada

Es la parte de una distribución que queda por encima o debajo de uncierto valor dado:

f    (x   j x  > a) =   f    (x )Pr (x  > a)

Esto es, truncar equivale a introducir un factor de escala en la funciónde densidad, de manera que integre a 1.

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 6 / 32

Modelos Censurados y Truncados Truncamiento

Page 7: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 7/32

Modelos Censurados y Truncados   Truncamiento

Densidad de una variable aleatoria truncada

En trabajos aplicados se utiliza comúnmente la distribución normaltruncada. Si  x   N 

µ, σ 2

, entonces:

Pr (x  > a) = 1 Φa µ

σ   = 1 Φ (α)

donde  α =   aµσ   .

Entonces:

f    (x   j  x  > a) = 2πσ 21/2

e 1

2 (x µ

σ   )

2

1 Φ (α)  = σ 

1

φ x µ

σ  1 Φ (α)

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 7 / 32

Modelos Censurados y Truncados Truncamiento

Page 8: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 8/32

Modelos Censurados y Truncados   Truncamiento

Momentos de una variable aleatoria truncada

Recordemos las de…niciones de valor esperado y varianza de unadistribución truncada:

E  (x   j x  > a) =Z   ∞a

xf    (x   j x  > a) dx 

Var  (x   j  x  > a) =Z   ∞a

(x   E  (x   j x  > a))2f    (x   j  x  > a) dx 

Para una variable aleatoria normal, con esperanza  µ  y varianza  σ 2,truncada en cierta constante  a, se tiene que:

E  (x   j truncamiento)   =   µ + σλ (α)

Var  (x   j truncamiento)   =   σ 2 (1 δ (α))

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 8 / 32

Modelos Censurados y Truncados Truncamiento

Page 9: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 9/32

Modelos Censurados y Truncados   Truncamiento

Momentos de una variable aleatoria truncada

Donde:

α =   aµσ 

δ (α) = λ (α) [λ (α) α]

λ (α) = (   φ(α)

1Φ(α)   si   x  >

aφ(α)Φ(α)   si   x  < a

Se tiene además que  δ (α) 2 (0, 1)   , 8α. (Intuitivamente, si lavarianza de  x   es  σ 2, la varianza de  x  condicional al truncamiento

debería ser menor a  σ 2

.La variable  λ (α)  se llama la razón de Mills inversa.

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 9 / 32

Modelos Censurados y Truncados Truncamiento

Page 10: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 10/32

Modelos Censurados y Truncados   Truncamiento

Modelo de Regresión Truncada

Sea:y i  =  β0xi  + εi    εi   N 0, σ 2lo cual implica que:

y i   j  xi   N  β0xi , σ 

2

Supongamos que  y i  se encuentra truncada por sobre un valor  a.

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 10 / 32

Modelos Censurados y Truncados   Truncamiento

Page 11: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 11/32

y

Modelo de Regresión Truncada

Entonces, de acuerdo al valor esperado de una variable aleatoriasujeta a truncamiento:

E  (y i   j  x i , y i   > a) = β0x i  + σ φ

a β0xi 

σ 

1 Φ a β0xi 

σ  Equivalentemente, usando la de…nición de la razón de Mills inversa:

E  (y i   j x i , y i   > a) =  β0x i  + σλ (αi )

donde:

λ (αi ) =φ

a β0xi 

σ 

a β0xi 

σ 

,   αi   =   a β0xi 

σ 

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 11 / 32

Modelos Censurados y Truncados   Truncamiento

Page 12: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 12/32

y

Modelo de Regresión Truncada

Por otra parte, la varianza de  y i , condicional en  y i   > a, viene dadapor:

Var  (y i   j x i , y i   > a) = σ 2 [1 δ (αi )]

Adicionalmente, dada la expresión para el valor esperado condicionalal truncamiento, se pueden obtener los efectos marginales para lasubpoblación  (es decir, aquellos individuos que cumplen con  y i   > a):

∂E  (y i   j  x i , y i   > a)

∂xi 

=   β + σ ∂λ (αi )

∂αi  ∂αi 

∂xi =   β [1 δ (αi )]

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 12 / 32

Modelos Censurados y Truncados   Truncamiento

Page 13: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 13/32

Estimación de una Regresión Truncada (I): Mínimos

Cuadrados No Lineales

Sea el modelo:

E  (y i   j x i , y i   > a) + u i  =  β0x i  + σλ (αi ) + u i 

donde  Var  (u i   j xi ) = σ 2 [1 δ (αi )]. Esto implica que  u i   esheterocedástico.

Además, es claro que estimar una regresión de  y i , con  y i   > a  en  x , elestimador de  β  estaría sesgado.

Nótese además que  λi  es una función no lineal de  β  y  σ . Por ello, en

una primera etapa, puede estimarse la ecuación por mínimoscuadrados no lineales, ignorando la heterocedasticidad de  u i .

Una vez que se cuenta con estimadores de  β  y  σ , se corrige porheterocedasticidad, a …n de lograr ganancias en e…ciencia.

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 13 / 32

Modelos Censurados y Truncados   Truncamiento

Page 14: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 14/32

Estimación de una Regresión Truncada (I): Máxima

Verosimilitud

Para estimar el modelo por MV, partimos de la función dedistribución sujeta a truncamiento:

f    (y i   j  xi , y i   > a) =σ 1φ

a β0xi 

σ 

1 Φ a β0xi 

σ  En este contexto, el logaritmo de la función de verosimilitud de unamuestra de  n  observaciones independientes viene dado por:

ln L   =   n2ln (2π ) + ln σ 2   1

2σ 2

n

∑ i =1

y i   β0xi 2

n

∑ i =1

ln

1 Φ

a β0xi 

σ 

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 14 / 32

Modelos Censurados y Truncados   Truncamiento

Page 15: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 15/32

Estimación de una Regresión Truncada (I): Máxima

Verosimilitud

Las condiciones de primer orden son:

∂ ln L

∂β  =

n

∑ i =1

y i   β0xi 

σ 2 

 λi 

σ 

xi   = 0

∂ ln L∂β

  =n

∑ i =1

  12σ 2

 + y i   β0xi 2

2σ 4   αi λi 

2σ 2! = 0

donde:   αi   =   a β0xi 

σ    ,  λi   =   φ(αi )1Φ(αi )

La varianza se puede aproximar por:

Var  (θ) =

0

@n

∑ i =1

∂ lny i , xi ,

 b β, bσ 2∂θ

∂ lny i , xi ,

 b β, bσ 2∂θ 0

1

A

1

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 15 / 32

Modelos Censurados y Truncados   Truncamiento

Page 16: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 16/32

Ejemplo:

Rubinfeld llevó a cabo un estudio de decisiones de voto en unamuestra de 95 individuos en un referéndum sobre impuestos escolaresen una comunidad de Michigan.

Las respuestas a la encuesta proporcionaron una lista de atributos delos votantes, así como estimaciones del ingreso familiar y el precio dela educación.

Esta variable fue calculada como el costo para un individuo de…nanciar un dólar extra por alumno por concepto de gasto escolar en

la comunidad.

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 16 / 32

Modelos Censurados y Truncados   Truncamiento

Page 17: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 17/32

Ejemplo:

Supongamos que sólo se tiene información del gasto deseado eneducación para aquellos individuos que votaron "sí" en el referéndum.En nuestra notación, podríamos asumir que el punto de corte deltruncamiento es  a = 0.

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 17 / 32

Modelos Censurados y Truncados   Truncamiento

Page 18: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 18/32

Ejemplo: Estimación vía Máxima Verosimilitud

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 18 / 32

Modelos Censurados y Truncados   Truncamiento

Page 19: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 19/32

Ejemplo: Estimación vía MCO

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 19 / 32

Modelos Censurados y Truncados   Datos Censurados

Page 20: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 20/32

Introducción

En este caso, todos los valores contenidos en un cierto rango se hantransformado en un  único valor. Por ejemplo, consideremos elnúmero de alumnos que desea inscribirse en una determinada secciónde un curso. Si se llena el total de las vacantes disponibles en dichasección, el número de cupos demandados es censurado al número decupos totales.

Supongamos, por simplicidad, que tenemos una variable aleatoria  y 

censurada en cero. Sólo la parte de la distribución por encima de cero

contiene información relevante sobre  y .

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 20 / 32

Modelos Censurados y Truncados   Datos Censurados

Page 21: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 21/32

Introducción

Cuando los datos están censurados, la distribución de probabilidadesde la variable a analizar es una mezcla de una distribución discreta yotra contínua.

De…namos una variable  y  que posee el siguiente comportamiento:

y  =

  0 si   y   0y  si   y  > 0

donde  y 

es una variable aleatoria con función de distribución   f    (y 

).

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 21 / 32

Modelos Censurados y Truncados   Datos Censurados

Page 22: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 22/32

Introducción

Por ejemplo, si  y   N 

µ, σ 2

, se tiene que:

f    (y ) =8<: Φ µσ   = 1 Φ µσ    si   y   0

2πσ 21/2

exp0.5σ 2 (y   µ)2

  si   y  > 0

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 22 / 32

Modelos Censurados y Truncados   Datos Censurados

Page 23: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 23/32

Momentos de una variable aleatoria normal censurada

Sea  y   N µ, σ 2  una variable censurada en el valor de  a:

y  =

  0 si   y   a

y  si   y  > a

Entonces el valor esperado y la varianza vienen dados por:

E  (y )   =   aΦ (α) + [1 Φ (α)] [µ + σλ (α)]

Var  (y )   =   σ 2 [1 Φ (α)]

h1 δ (α) + (α λ (α))2

Φ (α)

idonde Pr (y   a) = Φ (α),  α =   aµσ   ,  λ =   φ(α)

1Φ(α),

δ (α) = λ (α) [λ (α) α]

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 23 / 32

Modelos Censurados y Truncados   Datos Censurados

Page 24: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 24/32

Modelo Tobit

Supongamos que  y  es una función lineal de  x  más un componentealeatorio:

y i    =  β0xi  + εi 

Por ejemplo, supongamos que  y  mide el gasto efectivo enautomóviles en el caso de aquellos individuos que han comprado y elgasto deseado en el caso de aquellos que no. El vector de regresoresx i  incluye, por ejemplo, el nivel de ingreso y el número de individuosen el grupo familiar.

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 24 / 32

Modelos Censurados y Truncados   Datos Censurados

Page 25: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 25/32

Modelo Tobit

En la práctica,  y  no es observable para aquellos individuos que nohan comprado. Por consiguiente, esta variable se encuentra censuradaen cero. Como resultado, la variable dependiente está dada por:

y i  =   0 si   y i     0

y i    si   y i    > 0

Si utilizamos la expresión de valor esperado presentada anteriormente,obtenemos que:

E  (y i   j  xi ) = Φ β0xi 

σ   β0xi  + σλi 

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 25 / 32

Modelos Censurados y Truncados   Datos Censurados

Page 26: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 26/32

Modelo Tobit

Los impactos marginales de  xi  sobre la esperanza de la variableobservada son:

∂E  (y i   j  xi )

∂xi 

=  βΦ

 β0xi 

σ 

Mientras que para la variable latente  y 

se tiene:∂E  (y i    j  xi )

∂xi 

= β

De lo anterior, vemos que el primer efecto marginal se calcula

re-escalando el vector  β  por la probabilidad de ubicarse en la regióncensurada, esto es, por la probabilidad de que  y i    > 0.

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 26 / 32

Modelos Censurados y Truncados   Datos Censurados

Page 27: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 27/32

Modelo Tobit

Dado que  Φ  β0x i σ  λi  = φ  β0x i σ 

, podemos reescribir el efecto

marginal sobre la variable observada como:

∂E  (y i   j xi )

∂xi 

=   β [Φi  (1 λi  (λi   αi )) + φi  (λi   αi )]

=   Φi  β (1 δi ) + βφi  (λi   αi )

donde  Φi   = Φ  β0x i σ  ,  φi 

 β0x i σ  ,  αi  =  β0x i 

σ   ,  λi  =φi 

 β0x i σ 

Φ β

0x i 

σ    ,

δi  = λi  (λi   αi ).

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 27 / 32

Modelos Censurados y Truncados   Datos Censurados

Page 28: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 28/32

Modelo Tobit

Este efecto marginal puede presentarse de una forma un poco másintuitiva:

∂E  (y i   j  xi )

∂xi 

=   Pr (y i    > 0 j xi ) ∂E  (y i    j xi , y 

i    > 0)

∂xi 

+E  (y i    j x i , y i    > 0) ∂ Pr (y i    > 0 j  xi )∂xi 

Con ello, el efecto de un cambio marginal en  x i   sobre  y i   puededescomponerse en dos efectos:

1   El efecto sobre la media y i    condicional a que  y i    > 0.2   El efecto sobre la probabilidad de que la observación caiga en aquella

parte de la distribución en que  y i    > 0.

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 28 / 32

Modelos Censurados y Truncados   Datos Censurados

Page 29: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 29/32

Estimación (I): Modelo de Heckman en Dos Etapas

Recordemos que:

E  (y i    j xi 

,

y i    > 0) = β

0

xi  + σλi 

Este procedimiento consiste, en una primera etapa, en estimar el ratio

inverso de Mills  λi   =φ

 β0xi σ 

Φ

 β0xi σ 

 mediante un modelo probit.

Este último es estimado vía máxima verosimilitud distinguiendoaquellas observaciones para las cuales  y i    > 0 de aquellas para lascuales  y i     0. Esto es, de…nimos  z  = 1 si  y i    > 0 y  z  = 0 si  y i     0.

En una segunda etapa se estima el modelo:

y i   j y i   > 0 = β0xi  + σ  bλi  + u i 

es decir, se incluye  λi  como una variable explicativa adicional. Nóteseque esta regresión se estima únicamente para aquellas observacionesen las que  y i   > 0.

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 29 / 32

Modelos Censurados y Truncados   Datos Censurados

( )

Page 30: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 30/32

Estimación (I): Modelo de Heckman en Dos Etapas

Sin embargo, este procedimiento posee algunos inconvenientes:

1   El error  u i  es heterocedástico:   Var  (u i   j  x i ) =  σ 2 [1 δ (αi )], con locual los estadígrafos t calculados sin tomar en cuenta este problema

estarán sesgados.2   Dado que la variable  λi  es estimada en un paso previo, es una función

de parámetros que tienen asociados una determinada varianza. Elloconduce a que los errores estándar de la regresión de la segunda etapano sean los correctos.

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 30 / 32

Modelos Censurados y Truncados   Datos Censurados

E i i (II) M i V i ili d

Page 31: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 31/32

Estimación (II): Máxima Verosimilitud

Para una muestra de  n  observaciones independientes, el logaritmo dela función de verosimilitud vendrá dado por:

ln L   =   ∑ y i >0

12"ln (2π ) + ln σ 2+ y i   β

0

xi 2

σ 2#

+ ∑ y i =0

ln

1 Φ

 β0xi 

σ 

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 31 / 32

Modelos Censurados y Truncados   Datos Censurados

Ej l

Page 32: censuratrunc.pdf

7/21/2019 censuratrunc.pdf

http://slidepdf.com/reader/full/censuratruncpdf 32/32

Ejemplo:

La siguiente tabla muestra la estimación de un modelo Tobit para losdatos de los votantes del referéndum descritos anteriormente:

Luis Bendezú M. (OSINERGMIN)   Modelos Truncados y Censurados   Febrero 2009 32 / 32