Modelos de Probabilidad

29
CURSO DE ECONOMETRÌA II TEMA:MODELOS CON VARIABLES DEPENDIENTES CUALITATIVAS Y LIMITADAS Profesor : Mag. Cornelio Ticse Nùñez

description

los modelos de probabilidad, regresion de datos de una muestra

Transcript of Modelos de Probabilidad

Page 1: Modelos de Probabilidad

CURSO DE ECONOMETRÌA II

TEMA:MODELOS CON VARIABLES DEPENDIENTES CUALITATIVAS Y LIMITADAS

Profesor : Mag. Cornelio Ticse Nùñez

Page 2: Modelos de Probabilidad

MODELOS DE REGRESION CUALITATIVA

En un modelo en donde Yt es cuantitativa, el objetivo

consiste en estimar su valor esperado, o media

esperada. En modelos donde Yt es cualitativa, el

objetivo es encontrar la probabilidad de que un

acontecimiento suceda, como por ejemplo: enviar a los

hijos a la escuela pública, poseer una casa propia,

pertenecer o no a un sindicato, o practicar algún

deporte, etc. Por tanto, los modelos de regresión con

respuestas cualitativas a menudo se les conoce como

modelos de probabilidad que pueden ser discretas o

continuas.

Page 3: Modelos de Probabilidad

Al respecto se plantean las siguientes preguntas:

 1.- ¿Cómo se estiman los modelos de regresión con

respuestas cualitativas?, ¿se puede simplemente

estimarlos con los procedimientos usuales de los

MCO?

2.¿Se presentan problemas de inferencia especiales? En

otras palabras, ¿el procedimiento de pruebas de

hipótesis se diferencia de aquellos modelos de

regresión con variable de medición cuantitativa?

3.  Si la variable regresada es cualitativa, ¿cómo se mide

la bondad de ajuste en dicho modelo?, ¿Las pruebas

de inferencia usuales tienen vigencia?

Page 4: Modelos de Probabilidad

4.- ¿Cómo se elaboran los modelos para

fenómenos como el número de visitas al

médico en un año, la cantidad de patentes

que registra una empresa en un período

determinado, el número de artículos

publicados por un profesor universitario

durante un quinquenio, el número de

llamadas telefónicas recibidas en el lapso de

cinco minutos?

Dichos fenómenos, llamados datos de conteo, o

eventos raros, son un ejemplo del proceso (de

probabilidad) de Poisson.

Page 5: Modelos de Probabilidad

Se comienza el estudio de modelos con respuesta cualitativa considerando en primer lugar el modelo de regresión con respuesta binaria. Hay tres métodos para desarrollar un modelo de probabilidad con variable de respuesta binaria:

1.     El modelo Lineal de Probabilidad (MLP)

2.     El modelo Logit

3.     El modelo Probit

En vista de su simplicidad relativa y debido a que puede estimarse mediante MCG, se estudia primero el MLP, dejando los otros dos modelos para una presentación posterior.

Page 6: Modelos de Probabilidad

MODELO LINEAL DE PROBABILIDAD (MLP)

Para fijar las ideas, considérese el modelo simple:

Yi = β1+ β2 Xi + µi (*)

donde Xi = el ingreso familiar

Yi = 1 si la familia posee una casa

= 0 si la familia no posee una casa

  Modelos tales como (*), que se asemeja a un modelo de regresión lineal, se denomina Modelo Lineal de Probabilidad (MLP) ya que la variable regresada es dicótoma. Por tanto E(Yi/Xi) expresa la esperanza condicional de Yi dado Xi. ; es decir la probabilidad condicional de que el evento suceda dado Xi.

Page 7: Modelos de Probabilidad

Así, en el caso anterior, E(Yi/Xi) da la probabilidad de que una familia posea una casa y tenga un ingreso de una cierta cantidad . La justificación del nombre MLP para modelos como (*) puede ser la siguiente.

 

E(Yi/Xi)=β1 + β2Xi

Asumiendo que Pi = probabilidad de que Yi= 1 (es decir, de que el evento ocurra) y (1 – Pi )= probabilidad de que Yi=0 (es decir, de que el evento no ocurra), la variable Y tiene la distribución de probabilidad de Bernoulli.

Page 8: Modelos de Probabilidad

El MLP plantea diversos problemas a saber:

El supuesto de normalidad para ui ya no se mantiene en los MLP porque, al igual que Yi,ui solamente toma dos valores; es decir, también sigue la distribución de Bernoulli. Para ver esto, se escribe como:

La probabilidad de distribución de ui es

ui Probabilidad

Cuando Yi = 1 1-β1-β2Xi Pi

Cuando Yi = 0 -β1-β2Xi (1- Pi)

Page 9: Modelos de Probabilidad

Obviamente, no puede suponerse que esté normalmente distribuida; en realidad ésta sigue la distribución de Bernoulli

Por consiguiente, en muestras grandes, la inferencia estadística del MLP seguirá el procedimiento MCO usual bajo el supuesto de normalidad.

La varianza del error es heteroscedástica. Para la distribución del término de error dado, por definición de varianza, se tiene que :

var (ui) = Pi(1- Pi)

que sigue la distribución de Bernoulli

Page 10: Modelos de Probabilidad

Es decir, la varianza del término de error en el MLP es heteroscedástica. Puesto que , la varianza de depende, al final de cuentas, de los valores de X y por lo tanto no es homoscedástica.

  Puesto que la varianza de depende de una forma de resolver el problema de heteroscedasticidad es transformar el modelo dividiendo ambos lados del modelo por

 Como se puede verificar con relativa facilidad, que el término de error transformado por sqr(wi) es homocedástico. Por consiguiente el modelo inicial ahora se puede estimar por MCO, el cual no es otra cosa que la aplicación de mínimos cuadrados ponderados (MCP), donde wi son las ponderaciones.

Page 11: Modelos de Probabilidad

ALTERNATIVAS AL MLP

Como se ha visto, el MLP tiene infinidad de problemas, tales como 1) la no normalidad de los , 2) la heteroscedasticidad de , 3) la posibilidad de que se encuentre fuera del rango [0,1] y 4) los valores generalmente bajos de R2. Pero estos problemas se pueden resolver. Por ejemplo, se puede utilizar el MCP para resolverle problema de heteroscedasticidad o incrementar el tamaño de la muestra y minimizar así el problema de la no normalidad. Recurriendo a las técnicas de mínimos cuadrados restringidos o de programación matemática, es posible hacer que las probabilidades estimadas se encuentren dentro del intervalo [0,1]

Page 12: Modelos de Probabilidad

El sigmoide o curva en forma de S, se parece mucho a la función de distribución acumulativa de una variable aleatoria (FDA). Por consiguiente se puede utilizar fácilmente la FDA en regresiones de modelos en los cuales la variable de respuesta es dicótoma, adquiriendo valores 0-1. La pregunta práctica ahora es, ¿cuál FDA? Puesto que aunque todas las FDA tienen la forma de S, para cada variable aleatoria hay una FDA única. Por razones históricas la igual que prácticas, las FDA comúnmente seleccionadas para representar los modelos de respuesta 0-1 son: 1) la logística y 2) la normal; la primera da lugar al modelo logit y la segunda, al modelo probit (o normit). 

Page 13: Modelos de Probabilidad

Pero considérese ahora la siguiente representación de la propiedad de vivienda: 

 

Para facilidad de la exposición, se escribe como: 

La ecuación representa lo que se conoce como función de distribución logística (acumulativa).

Page 14: Modelos de Probabilidad

Es facil verificar que a medida que Zi se encuentra

dentro de un rango de (-∞ a +∞), Pi se encuentra en el

rango [0,1] y que Pi no está linealmente relacionado

con Zi (es decir, con Xi), satisfaciendo así los dos

requerimientos considerados anteriormente. Sin

embargo al satisfacer estos requerimientos, se crea un

problema de estimación porque Pi es no lineal no

solamente en X sino también en los β. Esto significa

que no se puede utilizar el procedimiento clásico de

MCO para estimar los parámetros. Por tanto es

necesario linealizar el modelo que presenta

distribución logística.

Page 15: Modelos de Probabilidad

Ya linealizado el modelo pueden observarse las características siguientes:

1.     A medida que P va de 0 a 1 (es decir, a medida que Z varía de -∞ a +∞ , el logit L varía de -∞ a +∞ . Es decir, aunque las probabilidades (por necesidad) se encuentra entre 0 y 1, los logit no están acotados en esa forma.

2.     Aunque L es lineal en X, las probabilidades en sí mismas no lo son. Esta propiedad contrasta con el modelo MLP… en donde las probabilidades aumentan linealmente con X.

3.     Aunque en el modelo anterior se ha incluido sólo una variable X, o regresora añadir tantas regresoras como lo indique la teoría subyacente.

Page 16: Modelos de Probabilidad

1.     Si L, el logit, es positivo, significa que cuando el valor de la(s) regresora(s) se incrementa, aumentan las posibilidades de que las regresadas sean igual a 1 (lo cual indica que sucederá algo de interés). Si L es negativo, las posibilidades de que la regresada iguale a 1 disminuyen conforme el valor de X se incrementa.

2.     De manera más formal, la interpretación del modelo dado en es la siguiente: , la pendiente, mide el cambio en L ocasionado por un cambio unitario en X, es decir, dice cómo el logaritmo de las probabilidades a favor de poseer una casa cambia a medida que el ingreso cambia en una unidad, por ejemplo US$ 1000. La intersección es el valor del logaritmo de las probabilidades en favor de poseer una casa si el ingreso es cero. Al igual que la mayoría de las interpretaciones de intersecciones, esta interpretación puede no tener significado.

Page 17: Modelos de Probabilidad

ESTIMACIÓN DEL MODELO LOGITZ

Para fines de estimación, se escribe …de la siguiente manera: 

 

En breve, se analizarán las propiedades del término de perturbación estocástica, ui.

Para estimar .., además de Xi, se necesitan los valores de la regresada o del logit Li. Esto depende del tipo de datos que se esté analizando. Estos se clasifican en dos categorías: 1) datos a nivel individual o micro, y 2) datos agrupados o replicados.

Page 18: Modelos de Probabilidad

Información del nivel individual

Si existe información disponible sobre familias individuales, como en la tabla 15.1, no es factible la estimación MCO de (15.6.1), lo cual es fácil de ver. En términos de los datos proporcionados en la tabla 15.1., Pi = si una familia es dueña de una casa y Pi = 0 si no posee una casa.

En ambos estas expresiones no tienen sentido y, para este tipo de información se recurre al método máxima verosimilitud (MV) para estimar los parámetros.

Page 19: Modelos de Probabilidad

Datos agrupados o replicados

Supongamos que se proporciona datos agrupados o replicados (observaciones repetidas) sobre diversas familias, de acuerdo con el nivel de ingreso y el número de familias que poseen una casa para cada nivel de ingreso. Correspondiente a cada nivel de ingreso Xi, hay Ni familias, de las cuales ni poseen casa (ni < Ni). Por consiguiente, si ahora se calcula:

 Es decir, la frecuencia relativa, se puede utilizar éste como una estimación del verdadero Pi correspondiente a cada Xi. Si Ni es relativamente grande, será una estimación razonablemente buena de Pi. Utilizando el Pi

Page 20: Modelos de Probabilidad

lo cual será una estimación relativamente buena del verdadero logit Li, si el número de observaciones Ni a cada nivel Xi es razonablemente grande. ¿Puede entonces aplicarse MCO a y estimar los parámetros en la forma usual? La respuesta es, aún no, ya que hasta el momento no se ha dicho nada sobre las propiedades del término de perturbación estocástico. Puede demostrarse que si Ni es relativamente grande y si cada observación en una clase de ingreso dado Xi está distribuida en forma independiente como una variable binomial, entonces

Page 21: Modelos de Probabilidad

es decir, ui sigue una distribución normal con media cero y varianza igual a .

Por consiguiente, como en el caso del MLP, el término de perturbación en el modelo logit es heteroscedástico. Así, en lugar MCO se deberán utilizar mínimos cuadrados ponderados (MCP). Para fines empíricos, sin embargo, se reemplazará la Pi desconocida por y se utilizará.

 

como estimador de

Page 22: Modelos de Probabilidad

error transformado. Ahora se describen los diversos pasos en la estimación de la regresión logit

1.     Para cada nivel de ingresos Xi, calcule la probabilidad estimada de poseer una casa como .

2.  Por cada Xi, obtenga el logit mediante

 

3. Para resolver el problema de heteroscedaticidad, se transforma de la siguiente manera:

El cual se estima por Mínimos Cuadrados Ordinarios. 

Page 23: Modelos de Probabilidad

MODELO PROBIT

En algunas aplicaciones, la FDA normal se ha encontrado útil. El modelo de estimación que surge de una FDA normal, es comúnmente conocido como el modelo probit, aunque algunas veces también es conocido como el modelo normit. En principio, se puede sustituir la FDA normal por la FDA logística y proceder como en el modelo Logit. Pero en lugar de seguir este camino, se presentará el modelo probit basado en la teoría de la utilidad, o de la perspectiva de selección racional con base en el comportamiento, según el modelo desarrollado por McFadden.

  Se expresa el índice Ii como:

donde Xi, es el ingreso de la i-ésima familia.

Page 24: Modelos de Probabilidad

¿Cómo se relaciona el Ii (no observable) con la decisión real de poseer una casa? Igual que antes, sea Y = 1 si la familia posee una casa y Y = 0 si no lo posee. Ahora bien, es razonable suponer que para cada familia hay un nivel crítico o umbral del índice (Ii*) , tal que si Ii excede a Ii*, la familia poseerá casa propia, de lo contrario no posee casa propia.

  Dado el supuesto de normalidad, la probabilidad de que Ii* sea menor o igual que Ii puede ser calculada a partir de la FDA normal estandarizado como:

Page 25: Modelos de Probabilidad

• La probabilidad de poseer casa propia se mide por el área de la curva normal estandar de -∞ a Ii como se presenta en figura de la lámina siguiente. Ii llamado índice de utilidad se calcula tomando la inversa de la FDA normal estandar según:

Ii = F-1 (Ii) = F-1 (Pi) = β1 + β2Xi

• Donde F-1 es la inversa de la FDA normal. Esto se explica con lo gráficos que aparecen más adelante . ¿Cómo se obtiene el índice Ii

• Así como las estimaciones de β1 y β2? La respuesta dependerá si se tienen datos agrupados e individuales.

Page 26: Modelos de Probabilidad
Page 27: Modelos de Probabilidad

ESTIMACION PROBIT CON DATOS AGRUPADOS Y NO AGRUPADOS

Se utilizan los mismos datos que se usaron para estimar el modelo Logit, por tanto ya se tienen las Pi relativas de poseer casa propia para ≠ niveles de ingresos, éstos valores se pueden utilizar para obtener Ii de la FDA normal como se muestra en la lámina del siguiente panel.

Una vez obtenidos los Ii, se procede a la estimación de β1 y β2

mediante técnicas no lineales ya estudiados basados en el método de maximaverosimilitud como el método de Newton. En el modelo Probit el índice de utilidad no observable Ii se conoce como desviación equivalente normal (d.e.n) y es negativa si Pi < 0.5

en la práctica se añade el nº 5 a la d.e.n. y dicho resultado se denomina Probit. Ver lámina siguiente:

Page 28: Modelos de Probabilidad
Page 29: Modelos de Probabilidad