Econometría espacial

30
Introducción a la Econometría Espacial. Una Aplicación al Estudio de la Fecundidad en la Argentina usando R. Marcos Herrera (2) * , Jorge A. Paz (1) , Juan C. Cid (2) (1) CONICET- IELDE, Universidad Nacional de Salta (2) IELDE, Universidad Nacional de Salta Resumen La econometría espacial es una rama econométrica relativamente joven pero con un gran crecimiento en las últimas décadas. La complejidad del análisis espacial ha sido uno de las principales obstáculos para la aplicación en estudios empíricos. El objetivo de este trabajo es contribuir a la difusión de las herramientas espaciales desarrolladas. Concretamente, el documento realiza una concisa revisión de los aspectos teóricos que involucran el tratamiento espacial. Asimismo, se presenta una aplicación empírica de las técnicas abordadas. Usando el programa estadístico R, se analizan los determinantes de la fecundidad en la Argentina. Palabras Clave: Econometría Espacial, Autocorrelación Espacial, Fecundidad, Programa Estadístico R. Código JEL: C21, R12, J13. Abstract Spatial econometrics is a relatively young branch econometric but with a great growth in the last decades. The complexity of spatial analysis and the estimation of spatial models has been the major obstacle for applied studies. The aim of this paper is to contribute to the diffusion of spatial tools developed. Specifically, this paper performs a concise review of the theoretical aspects that involve the spatial treatment. We also present an empirical application of the techniques discussed. Using the statistical program R, we analyze the determinants of fertility in Argentina. Keywords: Spatial Econometrics, Spatial Autocorrelation, Fertility, R Programming Language. JEL Codes: C21, R12, J13. * Autor para correspondencia: IELDE, Universidad Nacional de Salta. Av. Bolivia 5150 (A4408FVY), Salta (Argentina). Mail: [email protected] 1

description

...

Transcript of Econometría espacial

  • Introduccin a la Econometra Espacial. Una Aplicacin al Estudiode la Fecundidad en la Argentina usando R.

    Marcos Herrera(2)*, Jorge A. Paz(1), Juan C. Cid(2)

    (1)CONICET- IELDE, Universidad Nacional de Salta(2)IELDE, Universidad Nacional de Salta

    ResumenLa econometra espacial es una rama economtrica relativamente joven pero con un gran crecimiento en

    las ltimas dcadas. La complejidad del anlisis espacial ha sido uno de las principales obstculos para laaplicacin en estudios empricos. El objetivo de este trabajo es contribuir a la difusin de las herramientasespaciales desarrolladas. Concretamente, el documento realiza una concisa revisin de los aspectos tericos queinvolucran el tratamiento espacial. Asimismo, se presenta una aplicacin emprica de las tcnicas abordadas.Usando el programa estadstico R, se analizan los determinantes de la fecundidad en la Argentina.

    Palabras Clave: Econometra Espacial, Autocorrelacin Espacial, Fecundidad, Programa Estadstico R.

    Cdigo JEL: C21, R12, J13.

    AbstractSpatial econometrics is a relatively young branch econometric but with a great growth in the last decades.

    The complexity of spatial analysis and the estimation of spatial models has been the major obstacle for appliedstudies. The aim of this paper is to contribute to the diffusion of spatial tools developed. Specifically, this paperperforms a concise review of the theoretical aspects that involve the spatial treatment. We also present anempirical application of the techniques discussed. Using the statistical program R, we analyze the determinantsof fertility in Argentina.

    Keywords: Spatial Econometrics, Spatial Autocorrelation, Fertility, R Programming Language.

    JEL Codes: C21, R12, J13.

    *Autor para correspondencia: IELDE, Universidad Nacional de Salta. Av. Bolivia 5150 (A4408FVY), Salta(Argentina). Mail: [email protected]

    1

  • 1. IntroduccinLa econometra espacial es un sub-campo relativamente joven dentro de la econometra que

    incorpora el tratamiento de las efectos espaciales y los problemas que los mismos provocan enlos modelos economtricos que utilizan datos de corte transversal y de panel. Esta disciplina hatenido un importante crecimiento en las ltimas dcadas debido a tres principales razones (Anselin yFlorax, 1995): (1) La importancia del espacio geogrfico dentro de la teora econmica para explicaraspectos como los rendimientos crecientes y las economas de aglomeracin. Especficamente, laNueva Geografa Econmica (Krugman, 1991) ha reconocido la importancia de la localizacin comofactor influyente en la determinacin de las variables econmicas; (2) La existencia de grandesbases de datos socio-econmicos georeferenciados como REIS en Estados Unidos, sostenida porel departamento de Anlisis Econmico (BEA), y REGIO en Europa, sostenido por el departamentoestadstico de la Comisin Europea (Eurostat); (3) El avance tecnolgico en el manejo de grandesbases de datos con informacin espacial: Sistemas de Informacin Geogrfica y programas especficospara manipular y modelizar estos datos.

    Los mencionados avances han generado que la econometra espacial adquiera especial relevanciadentro de las principales lneas de investigacin economtrica. Pero a pesar de su relativa importancia,en la Argentina la presencia de este tipo de investigacin econmica es notoriamente escasa. Es porello que nuestro trabajo busca incentivar, desde una revisin terica y posterior ilustracin emprica,la investigacin en esta rea.

    El presente trabajo analiza la incorporacin de los efectos espaciales1 en un contexto deregresin lineal. En particular el efecto espacial que analizaremos es la dependencia espacial,comnmente denominada autocorrelacin espacial2. En este caso, la econometra clsica ha confinadoel tratamiento de la dependencia dentro de un contexto temporal. La mayora de libros de texto talescomo Goldberger (1991), Greene (1993), Davidson y MacKinnon (1993), Kennedy (1998), Ruud(2000), Hayashi (2000), por citar algunos, no mencionan la posibilidad de autocorrelacin espacialen datos de corte transversal (para este tipo de datos el principal problema que los textos destacan esla heterocedasticidad). Sin embargo, otras reas cientficas como la geologa, ecologa, epidemiologahan incorporado el tratamiento de dependencia espacial como sumamente relevante (vase Fischer yGetis, 2010, y sus referencias). En geografa, la primera ley establecida por Tobler (1979) destaca quetodo est relacionado con todo, pero las cosas prximas estn ms relacionadas que las distantes,dando a entender que la dependencia espacial es ms una norma que una excepcin.

    La estructura del trabajo es de la siguiente manera. La segunda seccin se limita a revisar laincorporacin de la dependencia espacial para datos de corte transversal (no se discute la dependenciaen espacio-tiempo ni modelos con variable dependiente limitada). La tercera seccin presenta unaaplicacin emprica para los departamentos3 de la Argentina. En esta seccin aplicamos los conceptosdesarrollados al anlisis de la fecundidad mediante el uso del programa estadsticoR. La cuarta seccinpresenta las principales conclusiones del trabajo. Adicionalmente, se incorpora un apndice con lasecuencia de comandos en R utilizados para la estimacin de los diferentes modelos.

    1Los efectos espaciales se pueden dividir en dos tipos: dependencia y heterogeneidad. El tratamiento de laheterogeneidad espacial hace referencia a la inestabilidad estructural en los coeficientes del modelo (coeficientes variableso regmenes espaciales) o la presencia de heterocedasticidad en el trmino de error. En este trabajo este tipo de efectoespacial no ser analizado (vase Anselin, 1988).

    2Claramente los dos conceptos no son sinnimos, en trminos estadsticos, siendo el concepto de dependencia untrmino ms amplio. Por simplicidad, en este trabajo, utilizaremos ambos trminos de forma intercambiable.

    3El uso del trmino departamentos es vlido para la mayora de las provincias de la Argentina. Las dos excepcionesson la provincia de Buenos Aires que denomina a estas reas como partidos y la Ciudad Autnoma de Buenos Aires que sedivide en distritos. Por simplicidad en este trabajo utilizaremos el trmino departamento para referirnos indistintamentea este nivel de agregacin regional del pas.

    2

  • 2. Incorporando la Dependencia Espacial en el Modelo EconomtricoDesde un punto de vista metodolgico, la inclusin de la dependencia espacial en los modelos

    economtricos ha sido motivada por dos vas alternativas. Por un lado, el espacio se ha incorporadomediante fundamentos tericos, es decir, siguiendo una especificacin formal dentro de un modeloeconmico tal que refleje la interaccin de los agentes y/o la interaccin social (Brock y Durlauf,1995). Por otro lado, desde los inicios ha existido una solucin pragmtica, introduciendo el espaciocomo una peculiaridad de los datos utilizados tales como la interdependencia espacial y la relevanciade los factores localizados en otros lugares (Paelinck y Klaassen, 1979).

    Formalmente, la autocorrelacin espacial puede definirse mediante la autocovarianza de lasiguiente manera:

    Cov (yi, yj) = E (yiyj) E (yi) E (yj) 6= 0, i 6= j, (1)

    donde yi e yj son observaciones de una variable aleatoria localizada en i y j sobre el espacio.Suponiendo que el conjunto de observaciones de un corte transversal es igual a N , en total

    existen [N (N 1) /2] autocovarianzas espaciales para todos los posibles pares de observaciones(considerando la simetra de la matriz de autocovarianzas). Dado que el nmero de parmetros aestimar excede al nmero de observaciones es imposible estimar cada una de las autocovarianzas.Adicionalmente, incrementar el tamao muestral no soluciona el problema ya que el nmero deparmetros a estimar tambin crece, siendo este caso un ejemplo tpico del problema de parmetrosincidentales (Lancaster, 2000).

    Desde una perspectiva univariante, la dependencia espacial puede ser representada mediante unmodelo espacial autoregresivo no restringido tal como:

    yi = ijyj + ikyk + i,yj = jiyi + jkyk + j ,yk = kiyi + kjyj + k,i; j ; k i.i.d.N

    (0;2

    ),

    y = Ay+ , (2)siendo A una matriz de coeficientes de interaccin con la siguiente estructura:

    A =

    0 ij ikji 0 jkki kj 0

    .El modelo (2) es de (...) escasa utilidad prctica dado que esto resultar en un sistema con

    muchos ms parmetros que observaciones (...). La solucin al problema de la sobreparametrizacin,que surge cuando permitimos que cada relacin de dependencia posea su propio parmetro, esimponer una estructura sobre las relaciones de dependencia espacial (LeSage y Pace, 2009, p. 8).

    En otros trminos, el modelo (2) se encuentra subidentificado y la solucin clsica radica enimponer alguna estructura en la matriz A, parametrizando la interaccin espacial como, por ejemplo:A = W , donde es un parmetro a estimar y W una matriz de contactos (tambin denominadamatriz de contigidades, pesos, ponderaciones, distancias o interacciones espaciales).

    2.1. Matriz de Contactos W . Su Importancia ClaveLa matriz de contactos permite incorporar el espacio dentro del anlisis economtrico y ocupa

    una posicin central dado que, esencialmente, define el conjunto de vecinos para cada localizacin.Tal como hemos enunciado, la necesidad de una matriz de contactos proviene del problema desubidentificacin que afecta a la mayora de los modelos espaciales. Haining (2003, p. 74) mencionaque el primer paso para cuantificar la estructura de dependencia espacial en un conjunto de datoses definir, para el conjunto de puntos o reas, la relacin espacial existen entre ellos. Este primer

    3

  • paso es crucial y, en puntuales casos, se puede tener informacin completa sobre la especificacin dedicha matriz. En otros casos, en su gran mayora, esta matriz es una mera hiptesis de trabajo.

    Utilizando la estructura A = W , el modelo (2) se transforma en un modelo restringido:

    y = Wy+ , (3)

    donde el trmino Wy es comnmente denominado rezago espacial de la variable endgena.Suponiendo que el tamao muestral es igual a N , la matriz W es de orden N N y puede

    representarse de la siguiente manera:

    W =

    0 w1,2 w1,j w1,Nw2,1 0 w2,j w2,N... ... . . .

    wi,1 wi,2... 0 wi,N

    ... ... ... ... . . . wN,1 wN,2

    ... wN,j 0

    , (4)

    donde las columnas y filas corresponden a las observaciones de corte transversal y los pesos wi,j(i, j = 1, 2, . . . , N) aproximan la relacin entre dos localizaciones i (filas) y j (columnas). La diagonalprincipal esta formada por ceros, estableciendo que ninguna observacin puede estar relacionadaconsigo misma (no puede ser que la misma observacin sea vecina de si misma). Obsrvese que se haintercambiado ij (parmetro a estimar dentro del modelo) por wij (hiptesis externa al modelo).

    Llegado a este punto, el problema radica en cmo se construyen los pesos de la matrizW . Existendiferentes criterios sobre su construccin siguiendo, por ejemplo, alguna hiptesis de interaccin. Cadahiptesis resultar en una matriz de ponderaciones diferentes llevando a un rezago espacial distinto.Es comn que la representacin del conjunto de vecinos obtenidos por algn criterio de seleccin serealice mediante una eleccin binaria, con wi,j = 1 cuando i y j son vecinos, y wi,j = 0 cuando nolo son.

    En la prctica economtrica, la matriz de contactos es a menudo construida desde la geografao geometra, usando los conceptos de contigidad y distancia. Por ejemplo, suponiendo que lasobservaciones se distribuyen sobre un mapa regular como el representado en la Figura 1, hay variasalternativas para establecer el conjunto de vecinos para la celda a. Una posibilidad es considerarvecinos a aquellas celdas que poseen un borde comn, siendo para nuestro ejemplo cada celda b delmapa superior izquierdo. Otra posibilidad es considerar como vecinos a aquellas celdas que poseen unvrtice comn, como en el mapa superior derecho. Las elecciones de estos conjuntos de vecinos sondenominadas, respectivamente, criterio tipo torre y criterio tipo alfil, en analoga al movimiento delas piezas de ajedrez. De igual forma, podramos elegir vecinos mediante una combinacin de amboscriterios dando lugar al criterio tipo reina.

    Las reas o polgonos de un mapa pueden transformarse en puntos, y viceversa. La eleccin deun punto representativo de un polgono es tpicamente resuelto por criterios geomtricos mediante elpunto central o centroide del polgono. Dado el centroide de cada celda, como en la grfica inferiorizquierda (Figura 1), es posible definir una red de puntos o nodos. En este caso, nos basaramos enun criterio de distancia para definir a los vecinos de a tal que cada centroide que se encuentre dentrode una distancia mxima al centroide de a sera considerado vecino.

    Un problema con la eleccin de vecinos por medio de la distancia (y contigidad) es la existenciade puntos aislados que pueden no contener vecino alguno para un radio determinado. Esto sucedehabitualmente cuando la densidad de los puntos sobre el plano no es regular o cuando se encuentranalgunos nodos distribuidos por agrupamientos (clusters) y otros aislados. Para salvar este problemase suele determinar un radio d de amplitud tal que asegure que cada observacin tienen al menos unvecino.

    4

  • Figura 1: Contigidad sobre Mapa Regular.

    Fuente: Anselin (1988).

    Un criterio alternativo es el de kvecinos ms cercanos. En este caso, considerando la distanciageomtrica entre las regiones, seleccionaramos a los k vecinos ms cercanos de cada punto. Laventaja de este criterio es que todas las unidades poseern la misma cantidad de vecinos evitando elproblema de unidades aisladas. Bajo mapas regulares, como los representados en la Figura 1, si k esigual a 4, los vecinos ms cercanos a la localidad a sern los mismos que los elegidos por el criteriotipo torre y, si k es igual a 8, los vecinos ms cercanos a la localidad a sern los mismos que loselegidos por el criterio tipo reina.

    Por otro lado, es posible considerar varios ordenes de contigidad o vecindad. En la Figura 1, lagrfica inferior derecha muestra el grupo de vecinos de segundo orden para la celda a. Este conjuntode vecinos, identificado por las letras c y d, incluye a los vecinos de los vecinos de a definidos por elcriterio tipo torre. Para distinguir el orden de vecindad se aade un supra-ndice a la matriz: W (j), j 2, siendo j el orden de vecindad.

    Como alternativa a los pesos binarios, pueden considerarse aquellas funciones de distancia entreunidades espaciales que combinan la distancia, el permetro y otras caractersticas geogrficas. Acontinuacin, Cuadro 1, presentamos algunas especificaciones utilizadas en la literatura aplicada.

    Determinadas especificaciones plantean posibles problemas de endogeniedad que debern serconsiderados en el momento de la estimacin del modelo economtrico. Este tipo de problemapuede surgir con propuestas que utilizan variables socio-econmicas, como el nivel de empleo o elproducto bruto per cpita, para la eleccin de los pesos. Exceptuando estos casos, los procedimientospresentados en el Cuadro 1 pueden encasillarse como procedimientos exgenos, es decir, aquellos quedeterminan la estructura de la matriz en funcin, nicamente, del arreglo espacial de los datos.

    Desde una perspectiva diferente, podran seleccionarse los pesos espaciales mediante unadescripcin estadstica de los datos. Las propuestas de este tipo suelen denominarse procedimientosendgenos. En este caso, los vecinos cercanos o lejanos son establecidos mediante la informacin

    5

  • brindada por los propios datos mediante un estadstico que sirve de gua, como en el modeloestadstico local, SLM , de Getis y Aldstadt (2004), el procedimiento AMOEBA de Aldstadt yGetis (2006), el de modelo de ecuaciones estructurales de Folmer y Oud (2008), la tcnica defiltrado espacial de Tiefelsdorf y Griffith (2007), el procedimiento de mxima entropa general deFernandez et al. (2008) o el procedimiento del coeficiente de correlacin completo, CCC, de Mur yPaelinck (2010).

    Cuadro 1: Especificaciones Alternativas de Pesos EspacialesReferencia Modelo Descripcin

    Dacey (1968) wij = ijii(j)

    ij : factor de contigidad binario (1,0).i: proporcin del rea de la unidad i respecto altotal de rea de todas las unidades del sistema.i(j): proporcin del permetro de la unidad i encontacto con la unidad j.

    Cliff y Ord (1973) wij = daij[i(j)

    ]b a, b: parmetros positivosdij :distancia entre los puntos o regiones (i,j).

    Bodson y Peters(1975)

    wij =Nn=1

    Kn{

    a

    1+becjdij} Kn: importancia del medio de comunicacin n.N : total de medios de comunicacin considerados.

    a, b, cj : parmetros a estimar.dij :distancia entre los puntos o regiones (i,j).

    Anselin (1980) wij = d2ij dij :distancia entre los puntos o regiones (i,j).

    Cliff y Ord (1981) wij = [c+ dij ]ac: trmino constante positivo.dij :distancia entre los puntos o regiones (i,j).

    Case et al. (1993) wij = 1|xixj | x: variable socioeconmica (ej.: PBI per cpita)

    Molho (1995)wij =

    Eadijj

    k 6=iEadikk

    ,

    i 6= j

    E: volumen de empleo.dij :distancia entre los puntos o regiones (i,j).

    Ma et al. (1997)

    wij = edaij ,

    wij =(lijli

    )a,

    wij =

    (lijli

    )adbij

    lij : longitud de frontera entre las regiones (i, j).li: permetro de la regin i.dij :distancia entre los puntos o regiones (i,j).

    Toral (2000) wij = ij kikjpipjdaij

    ij = 1, si las unidades espaciales i, j tienen unafrontera en comn y cero, si no la tienen. p:poblacin. k: longitud de carreteras (km). dij :distancia por carretera entre las capitales i, j. a:parmetro positivo,con valores 0, 1 2.

    Fuente: Chasco Yrigoyen (2003).

    Una vez elegidos los pesos espaciales, es raro que se utilicen en su forma natural. Lo habitual estrabajar con alguna transformacin de la matriz en el modelo espacial ya que mejora las propiedadesestadsticas de los estimadores y sus estadsticos. La transformacin ms utilizada es la normalizacinpor fila, en donde los nuevos pesos son obtenidos como wij = wij/

    j

    wij, de tal forma que la suma

    de cada fila de la matriz sea igual a la unidad: jwij = 1 (representaremos como W a la matriz de

    contactos normalizada).

    6

  • 2.2. Deteccin Global de Dependencia Espacial UnivarianteUna primera pregunta de anlisis en los estudios empricos suele ser: Presenta la variable de

    estudio autocorrelacin espacial?. Si la respuesta es afirmativa, entonces deberemos formular modeloseconomtricos ms complejos donde se incorpore explcitamente el efecto del espacio.

    La cuestin, entonces, pasa por conocer aquellas herramientas que nos permiten detectar lapresencia de autocorrelacin espacial. Desde una perspectiva descriptiva, una primera aproximacincualitativa puede realizarse mediante el anlisis exploratorio espacial (Haining, 2003).

    El anlisis exploratorio espacial permite la visualizacin mediante diferentes grficos delcomportamiento de la variable bajo estudio, siendo el mapa un elemento central. Existe una ampliavariedad de mapas y formas para describir datos continuos sobre polgonos irregulares4 (latticedata), una de las ms usuales es el mapa de coropletas. En este tipo de mapa se representala distribucin espacial de una variable o atributo mediante diferentes tonalidades. El nmero detonalidades representa a los diferentes intervalos y los mismos pueden ser definidos por el usuario.La realizacin de este anlisis puede llevarse a cabo mediante el programa estadstico OpenGeoDa,posiblemente la opcin existente ms integrada en cuanto a anlisis exploratorio espacial.

    El anlisis exploratorio espacial nos brindar los primeros indicios de dependencia aunquenecesitaremos herramientas inferenciales para poder obtener una cuantificacin de la misma. Laformulacin de estas herramientas vara a travs de diferentes estadsticos, aunque cada uno de ellospuede ser visto como un caso especial del test de Mantel (Mantel, 1967).

    El test de Mantel estima la correlacin existente entre dos matrices B y C donde dichas matricescapturan el grado de similitud en el espacio y en la distribucin de la variable, respectivamente. Dichoestadstico se define como:

    =Ni=1

    Nj=1

    i 6=j

    bijcij , (5)

    donde bij es un elemento de la matriz B que captura la similitud espacial de las localizaciones i yj, y cij es un elemento de la matriz C que captura la similitud de los valores de una determinadavariable entre las localizaciones i y j.

    Reformulando del estadstico , tal que los elementos bij sean los pesos espaciales de la matrizde contactos W y los elementos cij representen el cuadrado de la diferencia de valores de la variablede inters entre localizaciones, puede obtenerse el estadstico C de Geary (1954):

    C = N 12S0

    Ni=1

    Nj=1

    wji (yi yj)2

    Ni=1

    (yi y)2, (6)

    donde S0 =Ni=1

    Nj=1

    wij = 1W1, siendo 1 un vector (N 1) de unos y y es la media muestral.Los momentos del estadstico de Geary, bajo la hiptesis nula de aleatoriedad, son:

    E [C] = 1, (7)

    V [C] = (2S1 + S2) (N 1) 4S20

    2 (N + 1)S20, (8)

    donde S1 = 12Ni=1

    Nj=1

    (wij + wji)2 y S2 =Nj=1

    (wj + wj)2, siendo wj =Ni=1wij .

    4Existen diferentes tipos de datos georeferenciados. En este trabajo nos enfocamos en el manejo de variablescontinuas distribuidas en un espacio discreto o lattice data. Vase Cressie (1993) para una exposicin de los diferentestipos de datos.

    7

  • Su distribucin asinttica es normal:N [C 1]

    asN [0;V (C)] . (9)

    Posiblemente el test ms ampliamente utilizado, y que tambin puede derivarse del test de Mantel,es el estadstico I de Moran (1950):

    I = NS0

    i

    j

    (yi y)wji (yj y)Ni=1

    (yi y)2. (10)

    Los momentos del estadstico de Moran, bajo la hiptesis nula de aleatoriedad, son:

    E [I] = 1N 1 , (11)

    V [I] =(3S20 + S1R2 NS2

    )S0 (N + 1) (N 1)

    1(N 1)2 . (12)

    Su distribucin asinttica, nuevamente, es normal:N [I E (I)]

    asN [0;V (I)] . (13)

    Diferentes experimentos Monte Carlo (Anselin y Florax, 1995) revelan que la aproximacin a ladistribucin normal funciona razonablemente bien con tamaos muestrales medios (N > 50). Elcomportamiento del estadstico empeora sensiblemente cuando reducimos el tamao muestral o seaaden problemas nuevos como heterocedasticidad, atpicos, etc., lo que significa que los resultadosdeben interpretarse con cautela.

    Como nota final, tanto el test C de Geary como el test I de Moran capturan la dependenciaglobal, es decir, la autocorrelacin existente en todo el espacio geogrfico. Existen otros estadsticosque permiten capturar la dependencia local utilizando sub-muestras del espacio geogrfico. Entre losms utilizados se destacan el anlisis LISA de Anselin (1995) y los tests Gi (d) y Gi (d) de Getis yOrd (1996) y Ord y Getis (2001). El anlisis de estos estadsticos se encuentra fuera de los objetivosdel presente trabajo (para mayor detalle, vase las citadas referencias).

    El rechazo de la hiptesis nula de aleatoriedad de alguno de estos tests de autocorrelacin espacialimplica un anlisis ms detallado sobre los determinantes de la variable bajo estudio. Detectada laimportancia del espacio sobre la variable, ahora estamos en condiciones de introducir los diferentesmodelos economtricos que permiten la incorporacin de los efectos espaciales.

    2.3. Modelos Economtricos y Tests de Independencia EspacialEn esta seccin desarrollaremos la metodologa ms habitual en el campo aplicado. La misma

    consiste en el planteo inicial de un modelo esttico simple y a partir de all se incorporan elementosespaciales segn las diferentes pruebas estadsticas.

    El modelo esttico ms simple considera que existe una variable dependiente y un conjunto devariables explicativas. La ecuacin de trabajo es la siguiente:

    y = X + , (14) N

    (0, 2IN

    ),

    siendo la variable dependiente y un vector de dimensin (N 1), X es una matriz de variablesexplicativas, incluyendo una constante, de orden (N k), es un vector de parmetros desconocidosde orden (k 1) y es el trmino de error de dimensin (N 1).

    8

  • Comenzar con el modelo (14) tiene su lgica en el sentido de que la dependencia espacialunivariante, detectada en la seccin 2.2, puede ser explicada por el conjunto de variablesindependientes X. Si este fuese el caso, la sola incorporacin de estas variables explicativas evitaraintroducir modelos ms complejos.

    Por otra parte, utilizaremos como modelo de referencia, que incorpora la dependencia espacialresidual, el Modelo de Error Espacial (Spatial Error Model):

    y = X + u, (15)u = Wu+ u = B1, N

    (0, 2IN

    ),

    siendo B = [I W ].Si el modelo (15) se estima por mnimos cuadrados ordinarios, MCO, las consecuencias sern

    insesgado y consistente, con una matriz de covarianzas diferente a la habitual:

    =[XX]1

    Xy = +

    [XX]1

    Xu, (16)

    E[]

    = , (17)

    V[]

    = 2[XX]1

    X (BB)1

    X[XX]1

    . (18)

    Adems, el estimador MCO del parmetro de dispersin ser sesgado pero consistente:

    2 = uu

    N k =uMuN k =

    B1MB1N k , (19)

    E[2]

    = 2 tr(B1MB1

    )N k , (20)

    = 2

    N k tr(B2

    (XX)1

    XB2X

    )6= 2, (21)

    plim[2]

    = 2, (22)

    siendo M = I X(XX)1

    X .

    Estas consecuencias son las esperadas cuando se estima por MCO un modelo lineal con matrizde covarianzas no escalar en el trmino de error.

    Por lo tanto, tal como sucede en la prctica economtrica clsica, podemos implementar lasecuencia habitual de estimar el modelo esttico (14) por MCO y, a continuacin, analizar losposibles problemas de especificacin.

    En concreto, analizaremos la presencia de autocorrelacin espacial a travs del examen residualde la estimacin MCO. Planteado de esta forma, podemos utilizar los tests de dependencia globaladaptados al marco de regresin lineal general.

    En este caso, el test I de Moran ha tenido un rol preponderante en esta etapa. Aplicado sobrelos residuos MCO del modelo (14), la expresin del estadstico es:

    I = NS0

    Ni=1

    Nj=1

    uiwjiuj

    Ni=1u2i

    . (23)

    9

  • Las expresiones de los momentos del estadstico, bajo la hiptesis nula de aleatoriedad espacial,se modifican de la siguiente forma:

    E [I] = NS0

    tr (MW )N k =

    N

    S0

    tr[(XX)1

    XWX

    ]N k , (24)

    E[I2]

    =

    (NS0

    )2tr(MWMW

    )+ tr (MWMW ) + [tr (MW )]2(N 1) (N k + 2) . (25)

    La varianza puede obtenerse como: V [I] = E[I2] E[I]2.La distribucin probabilstica del estadstico I de Moran es desconocida para muestras finitas, por

    lo que comnmente se utiliza una aproximacin emprica por permutacin. Otra opcin es plantearla misma aproximacin asinttica del caso univariante:

    N [I E (I)]

    asN [0;V (I)] . (26)

    El problema con el test I de Moran es que el rechazo de la hiptesis nula no brinda informacinadicional sobre el modelo bajo la hiptesis alternativa.

    Otra alternativa para la deteccin de dependencia espacial residual son los estadsticos queresultan de la aplicacin del principio de mxima verosimilitud. En este caso, podemos utilizar elMutiplicador de Lagrange que para las hiptesis nula y alternativa:

    H0 : = 0,H1 : 6= 0,

    posee la siguiente estructura:

    LMERR =1

    2S0

    (uW u2

    )2as2(1), (27)

    donde u son los residuos MCO del modelo bajo la hiptesis nula. El resultado es simple y puedegeneralizarse a otros tipos de casos ms complejos en la estructura del error.

    Otro modelo de referencia que puede plantearse es el Modelo de Rezago Espacial (Spatial LagModel). Este modelo incorpora dependencia sustantiva en el sentido de que la variable endgenadepende de su propio rezago espacial, entre otros elementos. La estructura de dependencias generadapor este tipo de procesos es mucho ms intensa que la contemplada en el caso de dependencia residual.

    El Modelo de Rezago Espacial tiene la siguiente estructura:

    y = Wy+X + u, (28)u N

    (0, 2IN

    ),

    La implicaciones economtricas derivadas de la omisin de elementos dinmicos, como Wy, sonmuy significativas. Suponiendo que el modelo (28) es el correcto pero se ha estimado el modelo (14),puede comprobarse que los estimadores de los parmetros de posicin MCO son sesgados:

    =[XX]1

    Xy =

    [XX]1

    X (B1X +B1u

    ),

    =[XX]1

    XB1X +

    [XX]1

    XB1u,

    E[]

    =[XX]1

    XB1X 6= , (29)

    10

  • Los residuos, la estimacin del parmetro de dispersin y su esperanza tienen la siguiente forma:

    u = yX = M1B1 (X + u) , (30)

    2 = uu

    N k =(X + u)

    B1MB1 (X + u)N k , (31)

    E[2]

    = XB1MB1X + 2tr

    (B1MB1

    )N k . (32)

    Finalmente, el sesgo no desaparece en un contexto asinttico:

    plim[]

    = 1XXXBX 6= , (33)

    plim[2] = 2plimtr (B2)

    N, (34)

    siendo 1XX = lim[XXN

    ]1, XBX = lim

    [XB1XN

    ].

    La severidad de estos resultados aconseja chequear la posible omisin de elementos dinmicos enel modelo. El contexto ms detallado para afrontar esta cuestin se corresponde con el planteamientode mxima-verosimilitud, que desarrollaremos a continuacin.

    Partiendo de la habitual funcin de log-verosimilitud, correspondiente en este caso al modelo(28):

    l (y |) = N2 ln2pi N

    2 ln2

    [(ByX) (ByX)

    22

    ]+ ln |B| , (35)

    donde ln |B| = ln |I B| =Ni=1

    ln (1 i).El sistema de condiciones necesarias es no lineal, imposibilitando la obtencin de una solucin

    analtica:l

    = 1

    2

    [X (ByX)

    ]= 12Xu, (36)

    l

    = 1

    2

    [yW (ByX)

    ]

    Ni=1

    i1 i ,

    = 12

    [yWu

    ]

    Ni=1

    i1 i , (37)

    l

    2= N22 +

    (ByX) (yX)24 =

    N

    22 +uu24 . (38)

    Para poder solucionar este sistema debe recurrirse a algoritmos numricos o a procedimientosbasados en la log-verosimilitud concentrada. En este ltimo caso resulta relativamente sencilloobtener los estimadores mximo-verosmiles, MV , del vector y del parmetro de dispersin 2,condicionados ambos al parmetro de dependencia :

    =[XX]1

    XBy,

    =[XX]1

    Xy

    [XX]1

    Xy = Wy, (39)

    =[XX]1

    Xy, Wy =

    [XX]1

    XWy, (40)

    2 = uuN

    = [uy uWy][uy uWy]

    N, (41)

    u = yX, uWy = WyXWy. (42)

    11

  • Sustituyendo estos resultados en (35) se obtiene la funcin de log-verosimilitud concentrada quedepende solo del parmetro . A continuacin se optimiza esta funcin mediante iteraciones hastaalcanzar convergencia.

    Con el objetivo de contrastar la existencia de elementos dinmicos en la ecuacin principal delmodelo (28), bajo la hiptesis nula y alternativa:

    H0 : = 0,H1 : 6= 0,

    el Multiplicador de Lagrange es igual a:

    LMLAG =

    (yW u2

    )2V [N ]

    =

    (yW u2

    )2(XWMWX

    2

    ) as2(1). (43)

    Es interesante mencionar que los casos de autocorrelacin residual pueden entenderse como casosparticulares de dependencia sustantiva, lo cual se hace evidente en el test denominado COMFAC(de factores comunes). Supongamos que nuestro modelo de partida es un modelo con autocorrelacinresidual tal como:

    y = X + u, (44)u = Wu+ N

    (0, 2IN

    ),

    Manipulando el trmino de error tal que: u = W (yX)+, y reintroduciendo este resultadoen (44), obtenemos el Modelo Espacial de Durbin:

    y = Wy+X +WX + . (45)

    La ecuacin final (45) se corresponde con un modelo dinmico (aparece un rezago de la endgenacomo variable explicativa, Wy), en el que se ha aadido un rezago espacial de las exgenas WX,siendo el vector de parmetros que acompaa a estos rezagos. Dado que la perturbacin del modelo,, cumple con los supuestos bsicos, la ecuacin puede estimarse por mxima verosimilitud. El testde factores comunes se concreta en:

    H0 : + = 0,H1 : + 6= 0,

    el cual puede resolverse fcilmente aplicando la razn de verosimilitudes, LR. En este caso, el modeloamplio es el de la expresin final de (45), el cual se estimar por MV sin restricciones. El modelorestringido, bajo hiptesis nula, es el modelo (15)5. Este mismo modelo tambin se estimar porMV para poder obtener finalmente el estadstico LR:

    LRCOMFAC = 2[l|H1 l|H0

    ]as2q (46)

    5Bajo H0, = , entonces reemplazando en el modelo (45):

    y = Wy+X +WX () + y = Wy+X WX + (I W )y = (I W )X + .

    La ltima expresin puede resumirse en el Modelo de Error Espacial:

    y = X + (I W )1 ,

    donde = .

    12

  • siendo l|H1 la log-verosimilitud obtenida en la estimacin del modelo amplio y l|H0 la correspondienteal modelo de la hiptesis nula; q es el nmero de restricciones e igual al nmero de parmetrosincluidos en , sin considerar la constante.

    Otro punto de contacto entre ambos tipos de dependencia se produce en el test denominadoSARMA. Para obtener este ltimo, debe plantearse explcitamente un modelo amplio que incluyadependencia sustantiva y residual. Esta especificacin se denomina Modelo de Rezago y Error Espacial(SARAR(1, 1), Anselin y Florax, 1995):

    y = Wy+X + u (47)u = Wu+ (48) N

    (0, 2IN

    )En el test SARMA se analiza la no existencia de efectos espaciales en el modelo, combinando

    informacin de los estadsticos base LMERR y LMLAG:

    H0 : = 0; = 0,H1 : 6= 0; 6= 0,

    El estadstico Multiplicador de Lagrange, bajo hiptesis nula, es igual a:

    LMSARMA =

    [(yW u2

    )(uW u2

    )]2V [N ]

    + 12S0

    (uW u2

    )2as2(2). (49)

    Los diferentes Multiplicadores de Lagrange presentados hasta ahora cubren los principalesaspectos de la especificacin de un modelo economtrico de corte transversal. El inconveniente quepresentan es que son altamente sensibles a diferentes tipos de errores de especificacin. Por ejemplo,el LMERR no debera reaccionar si el error consiste en que se ha omitido un rezago de la variableendgena en la parte derecha de la ecuacin, y el LMLAG no debera reaccionar cuando el errorconsiste en la omisin de un rezago en la perturbacin. Sin embargo, esto no es lo habitual y ambosestadsticos mostrarn valores significativos en respuesta a un error en la especificacin, ya sea detipo sustantiva o residual.

    En este contexto, Anselin et al. (1996) proponen dos nuevos Multiplicadores de Lagrangediseados para que su comportamiento sea robusto a diferentes errores de especificacin. El LMELanaliza la falta de correlacin en los residuos, siendo robusto a errores de especificacin en laestructura dinmica de la ecuacin principal. El modelo de referencia, la hiptesis nula y el testestadstico son los siguientes:

    y = X + u, (50)u = Wu+ , N

    (0, 2IN

    ),

    H0 : = 0,H1 : 6= 0,

    LMEL =

    [(uW u2

    )(

    2S02S0+V[N ]

    )(yW u2

    )]2(

    2S0 (2S0)2

    2S0+V[N ]

    ) as2(1). (51)

    Por otra parte, el test LMLE permite detectar estructura dinmica de la ecuacin, siendo robustoa estructuras espaciales en el trmino de error. El modelo de referencia, la hiptesis nula y el test

    13

  • estadstico son los siguientes:

    y = Wy+X + u, (52)u N

    (0;2IN

    ),

    H0 : = 0,H1 : 6= 0,

    LMLE =

    [(uW u2

    )(uW u2

    )]2V [N ]

    as2(1). (53)

    Para un mayor detalle de los diferentes estadsticos de dependencia espacial en modelos linealesvase las excelentes revisiones provistas por Anselin y Bera (1998), Anselin (2001) y Florax y deGraaff (2004).

    Hasta el momento, se ha bosquejado la estrategia de especificacin usual en econometra espacial.Este tipo de estrategia es denominada de lo particular a lo general. Sin embargo, algunos modelosespaciales no han sido considerados y es posible plantearlos utilizando una estrategia de especificacinalternativa que es de lo general a lo particular. Ambos tipo de estrategias se presentan en la Figura2.

    Figura 2: Estrategias Alternativas de Especificacin Espacial

    M1: y = Wy+X+WX+u u = Wu+; ~ (0,2I)

    M2: y=Wy+X+u u = Wu+; ~ (0,2I)

    M3: y=Wy+X+WX+u u ~ (0,2I)

    M4: y =X+WX+u u = Wu+; ~ (0,2I)

    H0:=0 H0:=0 H0:=0

    M5: y=Wy+X+u u ~ (0,2I)

    M6: y=X+WX+u u ~ (0,2I)

    H0:=0

    H0:=0 H0:=0

    M8: y=X+u u ~ (0,2I)

    H0:=0

    H0:=0 H0:=0 H0:=0

    M7: y=X+u u = Wu+; ~ (0,2I)

    H0:=0 H0:=0

    H0:+=0

    De lo

    G

    ENERA

    L a

    lo

    PA

    RTICU

    LAR

    De lo

    PA

    RTICU

    LAR

    a

    lo

    G

    ENERA

    L

    M1: y = Wy+X+WX+u u = Wu+; ~ (0,2I)

    M2: y=Wy+X+u u = Wu+; ~ (0,2I)

    M3: y=Wy+X+WX+u u ~ (0,2I)

    M4: y =X+WX+u u = Wu+; ~ (0,2I)

    H0:=0 H0:=0 H0:=0

    M5: y=Wy+X+u u ~ (0,2I)

    M6: y=X+WX+u u ~ (0,2I)

    H0:=0

    H0:=0 H0:=0

    M8: y=X+u u ~ (0,2I)

    H0:=0

    H0:=0 H0:=0 H0:=0

    M7: y=X+u u = Wu+; ~ (0,2I)

    H0:=0 H0:=0

    H0:+=0

    De lo

    G

    ENERA

    L a

    lo

    PA

    RTICU

    LAR

    De lo

    PA

    RTICU

    LAR

    a

    lo

    G

    ENERA

    L

    Fuente: Basado en Mur y Angulo (2009).

    Con respecto a la estructura de la Figura 2, solo haremos algunos comentarios generales. Enlos modelos en que aparece ms de una matriz de contactos, es posible especificar diferentes en las

    14

  • estructuras de dependencia en la ecuacin principal y en la estructura del error. Lo natural en lostrabajos aplicados ha sido mantener la misma hiptesis de interaccin para todas las variables delmodelo.

    La especificacin del trmino de error ha sido planteada como autoregresiva espacial, SAR (1),u = Wu+ , pero pueden introducirse ms rezagos de orden p, SAR (p): u = 1Wu+ 2W 2u+ + pW pu + . Otra estructura habitual es la de media mvil, SMA (1): u = + W o unageneralizacin de la misma, SMA (q): u = + W + 2W 2 + + qW q. Las estructurasautoregresivas, SAR (1), y de media mvil, SMA (1), son las ms utilizadas habitualmente.

    En general, se supone inicialmente normalidad, lo cual simplifica la inferencia estadstica yla estimacin de los diferentes modelos. En este trabajo hemos desarrollado toda la taxonomaconsiderando normalidad. En la actualidad hay vas alternativas como la estimacin GMM que nonecesita dicho supuesto.

    El modelo M1 se corresponde en trminos economtricos con el modelo amplio, denominadoModelo de Cliff y Ord. Un argumento negativo para comenzar el anlisis desdeM1 es la complejidadde las relaciones que contempla. Desde otra perspectiva, el enfoque de lo general a lo particularha mostrado un mejor comportamiento en la seleccin del modelo cuando existe heterocedasticidady valores atpicos (Mur y Angulo, 2009).

    3. Ilustracin: Anlisis de la Fecundidad en la Argentina6

    Dado el objetivo del documento, el tratamiento de la fecundidad desarrollado en esta seccin sirvecomo ilustracin, no pretendiendo ser el tema principal de anlisis. Se reconoce que el estudio de lafecundidad es muy complejo y requiere una discusin terica ms detallada as como la incorporacinde un nmero muy amplio de variables. En lo que sigue hemos destacado los principales aspectostericos mencionados en la literatura y se han considerado las variables explicativas ms pertinentesy que se encuentran disponibles para la Argentina.

    El comportamiento moderno de la fecundidad femenina posee un patrn claramente distintivo.La fecundidad ha tendido a declinar, primero a travs de las naciones de alto ingreso en las ltimasdcadas del siglo XIX, y posteriormente a travs de la mayora de las naciones de ingreso medio enel siglo XX (Kuznets, 1966).

    A nivel urbano-regional, Sharlin (1986) destaca que, en una primera etapa, se observa unadeclinacin de la fecundidad en las ciudades y posteriormente esa declinacin se expande hacialas zonas rurales y aledaas.

    Existen distintas teoras que explican la transicin de la fecundidad. Desde el punto de vistaeconmico, diferentes modelos de asignacin del tiempo entre las actividades de consumo yproduccin permiten plantear diversas hiptesis que vinculan cambios en el entorno econmico endonde la gente vive y sus demandas reproductivas y de fecundidad (Becker, 1960). Por otra parte,una propuesta alternativa al enfoque econmico se relaciona al cambio de ideas y la influencia de lasinteracciones sociales (Cleland y Wilson, 1987). A lo largo del tiempo, los cambios de ideas en laszonas urbanas sobre la demanda de nios sirven como fundamento para la difusin hacia el exteriorde las ciudades. Simultneamente, las mejoras en las comunicaciones y el transporte pueden generarque las personas de zonas centrales y perifricas interacten rpidamente generando una difusinms acentuada de las ideas sobre fecundidad.

    La distincin entre las diferentes teoras y el rol que juegan los grupos externos a la familia y susinteracciones ha postulado estrategias de teoras de juego cooperativas y no cooperativas dentro delas familias. Sin embargo, la complejidad de los factores que probablemente afecten la formacin degrupos genera que empricamente determinados efectos no sean identificables (Manski, 1995).

    Siguiendo la teora de Cleland y Wilson (1987), las ciudades (vistas como regiones centralesdominantes) son el inicio de esta declinacin mediante el desarrollo de nuevas ideas de organizacin

    6El anlisis estadstico de esta seccin puede replicarse en su totalidad mediante la secuencia de comandos en Rque se encuentra en el apndice.

    15

  • social y eventualmente las zonas perifricas las siguen. En trminos econmicos, la mayor densidady estructura econmica no-agrcola de los lugares urbanos son un entorno propicio para reducirla demanda de nios. La menor cantidad de nios genera, en particular sobre la mujer, mayoresoportunidades para desarrollar su nivel educativo y laboral. Este comportamiento produce que laparticipacin femenina sea ms acentuada en la fuerza laboral, volvindose financieramente msindependiente y generando nuevos incentivos para limitar los niveles de reproduccin (Weeks et al.,2004).

    La universalidad del comportamiento de la fecundidad puede ser matizada por diferenciasculturales que pueden producir distintos niveles de fecundidad entre zonas y dentro de las mismas.Los estudios a nivel regional, en su vasta mayora, examinan la fecundidad por regiones basndose ensimples dicotomas urbano-rural, como si el espacio fuese uniforme dentro de estos dos grupos.La estrategia habitual es la utilizacin de variables ficticias que capturan la pertenencia de lasobservaciones a cada una de las reas. Sin embargo, es posible que existan importantes variacionesen la fecundidad entre las diferentes reas. Este punto es el inicio de nuestra investigacin emprica,intentando brindar evidencia de la falta de homogeneidad en el espacio de la variable fecundidad parael caso de la Argentina.

    Nuestro argumento es que los patrones espaciales son importantes debido a que ofrecen indiciossobre las principales causas y potenciales consecuencias del comportamiento. Como menciona Weeks(2003), existe una escasa literatura que presta atencin a las causas y consecuencias sociales de latendencia de la fecundidad a nivel local.

    Puede argumentarse que los patrones espaciales son obvios, pero esta hiptesis ha sidopobremente contrastada para el caso argentino. Desde nuestra opinin, no es que esta hiptesisno sea relevante o que sea un resultado trivial, ms bien puede deberse a la limitada difusin delherramental desarrollado en campos cientficos como la estadstica espacial o la econometra espacialque basan su anlisis en los sistemas de informacin geogrfica.

    3.1. Hiptesis de Trabajo y DatosNuestra hiptesis de partida es que los niveles de fecundidad son determinados slo parcialmente

    por la clase social de pertenencia, medida por el capital humano. Si bien los microdeterminantesconstituyen el eje de la teora econmica relacionada con este tema (Bryan y Zick, 2006), planteamosaqu que debe considerarse adems un componente de fecundidad que puede ser explicado porla localizacin geogrfica. Esto que es lo que en la literatura se denomina efecto contextual oconducta demogrfica (Weeks, 2003). Debido a que el ser humano es un ser inherentemente social,se encuentra influenciado por el contacto con quienes interacta. En otros trminos, la hiptesispuede representarse de la siguiente manera:

    Fecundidad = f [clase social, contexto geogrfico], (54)

    es decir, la fecundidad es funcin de factores diferentes: uno de pertenencia social y otro depertenencia geogrfica o contextual.

    Usando informacin agregada por departamentos del Censo 2001, nuestras variables son lassiguientes:

    (1). HIJOS: variable que captura la fecundidad como el nmero promedio de hijos nacidos vivospor mujer. El rango de edad relevante de la mujer ha sido definido entre 15 y 29 aos.

    (2). CONV IV : Porcentaje de mujeres que conviven con hombres (casadas o en pareja), mujeresde 15 a 29 aos.

    (3). EDUC: Promedio de aos de educacin formal, mujeres de 15 a 29 aos.(4). URBAN : Porcentaje de poblacin urbana dentro del total de mujeres de 15 a 29 del

    respectivo departamento.(5). ACTIV A: Tasa de actividad porcentual definida como la relacin entre la poblacin

    econmicamente activa y la poblacin total, mujeres de 15 a 29 aos.

    16

  • (6). HNOPOB: Porcentaje de hogares no pobres segn criterio IPMH (Indicador de PrivacinMaterial de los Hogares) considerando el grupo (1) de dicho ndice.

    En el Cuadro 2 se presentan los estadsticos descriptivos. De las variables utilizadas, es necesarioaclarar la construccin de HNOPOB. La misma utiliza el ndice de Privacin Material de losHogares que identifica a los hogares segn su situacin respecto a la privacin material en cuanto ados dimensiones: recursos corrientes y patrimonial, elaborado por el INDEC. La primera dimensin semide con un ndice de condiciones habitacionales, que considera si en la vivienda existan materialesprecarios. La dimensin patrimonial se estima a travs de un indicador de capacidad econmica,construido a partir de la relacin entre la cantidad de ocupados y jubilados del hogar y el nmerototal de miembros. En el clculo se consideran los aos de instruccin, el sexo, la edad y el lugar deresidencia. El IPMH define cuatro grupos de hogares: (1) Sin privacin (no pobres); (2) Con privacinslo de recursos corrientes; (3) Con privacin slo patrimonial y (4) Con privacin de ambos tipossimultneamente (para mayor detalle vase Alvarez et al., 2004).

    Cuadro 2: Estadsticos DescriptivosVariable Observ. Media Desv. Est. Min. Max.HIJOS 531 0.9183 0.2616 0.19 1.83CONV IV 531 38.2854 6.2231 21.19 68.89URBAN 531 67.1106 29.9461 0.00 100.00EDUC 531 9.3681 1.1717 4.83 12.78ACTIV A 531 41.3712 9.2530 18.65 66.81HNOPOB 531 48.5865 22.2683 1.23 91.32

    La inclusin de las variables explicativas CONV IV , URBAN , EDUC, ACTIV A yHNOPOB busca capturar el efecto social sobre la fecundidad. Un argumento bien conocido esque las reas locales pueden tener una amplia variedad de patrones espaciales dependiendo de lasdiferentes clases sociales que las integran (Knox, 1994). Si existe segregacin residencial por clasesocial y la clase social determina en gran medida la fecundidad, estos patrones residenciales definirnun patrn espacial de reproduccin en la regin estudiada. Tambin se reconoce desde hace siglos quela tendencia de fecundidad es ms baja para las clases sociales altas, como Adam Smith mencionaen La Riqueza de las Naciones (1776).

    Es posible que el efecto de la clase social (capturada por las variables explicativas) determinecompletamente el lugar donde uno habita as como cuntos hijos decide tener, entonces elcomponente espacial ser prcticamente explicado por el estatus social. En caso contrario, unoesperara encontrar dependencia espacial asociada con los patrones de fecundidad.

    3.2. Matriz de Contactos (W ) y Anlisis ExploratorioSiguiendo lo bosquejado en la seccin 2, la primera cuestin a resolver es la construccin de

    la matriz de contactos. Dado que no tenemos una teora que nos gue en construir la matrizde contactos para los departamentos de la Argentina, consideraremos dos criterios geogrficosampliamente utilizados: tipo reina (contigidad) y 4-vecinos ms cercanos (4 nn) (Figura 3).

    En el caso de reas irregulares, el criterio de contigidad arroja similares resultados que el criteriotipo reina. Para aplicar los criterios, previamente se ha definido el centroide de cada departamento.Una alternativa al centroide es identificar la ciudad cabecera del departamento, alterando en mayormedida la estructura de vecindad del criterio 4-vecinos ms cercanos.

    Obsrvese, que en el caso del criterio de contigidad, los departamentos de Tierra del Fuegoquedan desconectados del resto de departamentos. Cuando se utiliza el criterio de los 4-vecinosms cercanos, todas las unidades tienen el mismo nmero de conexiones. Como se ha mencionadopreviamente, el uso de criterios geogrficos genera un tratamiento exgeno de la matriz de contactos,

    17

  • evitando problemas de inferencia. La seleccin entre las matrices de contactos puede ser realizadaen una etapa ms avanzada, una vez definido el modelo espacial ms adecuado.

    Figura 3: Mapas de Contactos bajo Criterios Alternativos

    Contigidad de 1 Orden 4-Vecinos ms Cercanos

    A continuacin se presenta el mapa de coropletas para la variable HIJOS. En la Figura 4, puedeobservarse que las zonas de baja fecundidad se encuentran distribuidas en la regin central del pas,esto es, los departamentos de las provincias de Buenos Aires, Crdoba y Santa Fe. La alta fecundidadse concentra en las regiones del norte y sur de la Argentina.

    La Figura 4 refleja un patrn espacial que era de esperar, relacionando baja fecundidad con losprincipales centros urbanos del pas. Si bien el mapa brinda informacin, no puede determinarse si talinformacin es cuantitativamente relevante. Para obtener una medida cuantitativa de dependenciaespacial utilizaremos las matrices espaciales previamente definidas para construir los Diagramas deDispersin de Moran (Figura 5).

    En la Figura 5, bajo ambas matrices de contactos se obtiene una autocorrelacin espacial positiva.Es decir, el comportamiento de la tasa de fecundidad en el departamento i es similar al de sus vecinos:si los vecinos tienen baja (alta) tasa de fecundidad entonces el departamento analizado tender atener una tasa baja (alta) de fecundidad respecto al promedio nacional.

    En los diagramas de dispersin de la Figura 5 si incluye el valor de estadstico I de Moran. Lasvariables graficadas han sido previamente estandarizadas, es decir:

    hijosi = (HIJOSiHIJOS)/(HIJOSiHIJOS)2/N1. (55)

    18

  • Figura 4: Distribucin Espacial de Fecundidad

    Cuando se trabaja simultneamente con la matriz de contactos y la variable estandarizadas, uncamino simple para obtener el valor del test I de Moran es realizar la siguiente regresin:

    W hijosi = hijosi + i. (56)El valor del coeficiente estimado es igual al valor I de Moran7:

    =(xx

    )1xy = hijos

    W hijoshijoshijos

    = I. (57)

    Necesitaremos calcular la varianza y la media del estadstico para utilizar la aproximacin a ladistribucin Normal y as conocer si los valores obtenidos son significativos estadsticamente. Losvalores del test I de Moran normalizado son 25,34, con el criterio de contigidad, y 23,60, con elcriterio de 4-vecinos ms cercanos, siendo ambos significativos.

    En resumen, la variable fecundidad muestra dependencia espacial significativa tal comoinicialmente se haba visualizado en el mapa de coropletas.

    7En el apndice se presenta el cdigo para realizar este grfico en R.

    19

  • Figura 5: Diagrama de Dispersin

    3 2 1 0 1 2 3

    2

    1

    01

    2

    HIJOS

    Rez

    ago

    Espa

    cial H

    IJO

    S

    I de Moran= 0.6789

    3 2 1 0 1 2 3

    2

    1

    01

    2

    HIJOS

    Rez

    ago

    Espa

    cial H

    IJO

    S

    I de Moran= 0.6713

    Contigidad de Primer Orden 4-Vecinos ms Cercanos

    3.3. Anlisis de Regresin EspacialDetectada la dependencia espacial de la fecundidad, es posible que el conjunto de variables

    explicativas pueda capturar la variacin espacial de la misma. Por lo tanto, nuestro primer modeloes simple:

    HIJOSi = 0 + 1CONV IVi + 2URBANi + 3EDUCi + 4ACTIV Ai + 5HNOPOBi + i.(58)

    Los resultados de la estimacin del modelo (58) por MCO se presentan en el Cuadro 3.

    Cuadro 3: Estimacin por MCOVariable Coeficiente |t|

    CONSTANTE 1,2911 12,290CONV IV 0,0128 12,842URBAN 0,0006 3,685EDUC 0,0448 4,552ACTIV A 0,0039 4,774HNOPOB 0,0048 10,568

    R2 0,8733

    Los coeficientes tienen el signo esperado. La variable CONV IV , que captura el efecto de estaren pareja a la fecha del censo, tiene un efecto positivo sobre la tasa de fecundidad. Las variablesURBAN , EDUC, ACTIV A y HNOPOB reflejan que la mayor proporcin de poblacin urbana,mujeres ms educadas en promedio o con mayor participacin en el mercado laboral y mayor niveleconmico afectan negativamente a la decisin de procreacin promedio.

    La significancia estadstica no puede ser interpretada hasta tanto no se compruebe la hiptesisde independencia en los residuos. Nuevamente, recurrimos al mapa de coropletas para visualizar ladistribucin de los mismos (Figura 6).

    20

  • Figura 6: Distribucin Espacial de los Residuos MCO

    [0.4392,0.0508)[0.0508,0)[0,0.0444)[0.0444,0.5351]

    La distribucin residual representada por colores no parece tener un patrn aleatorio. La aplicacinde la batera de estadsticos espaciales confirma que la distribucin residual refleja dependenciaespacial (Cuadro 4).

    Cuadro 4: Tests de Independencia EspacialMatrices Contigidad de Primer Orden 4-Vecinos ms cercanos

    test Valor p-valor Valor p-valorI de Moran 0,41 0,0000 0,34 0,0000LMERROR 239,93 0,0000 147,67 0,0000LMEL 143,93 0,0000 85,67 0,0000LMLAG 102,69 0,0000 72,76 0,0000LMLE 6,70 0,0096 10,75 0,0010

    LMSARMA 246,63 0,0000 158,43 0,0000

    El estadstico I de Moran muestra un p-valor inferior al nivel de significancia del 1 %, detectandodependencia espacial aunque sin informarnos sobre el posible modelo espacial a seguir. Los estadsticosLM son ms tiles en este sentido.

    El test LMERROR y su versin robusta LMEL detectan presencia de autocorrelacin espacial enla estructura del error, indicndonos como ecuacin alternativa un modelo de error espacial. Por suparte, el test LMLAG y la versin robusta del mismo LMLE detecta indicios de autocorrelacin enla estructura de la ecuacin y el modelo adecuado ser un modelo de rezago espacial.

    21

  • Dada la informacin de los tests LM podemos optar por estimar los modelos SLM , SEM ySARAR, este ltimo incorpora simultneamente estructura dinmica en la ecuacin y en el trminode error. El Cuadro 5 muestra los resultados utilizando las posibles matrices de contactos.

    Cuadro 5: Estimacin por Mxima VerosimilitudMatrices Contigidad de Primer Orden 4 Vecinos ms cercanosModelo SLM SEM SARAR SLM SEM SARARVariable Coef. Estim./(|t|) Coef. Estim./(|t|)

    CONSTANTE0,6837(6,12)

    1,1395(11,83)

    1,1783(9,99)

    0,8311(7,45)

    1,2380(12,25)

    1,1340(9,68)

    CONV IV0,0130(14,34)

    0,0158(17,73)

    0,0158(17,24)

    0,0128(13,77)

    0,0145(15,18)

    0,0146(15,09)

    URBAN0,0011

    (6,43)0,0004

    (2,54)0,0003

    (2,29)0,0010

    (5,68)0,0003

    (1,92)0,0004

    (2,42)

    EDUC0,0212

    (2,28)0,0537

    (5,78)0,0549

    (5,85)0,0275

    (2,91)0,0595

    (6,10)0,0554

    (5,60)

    ACTIV A0,0018

    (2,30)0,0034

    (4,55)0,0034

    (4,57)0,0018

    (2,30)0,0026

    (3,30)0,0024

    (3,02)

    HNOPOB0,0039

    (9,39)0,0031

    (6,55)0,0030

    (6,38)0,0043(10,21)

    0,0037(7,57)

    0,0038(7,89)

    0,3015(10,01) -

    0,0330(0,68)

    0,2325(8,58) -

    0,0694(1,95)

    - 0,7470

    (22,46)0,7700(21,00) -

    0,6439(17,09)

    0,5824(12,31)

    log MV 556,99 616,40 616,52 544,87 580,19 581,65Notas: * Significativo al 5%.

    Los resultados de la estimacin de los modelos SLM , SEM y SARAR mantienen el signoesperado de las variables explicativas. En el caso de los modelos SLM y SEM , los coeficientes quecapturan la dependencia espacial son positivos y significativos. El problema es que no podemos elegirentre alguno de los dos modelos debido a que no se encuentran anidados.

    La estimacin del modelo SARAR nos permite seleccionar, en este caso aplicado, entre ambosmodelos. Como puede observarse, a pesar de que utilizamos dos matrices de contactos diferentes,la evidencia estadstica indica que debemos seleccionar el modelo SEM : el coeficiente no essignificativo en ninguno de los modelos SARAR y al eliminarlo de la ecuacin obtenemos el modelode error espacial.

    Un modelo an no presentado es el Modelo Espacial de Durbin. Recurdese que este modelo,si se cumplen las restricciones correspondientes, es posible reducirlo a un modelo de error espacial,SEM .

    Los resultados de la estimacin del modelo de Durbin, bajo las diferentes matrices de contactos,se presentan en el Cuadro 6. Nuevamente, los signos de las variables explicativas son los esperados.En este modelo, adicionalmente se incorporan efectos de vecindad de las variables explicativas y untrmino de dependencia sustantiva en la ecuacin.

    El resultado ms importante es el estadstico LR. Usando la matriz de contactos de contigidadel resultado es:

    LRCOMFAC = 2[l|H1 l|H0

    ]= 28,92

    as25, (59)

    p valor = 0,00002,

    rechazndose la hiptesis nula.Bajo la matriz de contactos 4 nn, el resultado es:

    22

  • LRCOMFAC = 2[l|H1 l|H0

    ]= 47,93

    as25, (60)

    p valor = 0,00000,

    nuevamente, rechazamos la hiptesis nula.

    Cuadro 6: Modelo de Durbin. Estimacin por MVMatrices Contigidad de Primer Orden 4 Vecinos ms cercanosVariable Coef. Estim./(|t|) Coef. Estim./(|t|)

    CONSTANTE0,5370(3,60)

    0,5603(3,77)

    CONV IV0,0165(18,34)

    0,0162(16,72)

    URBAN0,0004

    (2,88)0,0004

    (2,31)

    EDUC0,0542

    (5,73)0,0594

    (6,13)

    ACTIV A0,0030

    (4,06)0,0020

    (2,60)

    HNOPOB0,0023

    (4,62)0,0027

    (5,30)

    W CONV IV 0,0137

    (8,98)0,0108

    (7,14)

    W URBAN 0,00008(0,32)0,0004(1,77)

    W EDUC 0,0345

    (2,32)0,0513(3,54)

    W ACTIV A 0,0014(1,14)0,0006(0,52)

    W HNOPOB 0,0009(1,29)0,0005(0,72)

    0,6735(17,44)

    0,5547(12,99)

    LRCOMFAC 28,92 47,93log MV 630,86 604,16

    Notas: * Significativo al 5%.

    En conclusin el modelo de Durbin es el adecuado, segn los estadsticos de anlisis.Ante la disyuntiva de seleccionar entre un modelo con dependencia en el error como el SEM

    y otro modelo ms complejo como el de Durbin la literatura se inclina por este ltimo. La eleccinse debe a las consecuencias inferenciales que se derivan de ambos modelos. Si se estima un modelode error espacial, pero se ha omitido un parmetro de dependencia sustantiva, los coeficientesestimados son inconsistentes. En el caso de estimarse un modelo de Durbin, omitiendo un parmetrode dependencia residual, los estimadores sern consistentes a pesar de no ser eficientes.

    Finalmente, tenemos un modelo espacial elegido pero queda la cuestin de qu tipo de matrizde contactos se debe seleccionar. En este paso, podemos utilizar el ajuste del modelo respecto a lafuncin de mxima verosimilitud. Usando la informacin de la ltima fila del Cuadro 6, la matriz decontactos ms adecuada ser la de 4-vecinos ms cercanos.

    23

  • Como ltimo comentario, es posible explorar modelos ms complejos tales como los presentadosen la Figura 2, pero los mismos escapan a la finalidad del presente trabajo y se revisarn en futurosavances.

    4. ConclusionesEste trabajo ha pretendido introducir al lector dentro de los principales modelos desarrollados en

    econometra espacial. La revisin ha incluido cuestiones an abiertas y de intensa investigacin comoes el tema de la especificacin y seleccin de la matriz de contactos. Esta matriz es un elementoclave en econometra espacial ya que condiciona todo el anlisis posterior.

    Adicionalmente, el trabajo presenta la metodologa ms habitual que es de lo particular a logeneral en cuanto a la introduccin de elementos espaciales. Entre los modelos espaciales mssimples podemos mencionar el modelo de error espacial, SEM , y el modelo de rezago espacial,SLM . Dependiendo de la complejidad estudiada se pueden incorporar elementos espaciales en elerror y en la ecuacin principal simultneamente, modelo SARAR. Otro modelo ms avanzado esel modelo espacial de Durbin.

    El trabajo presenta una aplicacin emprica con la idea de mostrar la estimacin de los diferentesmodelos espaciales bajo el entorno del paquete estadstico R. Para ello utilizamos como ejemplo elanlisis de la fecundidad en la Argentina. El tema aplicado es por si mismo valioso debido a la faltade referencia de similares estudios para nuestro pas.

    La especificacin final del modelo de fecundidad ha sido desarrollada mediante la gua estadstica.Se reconoce que el anlisis de la fecundidad es muy complejo y requiere una discusin terica msdetallada as como la incorporacin de un nmero ms amplio de variables. En futuros avancespretendemos unificar teora econmica e informacin estadstica para arribar a una especificacinms completa.

    Como comentario final queremos destacar la informacin brindada en el apndice, en donde seincorpora el cdigo en R sobre la estimacin de los diferentes modelos. Esperamos con ello incentivarla investigacin dentro de esta rea economtrica.

    24

  • Referencias[1] Aldstadt, J. y A. Getis (2006). Using AMOEBA to Create a Spatial Weights Matrix and Identify

    Spatial Clusters, Geographical Analysis, 38, pp. 327-343.

    [2] Alvarez, G., Gmez, A., Lucarini, A., Mario, S. y F. Olmos (2004). El estudio de la pobrezasegn el Censo Nacional de Poblacin, Hogares y Viviendas 2001 Indice de Privacin Materialde los Hogares (IPMH), DNESyP/DEP/P5/PID, Serie Pobreza, DT Metodolgico, InstitutoNacional de Estadstica y Censos de la Repblica Argentina (INDEC).

    [3] Anselin, L. (1980). Estimation Methods for Spatial Autoregressive Structures, RegionalScience Dissertation and Monograph Series, Ithaca, New York.

    [4] Anselin, L. (1988). Spatial Econometrics: Methods and Models. Dordrecht: Kluwer

    [5] Anselin, L. (1995). Local Indicators of Spatial association-LISA, Geographical Analysis, 27,pp. 93-115.

    [6] Anselin, L. (2001). Raos Score Test in Spatial Econometrics, Journal of Statistical Planningand Inferences, 97, pp. 113-139.

    [7] Anselin, L. (2002). Under the Hood: Issues in the Specification and Interpretation of SpatialRegression Models, Agricultural Economics, 17, pp. 247267.

    [8] Anselin, L. y A. Bera (1998). Spatial Dependence in Linear Regression Models with anIntroduction to Spatial Econometrics, en A. Ullah y D. Giles (eds.), Handbook of AppliedEconomic Statistics. New York: Marcel Dekker.

    [9] Anselin, L., Bera, A., Florax, R. y M. Yoon (1996). Simple Diagnostic Tests for SpatialDependence, Regional Science and Urban Economics, 26, pp. 77-104.

    [10] Anselin, L. y R. Florax (eds.) (1995). New Directions in Spatial Econometrics. Berlin: Springer-Verlag.

    [11] Becker, G.S. (1960). An Economic Analysis of Fertility, en Demographic and Economic Changein Developed Countries, Princeton, NJ: Princeton University Press.

    [12] Bivand, R. S., E. J. Pebesma y V. Gmez-Rubio (2008). Applied Spatial Data Analysis with R.New York: Springer.

    [13] Bivand, R. S., W. Mller y M. Reder. (2009). Power calculations for global and local MoransI, Computational Statistics and Data Analysis, 53, pp. 28592872.

    [14] Bodson, P. y D. Peeters (1975). Estimation of the Coefficients of a Linear Regression in thePresence of Spatial Autocorrelation. An Application to a Belgian Labour-Demand Function,Environment and Planning A, 7, pp. 455-472.

    [15] Bryan, K. y C. Zick (2006). The Economic Organization of the Household. 2 Edicin. London:Cambridge University Press.

    [16] Brock, W. y S. Durlauf (1995). Discrete choice with social interactions I: Theory. WorkingPaper N W5291. National Bureau of Economic Research.

    [17] Case, A., Rosen, H. y J. Hines (1993). Budget Spillovers and Fiscal Policy Interdependence:Evidence from the States, Journal of Public Economics, 52, pp. 285-307.

    [18] Chasco Yrigoyen, C. (2003). Econometra Espacial Aplicada a la Prediccin-Extrapolacin deDatos Microterritoriales. Consejera de Economa e Innovacin Tecnolgica de la Comunidad deMadrid.

    25

  • [19] Cleland, J. y C. Wilson (1987). Demand Theories of the Fertility Transition: An IconoclasticView, Population Studies, 41(1), pp. 5-30.

    [20] Cliff, A. D. y J. K. Ord (1969). The problem of Spatial autocorrelation, en A. J. Scott (ed.),London Papers in Regional Science 1, Studies in Regional Science. London: Pion.

    [21] Cliff, A. D. and J. K. Ord (1973). Spatial autocorrelation. London: Pion.

    [22] Cliff, A. D. and J. K. Ord (1981). Spatial Processes, Models and Applications. London: Pion.

    [23] Cressie, N. (1993). Statistics for Spatial Data. Revised edition. New York: Wiley.

    [24] Dacey, M. (1969). Similarities in the Areal Distributions of Houses in Japan and Puerto Rico,Area, 3, pp. 35-37.

    [25] Davidson, R. y J. MacKinnon (1993). Estimation and Inference in Econometrics. New York:Oxford University Press.

    [26] Fernndez, E., Mayor, M. y J. Rodrguez (2009). Estimating Spatial Autoregressive Models byGME-GCE Techniques, International Regional Science Review, 32, pp. 148-172.

    [27] Fischer, M. y A. Getis (eds) (2010). Handbook of Applied Spatial Analysis. Software Tools,Methods ans Applications. Berlin: Springer-Verlag.

    [28] Florax, R. y T. de Graaff (2004). The Performance of Diagnostic Tests for Spatial Dependencein Linear Regression Models: A Meta-analysis of Simulation Studies, en L. Anselin, R. Floraxy S. Rey (eds.), Advances in Spatial Econometrics. Berlin: Springer-Verlag.

    [29] Folmer, H. y J. Oud (2008). How to get rid of W? A Latent Variable Approach to ModelingSpatially Lagged Variables, Environment and Planning A, 40, pp. 2526-2538.

    [30] Geary, R. C. (1954). The contiguity ratio and statistical mapping, The IncorporatedStatistician, 5, pp. 115145.

    [31] Getis, A. y J. Aldstadt (2004). Constructing the Spatial Weights Matrix Using a Local StatisticSpatial, Geographical Analysis, 36, pp. 90-104.

    [32] Getis, A. y J. Ord (1992). The Analysis of Spatial Association by Use of Distance Statistics,Geographical Analysis, 24, pp. 189206.

    [33] Getis, A. y J. Ord (1996). Local Spatial Statistics: An Overview, en Longley, P. y M.Batty (eds), Spatial Analysis: Modelling in a GIS Environment. Cambridge: GeoInformationInternational.

    [34] Goldberger, A. (1991). A Course in Econometrics. Harvard University Press,

    [35] Greene, W. (1993). Econometric Analysis. 2 edicin. New York: Macmillan.

    [36] Haining, R. (2003). Spatial Data Analysis: Theory and Practice. Cambridge: CambridgeUniversity Press.

    [37] Hayashi, F. (2000). Econometrics. Princeton University Press.

    [38] Kennedy, P. (1998). A Guide to Econometrics. 4 edicin. Cambridge: MIT Press.

    [39] Knox, P. (1994). Urbanization: An introduction to Urban Geography. Englewood Cliffs, NJ:Prentice Hall.

    [40] Krugman, P. (1991). Geography and trade. Cambridge, MA: MIT Press.

    26

  • [41] Kuznets, S. (1966). Modern Economic Growth: Rate Structure and Spread. New Haven: YaleUniversity Press.

    [42] Lancaster, T. (2000). The incidental parameter problem since 1948, Journal of Econometrics,95, pp. 391413.

    [43] Lesage, J. y K. Pace (2009). Introduction to Spatial Econometrics. Boca Raton: CRC Press.

    [44] Ma, J., Haining, R. y S. Wise (1997). SAGE Users Guide, Dpto. de Geografa y SheffieldCenter for Geographic Information and Spatial Analysis, Universidad de Sheffield.

    [45] Manski, C.F. (1995). Identification Problems in the Social Sciences, Cambridge, MA: HarvardUniversity Press.

    [46] Mantel, N. (1967). The Detection of Disease Clustering and a Generalized RegressionApproach, Cancer Research, 27, pp. 209-220.

    [47] Molho, I. (1995). Spatial Autocorrelation in British Unemployment, Journal of RegionalScience, 35, pp. 641-658.

    [48] Moran, P. (1948). The Interpretation of Statistical Maps, Journal of the Royal StatisticalSociety B, 10, pp. 243-251.

    [49] Moran, P. (1950). Notes on Continuous Stochastic Phenomena, Biometrika, 37 (1), pp.1723.

    [50] Mur, J. y A. Angulo (2009). Model Selection Strategies in a Spatial Setting, Regional Scienceand Urban Economics, 39, pp. 200-213.

    [51] Mur, J. y J. Paelinck (2010). Deriving the W-matrix via P-median Complete CorrelationAnalysis of Residuals, The Annals of Regional Science, DOI: 10.1007/s00168-010-0379-3.

    [52] Ord, J. y A. Getis (2001). Testing for local spatial autocorrelation in the presence of globalautocorrelation, Journal of Regional Science, 41, pp. 411432.

    [53] Paelinck, J. y L. Klaassen (1979). Spatial Econometrics. Farnborough: Saxon House.

    [54] Racine, J. y R. Hyndman (2002). Using R to Teach Econometrics, Journal of AppliedEconometrics, 17(2), pp. 149-174.

    [55] Ruud, P. (2000). An Introduction to Classical Econometric Theory. Oxford University Press.

    [56] Sharlin, A. (1986). Urban-Rural differences in fertility in Europe during the demographictransition, en A. Coale y S. Watkins (eds.), The decline of fertility in Europe. Princeton,NJ: Princeton University Press.

    [57] Smith, A. (1776). An Inquiry into the Nature and Causes of the Wealth of Nations. E. Cannan(ed), Chicago: The University Press [1976].

    [58] Tiefelsdorf M. y D. Griffith (2007). Semiparametric Filtering of Spatial Autocorrelation: TheEigenvector Approach, Environment and Planning A, 39(5), pp. 1193-1221.

    [59] Tobler, W. (1979). Cellular Geography, en S. Gale y G. Olsson (eds.), Philosophy in Geography,pp. 379386. Dordrecht: Reidel.

    [60] Toral, A. (2001). El Factor Espacial en la Convergencia de las Regiones de la UE: 1980- 1996,Tesis doctoral, ICADE, Universidad de Comillas. Madrid.

    27

  • [61] Weeks, J. (2003). The Role of Spatial Analysis in Demographic Research, en F. Goodchildy D. Janelle (eds.), Spatially Integrated Social Science: Examples in Best Practice. New York:Oxford University Press.

    [62] Weeks, J., Getis, A., Hill, A., Gadalla, M. y T. Rashed (2004). The Fertility Transition in Egypt:Intraurban Patterns in Cairo, Annals of the Association of American Geographers, 94(1), pp.7493.

    Apndice: Datos, Archivos, Paquetes y Cdigo en REl anlisis emprico ha sido realizado usando datos del Censo 2001 (INDEC), disponibles por

    departamento. Los datos pueden descargarse por medio del programa REDATAM SP desde lasiguiente pgina web: www.indec.gov.ar/Redatam+SP.

    Los archivos shapefile por departamentos de Argentina pueden descargarse de manera gratuitadesde la siguiente pgina web: www.gadm.org/country.

    En la actualidad, los investigadores aplicados disponen de una amplia gama de herramientaspara estimar modelos espaciales. Estas herramientas se han implementado en programas comercialestales como SAS, Matlab o Stata. Lamentablemente, estos programas comerciales pueden ser muycostosos y a veces prohibitivos. Una excelente alternativa para iniciarse en econometra espaciales OpenGeoDa (https://geodacenter.asu.edu/software/downloads), aunque presenta laslimitaciones de que su cdigo no es modificable y carece de los ltimos avances de estimacin8.Afortunadamente, existe otra alternativa a OpenGeoDa y a los programas comerciales que tiene comovirtud su actualizacin constante incluyendo la incorporacin de los ltimos avances en econometraespacial. El programa es denominado R y se encuentra disponible bajo licencia pblica GNU.Para obtener este programa simplemente debe ingresarse al sitio http://www.r-project.org y acontinuacin se deben seguir las instrucciones para su descarga.

    Bsicamente, R es un lenguaje de programacin de cdigo abierto y presenta varias ventajas:libre, portable, programable y permite el lenguaje matricial (Racine y Hyndman, 2002). Comodesventaja puede mencionarse que funciona por lnea de comandos y algunas funciones puedenno encontrarse disponibles ya que el funcionamiento de R se encuentra fundamentado en el uso depaquetes. Cada paquete es una coleccin de funciones que permiten la realizacin de determinadastareas que previamente debe instalarse (situacin similar a los toolboxes de Matlab). Debido alas contribuciones provenientes de diferentes reas cientficas, es posible que algunas funcionalidadesentre los paquetes se solapen ofreciendo estimaciones similares.

    Para el rea de econometra espacial, R dispone de diversos paquetes que se complementan. Acontinuacin presentamos el cdigo con los paquetes disponibles para replicar el anlisis emprico:

    ## Cargando los paquetes espacialeslibrary(maps) ## Projectionslibrary(maptools) ## Data managementlibrary(sp) ## Data managementlibrary(spdep) ## Spatial autocorrelationlibrary(RColorBrewer) ## Visualizationlibrary(classInt) ## Class intervalslibrary(lmtest) ## LM Tests### Carga de Datos y matrices ###argentina

  • summary(polgal)attach(argentina)polgwt
  • title(paste("I de Moran= ",format(round(mori2,4))))### Regresin Lineal ###mod.lm