La Utilidad de la Econometría Espacial en el Ámbito de la Ciencia Regional* por Esther Vayá...

49
La Utilidad de la Econometría Espacial en el Ámbito de la Ciencia Regional* por Esther Vayá Valcarce** Rosina Moreno Serrano** DOCUMENTO DE TRABAJO 2000-13 Mayo, 2000 * El presente documento es un resumen de un trabajo más amplio titulado "Técnicas econométricas en el tratamiento de datos espaciales: La Econometría Espacial" (Ediciones Universidad de Barcelona). Las autoras agradecen a Enrique López-Bazo el esfuerzo compartido en la utilización y difusión de la econometría espacial en el ámbito de la ciencia regional y que ha dado lugar a diversos trabajos conjuntos. Asimismo, agradecen a todos los miembros del Grupo de Investigación AQR sus útiles comentarios y sugerencias. Este trabajo forma parte del proyecto de la DGICYT SEC99-0700 y del Plan Nacional 2FD97-1004-C03-01. Rosina Moreno agradece la hospitalidad del Regional Research Institute de la West Virginia University y especialmente de Luc Anselin durante su estancia pre-doctoral en dicha institución. ** Grupo de Investigación “Anàlisi Quantitativa Regional” (AQR). Dpt. de Econometría, Estadística y Economía Española, Universidad de Barcelona. Av. Diagonal 690, 08034 Barcelona. Tel: 93-4024320; Fax: 93-4021821. e-mail: [email protected], [email protected] . Los Documentos de trabajo se distribuyen gratuitamente a las Universidades e Instituciones de Investigación que lo solicitan. No obstante están disponibles en texto completo a través de Internet: http://www.fedea.es/hojas/publicaciones.html#Documentos de Trabajo These Working Documents are distributed free of charge to University Department and other Research Centres. They are also available through Internet: http://www.fedea.es/hojas/publicaciones.html#Documentos de Trabajo

Transcript of La Utilidad de la Econometría Espacial en el Ámbito de la Ciencia Regional* por Esther Vayá...

La Utilidad de la Econometría Espacial en el Ámbito de la Ciencia Regional*

por Esther Vayá Valcarce**

Rosina Moreno Serrano** DOCUMENTO DE TRABAJO 2000-13

Mayo, 2000

* El presente documento es un resumen de un trabajo más amplio titulado "Técnicas

econométricas en el tratamiento de datos espaciales: La Econometría Espacial" (Ediciones Universidad de Barcelona). Las autoras agradecen a Enrique López-Bazo el esfuerzo compartido en la utilización y difusión de la econometría espacial en el ámbito de la ciencia regional y que ha dado lugar a diversos trabajos conjuntos. Asimismo, agradecen a todos los miembros del Grupo de Investigación AQR sus útiles comentarios y sugerencias. Este trabajo forma parte del proyecto de la DGICYT SEC99-0700 y del Plan Nacional 2FD97-1004-C03-01. Rosina Moreno agradece la hospitalidad del Regional Research Institute de la West Virginia University y especialmente de Luc Anselin durante su estancia pre-doctoral en dicha institución.

** Grupo de Investigación “Anàlisi Quantitativa Regional” (AQR). Dpt. de Econometría, Estadística y Economía Española, Universidad de Barcelona. Av. Diagonal 690, 08034 Barcelona. Tel: 93-4024320; Fax: 93-4021821. e-mail: [email protected], [email protected].

Los Documentos de trabajo se distribuyen gratuitamente a las Universidades e Instituciones de Investigación que lo solicitan. No obstante están disponibles en texto completo a través de Internet: http://www.fedea.es/hojas/publicaciones.html#Documentos de Trabajo These Working Documents are distributed free of charge to University Department and other Research Centres. They are also available through Internet: http://www.fedea.es/hojas/publicaciones.html#Documentos de Trabajo

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

1

"En muchas circunstancias la asunción más cuestionable...es que las unidades de corte transversal son mutuamente independientes. Por ejemplo, cuando las unidades corte transversal son regiones geográficas con fronteras dibujadas arbitrariamente -tales como los estados de Estados Unidos- no deberíamos esperar que esta asunción sea satisfecha" (Kmenta, 1971). "La primera ley de la Geografía es: cualquier cosa está relacionada con cualquier otra pero las cosas más cercanas están más relacionadas que las más distantes" (Tobler, 1970).

1. Introducción La economía regional y urbana ha experimentado un notable desarrollo metodológico en los últimos cuarenta años potenciando la necesidad de trabajar con la especial naturaleza de los datos de corte transversal. En este sentido, cuando se utiliza este tipo de datos suelen aparecer los denominados efectos espaciales: la heterogeneidad y la dependencia espacial. El primer efecto, la heterogeneidad espacial, surge cuando se utilizan datos de unidades espaciales muy distintas para explicar un mismo fenómeno. En tal caso, aparecen problemas como la heteroscedasticidad o la inestabilidad estructural, los cuales pueden ser resueltos mediante las técnicas econométricas ya existentes para series temporales. La dependencia o autocorrelación espacial surge cuando el valor de una variable en un lugar del espacio está relacionado con su valor en otro u otros lugares del espacio. No obstante, y a diferencia de lo ocurrido con la heterogeneidad espacial, la dependencia espacial no puede ser tratada por la econometría estándar, requiriendo un tratamiento específico. Ello es debido a la multidireccionalidad que domina las relaciones de interdependencia entre unidades espaciales. Con el objetivo de resolver los problemas que supone la presencia de efectos espaciales, especialmente el segundo de ellos, surgió la econometría espacial como subdisciplina de la econometría general, proporcionando las técnicas de contrastación y de estimación necesarias para trabajar con datos que presentan problemas de heterogeneidad y/o dependencia espacial. Si bien el conocimiento de los problemas causados por la estructura y la dependencia espacial y sus efectos en la validez de los métodos estadísticos tradicionales puede remontarse a Student (1914), los comienzos en el desarrollo de un campo separado de la estadística espacial se atribuyen a la obtención de los primeros índices formales

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

2

para detectar la presencia de autocorrelación espacial en los trabajos de Moran (1948) y Geary (1954). Tras esta fase inicial de reconocimiento del problema, es en la década de los setenta cuando surge el término econometría espacial, acuñado por Paelinck y Klaassen (1979) y originariamente referido a los esfuerzos realizados para abordar la autocorrelación espacial en el término de perturbación de un modelo de regresión. En Anselin (1988a), la econometría espacial se define más concretamente como la colección de técnicas que tratan las peculiaridades causadas por el espacio en el análisis estadístico de los modelos de ciencia regional. Según Anselin y Bera (1998), en esta ultima definición se estarían incorporando específicamente las regiones, la localización y la interacción espacial, formando la base de los trabajos empíricos en economía regional y urbana. El gran desarrollo de la econometría espacial se ha dado en las décadas de los ochenta y noventa. Así, los trabajos de Cliff y Ord (1981), Blommestein (1983) y Anselin (1980, 1988a, b) son los primeros en los que se analiza de manera general los aspectos metodológicos más importantes. Posteriormente han ido apareciendo en las revistas de economía regional contribuciones concretas en el campo de la econometría espacial. De esta forma, la importancia y relevancia de los métodos que analizan los efectos espaciales en los modelos econométricos está incrementando de forma notable. Como mencionan Anselin y Florax (1995a), ello es debido, entre otros aspectos, al renovado interés por el papel del espacio, de la interacción espacial y de las externalidades en la teoría de la ciencia social, la creciente disponibilidad de extensas bases de datos socio-económicos para datos geo-referenciados y, por último, por el desarrollo de una tecnología eficiente y poco costosa para tratar con datos referenciados espacialmente, tanto en forma de Sistemas de Información Geográfica como de software útil para el análisis de datos espaciales. Con relación a este último aspecto cabe destacar que en 1992 Anselin puso a disposición de los economistas aplicados el programa SpaceStat, en el que se hallan implementados bajo el entorno Gauss los diferentes contrastes de detección de autocorrelación espacial en los modelos de regresión así como los métodos de estimación que incorporan dicha problemática. Habida cuenta de la inexistencia previa de un software específicamente dedicado al tratamiento de los efectos espaciales, la aparición de este paquete econométrico ha facilitado la aplicación de dichos métodos, favoreciendo así el surgimiento de trabajos aplicados que analizan la problemática de los datos transversales en el ámbito de la economía regional y urbana.

No obstante, a pesar de esta aparente mayor difusión de la econometría espacial, la distancia que la separa, en términos de su conocimiento y difusión,

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

3

de la econometría clásica todavía es notable. Así, tal y como exponen Anselin y Florax (1995a), “...a pesar de los importantes desarrollos metodológicos, sería excesivo sugerir que la econometría espacial se ha convertido en una práctica aceptada en la investigación empírica en la ciencia regional y en la economía regional”. Por el contrario, la mayor parte de la literatura publicada en los últimos quince años sobre econometría espacial ha tenido poca difusión entre la mayoría de los analistas de economía empírica. A modo de ejemplo, en el cuadro 1 se recogen la mayor parte de los artículos publicados en revistas de perfil económico que aplican parte de las herramientas de especificación, constrastación y/o estimación del principal efecto espacial analizado en el presente libro: la dependencia espacial. Cuadro 1. Principales aplicaciones empíricas en el campo de la Econometría Espacial

Autores Año Revista Ámbito temático

Nagaraj, R. et al 1999 Annales d’Economie et de Statistique

Crecimiento económico y externalidades espaciales

López-Bazo, E. et al 1999 Annals of Regional Science Dinámica regional y convergencia Rey, S. y B.D. Montouri 1999 Regional Studies Crecimiento y convergencia regional

Mencken, F.C. 1998 Growth and Change Crecimiento económico y disparidades regionales

Vandeveer, L. et al 1998 Review of Agricultural Economics Estudio de mercados rurales y GIS Rietveld,P. y Wintershoven, P. 1998 Papers in Regional Science Red de infraestructuras en regiones frontera

Basu, S. y Thibodeau, T. 1998 Journal of Real Estate Finance and Economics

Precio de transacción de viviendas

Macedo, P.B.R 1998 Revista Brasileira de Economia Determinantes del precio de viviendas y externalidades

Varga, A. 1998 Tesis Doctoral Efectos regionales de la I+D universitaria Moreno, R. 1998 Tesis Doctoral Crecimiento económico, externalidades e

infraestructuras Vayá, E. 1998 Tesis Doctoral Crecimiento económico y externalidades

regionales Moreno, R. et al 1997 International Journal of

Development Planning Literature Crecimiento y capital público

Bivand, R. y Szymanski, S. 1997 Economic Letters Competencia local y externalidades Ashworth, J. y Parker, S.C. 1997 Scottish Journal of Political

Economy Determinantes del precio de las viviendas

Aten, B. 1997 International Regional Science Review

Precios y comercio internacional

Can, A. y Megbolugbe, I. 1997 Journal of Real Estate Finance and Economics

Índice de Precios de Viviendas

Kelejian, H. y Robinson, D. 1997 Papers in Regional Science Estudio de la productividad regional e infraestructuras públicas

Anselin, L. et al 1997 Journal of Urban Economics Spillovers Tecnológicos O’Loughlin, J. y Anselin, L. 1996 Economic Geography Comercio Internacional

Bernat, G. 1996 Journal of Regional Science Estudio del crecimiento regional Aten, B. 1996 Review of Income and Wealth Precios y comercio internacional

Lyson, T. y Tolbert, C. 1996 Environment and Planning (A) Tamaño de las empresas y bienestar de la comunidad local

Meen, G. 1996 Housing Studies Precios de viviendas en mercado nacional y

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

4

sub-nacionales Barkley, D. et al 1995 Papers in Regional Science Efectos spread y backwash

Molho, I. 1995 Journal of Regional Science Desempleo y externalidades en los ajustes ante shocks locales

Benirschka, M. y Brinkley, J.K. 1994 American Journal of Agricultural Economics

Estudio del valor de la tierra agrícola

Holtz-Eakin, D. 1994 Review of Economics and Statistics Estudio de potenciales spillovers procedentes de infraestructuras públicas

Case, A. C., et al 1993 Journal of Public Economics Spillovers fiscales Murdoch, J. et al 1993 Public Finance Quarterly Gasto público

LeSage, J. P. 1993 American Journal of Agricultural Economics

Precios en los mercados agrícolas

Case, A.C. 1992 Regional Science and Urban Economics

Estudio del proceso de adopción de nuevas tecnologías en la agricultura

Florax, R. 1992 Tesis Doctoral Impacto económico de las Universidades como productoras de conocimiento

Dubin, R.A. 1992 Regional Science and Urban Economics

Calidad del vecindario y precios de las viviendas

Heikkila, E. y Kantiotou, C. 1992 Regional Science and Urban Economics

Impacto fiscal de un cambio en los usos de la tierra

Congdon, P. 1990 Urban Studies Estudio de la variación de las tasas de mortalidad a través del tiempo y del espacio

Can, A. 1990 Economic Geography Determinación de los precios de las viviendas desde una perspectiva geográfica

Tras observar el cuadro 1, la principal conclusión que cabe extraer es el

escaso número de referencias existentes, muy especialmente en el ámbito español, haciendo evidente el esfuerzo necesario para acercar las técnicas econométricas espaciales a los investigadores que trabajan en el ámbito regional y urbano.

Teniendo todo ello en cuenta, el propósito del presente trabajo es contribuir a la difusión en nuestro país de las técnicas de econometría espacial, ofreciendo una breve recopilación de las principales aportaciones teóricas llevadas a cabo en el ámbito de la econometría espacial y que han ido aparececiendo en los últimos años en forma de monográficos y artículos dispersos en revistas especializadas. Con ello se pretende acercar su conocimiento a la comunidad investigadora usuaria de bases de datos referenciados geográficamente. Asimismo, cabe resaltar que el trabajo se centra en la problemática existente en torno a la dependencia espacial ya que, como comentamos anteriormente y a diferencia de lo ocurrido con la heterogeneidad espacial, la autocorrelación espacial requiere de un tratamiento específico no presente en la econometría clásica.

El presente documento se estructura de la siguiente forma. En el apartado 2 se define el concepto de dependencia espacial, analizando a su vez la utilidad de la matriz de pesos como instrumento básico para formalizar las interdependencias entre unidades espaciales. En el apartado 3 se describen los

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

5

principales estadísticos presentes a nivel univariante válidos para contrastar la existencia de dependencia espacial en la distribución de una variable en el espacio. El apartado 4 se centra en la presencia de dependencia espacial en un modelo de regresión, analizando las diferentes vías de especificación, contrastación y estimación de la misma. Asimismo, se discuten las diferentes estrategias existentes en la literatura para la selección final del modelo espacial más adecuado. Por último, en el apartado 5 se lleva a cabo un breve comentario acerca del tratamiento de la dependencia espacial cuando se dispone de un panel de datos.

2. Dependencia Espacial y la matriz de pesos

2.1. Definición de autocorrelación o dependencia espacial

La dependencia o autocorrelación espacial,1 objetivo principal de la econometría espacial ya desde sus comienzos, aparece como consecuencia de la existencia de una relación funcional entre lo que ocurre en un punto determinado del espacio y lo que ocurre en otro lugar (Cliff y Ord, 1973; Paelink y Klaassen, 1979; Anselin, 1988a). Es decir, el valor que toma una variable en una región no viene explicado únicamente por condicionantes internos sino también por el valor de las observaciones de esa misma variable en otras regiones vecinas 2, incumpliéndose por tanto el supuesto de independencia entre las observaciones muestrales.3 De esta forma, la existencia de dependencia espacial no hace posible cambiar la localización de los valores de una variable sin afectar a la información contenida en la muestra. La autocorrelación espacial puede ser positiva o negativa. Si la presencia de un fenómeno determinado en una región lleva a que se extienda ese mismo fenómeno hacia el resto de regiones que la rodean, favoreciendo así la concentración del mismo, nos hallaremos ante un caso de autocorrelación positiva. De esta forma si, por ejemplo, la variable crecimiento de la productividad mostrase un esquema de dependencia espacial positiva, las regiones vecinas a i se verían contagiadas de una buena evolución de la productividad en dicha región. Por el contrario, existirá autocorrelación negativa cuando la presencia de un fenómeno en una región impida o dificulte su aparición 1 En un sentido estricto, los conceptos de dependencia y autocorrelación espacial no son sinónimos, siendo la autocorrelación espacial una expresión más débil de la dependencia espacial, relativa únicamente a los primeros momentos de la distribución conjunta de una variable. Sin embargo, en lo que sigue, ambos conceptos serán utilizados indistintamente. 2 En el texto se utilizará el concepto de región como unidad espacial genérica. Asimismo, el concepto de vecindad debe ser entendido en sentido amplio y no exclusivamente vinculado a la proximidad geográfica. 3 La existencia de autocorrelación espacial implica que la muestra contiene menos información que la presente en otra muestra cuyas observaciones son independientes (Anselin y Rey, 1997). Este hecho deberá ser tenido en cuenta explícitamente durante el proceso de contrastación y estimación.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

6

en las regiones circundantes o contiguas a ella, es decir, cuando unidades geográficas cercanas sean netamente más disímiles entre ellas que entre regiones alejadas en el espacio. Esta situación sería compatible con la existencia de jerarquías, por ejemplo, de tipo centro-periferia, donde una favorable evolución del centro podría verse acompañada de un empeoramiento de las regiones periféricas próximas. Por último, cuando la variable analizada se distribuya de forma aleatoria, no existirá autocorrelación espacial. Dos son las principales causas que pueden inducir a la aparición de dependencia espacial: la existencia de errores de medida y de fenómenos de interacción espacial. Los errores de medida pueden surgir, entre otros aspectos, como consecuencia de una escasa correspondencia entre la extensión espacial del fenómeno bajo estudio y las unidades espaciales de observación.4 Son muchas las ocasiones en las que, en el ámbito de los trabajos aplicados de economía regional y urbana, dichos errores de medida pueden llegar a estar presentes. Por ejemplo, podría ocurrir que el fenómeno bajo estudio requiriese de información relativa a mercados de trabajo locales para los cuales es posible que no se disponga de información estadística, habiendo de utilizar en su lugar datos relativos a unidades muy desagregadas como municipios o unidades con un mayor nivel de agregación como es el regional. En este caso, la variable observada podrá mostrar un esquema de autocorrelación espacial bien porque los municipios colindantes que formen parte de un único mercado de trabajo local se encuentren correlacionados o bien porque un mismo mercado local forme parte de dos regiones contiguas. Por otro lado, la existencia de fenómenos de interacción espacial, de efectos desbordamiento y de jerarquías espaciales también tienen como consecuencia la aparición de un esquema de autocorrelación espacial.

2.2. Matriz de pesos como instrumento para recoger las interdependencias

Tras la definición anterior, es posible detectar una cierta similitud entre los conceptos de autocorrelación espacial y temporal en la medida en que, en ambos casos, se produce un incumplimiento de la hipótesis de independencia entre las observaciones muestrales, se hallen éstas referidas a unidades de corte transversal o a series temporales. Sin embargo, una importante diferencia aparece entre ellas: la dependencia temporal es únicamente unidireccional (el pasado explica el presente), mientras que la dependencia espacial es multidireccional (una región puede estar afectada no sólo por otra región contigua a ella sino por otras muchas que la rodean, al igual que ella puede influir sobre aquéllas)5. Este hecho 4 Ver Haining (1995) para una discusión acerca de los problemas que pueden surgir con los datos en la modelización econométrica espacial. 5 Uno de los problemas que surge en el contexto espacial es el llamado efecto frontera, el cual aparece como consecuencia de que la dependencia espacial no se limita a las regiones incluidas dentro de la muestra sino que se extiende a unidades espaciales para las cuales no se dispone de información (Griffith 1985, Anselin 1988a). Tal y como señala Florax (1992), no existe una solución única y comúnmente aceptada para dicho problema.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

7

imposibilita la utilización del operador de retardos L, Lpx = xt-p, presente en el contexto temporal, el cual recoge únicamente una relación unidireccional. En este caso, la solución al problema de la multidireccionalidad en el contexto espacial pasa por la definición de la denominada matriz W de pesos espaciales, de retardos o de contactos:

(1)

una matriz cuadrada no estocástica cuyos elementos wij reflejan la intensidad de la interdependencia existente entre cada par de regiones i y j.

Respecto a como construir la matriz W, cabe destacar que no existe una definición de W unánimemente aceptada, si bien se ha de cumplir que sus pesos sean no negativos y finitos (Anselin, 1980). A pesar de ello, de forma habitual se recurre al concepto de contigüidad física de primer orden, utilizado inicialmente por Moran (1948) y Geary (1954), donde wij es igual a 1 si las regiones i y j son físicamente adyacentes o a 0 en caso contrario6 (se asume por definición que wii=0).7 Si bien dicha matriz de contigüidad es habitualmente utilizada por su simplicidad, ciertamente presenta algunas limitaciones importantes que la hacen ser excesivamente restrictiva como, por ejemplo, su carácter simétrico (no es posible incorporar influencias no recíprocas) o la consideración de la adyacencia física como único determinante de las interdependencias regionales (descuidando con ello, por ejemplo, posibles influencias mutuas entre regiones que, aun estando alejadas, mantienen estrechas relaciones comerciales).

Siguiendo el criterio de la proximidad física, diversos autores han propuesto definiciones de la matriz W basadas en la utilización de la distancia entre regiones (Cliff y Ord, 1973, 1981; Bodson y Peeters, 1975), de manera que la intensidad de la interdependencia entre dos regiones disminuye conforme aumenta la distancia que separa sus respectivos centros. En este sentido, se recurre de forma habitual a la matriz inversa de distancias al cuadrado sugerida por Anselin (1980). Por último, cabe destacar que en los últimos años han sido propuestas matrices de pesos alternativas que tratan de huir del concepto de

6 En el caso de que las unidades espaciales sean puntos (por ejemplo, ciudades), la contigüidad puede consistir en la noción del camino más corto. Así, dos puntos son contiguos si la distancia que los separa es inferior a un valor δ determinado. 7 Respecto a la adyacencia física y suponiendo la existencia de una cuadrícula regular, existen dos criterios básicos para la identificación de los vecinos: el llamado criterio torre o rook (se considerarán vecinos aquéllos que comparten estrictamente algún lado de manera que cada cuadrado tendrá 4 vecinos en total) y el criterio reina o queen (cada cuadrado tendrá 8 vecinos al incluir también a aquéllos con los que comparte sus vértices).

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

8

contigüidad o proximidad física para acercarse más al objeto de estudio analizado en cada caso. Así, cabe mencionar los trabajos de Case et al (1993) donde se define una matriz W basada en un concepto de distancia económica entre regiones o de Vayá et al (1998a) y López-Bazo et al (1999), donde los pesos de W recogen el grado de intercambio comercial entre las regiones analizadas. En cualquier caso es preciso remarcar que, en el proceso de contrastación y estimación, la matriz de pesos ha de ser considerada exógena, de manera que se deberá asegurar la exogeneidad de W cuando se recurra a indicadores socioeconómicos para definir sus elementos (salvo que se considere explícitamente la endogeneidad de W en la especificación del modelo). Por último, cabe destacar que de forma habitual se recurre a la estandarización de la matriz W, dividiendo cada elemento wij por la suma total de la fila a la que pertenece, haciendo que la suma de cada fila sea igual a la unidad. Si bien no existe una razón contundente que justifique este hecho, la posibilidad de ponderar por igual la influencia total que recibe cada región de sus vecinos, con independencia del número total de vecinos de cada una de ellas, explicaría dicha transformación.8 Asimismo, dicha estandarización facilita la interpretación de los coeficientes autorregresivos del modelo estimado al asimilarlos a un coeficiente de correlación,9 asegurando además que los parámetros espaciales estimados sean comparables entre los distintos modelos propuestos. Evidentemente, tras la estandarización de W la matriz resultante será asimétrica (siempre que Σj.wij ≠ Σi.wji), complicando los cálculos de algunos estadísticos y estimadores.

8 No obstante, tal y como expone Anselin (1988a), la estandarización de W no siempre es adecuada, especialmente cuando ésta se basa en un concepto de distancia dado que, en este caso, la matriz estandarizada carecería de significado. 9 Ello está relacionado, como se verá posteriormente, con las restricciones impuestas en el marco de la estimación máximo-verosímil.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

9

3 . Dependencia espacial a nivel univariante

Como hemos mencionado anteriormente, la dependencia espacial positiva (negativa) se caracteriza por la existencia de una concentración en el espacio de valores similares (disímiles) de una determinada variable. En este sentido, ciertamente la visión de un mapa en el que se represente dicha variable puede ofrecernos una primera idea de la posible presencia o no de una cierta asociación espacial en la distribución de la variable en el territorio seleccionado. Para comprobarlo, observemos la figura 1 donde se encuentra representada la distribución espacial del logaritmo de la variable valor añadido bruto por ocupado para las regiones europeas en 1992.

A partir de la figura 1 cabe concluir en la existencia de una tendencia hacia la concentración en el espacio de valores similares del VAB por ocupado, alejándose así la posibilidad de una distribución aleatoria de dicha variable. No obstante, si bien esta conclusión parece razonable, es preciso remarcar que los resultados que puedan deducirse de la inspección de un mapa son altamente sensibles, entre otros aspectos, al número de intervalos definidos para representar la variable bajo estudio. De esta forma, es preciso llevar a cabo un estudio exhaustivo que nos permita contrastar la existencia de un esquema de dependencia espacial estadísticamente significativo en la distribución espacial de una variable. Para ello, existen en la literatura una batería de tests de autocorrelación o dependencia espacial, los cuales pueden dividirse en dos grupos: contrastes globales y contrastes locales de autocorrelación espacial.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

10

Figura 1. Distribución espacial del LnVAB por ocupado 1992, regiones europeas

3.1. Estadísticos globales de dependencia espacial

Para contrastar si se cumple la hipótesis de que una variable se encuentra distribuida de forma totalmente aleatoria en el espacio o, por el contrario, existe una asociación significativa de valores similares o disímiles entre regiones vecinas, han sido propuestos un conjunto de estadísticos de dependencia espacial, entre los que merece destacar la I de Moran y la G(d) de Getis y Ord.10

El contraste I de Moran (Moran, 1948) presenta la siguiente expresión:

(2)

10 Ver Geary (1954) y Dacey (1968) como ejemplo de otros estadísticos globales de dependencia espacial.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

11

donde xi refleja el valor de la variable cuantitativa11 x en la región i, es su media muestral, wij son los pesos de la matriz W, N es el tamaño muestral y

.

Respecto a la distribución del estadístico, según Cliff y Ord (1981) cuando

el tamaño muestral es suficientemente grande, la I de Moran estandarizada, Z(I), sigue una distribución asintótica normal estándar. En este caso, un valor no significativo de Z(I) llevará a no rechazar la hipótesis nula de no autocorrelación espacial, mientras que un valor significativo positivo (negativo) del mismo informará acerca de la presencia de un esquema de autocorrelación espacial positivo (negativo).

Las expresiones de los momentos de primer y segundo orden de la I de Moran (EA(I) y EA(I2) respectivamente) bajo la hipótesis de muestreo aleatorio12 de x son:

(3)

(4)

donde , , ,

y .

El estadístico G(d), definido por Getis y Ord (1992) como una medida de

la concentración espacial de una variable x, presenta la siguiente expresión:

(5)

donde dos pares de regiones i y j son consideradas vecinas siempre que se encuentren dentro de una distancia d determinada, tomando, en este caso, wij(d) un valor igual a 1, o 0 en caso contrario. 11 Para un análisis detallado sobre la problemática espacial en torno a las variables cualitativas ver Cliff y Ord (1973, 1981), Anselin (1988a), McMillen (1992, 1995), Dubin (1995) o Ferguson y Kanaroglou (1995). 12 Cliff y Ord (1981) definen asimismo los momentos de primer y segundo orden de I bajo el supuesto de distribución normal de la variable analizada. Sin embargo, dado que es habitual que dicha hipótesis no sea satisfecha, se ha optado por no incluir dichas expresiones.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

12

Tras la estandarización de la G(d), ésta se distribuye a nivel asintótico

según una normal N(0,1). Siguiendo una hipótesis de muestreo aleatorio, los momentos de primer y segundo orden de dicho estadístico son respectivamente:

(6)

(7)

siendo y donde

(8)

En este caso, la hipótesis nula asociada al estadístico Z(G) es la ausencia

de asociación espacial, mientras que un valor positivo (negativo) y significativo indica la existencia de una tendencia a la concentración de valores elevados (bajos) de x en el espacio analizado. De esta forma, el cálculo de la I de Moran no excluye el cálculo de la G(d) dado que ambos estadísticos suministran informaciones complementarias.

Con relación a los estadísticos comentados cabe resaltar cuatro aspectos importantes. En primer lugar, destacar que otro instrumento útil en el análisis del grado de dependencia espacial de una variable y que suministra información similar a la obtenida con el cómputo del estadístico I de Moran es la observación del denominado Scatterplot de Moran. Este tipo de gráfico representa en el eje de abcisas las observaciones de la variable x normalizada y en el de ordenadas el retardo espacial de dicha variable también normalizado (obtenido tras multiplicar la matriz W por la variable x). De este modo, los cuatro cuadrantes reproducen diferentes tipos de dependencia espacial. Si la nube de puntos está dispersa en los cuatro cuadrantes es indicio de ausencia de correlación espacial. Si, por el contrario, los valores se encuentran concentrados sobre la diagonal que cruza los cuadrantes I (derecha superior) y III (izquierda inferior), existe una elevada correlación espacial positiva de la variable, de forma que su pendiente es igual al valor obtenido para el contraste de la I de Moran. La dependencia será negativa si los valores se concentran en los dos cuadrantes restantes.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

13

En segundo lugar, cabe mencionar que para el cómputo de los contrastes de autocorrelación se puede utilizar cualquier definición de la matriz de pesos W, siendo habitual proceder previamente a la estandarización de la misma. Sin embargo, los resultados obtenidos por los diferentes contrastes pueden variar, a veces dramáticamente, en función de la matriz W especificada. Asimismo, en caso de utilizar una matriz de contigüidad física, es habitual replicar el cálculo del estadístico I de Moran para matrices de contigüidad de órdenes superiores,13 con tal de contrastar si el esquema de autocorrelación espacial detectado entre regiones vecinas es extensible a regiones alejadas en el espacio.14

En tercer lugar, se ha de notar que los estadísticos anteriores son sensibles a las transformaciones realizadas sobre la variable original, especialmente en el caso del contraste G(d), el cual únicamente es aplicable al caso de variables positivas y naturales (no aplicable, por tanto, al caso de los residuos de una regresión).

Asimismo, mencionar que las medidas de autocorrelación espacial se ven afectadas por el denominado problema de la unidad aérea modificable, asociado con la forma en la que se encuentran organizadas las unidades espaciales y, especialmente, con el nivel de agregación escogido.15 En concreto, para el caso de la I de Moran, Chou (1991) demuestra como dicho estadístico se ve influido por los denominados efectos escala asociados con cambios tanto en el tamaño del área de estudio como en el nivel de resolución del mapa. Con relación a este último aspecto, Chou muestra como a medida que incrementa el nivel de desagregación de las unidades espaciales, comienza a dominar un esquema de autocorrelación espacial positiva.

Finalmente, cabe destacar que si bien los dos estadísticos antes comentados son los más habitualmente utilizados, Brett y Pinkse (1997) han propuesto un nuevo test de dependencia espacial desde una perspectiva semiparamétrica basado en el uso de una función característica, derivando formalmente las propiedades del citado estadístico. Pese a que los propios autores aconsejan su cálculo juntamente con otros estadísticos de autocorrelación espacial como la I de Moran, el contraste de Brett y Pinkse presenta una ventaja adicional: está especialmente indicado para detectar estructuras de asociación espacial no lineales que no son detectadas por los tests de autocorrelación espacial habituales.

13 Diremos que las regiones i y j son contiguas de segundo orden si ambas están separadas por una tercera región h que es contigua de primer orden a ambas. La misma idea es extensible para órdenes de contigüidad superiores. 14 Los denominados correlogramas espaciales consisten en la representación del valor de la I de Moran estandarizada para matrices de diferentes órdenes de contigüidad. 15 Dicho problema surge como consecuencia de la no homogeneidad del proceso espacial estudiado.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

14

3.2. Estadísticos locales de dependencia espacial

Uno de los rasgos que caracterizan a los estadísticos de asociación anteriormente descritos es que son válidos para contrastar la presencia de un esquema de autocorrelación espacial global, dado que analizan todas las regiones de la muestra de forma conjunta. Por ello, dichos estadísticos no son sensibles a situaciones donde predomina una importante inestabilidad en la distribución espacial de la variable objeto de estudio (procesos no estacionarios espacialmente16), existiendo por ejemplo clusters o agrupaciones de regiones localizados en áreas específicas del territorio que concentran valores más elevados o bajos de lo que cabría esperar en caso de encontrarnos ante una distribución homogénea, mientras que la aleatoriedad domina en el resto del territorio. Es decir, no contemplan la posibilidad de que el esquema de dependencia detectado a nivel global (por ejemplo, ausencia de autocorrelación espacial) pueda no mantenerse en todas las unidades del espacio analizado.

Dicha limitación es fácilmente superable por medio del cálculo de los denominados contrastes locales de asociación espacial entre los que se encuentran el estadístico local de Moran, Ii, basado en el test tradicional de la I de Moran, y la Gi(d) de Ord y Getis (1995). En este caso, como se verá a continuación, se obtendrá un valor de dichos estadísticos para cada región de la muestra, pudiendo así analizar la situación de cada unidad espacial por separado.

Con relación al primer estadístico de autocorrelación espacial local mencionado, la Ii de Moran (Anselin, 1995), éste presenta la siguiente expresión:

(9)

donde zi es el valor correspondiente a la región i de la variable ya

normalizada y Ji el conjunto de regiones vecinas a i. Siguiendo una hipótesis de distribución aleatoria, la esperanza del citado estadístico es:

(10)

16 La estacionariedad de un proceso espacial implica que sus propiedades estadísticas no cambian a través del espacio. En sentido estricto, un proceso espacial es estacionario cuando cualquier distribución conjunta de variables aleatorias sobre un subconjunto de puntos en el espacio depende únicamente de la posición relativa de las diferentes localizaciones, la cual se encuentra determinada por su orientación relativa (ángulo) y las distancias respectivas (Anselin ,1988a).

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

15

donde Wi es la suma de todos los elementos de la fila de la matriz W correspondiente a la región i, Asimismo:

(11)

donde .

De forma similar a los estadísticos anteriores, se puede asumir la hipótesis

de que la Ii estandarizada se distribuye según una normal N(0,1).17 Tras su estandarización, un valor positivo (negativo) del contraste Ii indicará la existencia de un cluster de valores similares (disímiles) de la variable analizada alrededor de la región i.

La expresión del segundo estadístico de asociación espacial local, Gi(d) de Ord y Getis (1995) ya estandarizada, es la siguiente:

(12)

donde

Dicho estadístico se distribuye asintóticamente según una normal N(0,1).18 En este sentido, un valor significativo y positivo (negativo) de la Gi(d) indicará la existencia de un cluster alrededor de la región i de valores similares elevados (bajos) de la variable x.

De nuevo, es necesario resaltar el interés del cálculo simultáneo del estadístico Ii y de la Gi(d) en la medida en que ambos contrastes suministran información complementaria derivada del diferente significado de sus signos.

17 Si bien es habitual asumir una distribución asintótica normal para el estadístico, Anselin (1995) cuestiona dicha distribución en la medida en que no siempre la aproximación asintótica es válida y, segundo, porque los momentos de primer y segundo orden utilizados para la estandarización del estadístico son obtenidos bajo una hipótesis nula de no autocorrelación espacial que no siempre se cumple. Por ello, Anselin propone la obtención de unos pseudo-niveles de significación obtenidos de una distribución empírica derivada siguiendo un criterio de aleatoriedad condicional o de permutación. 18 Nuevamente, al igual que en el caso del estadístico Local de Moran, en lugar de asumir a priori una distribución normal para el contraste Gi(d) cabría la posibilidad de derivar unos pseudo-niveles de significación a partir de una distribución empírica del citado contraste.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

16

Por último, cabe destacar dos aspectos relevantes en relación a los anteriores contrastes de autocorrelación local. Primero, tal como se ha comentado anteriormente, el estadístico Gi(d) informa acerca de si los clusters de valores similares detectados por el estadístico Ii concentran valores elevados o bajos de la variable analizada. Sin embargo, no son útiles para conocer si las agrupaciones detectadas de valores disímiles (signo negativo de la Ii estandarizada) se hallan ocasionadas por un esquema donde la región i muestra valores significativamente elevados de x mientras que sus regiones vecinas presentan valores significativamente bajos de la misma. O si, por el contrario, son las regiones vecinas a i las que muestran valores muy elevados en comparación al observado en i. Una posible solución a dicho problema se encuentra en la representación del Scatterplot de Moran comentado anteriormente. En este sentido, los puntos que se localicen en el cuadrante II (IV) representarán valores bajos (elevados) de la variable x en la región i frente a valores elevados (bajos) de dicha variable en sus regiones vecinas.

En segundo y último lugar, cabe destacar que a partir de la Ii es posible conocer la contribución exacta que presenta cada región al valor del estadístico global de dependencia I de Moran, pudiendo de esta forma detectar observaciones outliers, es decir, observaciones con una contribución excepcional al mismo.19 Ello la convierte, a diferencia de lo ocurrido con la Gi(d), en un indicador LISA (Local Indicator of Spacial Association).20

4. Dependencia espacial a nivel multivariante con datos de corte transversal

4.1. Dependencia espacial en un modelo de regresión: dependencia sustantiva y residual En el apartado anterior se han analizado los estadísticos espaciales habitualmente utilizados para contrastar la presencia de dependencia espacial a nivel univariante. No obstante, de igual modo, es posible que el citado efecto espacial esté presente en el contexto de un modelo de regresión, ya sea como consecuencia de la existencia de variables sistemáticas (endógena y/o exógenas) correlacionadas espacialmente o como consecuencia de la existencia de un esquema de dependencia espacial en el término de perturbación. 19Ello es posible porque, a diferencia de la G(d), la I de Moran puede ser expresada como la suma de las diferentes Ii multiplicadas por un factor de proporcionalidad γ:

20 Para que un estadístico sea considerado como un LISA se deberá de cumplir que, primero, el valor del estadístico obtenido para cada observación suministre información acerca de la relevancia de una agrupación espacial de valores similares alrededor de la misma y, segundo, siempre que la suma del valor del estadístico para todas las observaciones sea proporcional a un indicador global de asociación espacial.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

17

En cualquiera de los dos casos apuntados, para la inclusión de dicha autocorrelación espacial en un modelo de regresión es necesario recurrir a la matriz de pesos o de contactos W, la cual permite incorporar fácilmente las influencias mutuas presentes entre las unidades espaciales de la muestra. Así, por ejemplo, en caso de que la variable endógena de un modelo de regresión esté correlacionada espacialmente, la solución pasa por especificar el siguiente modelo, denominado modelo mixto regresivo espacial autorregresivo o también llamado modelo del retardo espacial:

(13)

donde y es un vector (Nx1), Wy el retardo espacial de la variable y, X una matriz de K variables exógenas, u un término ruido blanco, N el número de observaciones y, por último, ρ el parámetro autorregresivo que recoge la intensidad de las interdependencias entre las observaciones muestrales de la variable endógena.21 De igual forma, la autocorrelación espacial podría estar únicamente presente en el término de perturbación, dando lugar al denominado modelo de regresión lineal con perturbaciones espaciales autorregresivas o también llamado modelo del error espacial:

(14)

donde u es un término ruido blanco y λ el parámetro autorregresivo que refleja la intensidad de las interdependencias en el término de perturbación. A partir de la expresión (13) es fácil observar como, en caso de omitir de forma errónea un retardo espacial de la variable endógena (y/o exógenas), la dependencia espacial se trasladaría directamente al término de perturbación, el cual pasaría a estar correlacionado espacialmente. Este tipo de autocorrelación 21 De igual forma, es posible incluir únicamente retardos espaciales de las variables exógenas, dando lugar al modelo mixto regresivo espacial cruzado-regresivo:

donde las variables incluidas en R pueden coincidir o no con las variables incluidas en X.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

18

espacial es conocida con el nombre de autocorrelación espacial sustantiva y su solución pasa por la inclusión en el modelo de un retardo espacial de la variable sistemática omitida correlacionada espacialmente. Por el contrario, cuando la dependencia espacial residual no esté causada por la omisión errónea de un retardo de alguna de las variables sistemáticas, nos hallaremos ante un caso de autocorrelación espacial residual como nuisance o perturbación.22 Dicha situación podría verse explicada por la omisión de variables no cruciales que se hallen correlacionadas espacialmente o por la existencia de errores de medida derivados, como comentamos en el apartado 2.1, de una escasa correspondencia entre el ámbito espacial del fenómeno bajo estudio y las unidades espaciales de observación. En este caso, la solución supondría la consideración explícita de una esquema de dependencia espacial en el término de error. A partir de las sencillas especificaciones esbozadas en las expresiones (13) y (14), cabe destacar que la especificación más general para un modelo espacial se corresponde con el modelo mixto regresivo espacial regresivo con perturbaciones autorregresivas y heteroscedásticas (Anselin 1988b, Florax y Folmer 1992):

(15)

donde y es el vector (Nx1) correspondiente a la variable endógena, X una matriz (NxK1) de variables exógenas y R una matriz (NxK2) de variables exógenas que son retardadas espacialmente (las cuales pueden coincidir o no con las incluidas en la matriz X). Por otra parte, ε incorpora una estructura de dependencia espacial autorregresiva especificada mediante un esquema de Markov de primer orden. A su vez, se ha considerado u como un vector distribuido normalmente, con una matriz de varianzas y covarianzas diagonal, pero heteroscedástico (los elementos de su diagonal principal estarán en función de P+1 variables exógenas Z). Por último, ρ es el coeficiente de la variable dependiente retardada espacialmente, λ el coeficiente en la estructura autorregresiva espacial de ε, β1 y β2 los vectores de dimensiones (K1x1) y (K2x1) asociados a las variables exógenas y exógenas retardadas respectivamente, mientras que a es el vector Px1 asociado con los términos no constantes de Z.23

22 En adelante, se asimilará el concepto de autocorrelación espacial residual como nuisance con el de autocorrelación espacial residual simplemente. 23 Con relación a la expresión (15), cabe decir que si W1=W3 los parámetros ρ y λ estarán identificados únicamente cuando la matriz X contenga al menos una variable exógena (además de la constante) y cuando se impongan las restricciones no lineales correspondientes.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

19

Respecto a los diferentes subíndices incorporados para las matrices de contacto, nuevamente no existe consenso en torno a la especificación más adecuada para cada una de ellas. En este sentido, Arora y Brown (1977) al igual que Hordijk (1979), proponen utilizar una matriz neutral, de contigüidad binaria, para el término de perturbación. En cambio, cuando la matriz de contactos debe ser incluida en la especificación funcional del modelo econométrico espacial, como ocurre con W1 y W2, tanto Hordijk (1979) como Anselin (1980) señalan la necesidad de utilizar una matriz más relacionada con el concepto de accesibilidad propio de la teoría de la interacción espacial, evitando así conclusiones falsas o espurias. Esta restricción puede relajarse cuando la matriz W ha de utilizarse en la construcción de hipótesis (Anselin, 1988a) ya que, en este caso, se está contrastando únicamente la escasez de independencia entre los términos de perturbación y no un tipo particular de dependencia, si bien para maximizar el poder del test debería escogerse una W relacionada con la hipótesis alternativa propuesta. En cualquier caso, es preciso tener en cuenta que una especificación errónea de W puede tener importantes consecuencias sobre el modelo de regresión estimado (para un estudio de las consecuencias derivadas de una sub o sobre-especificación de la matriz de contactos, ver Florax y Rey, 1995). Por último, cabe decir que en las especificaciones anteriores la dependencia espacial ha sido incorporada en el término de perturbación a través de una estructura autorregresiva de primer orden. Si bien dicha estructura es la más utilizada a nivel tanto teórico como empírico, es posible modelizar el término de perturbación de forma diferente. Así, Cliff y Ord (1981) sugieren utilizar un proceso de medias móviles espacial, SMA(1):

(16)

donde θ es el coeficiente de medias móviles espacial y u es el término de perturbación incorrelacionado. Esto nos lleva a poder definir un modelo mixto regresivo espacial autorregresivo con perturbaciones espaciales que incorporan un esquema de dependencia espacial media móvil, es decir, un modelo SARMA(1,1):

(17)

En este modelo, y a diferencia de lo ocurrido cuando un esquema autorregresivo está presente en el término de error, los parámetros ρ y θ estarán siempre identificados aun cuando W1=W2=W.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

20

No obstante, respecto a las estructuras autorregresivas y medias móviles, cabe decir que si bien la mayoría de los resultados de las estimaciones y contrastes derivados de una estructura media móvil pueden obtenerse también a partir de una estructura autorregresiva, es importante notar que las estructuras de dependencia espacial derivadas de un esquema autorregresivo y de un media móvil difieren notablemente (Anselin y Bera, 1998; Mur, 1999). Así, partamos de una especificación sencilla de un SMA(1) para el error como la mostrada en (16), la cual puede reescribirse como:

(18)

A partir de la expresión (18), es posible derivar la matriz de varianzas y covarianzas de y:

(19)

Como se puede observar en (19), la matriz obtenida no es una matriz completa, de manera que, en el caso de un SMA(1), los shocks que recibe una variable y serán de tipo local y únicamente tendrán repercusiones sobre la región afectada y sus respectivas vecinas de primer y segundo orden.24 Supongamos ahora que el modelo incorpora una estructura autorregresiva en el error, de manera que:

(20)

En este caso, la matriz de varianzas y covarianzas de y tiene la siguiente expresión:

(21)

una matriz completa a partir de la cual se puede observar como, aunque el shock afecte inicialmente sólo a una región, dicho efecto cruzará las fronteras de las demás regiones, teniendo por tanto un carácter global.25 En este último caso, la interacción derivada es mucho mayor que en el caso de una estructura media

24 Obviamente, bajo el supuesto que W sea una matriz de contigüidad de primer orden. 25 Esta explicación se hace extensiva al caso de dependencia espacial sustantiva dado que la matriz de varianzas y covarianzas de y dada en (21) coincide con la expresión de dicha matriz cuando está presente un retardo espacial de la variable endógena.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

21

móvil, con una intensidad decreciente a medida que la distancia que separa a cada par de regiones incrementa. Por último, cabe destacar que Kelejian y Robinson (1993, 1995) hacen una evaluación crítica de la estructura espacial autorregresiva del error, sugiriendo en su lugar el denominado modelo de componentes del error espacial. Éste consiste en un término de error correspondiente a cada región que está integrado por dos vectores: uno, que recoge un shock específico regional y, el otro, que es el resultado de una combinación lineal de shocks generados en otras regiones que afectan a una región i concreta (spillovers espaciales), la cual vendrá determinada por la matriz de pesos W especificada. Es decir,

ε = Wυ+ ψ

(22)

donde ψ y υ son dos vectores estocásticos independientes (no necesariamente distribuidos según una normal), siendo ψ el vector que recoge los shocks específicos de cada región. De esta forma, si consideramos que:

(23)

tendremos que:

(24)

donde y . En este caso, siempre que los elementos de ε no

estarán correlacionados, mientras que si al menos algunos elementos del término de error ε sí lo estarán26 (siempre que WW’ no sea diagonal).

4.3. Contrastación de la dependencia espacial Recuperando la distinción efectuada en el apartado 4.2 entre autocorrelación espacial sustantiva y autocorrelación espacial residual como nuisance, seguidamente se presenta una amplia batería de estadísticos espaciales existentes para contrastar las anteriores estructuras.

26 Kelejian y Robinson (1995) derivan la expresión para el coeficiente de correlación para cada par de elementos i y j de ε. En este sentido, muestran como dicho coeficiente de correlación decrece a medida que incrementa el ratio , es decir, a medida que el shock específico regional tiene una mayor importancia en relación con los shocks procedentes de otras regiones.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

22

4.3.1. Contrastación de la existencia de dependencia espacial residual Partiendo del siguiente modelo de regresión lineal

(25) la existencia de autocorrelación espacial residual es habitualmente contrastada mediante alguno de los cuatro estadísticos siguientes: la I de Moran, el test de K-R y los contrastes basados en el principio de los multiplicadores de Lagrange, LM-ERR y LM-EL.27

1) El test I de Moran (Cliff y Ord, 1972, 1973) presenta la siguiente

expresión:

(26)

donde e es el vector de residuos mínimo cuadrático ordinarios (MCO) de un modelo de regresión lineal como el especificado en (25), N el tamaño muestral y S la suma de todos los elementos wij de la matriz de pesos. En un contexto asintótico y bajo el supuesto de residuos incorrelacionados, el estadístico I de Moran, debidamente estandarizado, se distribuye según la normal estándar. Con relación a los momentos de primer y segundo orden, éstos pueden obtenerse a partir de las expresiones siguientes:

(27)

(28)

donde M es una matriz idempotente, M= I - X(X'X)-1 X'. ii) El test K-R (Kelejian y Robinson, 1992) se deriva de una regresión auxiliar en la que se usan los productos cruzados de los residuos de las observaciones que están potencialmente correlacionadas espacialmente (según el esquema de la matriz de pesos) y los productos cruzados de las

27 Tras sopesar las ventajas e inconvenientes de utilizar la denominación española o anglosajona de los contrastes basados en el principio de multiplicadores de Lagrange, hemos preferido utilizar esta última con la finalidad de facilitar la identificación de los mismos. De esta forma, hablaremos de los tests LM.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

23

variables explicativas correspondientes a dichas observaciones. De forma concreta, la variable dependiente en la regresión auxiliar es:

(29) donde h es un índice para cada producto cruzado, e es el término residual, mientras que i y j son las observaciones contiguas. Las variables explicativas en la regresión auxiliar, Zh, están formadas por los productos cruzados de Xi y Xj. Considerando γ el vector de coeficientes obtenido de la estimación MCO en una regresión de C en Z, y α el vector asociado de residuos, el estadístico de K-R resultante tiene la siguiente expresión:

(30)

donde hR es el número de observaciones en el vector auxiliar. El estadístico se distribuye como una χ2 con K grados de libertad, donde K es el número de variables explicativas en Z. iii) El test LM-ERR (Burridge, 1980) se obtiene a partir de la siguiente expresión:

(31)

donde e es nuevamente el vector de residuos MCO de la regresión (25), T1=traza(W’W+W2) y s2 la estimación de la varianza residual de dicho modelo. En concreto, y a diferencia del anterior contraste, el test LM-ERR se distribuye según una χ2 con un grado de libertad. iv) El test LM-EL (Bera y Yoon, 1992) se calcula como:

(32)

donde M es la matriz idempotente ya definida y RJρ-

β=[T1+(WXβ)’M(WXβ)/s2]-1. De igual forma que en el caso anterior, el test LM-EL se distribuye según una χ2 con un grado de libertad. En concreto, si bien el estadístico LM-EL es similar al definido en (31), éste

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

24

presenta la ventaja adicional de ser robusto ante posibles especificaciones erróneas locales como la presencia de una variable endógena retardada espacialmente.

Con relación a los cuatro estadísticos analizados, cabe destacar que todos ellos comparten una misma hipótesis nula, la ausencia de dependencia espacial en el término de perturbación. Sin embargo, si bien los estadísticos LM-ERR y LM-EL presentan una hipótesis alternativa específica, esto es, la existencia de un esquema autorregresivo/media móvil de primer orden en el término de perturbación (expresión 14), no ocurre lo mismo con los estadísticos I de Moran y K-R, los cuales no tienen una hipótesis alternativa claramente definida. Esto lleva a que ambos estadísticos presenten un escaso poder para discriminar entre la existencia de un esquema de autocorrelación espacial residual o sustantiva. Asimismo, se ha de hacer notar que los tests LM-ERR y LM-EL están basados en el principio de los multiplicadores de Lagrange y son obtenidos a partir de la estimación del modelo bajo la hipótesis nula correspondiente. En este sentido, si bien podrían derivarse de forma similar contrastes de autocorrelación espacial basados en los tests de Wald o de razón de verosimilitud (Cliff y Ord, 1973 y 1981; Brandsman y Ketellapper, 1979; Anselin, 1980; Upton y Flingleton, 1985), el requerimiento en estos últimos de la compleja estimación del modelo bajo la hipótesis alternativa dota a los contrastes LM de una importante ventaja, quedando justificada así su mayor utilización. Por otra parte, es preciso destacar que, a excepción del test K-R, tanto la I de Moran como los contrastes basados en el principio de multiplicadores de Lagrange requieren la normalidad del término de perturbación así como de la linealidad del modelo de regresión.28 Asimismo, cabe mencionar que el hecho de que la expresión del test LM-ERR sea igualmente válida para contrastar la existencia de una estructura autorregresiva o media móvil en el término de error (de manera que es localmente óptimo para ambas hipótesis alternativas) imposibilita utilizar dicho contraste para discriminar entre ambas hipótesis alternativas (Anselin y Bera, 1998).29 Por último, cabe señalar que únicamente se han mostrado los tests válidos para contrastar la existencia de autocorrelación espacial bajo el supuesto de

28 No obstante, la expresión derivada para el contraste LM-ERR no variaría aun bajo el supuesto de no linealidad del modelo. En cualquier caso, cabe destacar la escasa atención que se ha prestado al estudio del comportamiento de los contrastes de autocorrelación espacial en el caso de que los modelos no sean lineales, así como a la construcción de contrastes de autocorrelación especialmente diseñados para dichas situaciones (ver Graaff et al, 1998). 29 Habida cuenta de la no disponibilidad de métodos que permitan discriminar claramente entre la existencia de una estructura autorregresiva o media móvil, Mur (1999) propone una estrategia de identificación, basada en el cálculo de contrastes de mutiplicadores de Lagrange, que permite detectar la estructura de dependencia correcta.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

25

errores homoscedásticos y ausencia de regresores endógenos. De esta forma, el incumplimiento de dichos supuestos resta validez a los anteriores contrastes. En este sentido, Anselin (1988b) propone un test de multiplicadores de Lagrange para contrastar la dependencia espacial residual cuando está presente un retardo espacial de la variable endógena, mientras que Anselin y Kelejian (1997) proponen un contraste LM-ERR válido ante regresores endógenos diferentes del retardo espacial de la variable endógena. De igual forma, en Anselin (1988a) se muestra el contraste de multiplicadores de Lagrange para el error en el caso de existencia de un término de perturbación heteroscedástico.30 Por último, Anselin (1988b, 1994) propone un test SARMA basado en el principio de multiplicadores de Lagrange para contrastar la presencia simultánea de un retardo espacial de la variable endógena y de una estructura media móvil espacial en el término de error.

4.3.2. Contrastación de la existencia de dependencia espacial sustantiva Partiendo del mismo modelo de regresión lineal especificado en (25), la omisión errónea de un retardo espacial de la variable endógena puede ser contrastada por medio de los tests basados en el principio de multiplicadores de Lagrange, el test LM-LAG y el LM-LE.

i) El test LM-LAG (Anselin, 1988b) presenta la siguiente expresión:

(33)

donde nuevamente e es el vector de residuos MCO del modelo (25), manteniéndose el significado en el resto de elementos. El test LM-LAG se distribuye según una χ2 con un grado de libertad.31

30 Kelejian y Robinson (1998) sugieren la utilización de un nuevo estadístico, denominado KR-SPHET, válido para contrastar la ausencia de autocorrelación espacial y/o heteroscedasticidad en el término de error. Tras un ejercicio de simulación concluyen en el mayor poder de dicho contraste sobre estadísticos como la I de Moran y aquéllos basados en el principio de multiplicadores de Lagrange cuando la heteroscedasticidad es importante y la dependencia espacial es leve. 31 A diferencia de lo que ocurre con el test LM-ERR, si bajo la hipótesis nula el modelo no fuera lineal el test LM-LAG dado en (33) no sería correcto, habiendo de ser substituido por la siguiente expresión (Moreno et al, 1998):

donde e*= es el vector de residuos de la estimación no lineal bajo la hipótesis nula y

, con y , donde

es la matriz (NxK) de pseudo-regresores y el estimador no lineal.

.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

26

ii) El test LM-LE (Bera y Yoon, 1992) se puede calcular como:

(34)

manteniéndose el mismo significado en los elementos que el definido para los estadísticos anteriores. Dicho contraste se distribuye según una χ2 con un grado de libertad. Asimismo, y de forma similar a lo ocurrido en el caso del contraste LM-EL, el test LM-LE presenta la ventaja adicional respecto el test LM-LAG de ser robusto ante posibles especificaciones erróneas locales, como la existencia de un término de perturbación correlacionado espacialmente.32

En ambos casos, la hipótesis alternativa corresponde al modelo definido en (13):

es decir, HA: ρ≠0, frente a la hipótesis nula de H0: ρ=0. De igual forma que en el caso de los estadísticos LM-ERR y LM-EL, los tests LM-LAG y LM-LE están basados en el principio de multiplicadores de Lagrange, mostrando por tanto propiedades asintóticas y requiriendo la normalidad del término de perturbación.

4.3.3. Comportamiento de los contrastes de autocorrelación espacial en un contexto finito Tras analizar la batería de tests presentes en la literatura válidos para contrastar la presencia de dependencia espacial, es preciso destacar que uno de los aspectos que caracteriza a dichos estadísticos es que todos ellos se basan en propiedades asintóticas, de manera que su traslación a un contexto finito puede conllevar problemas. Asimismo, a excepción del test de K-R, el resto de contrastes se basan en la normalidad del término de perturbación, pudiendo no comportase correctamente cuando dicha asunción no se cumple. Teniendo ello en cuenta, han sido algunos los trabajos en los que, a partir de ejercicios de simulación de Monte Carlo, han tratado de analizar el poder y tamaño de los citados contrastes en muestras finitas, así como las consecuencias que sobre ellos puede tener una alteración de la distribución normal del término de 32 En este sentido, Anselin y Bera (1998) proponen un contraste de multiplicadores de Lagrange para detectar un retardo espacial de la variable endógena en presencia de un término de error autocorrelacionado espacialmente.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

27

perturbación o una especificación errónea de la matriz de contactos utilizada. Así, cabría destacar los trabajos de Mur (1990, 1992), Anselin y Rey (1991), Florax y Folmer (1992, 1994), Anselin y Florax (1995b), Anselin et al (1996) y Florax y Rey (1995). De forma muy breve, las principales conclusiones que se extraen de dichos estudios pueden resumirse en los siguientes puntos:

• Las propiedades de los contrastes son sensibles a la elección de la matriz de contactos. Así, tanto la distribución bajo la hipótesis nula de dichos contrastes como la frecuencia de rechazo de la hipótesis nula en presencia de dependencia espacial varían notablemente en función de la matriz de pesos elegida.

• Elevado poder de la I de Moran contra cualquier hipótesis formulada de

dependencia espacial, si bien esta circunstancia disminuye su utilidad para discriminar entre diferentes hipótesis alternativas (dependencia espacial residual y sustantiva). Por ello, los tests basados en el principio de los multiplicadores de Lagrange aparecen como mejores para elegir entre un tipo de autocorrelación u otro. A su vez, para cualquier tamaño muestral, salvo para muestras pequeñas, el test LM-LAG utilizado para contrastar la presencia de un retardo espacial de la variable endógena presenta un poder más elevado que los tests I de Moran y LM-ERR utilizados para detectar una estructura espacial del error. Este resultado es importante dado que las consecuencias para la estimación MCO de obviar erróneamente un retardo espacial de la variable endógena (sesgadez e inconsistencia) son más graves que las que aparecen tras obviar una estructura de dependencia en el error (ineficiencia).

• La alteración de la distribución normal del error tiene escasas

consecuencias sobre el poder de los tests, si bien los contrastes del error se ven más afectados por dicha alteración que los tests de la endógena retardada (subrechazando la hipótesis nula). En general, los tests analizados presentan mayor poder contra alternativas autorregresivas que contra estructuras medias móviles, sobre todo en muestras pequeñas.

• Escaso poder del test K-R, explicado por los reducidos tamaños

muestrales analizados que no le permiten alcanzar sus propiedades asintóticas.

• Buen comportamiento de los tests robustos LM-EL y LM-LE, en especial

de este último, resultando escasamente penalizados cuando su utilización es innecesaria y mostrando un poder prácticamente indistinguible entre ellos y sus tests análogos no robustos para tamaños muestrales elevados.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

28

A su vez, la utilidad de estos tests robustos aumenta cuando se combinan con los tests LM-ERR y LM-LAG.

4.4. Estimación en presencia de dependencia espacial Tras analizar los estadísticos válidos para contrastar la existencia de autocorrelación espacial en un modelo de regresión y antes de analizar los métodos de estimación adecuados en presencia de dicha dependencia espacial, cabe mencionar brevemente las consecuencias derivadas de la autocorrelación espacial en la estimación habitual por MCO. Para ello, es preciso discernir si la dependencia espacial presente es sustantiva o residual. Por lo que hace referencia a las consecuencias de la presencia de residuos correlacionados espacialmente en la estimación MCO, éstas son similares a las conocidas en el contexto temporal (Hordijk, 1979; Cliff y Ord, 1981; Kramer y Donninger, 1987; Anselin y Griffith, 1988). Así, si bien las estimaciones de los parámetros seguirán siendo insesgadas, sin embargo serán ineficientes dado que la matriz de varianzas y covarianzas del término de perturbación será no esférica:

E[εε’] = σ2Ω=σ2 (I-λW)-1 (I-λW)’-1 =σ2[(I-λW)’ (I-λW)]-1 (35) Esto llevará a que la varianza de las estimaciones MCO de β se encuentre sobrestimada en comparación con la obtenida tras aplicar Mínimos Cuadrados Generalizados (MCG) a la expresión (14) (conocido el valor de λ A su vez, la varianza residual será sesgada y estará subestimada (sobre todo en presencia de autocorrelación positiva), siendo las predicciones MCO ineficientes. Todo ello llevará a que la inferencia basada en los tests de significación de la t-student y en el coeficiente de determinación R2 sea sesgada. Asimismo, esto afectará a la validación de un número importante de contrastes utilizados para detectar especificaciones erróneas como, por ejemplo, los tests de inestabilidad estructural como el test de Chow, o los tests de heteroscedasticidad.33 Si bien las consecuencias de la presencia de residuos autocorrelacionados espacialmente no difieren de forma importante de lo que ocurre en el contexto temporal, no ocurre lo mismo cuando el problema de la autocorrelación espacial

33 Anselin (1987) demuestra como el incumplimiento de la hipótesis de independencia en el término de perturbación lleva a que la frecuencia de rechazo empírica del test de Glesjer y el de Breusch y Pagan sobrepase de forma importante sus correspondientes niveles de significación nominales, al contrario de lo que ocurre con el test de White. Resultados similares son obtenidos por Anselin (1990) para el test de Chow. Ver Anselin (1988a, 1988b y 1990), para una adaptación de los test de Chow y de Breusch-Pagan en presencia de dependencia espacial residual.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

29

deviene de la presencia de un retardo espacial de la variable endógena. En este caso, las consecuencias son más graves de las que se darían a nivel temporal. Como es bien sabido, la inclusión de un retardo temporal de la variable endógena no implica la inconsistencia, aunque sí la sesgadez de la estimación MCO siempre que el término de perturbación no muestre una estructura correlacionada temporalmente (Greene, 1999). Sin embargo, en el contexto espacial las estimaciones MCO del modelo descrito en (13) serán sesgadas e inconsistentes, aún cuando el término de perturbación no esté correlacionado espacialmente. La comprobación es sencilla. Partiendo del siguiente modelo

(36) es posible obtener la estimación MCO de ρ de la forma habitual:

(37) donde yL = Wy es la variable dependiente retardada espacialmente. Sustituyendo la expresión (36) en (37) se obtiene:

(38) una estimación sesgada de ρ dado que el valor esperado del segundo término no es igual a cero. Asintóticamente, la consistencia del estimador mínimo-cuadrático depende de las dos condiciones siguientes:

plim N-1 (yL'yL) = Q , siendo Q una matriz finita y no singular plim N-1 (yL'u) = 0

(39)

Mientras que la primera condición puede verse satisfecha con las restricciones adecuadas en el valor del parámetro ρ y la estructura de la matriz de contactos, la segunda condición no se mantiene en el caso espacial. Así, teniendo en cuenta que el modelo (36) puede ser reescrito como , tendremos que:

plim N-1 (yL'u) = plim N-1 {W (I -ρW)-1 u}u (40) En este caso, la presencia de la matriz de contactos tiene como consecuencia la aparición de una forma cuadrática en los términos de perturbación. Por consiguiente, excepto en el caso de que ρ sea igual a 0, la probabilidad en el límite de esta expresión no se anulará.34 En consecuencia, el estimador MCO de los parámetros de un modelo autorregresivo espacial será sesgado además de 34 Se debe notar que la matriz inversa (I-ρW)-1 es una matriz no triangular.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

30

inconsistente, independientemente de las propiedades del término de perturbación.

Por tanto, parece evidente que, con independencia del esquema de dependencia espacial detectado, la estimación MCO no es la adecuada. En este sentido, la aproximación máximo verosímil (MV) se ha mostrado como una de las alternativas más ampliamente utilizadas. Con respecto a dicho método de estimación, cabe decir que, de idéntica forma que en el contexto temporal, los estimadores MV deberán ser obtenidos a partir de la maximización del logaritmo de la función de verosimiltud asociada al modelo espacial especificado. En este sentido, partiendo de un función de densidad normal conjunta para los errores del modelo más general definido en la expresión (15), se obtiene una función de verosimilitud cuya expresión es (en logaritmos):

(41)

donde θ=[ρ, β’, λ, σ2, α’], A=(I-ρW), B=(I-λW), Ω es la matriz de varianzas y covarianzas del término de perturbación y υ’υ=(Ay-Xβ)’B’Ω-1B(Ay-Xβ). Uno de los aspectos más interesantes de la expresión (41) es el Jacobiano de la transformación, que toma la forma de |I-λW| y |I-ρW|.35 Al contrario de lo que sucede en el caso del dominio temporal, el Jacobiano espacial no es el determinante de una matriz triangular, sino de una matriz completa, lo que complica los cálculos de forma considerable. Sin embargo, Ord (1975) mostró que dicho término Jacobiano puede ser expresado en función de los valores propios wi de la matriz de contactos. Así, por ejemplo, en el caso del término |I-ρW|, éste podrá ser calculado como:

(42) A partir de la expresión (41), los estimadores MV podrán ser obtenidos igualando a 0 el vector de derivadas parciales de (41) respecto a θ. En este trabajo, si bien no se desarrollará el proceso de derivación de dichos estimadores (ver Anselin, 1988a, para un análisis exhaustivo), es necesario destacar que el sistema resultante de primeras derivadas es altamente no lineal. Para solucionarlo será preciso recurrir a métodos numéricos dada la imposibilidad de disponer de una solución analítica válida. No obstante, esta dificultad se ve reducida cuando se imponen determinadas restricciones en el modelo general, pasando a trabajar

35 Esta expresión muestra claramente el porqué, al contrario que en el caso de series temporales, la estimación MCO no es máximo verosímil en la medida en que ignora el término Jacobiano.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

31

con modelos más sencillos como los definidos en (13) y (14). En este caso, la solución al problema de la no linealidad viene de la mano de una función de verosimilitud concentrada, la cual será lineal para todos los parámetros menos uno. Así, la expresión del logaritmo de la función de verosimilitud concentrada para el modelo (13), donde únicamente está presente un retardo espacial de la variable endógena, es:

(43)

donde cte recoge la constante usual y e0 y eL son, respectivamente, los residuos de las regresiones de y y Wy sobre X. De esta forma, al depender todos los términos de la función de verosimilitud de ρ es posible obtener una estimación MV de dicho parámetro a partir de la optimización numérica de la expresión (43). Una expresión similar puede ser obtenida para el modelo (14), donde está presente una estructura espacial autorregresiva en el término de perturbación:

(44)

donde e=y-Xb, siendo b la estimación por MCG Estimados del vector de parámetros β, obtenida a partir de la siguiente expresión:

(45)

En este caso, la obtención del estimador MV de λ no es tan inmediata

como en el caso anterior dado que, como se puede comprobar en (45), para la obtención de b es necesario disponer previamente de una estimación de λ. De esta forma, el vector de residuos e depende indirectamente de λ, teniendo como consecuencia que no sea suficiente una única optimización de la expresión (44) para obtener una estimación MV de λ. En su lugar, será necesario llevar a cabo un proceso iterativo. No obstante, es preciso destacar que, si bien el método de estimación MV es el más ampliamente utilizado, esta técnica presenta algunas complicaciones derivadas tanto de la necesidad ya mencionada de recurrir a métodos numéricos para resolver los procesos de optimización no lineales como de sus propiedades asintóticas y de las restricciones impuestas sobre el valor de los parámetros

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

32

autorregresivos.36 Por todo ello, han sido propuestos por la literatura métodos de estimación alternativos: la estimación por variables instrumentales (Haining, 1978; Bivand, 1984; Anselin, 1988a), la estimación bayesiana (Anselin, 1982, 1988a; LeSage, 1995 y 1997) o métodos de estimación robustos basados en técnicas de remuestreo como el bootstrap o el jacknife (Anselin, 1988a). Asimismo, en los últimos años, se ha planteado la estimación por el Método Generalizado de Momentos como alternativa a la estimación MV (Kelejian y Robinson, 1993; Kelejian y Prucha, 1997).

Por otra parte, es necesario mencionar otro problema importante que trae consigo la estimación máximo-verosímil: el coste computacional que supone su implementación en caso de trabajar con tamaños muestrales medios o elevados. En este sentido, es preciso tener en cuenta que durante el proceso de obtención de los estimadores MV, es necesario computar un número importante de determinantes, matrices inversas, cálculos de valores propios de W y multiplicaciones entre matrices de órdenes NxN. Claramente, este hecho conlleva un importante consumo de tiempo y requiere de ordenadores con una memoria considerable capaces de almacenar una gran cantidad de información, tanto más cuanto mayor sea el tamaño muestral.37 Sin embargo, tal y como comentan Pace (1996) y Pace y Barry (1996, 1997), la mayor parte de las matrices utilizadas en dichos cálculos se caracterizan por incluir un gran número de elementos iguales a 0, incrementando la proporción de estos últimos con relación al número total de observaciones a medida que aumenta el tamaño muestral. Este hecho posibilita la aplicación de técnicas de matrices sparse basadas en la aplicación de un conjunto de algoritmos (Pace y Barry, 1996), lo cual reduce de forma notable el tiempo invertido en la estimación MV así como la cantidad de información que es preciso almacenar de forma temporal y permanente. Ello es así porque dichas técnicas de matrices sparse permiten que el coste computacional derivado de la estimación MV dependa únicamente del número de elementos diferentes de 0 de W y no del tamaño muestral. 38

4.5. Estrategias para la selección final del modelo espacial 36 En este sentido, cabe notar que dichos estimadores MV alcanzarán sus propiedades asintóticas (consistencia, eficiencia y normalidad asintóticas) siempre que las condiciones de regularidad para el logaritmo de la función de verosimilitud sean satisfechas (ver Greene, 1999). Para ello, se deberá evitar que Ω no sea definida positiva y que A y B muestren un comportamiento explosivo. Este hecho supone una limitación en el rango de valores posibles que puede alcanzar los parámetros espaciales. Específicamente, se deberá de cumplir que 1/ωmin<ρ<1/ωmax y que 1/ωmin<λ<1/ωmax, donde ωmax y ωmin son, respectivamente, el mayor y menor valor propio en términos reales de W. En caso de que W esté estandarizada, ωmax alcanza un valor igual a 1, mientras que 1/ωmin ≤-1, de manera que los valores positivos de los parámetros espaciales deberán de ser menores que 1. 37 Según Pace y Barry (1997), el número de cálculos requeridos para realizar operaciones como determinantes o inversas crece a un ratio proporcional a N3. 38 No obstante, Bell y Bockstael (1997) muestran los problemas computacionales que encuentran a la hora de obtener los valores propios para matrices de orden 2000x2000 aun utilizando técnicas de matrices sparse.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

33

Tras repasar los contrastes existentes de autocorrelación espacial en un modelo de regresión y analizar los principales métodos de estimación en presencia de aquélla, se hace necesaria una breve reflexión acerca de la estrategia para la selección del modelo espacial adecuado. En este sentido, dicha estrategia dependerá de la existencia o no de un modelo teórico previo en el que se haya justificado e incorporado de forma explícita un esquema de dependencia espacial. En caso de disponer de una especificación previa del modelo con base teórica que incluya de partida la presencia de dependencia espacial a través de, por ejemplo, retardos espaciales de la variable endógena y/o exógenas, la estrategia más adecuada es la estimación directa del modelo propuesto y la contrastación ulterior de la significación de los retardos espaciales incluidos. Asimismo, sería aconsejable contrastar si existe algún remanente de autocorrelación espacial residual que no haya sido recogido por medio de la especificación espacial estimada. Si, por el contrario, no se dispone de un modelo teórico previo, la mejor opción pasa por aplicar alguna de las estrategias propuestas por Florax (1992) y Folmer y Florax (1992), basadas en el método de expansión espacial de variables. Dicho método fue ideado con la finalidad de corregir la existencia de dependencia espacial mediante la inclusión de un conjunto de retardos espaciales de las variables explicativas omitidos erróneamente. Si bien los citados autores proponen hasta tres estrategias diferentes asociadas con tres métodos diferentes de expansión espacial de variables, nos centraremos en aquélla basada en el método denominado Expansion Espacial de Variables 2 (EEV2). Dicha estrategia se basa en los siguientes pasos. En primer lugar, se debe estimar el modelo de regresión habitual dado en (25) mediante MCO. Seguidamente, se procede a seleccionar un conjunto S de variables sistemáticas para las cuales la inclusión de un retardo espacial tenga un sentido teórico. En tercer lugar, se debe contrastar la hipótesis de no autocorrelación espacial ni residual ni sustantiva mediante los tests LM-ERR y LM-LAG. Con relación a dichos estadísticos, caben tres posibilidades: i) Ni el test LM-ERR ni LM-LAG rechazan sus respectivas hipótesis nulas.

En este caso, se deberá expandir el modelo de regresión con las variables definidas previamente en el conjunto S, contrastando seguidamente su significación e incluyendo todas aquellas variables retardadas espacialmente que sean significativas y que muestren una menor probabilidad.

ii) Únicamente el test LM-ERR es significativo o bien ambos tests rechazan

sus respectivas hipótesis nulas pero la probabilidad de éste es inferior a la del test LM-LAG. En este caso, el modelo seleccionado finalmente será

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

34

aquél que presente un esquema autorregresivo en el término de perturbación (expresión 14).

iii) Únicamente el test LM-LAG es significativo o bien ambos tests rechazan

sus hipótesis nulas pero la probabilidad de éste es inferior a la del test LM-ERR. En tal caso, se deberá incluir un retardo espacial de la variable endógena al modelo inicial especificado y estimarlo por el método adecuado (expresión 13). Seguidamente, se irá expandiendo sucesivamente el modelo utilizando las variables exógenas retardadas definidas en el conjunto S antes citado, contrastando su significación mediante un contraste habitual de razón de verosimilitud.

En cualquier caso, es importante resaltar que la estrategia basada en el método de expansión fue propuesta con anterioridad a la aparición de los contrastes robustos de dependencia espacial LM-LE y LM-EL comentados en el apartado 4.3. En cualquier caso, tal y como apuntan Anselin y Florax (1995b), los estadísticos robustos pueden ayudar de forma notable en el proceso de selección del modelo espacial, apoyando los resultados obtenidos por los contrastes no robustos. Así, y con relación al método EEV2, cuando el test LM-LAG sea más significativo que el LM-ERR y el estadístico LM-LE sea significativo y el LM-EL no, el modelo deberá incluir, sin lugar a dudas, un retardo espacial de la variable endógena. Por el contrario, la situación opuesta evidenciará claramente la necesidad de modificar la estructura del término de perturbación e introducir un esquema autorregresivo espacial de primer orden. Si bien la estrategia EEV2 es la más utilizada, no obstante, tal y como exponen Florax et al (1998), la citada estrategia, llamada clásica por dichos autores y basada en una aproximación “bottom-up”, adolece de las siguientes desventajas:

Primero, el nivel de significación de la secuencia no estructurada de contrastes es desconocido. Así, como hemos visto anteriormente, en el supuesto de que el modelo fuese estimado por MCO y un esquema de autocorrelación espacial residual fuese detectado, se debería de reestimar el modelo tras incorporar una estructura autorregresiva en el término de perturbación. En este caso, y siguiendo a Hendry (1979) y Minzon (1977), el nivel de significación de los coeficientes estimados en el modelo reespecificado sería desconocido.

Segundo, cada uno de los tests utilizados en dicha estrategia clásica está

condicionado a una serie de asunciones que son arbitrarias. Esto lleva a que, si dichas asunciones son contrastadas y rechazadas, la inferencia obtenida previamente queda invalidada.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

35

Tercero, es posible que, en algunas ocasiones, el procedimiento de expansión espacial de variables no acabe por detectar el mejor modelo, siendo los resultados obtenidos altamente dependientes tanto del tamaño de la muestra como de la especificación escogida para la matriz de contactos.

Teniendo ello en cuenta, dichos autores analizan la idoneidad de una estrategia alternativa: la metodología Hendry, no aplicada con anterioridad para la selección de modelos espaciales. A diferencia de la estrategia clásica, la metodología Hendry parte de un modelo general sobreparametrizado donde se asume a priori la existencia de autocorrelación espacial entre varias variables del modelo, para progresivamente ir simplificándolo en base a los resultados de una batería de contrastes de significación. Así, dicha metodología se basa en los siguientes 3 pasos:

i) identificación del subconjunto de S variables explicativas sistemáticas para las cuales la inclusión de sus retardos espaciales tenga una base teórica;

ii) especificación de un modelo general que incluya, además de las variables exógenas iniciales, todos los retardos espaciales de la variable endógena y/o exógenas que hayan sido definidos en el paso i) y estimación de dicho modelo por el método apropiado (MCO si no incluye un retardo espacial de la variable endógena o un estimador máximo-verosímil si lo incluye).

iii) Contrastación de la significación individual de todas las variables incluidas en el modelo general. Si todas las variables son significativas, el modelo seleccionado finalmente es el modelo general especificado en un primer momento. Si, por el contrario, alguna de las variables no resulta significativa, se debe eliminar del modelo y volver al paso ii), repitiendo el proceso hasta conseguir una especificación en la que todas la variables incluidas sean significativas.

Con el objetivo de comparar ambas metodologías, la estrategia clásica frente a la metodología Hendry, Florax et al llevan a cabo un ejercicio de simulación. La principal conclusión que cabe extraer de dicho ejercicio es que no existe una superioridad clara de un método frente al otro a la hora de seleccionar el modelo espacial correcto. En cualquier caso, sí es importante mencionar que cuando el modelo correcto únicamente incorpora retardos espaciales de las variables exógenas, la metodología Hendry se revela como claramente superior a la estrategia clásica al mostrar una mayor probabilidad de seleccionar el modelo correcto. La situación contraria ocurre cuando está presente un retardo espacial de

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

36

la variable endógena o un esquema de autocorrelación espacial en el término de perturbación. Por último, cabe mencionar que, entre los principales criterios existentes para la selección del mejor modelo final entre diferentes modelos alternativos, no se encuentra el coeficiente de determinación R2. Ello es debido a que su cálculo pierde sentido cuando, al tratar de solucionar la existencia de dependencia espacial (residual y sustantiva), se introduce un esquema autorregresivo espacial y se estima por métodos diferentes a la estimación mínimo cuadrática ordinaria. En su lugar, es posible hacer uso del logaritmo de la función de verosimilitud. Asimismo, otras medidas de selección de modelos susceptibles de ser directamente utilizadas en el contexto espacial son aquéllas basadas en criterios de información como el de Akaike, el cual penaliza aquellas especificaciones que contienen mayor número de parámetros y que muestran una menor precisión en sus estimaciones (Anselin, 1988a).

5. Dependencia espacial en un panel de datos Todos los métodos de contrastación y estimación vistos hasta el momento han sido creados para ser aplicados en un contexto espacial, en el que las observaciones están dadas en una única dimensión transversal. Sin embargo, cada vez es más frecuente la utilización de un panel de datos, bien porque las observaciones estén disponibles para dos dimensiones, temporal y transversal, bien con el objetivo de suplir la escasez de información estadística presente a nivel temporal y/o territorial y obtener así estimaciones más eficientes. Teniendo ello en cuenta, en las décadas de los años ochenta y noventa han aparecido numerosas e interesantes aportaciones en torno a las técnicas apropiadas de contrastación y estimación en presencia de esta doble dimensionalidad de los datos. Los manuales de Shiao (1986) y Baltagi (1995), así como la recopilación de Mátyás y Sevestre (1996) es buena muestra de ello. Sin embargo, las cuestiones de metodología econométrica propiamente espacio-temporal ante la existencia de problemas de autocorrelación espacial no abundan. De esta forma, la doble dimensionalidad presente en un panel de datos se ha resuelto, en algunos casos, mediante la traslación ad-hoc al ámbito espacio-temporal de las técnicas de contrastación y estimación presentes en el ámbito espacial. Así, por ejemplo, partiendo de un modelo de regresión simple,

(46) la hipótesis de dependencia espacial residual puede ser contrastada a través de una variante del estadístico de la I de Moran para los residuos de la regresión pero adaptado a datos espacio-tiempo (Florax, 1992):

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

37

(47) donde IR es el estadístico I de Moran para un panel de datos, y donde IT es una matriz identidad de dimensión T, con T el número total de períodos temporales, W una matriz de contactos estandarizada por filas de dimensión NxN, siendo N el número total de observaciones transversales, y manteniendo el resto de notación como antes. Es decir,

(48)

con una dimensión ((NxT)x(NxT)), siendo 0 una matriz de ceros (NxN) y Ctt una matriz de pesos espacial (NxN), donde cada uno de sus elementos, , reflejan la interacción entre la unidad i y la unidad j en el periodo t. En relación a la definición de la matriz dada en (48), es importante destacar que únicamente contempla la posibilidad de dependencia espacial contemporánea, de manera que la dependencia espacial entre diferentes momentos del tiempo se considera nula. Se podría pensar en variaciones más complejas con una matriz triangular en bloques donde en el triángulo inferior se permitiera la existencia de dependencia entre regiones en los diferentes momentos del tiempo. El inconveniente que posee este contraste de Moran, así como algunas variantes espacio-temporales más complejas como las dadas en Martin y Oeppen (1975) y Hordijk y Nijkamp (1977), es que sus propiedades distribucionales se desconocen, dificultando su aplicación. Es por ello que se suele utilizar la variante espacio-tiempo del estadístico LM-ERR, con la siguiente expresión:

(49)

De igual forma, el test LM-LAG podría ser adaptado al contexto espacio-temporal sustituyendo la matriz W de dimensión (NxN) por la matriz . En relación a los métodos de estimación y estrategias de selección de modelos, el procedimiento a seguir es idéntico al definido en los apartados anteriores, si bien ahora el vector de observaciones de las variables consideradas

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

38

tendrá dimensión (NxT)x1, siendo asimismo preciso sustituir la matriz W por la matriz . No obstante, se ha de hacer notar que en este contexto no podemos permitir la utilización de efectos individuales fijos no observables (modelo de efectos fijos de datos de panel) en caso de aplicar el principio máximo verosímil, tanto para la contrastación como en la estimación en presencia de dependencia espacial. Esto es debido a que se crearía un problema de parámetros incidentales, es decir, el número de parámetros crecería con el tamaño muestral. Si se considera que N tiende a infinito (tal como se hace con cualquier modelo autorregresivo espacial) entonces conceptualmente el número de efectos fijos individuales también crece con N,lo que genera una situación inestimable. En otras palabras, asintóticamente a la hora de utilizar los contrastes de los multiplicadores de Lagrange así como la estimación máximo verosímil se requiere que N vaya hacia infinito, lo que comportaría un número infinito de variables ficticias. Existen varias posibles soluciones para poder seguir utilizando las técnicas tradicionales de estimación y constrastación espacial con la matriz . En primer lugar, se puede utilizar el modelo de efectos aleatorios en caso de que los efectos inobservables no se hallen correlacionados con los regresores del modelo. En segundo lugar, optar por la inclusión de diferencias inobservables temporales pero no individuales. Finalmente, se puede pensar en la consideración de variables que sean una buena aproximación a las diferencias entre las regiones. Desgraciadamente, esta última opción no es siempre factible, de forma que en algunos trabajos (Vayá et al, 1998b; Moreno et al, 1998) se han adoptado estrategias intermedias como la introducción de ciertas ficticias que tengan en cuenta las diferencias en las distintas observaciones individuales (como por ejemplo, ficticias que permitan separar las regiones con productividades por encima y por debajo de la media, ficticias que permitan agregar regiones según la composición/especialización sectorial de las mismas, entre otras). Por último, cabe destacar que, en relación a la modelización espacio-temporal, la simple adaptación directa de los métodos de contrastación y estimación desde el contexto transversal presenta la desventaja de que la naturaleza del panel de datos no se acaba considerando. En este caso, la solución viene de la mano, por una parte, de los denominados modelos SUR (Modelos de ecuaciones aparentemente no relacionadas) y SUR espacial y, por la otra, de los modelos de componentes del error.

Muy brevemente, mencionar que la idea original del modelo SUR aparece en Zellner (1962) y está basada en la especificación de un sistema de ecuaciones, definidas en el contexto espacio-temporal y dependientes entre sí a través de sus términos de perturbación. En concreto, en el modelo SUR (definido cuando T>N) la autocorrelación espacial surgirá como consecuencia

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

39

de la correlación entre los términos de perturbación de cada ecuación del sistema. Por el contrario, en el modelo SUR espacial (definido cuando T<N), cada ecuación del sistema podrá incorporar una estructura de dependencia espacial, bien sustantiva bien en su término de perturbación. Por otra parte, los modelos de componente del error introducen los efectos espacio-temporales en el término de perturbación, introduciendo, en su especificación más general, un componente específico temporal (idéntico para todas las unidades espaciales), un componente específico espacial (idéntico para todas las observaciones temporales) y, por último, un componente que varía para cada unidad espacio-temporal. En este caso, será precisamente la presencia de un componente que permanece constante entre las observaciones espaciales el causante de la aparición de un esquema de autocorrelación espacial en el término de perturbación (ver Anselin, 1988a, para un análisis exhaustivo de ambos tipos de modelos y como resolver la presencia de depedencia espacial en los mismos).

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

40

Referencias bibliográficas: Anselin, L., 1980, "Estimation methods for spatial autoregressive structures"

Ithaca NY: Cornell University, Regional Science Dissertation and Monograph Series #8.

Anselin, L., 1982, "A note on small sample properties of estimators in a first-order spatial autoregressive model", Environment and Planning A, 14, 1023-30.

Anselin, L., 1987, "Spatial dependence and spatial heterogeneity, a closer look at alternative approaches”, Working Paper, Department of Geography, University of California, Santa Barbara.

Anselin, L., 1988a, Spatial Econometrics: Methods and Models. Kluwer Academic Publishers, The Netherlands.

Anselin, L., 1988b, "Lagrange multiplier test diagnostic for spatial dependence and spatial heterogeneity", Geographical Analysis, 20(1), 1-17.

Anselin, L., 1990, "Spatial dependence and spatial structural instability in applied regression analysis", Journal of Regional Science, 30(2), 185-207.

Anselin, L., 1994, "Testing for spatial dependence in linear regression models: A review”, Regional Research Institute Research Paper. West Virginia University, Morgantown.

Anselin, L., 1995, "Local indicators of spatial association-LISA", Geographical Analysis, 27, 93-115.

Anselin, L. y D.A. Griffith, 1988, "Do spatial effects really matter in regression analysis?", Papers Regional Science Association, 65, 11-34.

Anselin, L. y S. Rey, 1991, "Properties of tests for spatial dependence in linear regression models", Geographical Analysis, 23, 112-131.

Anselin, L. y R. Florax, 1995a, New Directions in Spatial Econometrics, Ed: Springer. Berlin.

Anselin, L. y R. Florax, 1995b, "Small sample properties of tests for spatial dependence in regression models: some further results", New Directions in Spatial Econometrics, 21-74. Ed: Springer. Berlin.

Anselin, L., A. Bera, R. Florax y M.J. Yoon, 1996, "Simple diagnostic for spatial dependence”, Regional Science and Urban Economics, 26, 77-104.

Anselin, L., A. Varga y Z. Acs, 1997, “Local geographic spillovers between university research and high technology innovations”, Journal of Urban Economics, 42(3), 422-448.

Anselin, L. y S. J. Rey, 1997, “Introduction to the special issue on spatial econometrics”, International Regional Science Review, 20(1,2), 1-8.

Anselin, L. y H. H. Kelejian, 1997, “Testing for spatial error autocorrelation in the presence of endogenous regressors”, International Regional Science Review, 20(1,2), 153-182.

Anselin, L. y A. K. Bera, 1998, “Spatial dependence in linear regression models with an introduction to spatial econometrics”, Handbook of Applied

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

41

Economic Statistics, eds., Aman Ullah and D. E. A. Giles. New York: Marcel Dekker, Inc.

Arora, S. y M. Brown, 1977, “Alternative approaches to spatial autocorrelation: an improvement over current practice”, International Regional Science Review, 2, 67-78.

Ashworth, J. y S.C. Parker, 1997, “Modelling regional house prices in the UK”, Scottish Journal of Political Economy, 44(3), 225-246.

Aten, B., 1996, “Evidence of spatial autocorrelation in international prices”, Review of Income and Wealth, 42, 149-163.

Aten, B., 1997, “Does space matter? International comparisions of the prices of tradables and nontradables”, Special issue on Spatial Econometrics, International Regional Science Review, 20 (1,2), 35-52.

Baltagi, B.H., 1995, Econometric analysis of panel data, John-Willey&Sons. Barkley, D., M. Henry, S. Bao y K. Brooks, 1995, “How functional are economic

areas? Tests for intraregional spatial association using spatial data analysis”, Papers in Regional Science, 74(4), 297-316.

Basu, S. y T.G. Thibodeau, 1998, “Analysis of spatial autocorrelation in houses prices “, Journal of Real Estate Finance and Economics, 17(1), 61-85.

Bell, K. y Bockstael, S., 1997, “Applying the generalized method of moments approach to spatial problems involving micro-level data”, Department of Agricultural and Resource Economics, Working Paper 97-03, University od Maryland.

Benirschka, M. y J.K. Brinkley, 1994, “Land price volatility in a geographically dispersed market.”, American Journal of Agricultural Economics, 76, 185-195.

Bera, A.K. y M.J. Yoon., 1992, ”Simple diagnostic tests for spatial dependence”, University of Illinois. Department of Economics (mimeo). Champaing, IL: Department of Economics, University of Illinois.

Bernat, G.A., 1996, “Does manufacturing matter? A spatial econometric view of Kaldor’s laws”, Journal of Regional Science, 36, 463-477.

Bivand, R.S., 1984, "Regression modeling with spatial dependence: an application of some class selection and estimation methods", Geographical Analysis, 16(1), 25-37.

Bivand, R. y Szymanski, S., 1997, “Spatial dependence through local yardstick competition: theory and testing”. Economic Letters, 55(2), 257-265.

Blommestein, H., 1983, “Specification and estimation of spatial econometric models: A discussion of alternative strategies for spatial economic modelling”, Regional Science and Urban Economics,13, 251-270.

Bodson, P. y D. Peeters, 1975, "Estimation of the coefficients of a linear regression in the presence of spatial autocorrelation. An application to a Belgian labour-demand function”, Environment and Planning A, 7, 455-472.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

42

Brandsman, A. y R. Ketellapper, 1979, "Further Evidence on Alternative Procedures for Testing of Spatial Autocorrelation Among Regression Disturbances”, In Exploratory and Explanatory Analysis In Spatial Data, 111-36. Edited by C. Bartels and R. Ketellaper. Boston.

Brett, C. y J. Pinkse, 1997, “Those taxes are all over the map! A test for spatial independence of municipal tax rates in British Columbia”, International Regional Science Review, 20(1,2), 131-152.

Burridge, P., 1980, “On the Cliff-Ord test for spatial autocorrelation”, Journal of the Royal Statistical Society B, 42, 107-108.

Can, A., 1990, “The measurement of neighborhood dynamics in urban house prices”, Economic Geography, 66(3), 254-272.

Can, A. y I. Megbolugbe, 1997, “Spatial dependence and house price index constrution”, Journal of Real Estate Finance and Economics, 14, 203-222.

Case, A.C., 1992, “Neighborhood Influence and techonological change”, Regional Science and Urban Economics, 22, 491-508.

Case, A., H. Rosen y J. Hines, 1993, “Budget spillovers and fiscal policy interdependence: evidence from the states”, Journal of Public Economics, 52, 285-307.

Chou, Y.H., 1991, "Map resolution and spatial autocorrelation", Geographical analysis, 23(3), 228-246.

Cliff, A. y J. Ord, 1972, "Testing for spatial autocorrelation among regression residuals”, Geographical Analysis, 4, 267-84.

Cliff, A. y J. Ord, 1973, Spatial Autocorrelation. London, Pion. Cliff A. y J. Ord, 1981, Spatial Process. Models and Applications. London, Pion. Congdon, P., 1990, “Issues in the analysis of small area mortality”, Urban

Studies, 27(4), 519-536. Dacey, M., 1968, "A review of measures of contiguity for two and K-Color

Maps." In spatial analysis: a reader in statistical geography, 479-495. Editado por B.Berry.

Dubin, R., 1992, “Spatial autocorrelation and neighborhood quality”, Regional Science and Urban Economics, 22, 433-452.

Dubin, R., 1995, "Estimating Logit Models with Spatial Dependence”, New Directions in Spatial Econometrics, 229-41. Ed: Springer. Berlin.

Ferguson, M. R. y P. S. Kanaroglou, 1995, “Utility variability within aggregate spatial units and its relevance to discrete models of destination choice”, New Directions in Spatial Econometrics, 243-269, Ed. Springer: Berlín.

Florax, R., 1992, “The university: a regional booster?, Economic impacts of academic knowledge infrastructure”, Ph Dissertation. Wageningen University.

Florax, R. y H. Folmer, 1992, “Specification and estimation of spatial linear regression models: Monte Carlo evaluation of pre-test estimators”, Regional Science and Urban Economics, 22, 404-432.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

43

Florax, R. y H. Folmer, 1994, “The relevance of hendry's econometric methodology in linear spatial process modeling: experimental simultaion results for ML and IV estimators”, Regional Research Institute Research Paper. West Virginia University, Morgantown.

Florax, R., y S. Rey, 1995,"The impacts of misspecified spatial interaction in linear regression models”, New Directions in Spatial Econometrics, 111-134. Ed: Springer. Berlin.

Florax, R., H. Folmer y S. Rey, 1998,"The relevance of Hendry’s econometric methodology: Experimental simulaion results for linear spatial models”, Working Paper TI 98-125/4 Tinbergen Institute Econometrics.

Geary, R., 1954, "The contiguity ratio and statistical maping." The Incorporates Statistician, 5, 115-145.

Getis, A. y J. Ord, 1992, "The analysis of spatial association by use of distance statistics”, Geographical Analysis, 24, 189-206.

Griffith, D.A., 1985, “An evaluation of correction techniques for boundary effects in spatial statistical analysis: contemporary methods”, Geographical Analysis, 17, 81-88.

Graaff, Th. De, R. J. G.M. Florax, P. Nijkamp y A. Reggiani, 1998, “Diagnostic tools for nonlinearity in spatial models”, Working Paper of Tinbergen Institute, Amsterdam.

Greene, W.H., 1999, Análisis econométrico. Tercera Edición. Ed. Prentice Hall, Madrid.

Haining, R., 1978, "Estimating spatial interaction models”, Environment and Planning A, 10, 305-320.

Haining, R. P., 1995, “Data problems in spatial econometric modeling”, New Directions in Saptial Econometrics, 156-171, Ed: Springer. Berlin

Heikkila, E. y C. Kantiotou, 1992, “Calculating fiscal impacts where spatial effects are present”, Regional Science and Urban Economics, 22(3), 475-490.

Hendry, D.F., 1979, Predictive failure and econometric modelling in macroeconomics: The transactions demand for money, P. Ormerod, Ed. Economic Modelling (Heinemann, London).

Holtz-Eakin, D., 1994, “Public-sector capital and the productivity puzzle”, Review of Economics and Statistics, 76, 12-21.

Hordijk, L., 1979, "Problems in estimating econometric relations in space”, Papers Regional Science Association, 42, 99-115.

Hordijk, L. y P. Nijkamp, 1977, "Dynamic models of spatial autocorrelation”, Environment and Planning A, 9, 505-519.

Hsiao, C. (1986) Analysis of Panel Data, Cambridge University Press, Cambridge.

Kelejian, H.H. y D.P. Robinson, 1992, "Spatial autocorrelation. A new computationally simple test with an application to per capita county police expenditures”, Regional Science and Urban Economics, 22, 317-331.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

44

Kelejian, H.H. y D.P. Robinson, 1993, "A suggested method of estimation for spatial interdependent models with autocorrelated errors, and an application to a Spatial autocorrelation. A new computationally simple test with an application to per capita county police expenditures”, Papers in Regional Science, 72, 297-312.

Kelejian, H.H. y D.P. Robinson, 1995, “Spatial correlation: a suggested alternative to the autoregressive model”, New Directions in Spatial Econometrics, 75-95, Ed. Springer: Berlín.

Kelejian, H.H. y D.P. Robinson, 1997, "Infrastructure productivity estimation and its underlying econometric specifications: a sensitivity analysis”, Papers in Regional Science, 76, 115-131.

Kelejian, H.H. y I. R. Prucha, 1997, "A generalized moments estimator for the autoregressive parameter in a spatial model”, International Economic Review, 40 (2), 509-536.

Kelejian, H.H. y I. R. Prucha, 1998, "A generalized spatial two-stage least squeares procedure for estimating a spatial autoregressive model with autoregressive disturbances”, Journal of Real Estate Finance and Economics, 17(1), 99-121.

Kelejian, H.H. y D.P. Robinson, 1998, "A suggested test for spatial autocorrelation and/or heteroskedasticity and corresponding Monte Carlo results”, Regional Science and Urban Economics, 28, 389-41

Kmenta, J., 1971, Elements of econometrics, New York: MacMillan. Kramer, W. y C. Dronninger, 1987, "Spatial autocorrelation among errors and the

relative efficiency of OLS in the linear regression model”, Journal of the American Statistical Association, 82(398), 577-579.

LeSage, J.P., 1993, "Spatial modeling of agricultural markets”, American Jorunal of Agricultural Economics, 75, 1211-1216.

LeSage, J.P., 1995, "A multiprocess mixture model to estimate space-time dimensions of weekly pricing of certificates of deposit”, New Directions in Spatial Econometrics, 359-397. Ed: Springer. Berlin.

LeSage, J.P., 1997, "Bayesian estimation of spatial autoregressive models”, Special issue on Spatial Econometrics, International Regional Science Review, 20 (1,2), 113-130.

López-Bazo, E., E. Vayá, A.J. Mora y J. Suriñach, 1999, “Regional economic dynamics and convergence in the European Union”, The Annals of Regional Science, 33(3), 343-370.

Lyson, T.A. y C.M. Tolbert, 1996, “Small manufacturing and nonmetropolitan socioeconomic well-being”, Environment and Planning A, 28(19), 1779-1794.

Macedo, P.B.R., 1998, “Hedonic price models with spatial effects: an application to the housing market of Belo Horizonte, Brazil”, Revista Brasileira de Economia, 52(1), 63-81.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

45

Martin, R.L.y J.E. Oeppen, 1975, "The identification of regional forecasting models using space-time correlation functions”, Transactions of the Institute of British Geographers, 66, 95-118.

Matyas, L. y Sevestre, P. (1996) The econometrics of panel data: A handbook of the theory with applications, Kluwer Academic Publishers, Dordrecht, The Netherlands.

McMillen, D.P., 1992, "Probit with spatial autocorrelation”, Journal of Regional Science, 32(3), 335-348.

McMillen, D.P., 1995, "Spatial Effects in Probit Models: A Monte Carlo Investigation”, New Directions in Spatial Econometrics, 189-228. Ed: Springer. Berlin.

Meen, G., 1996, “Spatial aggregation, spatial dependence and predictability in the UK housing market”, Housing Studies, 11(3), 345-372.

Mencken, F.C., 1998, “Persistent differences in well-being between Appalachian subregions”, Growth and Change, 29(4), 469-479.

Minzon, G. E., 1977, Model selection procedures, M.J. Artis y A. R. Nobays, eds. Studies in modern economic analysis. Basil Blackwell, Oxford.

Molho, I., 1995, "Spatial autocorrelation in British unemployment”, Journal of Regional Science, 35 (4), 641-658.

Moran, P., 1948, "The interpretation of statistical maps”, Journal of the Royal Statistical Society B, 10, 243-251.

Moreno, R., 1998, “Infraestructuras, externalidades y crecimiento regional. Algunas aportaciones para el caso español.” Tesis Doctoral, Universidad de Barcelona.

Moreno, R., Artís, M., López-Bazo, E. and Suriñach, J., 1997, “Evidence on the complex link between infrastructure and regional growth”, International Journal of Development Planning Literature, 12(1&2), 81-108.

Moreno, R., E. López-Bazo, E. Vayá y M. Artís, 1998, “Externalities, public capital and costs of production”, Comunicación presentada en el 45th North American Meetings of the Regional Science Association International. Santa Fe, New Mexico, USA.

Mur, J., 1990, "Correlación espacial: un estudio de Monte Carlo" Tesis Doctoral, Departamento de Análisis Económico. Universidad de Zaragoza.

Mur, J., 1992, "Contrastes de autocorrelación espacial. Un estudio de Monte Carlo”, Estadística Española, 34(130), 285-307.

Mur, J., 1999, "Testing for spatial autocorrelation: moving average versus autoregressive processes”, Environment and Planning-A, 31(8), 1371-1382.

Murdoch, J., M. Rahmatian y M. Thayer, 1993, “A spatially autoregressive median voter model of recreation expenditures”, Public Finance Quarterly, 21, 334-350.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

46

Najaraj, R., A. Varoudakis, y M.A. Veganzones, 1999, “Infrstructure et performances de croissance a long term: Le cas des Etats de l’Inde”, Annales d’Economie et de Statistique, 0(53), 93-126.

O’Loughlin, J., y L. Anselin, 1996, “Geo-economic competition and bloc formation: U.S., German, and Japanese trade development, 1968-1992”, Economic Geography, 72, 131-160.

Ord, J., 1975, “Estimation methods for models of spatial interaction”, Journal of the American Statistical Association, 70, 120-126.

Ord, J.K. y A. Getis, 1995, "Local spatial autocorrelation statistics: distributional issues and an application”, Geographical Analysis, 27 (4), 286-306.

Paelinck, J.H.P y L.H. Klaassen, 1979, Spatial Econometrics. Farnborough, Saxon House.

Pace, R. K., 1996, “Performing large spatial regressions and autoregressions”, Economic Letters, 54, 283-291.

Pace, R. K. y R. Barry, 1996, “Sparse spatial autoregressions”, Statistics and Probability Letters, 2158, 1-7.

Pace, R. K. y R. Barry, 1997, “Quick computation of spatial autoregressive estimators”, Sgeographical Analysis, 29, 232-247.

Rey, S. y B.D. Montouri, 1999, “Regional income convergence: a spatial econometric perspective”, Regional Studies, 33(2), 143-156.

Rietveld, P. y P. Wintershoven, 1998, “Border effects and spatial autocorrelation in the supply of network infrastructure”, Papers in Regional Science, 77(3), 265-276.

Student, 1914 “The elimination of spurious corrrelation due to position in time or space”, Biometrika, 10, 179-180.

Tobler, W., 1979, Cellular Geography. En Philosophy in Geography. Ed: S. Gale and G. Olsson. Dordrecht: Reidel.

Upton, G y B. Fingleton, 1985, Spatial Data Analysis by Example. Ed: Wiley. New York.

Vandeveer, L. et al, 1998, “Geographic information systems procedures for conducting rural land market research”, Review of Agricultural Economics, 20(2), 448-461.

Vayá, E., 1998, “Localización, crecimiento y externalidades regionales. Una propuesta basada en la econometría espacial”, Tesis Doctoral, Universidad de Barcelona.

Vayá, E., E. López-Bazo y M. Artís, 1998a, “Growth, convergence and (why not?) regional externalities”, Working Paper Divisió II, E98/31,University of Barcelona.

Vayá, E., E. López-Bazo, R. Moreno y J. Suriñach, 1998b, “Economic growth and spatial externalities”, Comunicación presentada en el 45th North American Meetings of the Regional Science Association International. Santa Fe,New Mexico, USA.

FEDEA – D.T. 2000-13 por Esther Vayá y Rosina Moreno

47

Zellner, A., 1962, "An efficient method of estimating seemingly unrelated regressions and tests of aggregation bias”, Journal of the American Statistical Association, 57, 348-368.

RELACION DE DOCUMENTOS DE FEDEA COLECCION RESUMENES 98-01: “Negociación colectiva, rentabilidad bursátil y estructura de capital en España”, Alejandro

Inurrieta. TEXTOS EXPRESS 99-02: “Economic implications of the demographic change in Spain: Call for research”, Namkee

Ahn. 99-01: “Efectos macroeconómicos de la finalización de las ayudas comunitarias”, Simón Sosvilla-

Rivero y José A. Herce. DOCUMENTOS DE TRABAJO 2000-13: “La utilidad de la econometría espacial en el ámbito de la ciencia regional”, Esther Vayá

Valcarce y Rosina Moreno Serrano. 2000-12: “The role of the minimum wage in the welfare state: An appraisal”, Juan J. Dolado,

Florentino Felgueroso y Juan F. Jimeno. 2000-11: “Modelling evolving long-run relationships: The linkages between stock markets in Asia”,

José L. Fernández-Serrano y Simón Sosvilla-Rivero. 2000-10: “Integration and Inequality: Lesson from the Accessions of Portugal and Spain to the EU”,

Juan F. Jimeno, Olga Cantó, Ana Rute Cardoso, Mario Izquierdo y Carlos Farinha Rodrigues.

2000-09: “Explaining Youth Labor Market Problems in Spain: Crowding-Out, Institutions, or Technology Shifts”, Juan J. Dolado, Florentino Felgueroso y Juan F. Jimeno.

2000-08: “Distributional aspects of the quality change bias in the CPI: Evidence from Spain”, Javier Ruiz-Castillo, Eduardo Ley y Mario Izquierdo.

2000-07: “Testing chaotic dynamics via Lyapunov exponents”, Fernando Fernández-Rodríguez, Simón Sosvilla-Rivero y Julián Andrada-Félix.

2000-06: “Convergencia: Un análisis conjunto de los sectores. Aplicación al caso de las regiones españolas”, Pablo Álvarez de Toledo, Jaime Rojo, Álvaro Toribio y Carlos Usabiaga.

2000-05: “The Laspeyres bias in the Spanish consumer price index”. Javier Ruiz-Castillo, Eduardo Ley y Mario Izquierdo.

2000-04: “Evaluación de los efectos del Plan Prever a partir de un modelo de simulación de reemplazos del parque español de automóviles”, Omar Licandro y Antonio R. Sampayo.

2000-03: “Minimum consumption, transitional dynamics and the Kuznets curve”, María José Alvarez y Antonia Díaz.

2000-02: “Vintage human capital, demographic trends and endogenous growth”, Raouf Boucekkine, David de la Croix y Omar Licandro.

2000-01: “Vintage capital and the dynamics of the AK model”, Raouf Boucekkine, Omar Licandro, Luis A. Puch y Fernando del Río.

99-21: “Los efectos macroeconómicos de la Agenda 2000”, Simón Sosvilla-Rivero y José A. Herce.

99-20: “Unemployment duration and workers’ wage aspirations in Spain”, Namkee Ahn y J. Ignacio García-Pérez.

99-19: “El patrón inversor de los establecimientos industriales de la Comunidad de Madrid”, Ana Goicolea, Omar Licandro y Reyes Maroto.