Análisis Espacial

25

CAPÍTULO II. METODOLOGÍA UTILIZADA EN EL ANÁLISIS ESPACIAL

2.1. Conceptos

A continuación presentaremos la metodología utilizada en este trabajo para analizar la

distribución espacial de las remesas, a través de la utilización de sistemas de información

geográfica (SIG), los cuales consisten en una integración de datos estadísticos geográficamente

referenciados. En este estudio, estos sistemas de información serán procesados mediante de

técnicas estadísticas espaciales. La metodología utilizada en el análisis espacial propuesto en este

trabajo consiste en la evaluación de la aglomeración de las unidades geográficas de

observación29 en torno a los valores exhibidos por un atributo de interés, entendido éste como

una variable que describe características específicas de estas unidades. Para tal efecto

analizaremos datos estadísticos obtenidos de fuentes oficiales de información y algunos

construidos ex profeso para la realización de este trabajo. Según Haining (2001), análisis

espacial representa una colección de técnicas y modelos que explícitamente usan referencias

espaciales asociadas con cada valor de una variable que está especificado dentro del sistema que

se está estudiando. El análisis espacial consta de tres elementos principales: el modelo

cartográfico, donde cada base de datos está representada como un mapa; los modelos

matemáticos, donde los resultados dependen de la forma de interacción espacial entre los objetos

en el modelo, o de relaciones espaciales, o bien de la posición geográfica de los objetos dentro

del modelo; y el desarrollo y la aplicación de técnicas estadísticas para el adecuado análisis de

los datos espaciales y el cual, como consecuencia, hace uso de la referencia espacial de los datos

(Haining, 2001).

Los métodos estadísticos tradicionales no involucran coordenadas geográficas ni distancias

físicas y asumen que no hay interacción entre las unidades de observación, es decir, que los

valores de los atributos son independientes entre sí. Cuando se realiza inferencia estadística se

asume que hay aleatoriedad en el comportamiento de los valores de los atributos, comúnmente

dicha aleatoriedad se asocia a una distribución estadística que da origen a los datos (una

distribución normal, una poisson, etc).

29 En el análisis espacial, una unidad geográfica de observación refiere al espacio geográfico donde una variablemuestra características o valores en función de una escala geográfica definida, llámese ésta país, estado, región,municipio, localidad, etc.

26

Aquí cabe entonces, formular la siguiente pregunta: ¿Qué supone el análisis estadístico

tradicional para estudiar unidades geográficas? El análisis estadístico tradicional utilizado para

analizar variables asociadas a un espacio geográfico, se caracteriza por construirse sobre

supuestos en los que no hay autocorrelación entre las unidades de observación.

Por el contrario, el método estadístico propuesto para efectuar nuestro análisis espacial en

torno a la recepción de remesas, considera la dependencia espacial entre las unidades de

observación. De este modo las características geográficas asociadas a las remesas y su

distribución regional (y que comentamos en el capítulo anterior) pueden ser analizados a través

de técnicas que consideren la dependencia espacial y la autocorrelación espacial.

La dependencia espacial significa que los valores de una misma variable que son medidos

en localidades que son cercanas entre sí tienden a ser similares, es decir, a mayor cercanía

geográfica corresponde una mayor similitud en los valores, dicho en otras palabras, la

dependencia espacial se produce cuando el valor de la variable dependiente en una unidad

espacial, es parcialmente función del valor de la misma variable en unidades vecinas. La

dependencia espacial hace diferente a la estadística espacial de la tradicional debido a que

considera la distancia y la contigüidad existentes entre unidades de observación. Este trabajo

utiliza técnicas estadísticas que han sido desarrolladas para determinar los grados de asociación

espacial existentes entre nuestras unidades de observación, aportando elementos importantes

para estudiar la posible influencia y la dependencia espacial entre estas unidades.

En el caso concreto del presente trabajo, el concepto de dependencia espacial lo utilizamos

como una forma de explicar los componentes regionales de las remesas en México planteados en

el primer capítulo.

2.2. Autocorrelación espacial

La autocorrelación espacial es utilizada en la medición de la asociación lineal entre dos variables

aleatorias,30 y puede definirse como la influencia de la coincidencia de valores similares de una

variable en espacios geográficos cercanos, es decir, cuando una variable tiende a asumir valores

30 Una variable aleatoria es una función que asigna un valor numérico a cada suceso elemental del espacio muestral.Es decir, una variable aleatoria es una variable cuyo valor numérico está determinado por el resultado delexperimento aleatorio.

27

similares en unidades geográficamente cercanas (Anselin, 2001). Es decir, una vez que se

involucra la distancia, queremos saber qué tan semejante o diferente es el valor de la variable

“consigo misma”, una vez que consideramos la variación de los valores de estos atributos entre

los diferentes puntos en el espacio. En síntesis, la autocorrelación espacial refleja el grado en que

objetos o actividades en una unidad geográfica, son similares a otros objetos o actividades en

unidades geográficas próximas. La propiedad básica de los datos espacialmente

autocorrelacionados es que los valores no son aleatorios en el espacio, es decir, los valores de los

datos están espacialmente relacionados entre sí (Lee y Wong, 2001). Conceptualmente, podemos

hablar indistintamente de autocorrelación y dependencia espacial, aunque puede distinguirse

entre estos dos términos a partir de cómo se involucra una reflexión teórica.31

La autocorrelación espacial puede presentarse con valores positivos o negativos; existe

autocorrelación positiva cuando valores similares de una variable aleatoria tienden a aglomerarse

en el espacio, habiendo dependencia espacial entre ellos; por otra parte, la autocorrelación

negativa se presenta cuando las unidades geográficas de observación tienden a estar rodeadas de

valores opuestos estadísticamente significativos. Las aglomeraciones resultantes son

caracterizadas por la similitud de los valores de las unidades de observación, clasificándose en

altas, con valores superiores a la media del conjunto de observaciones y bajas, con valores

inferiores a esa misma media. Para distinguir las aglomeraciones que exhiben valores de nuestros

atributos, superiores o inferiores a la media del total de las observaciones, utilizaremos métodos

asociados al análisis exploratorio espacial recientemente desarrollados (Anselin, 1992, 1995).

El análisis exploratorio de datos espaciales (ESDA,32 por sus siglas en inglés) consiste en

un conjunto de técnicas utilizadas para describir y visualizar distribuciones espaciales, detectar

patrones de asociación espacial y aglomeraciones en torno a un atributo, así como sugerir

regímenes espaciales u otras formas de heterogeneidad espacial (Haining, 1990; Anselin, 1995;

Lee & Wong, 2001). Este tipo de análisis de exploración visual distingue dos tipos de

autocorrelación: la autocorrelación global y la local; el primer tipo considera los valores de todas

las observaciones, mientras el segundo considera la autocorrelación de los valores de las

unidades de observación y los de sus vecinos (Anselin, 1995). Paralelamente, incluye la

31 Dado la similitud existente entre los conceptos de autocorrelación espacial y dependencia espacial, cabe señalarque se presentan de forma separada puesto que la existe una diferencia entre ellas, la cual radica en que la primera serefiere simultáneamente a un fenómeno y técnica estadística, y la segunda a una explicación teórica (Vilalta, 2004).32 Exploratory Spatial Data Analysis.

28

identificación de las propiedades de los datos y la formulación de hipótesis a partir de estos

mismos datos georeferenciados. Para identificar en nuestro trabajo a cada una de estas

modalidades podemos caracterizar la forma en que la recepción de remesas y la relación entre

remesas y PIB están localizadas en México y al interior de sus regiones, así como la forma en

que estos patrones de localización han cambiado a través del tiempo.

La autocorrelación espacial puede ser medida en términos de su intensidad; una fuerte

autocorrelación espacial significa que los valores del atributo de las unidades de observación

geográfica adyacentes, están intensamente relacionados. En el caso de que los valores de los

atributos parezcan no tener una relación clara, es decir, cuando no exhiben significancia

estadística, la distribución presenta entonces una autocorrelación débil, o bien refleja un patrón

aleatorio (Lee y Wong, 2001).

Este tipo de análisis requiere de contar con una medida de asociación lineal para medir

grados de semejanza entre las observaciones en función de sus atributos. Para tal efecto en esta

tesis utilizamos el índice de Moran, que es una medición usada ampliamente desde la década de

1990, para evaluar autocorrelación espacial en múltiples investigaciones que incluyen variables

económicas, sociales y demográficas, principalmente.

2.2.1. Medidas de autocorrelación global: Indice de Moran

El índice de Moran expresa de manera formal el grado de asociación lineal entre dos variables

aleatorias independientes, representadas funcionalmente por el vector Z de los valores

observados y el vector W, de las medias ponderadas espacialmente de los valores de las unidades

de observación vecinas, llamado el vector (lag) espacial. Este coeficiente está fundamentado en

un modelo de autocovarianza. La proximidad entre “i” y “j” (filas y columnas) se denota como

dij , y son elementos de la matriz de distancia (W), El índice de Moran se expresa formalmente

mediante la siguiente ecuación:

Ecuación (1)

Donde n es el número de unidades geográficas de observación, wij son los elementos de una

matriz binaria de contigüidad, s es la suma de todos los elementos de la matriz W y zi y zj son los

n

ii

ji

n

i

n

j ij

z

zzw

s

nI

1

2

1 1

29

valores estandarizados de la variable a analizar de la unidad geográfica de observación i y j. La

doble sumatoria de i y j está comparando a los valores con la media de toda la región estudiada.

Los valores del índice de Moran oscilan entre +1 y -1, donde el primer valor significa una

autocorrelación positiva perfecta (perfecta concentración), y el segundo una autocorrelación

negativa perfecta (perfecta dispersión); el cero significa un patrón espacial completamente

aleatorio. En el índice de Moran, la asociación de valores en el conjunto de datos está

determinada por una matriz de distancias o contigüidad, la cual predefine los valores vecinos

para el cálculo del coeficiente de autocorrelación. Esta matriz, también llamada de pesos

espaciales, está basada en los vecinos k-más cercanos calculados desde la distancia radial entre

los centroides regionales (Le Gallo, 2003).

El índice de Moran puede interpretarse como una medición estandarizada de la autocovarianza

de una variable, una vez que se calcula una matriz de distancia. El índice de Moran tiene un valor

esperado de no autocorrelación que está dado por la siguiente expresión: , donde

E (I) es el valor esperado; y n es el número de las observaciones. Para aceptar o rechazar la

hipótesis nula de no autocorrelación espacial, pueden utilizarse pruebas de inferencia estadística

basadas en supuestos de normalidad, o en distribuciones experimentales, como es el caso de la

distribución Monte Carlo, utilizada como método no determinístico para aproximar

numéricamente expresiones matemáticas complejas y costosas de evaluar con exactitud. Este

tipo de distribución es el que será utilizada en el análisis exploratorio espacial de las remesas que

ocupa a este trabajo.

Las técnicas propuestas de análisis espacial están basadas en los criterios de contigüidad y

de distancia. Así, la relación de vecindad y de interacción espacial entre las unidades de

observación, tiene que ser determinada antes de efectuar los cálculos estadísticos. El criterio de

contigüidad (vecindad), es aplicado a partir de una matriz de contigüidad o pesos geográficos de

dimensiones n x n, la cual será determinante en la evaluación de la aglomeración y/o dispersión

de las unidades de observación, en función a la semejanza de los valores que presenta un atributo

y a su ubicación en el espacio. Asimismo, el criterio de distancia utilizado, considera la distancia

entre los centroides de las unidades geográficas, entendidos como los centros geométricos de los

polígonos irregulares, asociados con cada unidad de observación en el plano real sobre el terreno

físico.

1

1)(

nIE

30

El índice de Moran es una estadística global que considera los valores de todas las

observaciones, el cual, si bien no permite evaluar la estructura local de la autocorrelación

espacial, muestra la existencia de aglomeraciones espaciales locales en torno a valores superiores

o inferiores a la media de todas las observaciones, y especialmente cuales son las regiones que

contribuyen más a la autocorrelación espacial global. Las medidas originales de dependencia

espacial desarrolladas por Moran (1948) y Geary, estaban basadas en las nociones de contigüidad

binaria33 entre unidades espaciales, desde donde se genera una matriz cuyos elementos eran ceros

y unos, queriendo reflejar con los unos que la unidad espacial a la que le correspondía aquella

fila y la unidad espacial a la que le correspondía la columna tenían algún tramo de frontera en

común, mientras que los elementos ceros significaban que no tenían ningún tramo de frontera en

común. Esta definición de contigüidad naturalmente asume la existencia de un mapa, a partir del

cual se pueda discernir la existencia o no de fronteras. Si las distintas unidades espaciales son

irregulares, esta matriz se puede obtener de manera directa, sin embargo no diferencia aquellas

unidades que tienen una frontera en común muy amplia de las que apenas tienen un borde en

común. La contigüidad simple solamente proporciona una representación limitada, de hasta que

punto la interacción espacial puede expresarse en un modelo. De cualquier forma, la utilidad

analítica que significa el uso de estos constructos metodológicos, ofrece ventajas considerables

para efectuar análisis espaciales, respecto a los métodos estadísticos tradicionales.

En general, los datos geográficos se presentan en un mapa continuo, como en el siguiente

ejemplo simple de tan sólo nueve localizaciones próximas:

33 “El concepto de contigüidad binaria, fue extendido por Cliff y Ord (1973, 1981) para incluir una medida generalde la interacción potencial entre dos unidades espaciales. La sugerencia inicial de Cliff y Ord consiste en lautilización de una combinación de medidas de distancia (inversa de la distancia, una función exponencial negativade la distancia) y la longitud relativa de la frontera que tienen en común dos unidades espaciales en relación a lalongitud de frontera que tiene una unidad espacial con el resto de unidades de su alrededor. Los elementosresultantes serán por tanto asimétricos, a menos que ambas unidades espaciales tengan la misma longitud defrontera” (Gómez de Antonio, 1999).

a b c

d e f

g h i

31

La contigüidad respecto de la localización central (e), puede entonces definirse de tres

maneras principales: En el caso de Rooks, se consideran adyacentes a la localización “e” las b, d,

f, h; la contigüidad de Bishops, por el contrario, analiza las relaciones de proximidad en relación

diagonal, y consideraría vecinas a la localización “e” las a, c, g, i; el criterio de Queen combina

los dos anteriores. Entonces, el criterio de vecindad de la matriz de tipo Queen, considera la

contigüidad respecto a la celda “e”, en las celdas a, b, c, d, f, g, h, i. En este trabajo se utilizará el

tipo de contigüidad Queen.

Gráfica 2.1. Tipos de matrices de contigüidad

Rooks Bishops Queen

2.2.2. Medidas de autocorrelación local: LISA34

El cálculo del índice de Moran a nivel global está basado en que el grado de

autocorrelación espacial de un atributo entre unidades espaciales es igual para todos los

polígonos o puntos analizados, es decir existe un supuesto implícito de estacionalidad

(homogeneidad) espacial. Este supuesto puede desviarse de lo que pasa en la asociación espacial

a nivel local. Es decir, probablemente la estadística global del Moran pueda estar distorsionando

lo que sucede a niveles locales. La expresión formal del indicador local queda como sigue:

Ecuación (2)

Donde n es el número de unidades geográficas de observación, wij son los elementos de una

matriz binaria de contigüidad, x es el atributo de la variable y es la media del producto

cruzado.

34 Local Indicators of Spatial Autocorrelation (Indicadores locales de autocorrelación espacial).

i i

j jiji

inxx

xxwxxI

/)(

)()(

2

x

32

El análisis espacial a nivel local implica la comparación de la diferencia de la media de

cada observación con la media de todo el conjunto de observaciones, así como de la diferencia

de la media de las observaciones vecinas.

En este trabajo analizamos la autocorrelación espacial local con dos herramientas: el

diagrama de dispersión de Moran y los Indicadores Locales de Autocorrelación Espacial LISA

(Anselin, 1992). Este indicador satisface dos criterios: en primer lugar, la LISA de a cada

observación indica aglomeración espacial estadísticamente significativa de valores similares

alrededor de esa observación; segundo, la sumatoria de las LISA para todas las observaciones es

proporcional a un indicador global de asociación espacial –Moran- (Le Gallo, 2005). En otros

términos, el análisis de la autocorrelación espacial local consiste en la comparación de la

diferencia de la media de la observación con la de todo el país, aunque en el análisis local no se

esté considerando lo global. Este nivel de análisis compara también la diferencia con la media de

las observaciones vecinas.

El análisis de las LISA, permite explorar visualmente los patrones de aglomeración

formados en función a los valores de una variable que presentan las unidades de observación

analizadas y las unidades vecinas. De esta forma, puede apreciarse en que unidades geográficas

existe homogeneidad en los patrones de aglomeración, es decir, cuando existe una

autocorrelación espacial positiva; y heterogeneidad cuando existe autocorrelación espacial

negativa.

Cuando se presenta la autocorrelación espacial negativa, se cumplen las condiciones

elementales de heterogeneidad espacial, la cual se presenta cuando en una unidad de

observación, el valor de una variable que esté por arriba del promedio de todas las

observaciones, está rodeada por vecinos que presentan valores por debajo de ese mismo

promedio y viceversa. Indica la presencia de diferencias sistemáticas en la ocurrencia de un

fenómeno en distintas regiones geográficas, de tal forma que este podría tener diferentes

distribuciones (media, varianza u otros parámetros) en un subgrupo espacial de los datos o bien,

simplemente cambiar con la ubicación de las unidades (Anselin 1992). Significa que el

comportamiento de la variable analizada en un espacio geográfico, no es espacialmente estable y

puede generar patrones espaciales característicos bajo la forma de regímenes espaciales (Le

Gallo, 2003).

33

En el marco de este trabajo en específico, consideramos pertinente hacer la aclaración de

que la heterogeneidad espacial presentada en este apartado, no es conceptualmente equivalente

al planteamiento de heterogeneidad espacial, atribuida a la recepción y a los impactos de las

remesas en México a nivel país del apartado 1.6 del primer capítulo. La heterogeneidad espacial

citada en este apartado se presenta en el análisis de autocorrelación espacial local del tercer

capítulo.

2.3. Exploración visual de datos georeferenciados

La técnica de exploración visual en el análisis espacial propuesta para este trabajo utiliza el

diagrama de dispersión de Moran (Anselin, 1992), el cual muestra el lag espacial (matriz de

contigüidad) Wzt contra los valores originales zt. Los diferentes cuadrantes del diagrama de

dispersión corresponden a los cuatro tipos de asociación espacial local entre una región y sus

vecinos. El diagrama propuesto resulta un instrumento útil para analizar distribuciones de puntos

que representan un valor para identificar algún patrón reconocible. Cada distribución de puntos

es el resultado de algunos procesos en un tiempo y espacios determinados (Lee y Wong, 2001).

Gráfica 2.2. Diagrama de dispersión (scatterplot) de Moran.

Ma

triz

de

co

nti

gü

idad

(W)

de

rem

es

as

tota

les

Remesas totales

La exploración visual de las LISA permite identificar el signo de la autocorrelación

espacial entre los puntos (observaciones) en todos los cuadrantes del diagrama de dispersión del

A-AB-A

A-BB-B

34

Moran, donde es posible identificar tanto homogeneidad como heterogeneidad espacial. La

heterogeneidad se presenta cuando hay presencia en los cuatro cuadrantes del diagrama de

dispersión, particularmente en el A-B y el B-A. La exploración visual de las LISA permite

identificar el signo de la autocorrelación de los puntos (observaciones) en todos los cuadrantes

del diagrama de dispersión de Moran. En los casos de los cuadrantes A-B (valores altos del

atributo en la observación-valores bajos de los vecinos) y B-A (valores bajos del atributo en la

observación y valores altos de los vecinos) podemos dar cuenta de la presencia de

heterogeneidad espacial.35 Los análisis de cuadrantes son también útiles para la detección de

valores extraordinarios.

2.4. Construcción de la base de datos y fuentes utilizadas.

Este trabajo utilizará dos unidades de análisis espacial, o escalas geográficas de acuerdo con

Jones (1998); municipios y estados para la sección del análisis exploratorio de los montos de

remesas recibidas en el año 2000, y estados para la sección del análisis del crecimiento de las

participaciones porcentuales de las remesas por estado y de la razón entre remesas y producto

interno bruto para el período 1995-2004.

La selección de únicamente estados como unidades de análisis para la última sección

obedeció a que no hay disponibilidad de información de montos de remesas ni de producto

interno bruto a nivel municipal.

La variable propuesta para el análisis exploratorio a nivel municipal es la cantidad en pesos

que recibió cada municipio en el 2000. Estas cantidades son producto de unas estimaciones

inéditas realizadas por Fernando Lozano (sin fecha). Las estimaciones de los montos de remesas

a nivel municipal, se realizaron con base a la información obtenida de la pregunta número 31 del

cuestionario ampliado del XII Censo de Población y Vivienda (INEGI, 2000): si el encuestado

recibe dinero por ayudas de familiares en otro país. La información obtenida a nivel de

individuos fue agregada a nivel de hogares y se determinaron los montos mensuales dependiendo

de la frecuencia en la que los recursos son recibidos. Posteriormente se calcularon los montos de

las ayudas de otro país a nivel municipal. En los casos de los municipios donde se encontró un

35 Ver gráfica 3.1 de la página 43.

35

porcentaje mayor al 10% de hogares en los que se reciben ayudas monetarias de otro país pero

no se reporta la cantidad, se les asignó el promedio por hogar calculado para el resto del estado al

que pertenecen. Este promedio se obtuvo considerando la información de las cantidades de los

hogares que si fueron declaradas.

En el capítulo III se consideraron los montos de remesas y las participaciones porcentuales

por entidad del Banco de México anualizados para 1995 y 2006.

En el capítulo IV, se relacionan los montos de remesas expresadas en miles de pesos de los

años 1995 y 2004 con el Producto Interno Bruto de los mismos años a nivel estatal (remesas

como porcentaje del PIB). Para ambos años las cifras en dólares fueron transformadas a pesos

corrientes considerando el tipo de cambio promedio anual del dólar intercambiario a la venta

para cada año (tanto para 1995 y tanto para 2004). Para hacerlos comparables con las cifras de

los productos internos brutos en el capítulo cuarto, los cálculos con los montos de remesas son

efectuados en miles de pesos. Se utilizó la información de los PIB’s estatales del portal de

INEGI. La construcción de esta variable busca demostrar los grados de dependencia a nivel

estatal controlados por su adscripción regional, desde una perspectiva espacial que los agrupa en

las regiones migratorias propuestas por CONAPO (2005) como referencia para nuestro análisis.

El análisis longitudinal explorará la participación de las remesas en el crecimiento

económico, o visto de otro modo, la dependencia de la economía de un producto externo,

mediante la exploración del crecimiento de esta razón a diferentes escalas geográficas: estado y

región. De esta forma podremos apreciar como se forman patrones regionales en función al

crecimiento de la razón remesas sobre producto.

Hemos seleccionado el PIB como variable que expresa crecimiento económico, ya que a

nuestro juicio, resulta relevante relacionar el producto interno local con recursos que constituyen

un producto generado en el exterior del país.

Análisis Espacial

Documents

Transcript of Análisis Espacial