Análisis Espacial
-
Upload
camilo-lillo -
Category
Documents
-
view
214 -
download
0
description
Transcript of Análisis Espacial
25
CAPÍTULO II. METODOLOGÍA UTILIZADA EN EL ANÁLISIS ESPACIAL
2.1. Conceptos
A continuación presentaremos la metodología utilizada en este trabajo para analizar la
distribución espacial de las remesas, a través de la utilización de sistemas de información
geográfica (SIG), los cuales consisten en una integración de datos estadísticos geográficamente
referenciados. En este estudio, estos sistemas de información serán procesados mediante de
técnicas estadísticas espaciales. La metodología utilizada en el análisis espacial propuesto en este
trabajo consiste en la evaluación de la aglomeración de las unidades geográficas de
observación29 en torno a los valores exhibidos por un atributo de interés, entendido éste como
una variable que describe características específicas de estas unidades. Para tal efecto
analizaremos datos estadísticos obtenidos de fuentes oficiales de información y algunos
construidos ex profeso para la realización de este trabajo. Según Haining (2001), análisis
espacial representa una colección de técnicas y modelos que explícitamente usan referencias
espaciales asociadas con cada valor de una variable que está especificado dentro del sistema que
se está estudiando. El análisis espacial consta de tres elementos principales: el modelo
cartográfico, donde cada base de datos está representada como un mapa; los modelos
matemáticos, donde los resultados dependen de la forma de interacción espacial entre los objetos
en el modelo, o de relaciones espaciales, o bien de la posición geográfica de los objetos dentro
del modelo; y el desarrollo y la aplicación de técnicas estadísticas para el adecuado análisis de
los datos espaciales y el cual, como consecuencia, hace uso de la referencia espacial de los datos
(Haining, 2001).
Los métodos estadísticos tradicionales no involucran coordenadas geográficas ni distancias
físicas y asumen que no hay interacción entre las unidades de observación, es decir, que los
valores de los atributos son independientes entre sí. Cuando se realiza inferencia estadística se
asume que hay aleatoriedad en el comportamiento de los valores de los atributos, comúnmente
dicha aleatoriedad se asocia a una distribución estadística que da origen a los datos (una
distribución normal, una poisson, etc).
29 En el análisis espacial, una unidad geográfica de observación refiere al espacio geográfico donde una variablemuestra características o valores en función de una escala geográfica definida, llámese ésta país, estado, región,municipio, localidad, etc.
26
Aquí cabe entonces, formular la siguiente pregunta: ¿Qué supone el análisis estadístico
tradicional para estudiar unidades geográficas? El análisis estadístico tradicional utilizado para
analizar variables asociadas a un espacio geográfico, se caracteriza por construirse sobre
supuestos en los que no hay autocorrelación entre las unidades de observación.
Por el contrario, el método estadístico propuesto para efectuar nuestro análisis espacial en
torno a la recepción de remesas, considera la dependencia espacial entre las unidades de
observación. De este modo las características geográficas asociadas a las remesas y su
distribución regional (y que comentamos en el capítulo anterior) pueden ser analizados a través
de técnicas que consideren la dependencia espacial y la autocorrelación espacial.
La dependencia espacial significa que los valores de una misma variable que son medidos
en localidades que son cercanas entre sí tienden a ser similares, es decir, a mayor cercanía
geográfica corresponde una mayor similitud en los valores, dicho en otras palabras, la
dependencia espacial se produce cuando el valor de la variable dependiente en una unidad
espacial, es parcialmente función del valor de la misma variable en unidades vecinas. La
dependencia espacial hace diferente a la estadística espacial de la tradicional debido a que
considera la distancia y la contigüidad existentes entre unidades de observación. Este trabajo
utiliza técnicas estadísticas que han sido desarrolladas para determinar los grados de asociación
espacial existentes entre nuestras unidades de observación, aportando elementos importantes
para estudiar la posible influencia y la dependencia espacial entre estas unidades.
En el caso concreto del presente trabajo, el concepto de dependencia espacial lo utilizamos
como una forma de explicar los componentes regionales de las remesas en México planteados en
el primer capítulo.
2.2. Autocorrelación espacial
La autocorrelación espacial es utilizada en la medición de la asociación lineal entre dos variables
aleatorias,30 y puede definirse como la influencia de la coincidencia de valores similares de una
variable en espacios geográficos cercanos, es decir, cuando una variable tiende a asumir valores
30 Una variable aleatoria es una función que asigna un valor numérico a cada suceso elemental del espacio muestral.Es decir, una variable aleatoria es una variable cuyo valor numérico está determinado por el resultado delexperimento aleatorio.
27
similares en unidades geográficamente cercanas (Anselin, 2001). Es decir, una vez que se
involucra la distancia, queremos saber qué tan semejante o diferente es el valor de la variable
“consigo misma”, una vez que consideramos la variación de los valores de estos atributos entre
los diferentes puntos en el espacio. En síntesis, la autocorrelación espacial refleja el grado en que
objetos o actividades en una unidad geográfica, son similares a otros objetos o actividades en
unidades geográficas próximas. La propiedad básica de los datos espacialmente
autocorrelacionados es que los valores no son aleatorios en el espacio, es decir, los valores de los
datos están espacialmente relacionados entre sí (Lee y Wong, 2001). Conceptualmente, podemos
hablar indistintamente de autocorrelación y dependencia espacial, aunque puede distinguirse
entre estos dos términos a partir de cómo se involucra una reflexión teórica.31
La autocorrelación espacial puede presentarse con valores positivos o negativos; existe
autocorrelación positiva cuando valores similares de una variable aleatoria tienden a aglomerarse
en el espacio, habiendo dependencia espacial entre ellos; por otra parte, la autocorrelación
negativa se presenta cuando las unidades geográficas de observación tienden a estar rodeadas de
valores opuestos estadísticamente significativos. Las aglomeraciones resultantes son
caracterizadas por la similitud de los valores de las unidades de observación, clasificándose en
altas, con valores superiores a la media del conjunto de observaciones y bajas, con valores
inferiores a esa misma media. Para distinguir las aglomeraciones que exhiben valores de nuestros
atributos, superiores o inferiores a la media del total de las observaciones, utilizaremos métodos
asociados al análisis exploratorio espacial recientemente desarrollados (Anselin, 1992, 1995).
El análisis exploratorio de datos espaciales (ESDA,32 por sus siglas en inglés) consiste en
un conjunto de técnicas utilizadas para describir y visualizar distribuciones espaciales, detectar
patrones de asociación espacial y aglomeraciones en torno a un atributo, así como sugerir
regímenes espaciales u otras formas de heterogeneidad espacial (Haining, 1990; Anselin, 1995;
Lee & Wong, 2001). Este tipo de análisis de exploración visual distingue dos tipos de
autocorrelación: la autocorrelación global y la local; el primer tipo considera los valores de todas
las observaciones, mientras el segundo considera la autocorrelación de los valores de las
unidades de observación y los de sus vecinos (Anselin, 1995). Paralelamente, incluye la
31 Dado la similitud existente entre los conceptos de autocorrelación espacial y dependencia espacial, cabe señalarque se presentan de forma separada puesto que la existe una diferencia entre ellas, la cual radica en que la primera serefiere simultáneamente a un fenómeno y técnica estadística, y la segunda a una explicación teórica (Vilalta, 2004).32 Exploratory Spatial Data Analysis.
28
identificación de las propiedades de los datos y la formulación de hipótesis a partir de estos
mismos datos georeferenciados. Para identificar en nuestro trabajo a cada una de estas
modalidades podemos caracterizar la forma en que la recepción de remesas y la relación entre
remesas y PIB están localizadas en México y al interior de sus regiones, así como la forma en
que estos patrones de localización han cambiado a través del tiempo.
La autocorrelación espacial puede ser medida en términos de su intensidad; una fuerte
autocorrelación espacial significa que los valores del atributo de las unidades de observación
geográfica adyacentes, están intensamente relacionados. En el caso de que los valores de los
atributos parezcan no tener una relación clara, es decir, cuando no exhiben significancia
estadística, la distribución presenta entonces una autocorrelación débil, o bien refleja un patrón
aleatorio (Lee y Wong, 2001).
Este tipo de análisis requiere de contar con una medida de asociación lineal para medir
grados de semejanza entre las observaciones en función de sus atributos. Para tal efecto en esta
tesis utilizamos el índice de Moran, que es una medición usada ampliamente desde la década de
1990, para evaluar autocorrelación espacial en múltiples investigaciones que incluyen variables
económicas, sociales y demográficas, principalmente.
2.2.1. Medidas de autocorrelación global: Indice de Moran
El índice de Moran expresa de manera formal el grado de asociación lineal entre dos variables
aleatorias independientes, representadas funcionalmente por el vector Z de los valores
observados y el vector W, de las medias ponderadas espacialmente de los valores de las unidades
de observación vecinas, llamado el vector (lag) espacial. Este coeficiente está fundamentado en
un modelo de autocovarianza. La proximidad entre “i” y “j” (filas y columnas) se denota como
dij , y son elementos de la matriz de distancia (W), El índice de Moran se expresa formalmente
mediante la siguiente ecuación:
Ecuación (1)
Donde n es el número de unidades geográficas de observación, wij son los elementos de una
matriz binaria de contigüidad, s es la suma de todos los elementos de la matriz W y zi y zj son los
n
ii
ji
n
i
n
j ij
z
zzw
s
nI
1
2
1 1
29
valores estandarizados de la variable a analizar de la unidad geográfica de observación i y j. La
doble sumatoria de i y j está comparando a los valores con la media de toda la región estudiada.
Los valores del índice de Moran oscilan entre +1 y -1, donde el primer valor significa una
autocorrelación positiva perfecta (perfecta concentración), y el segundo una autocorrelación
negativa perfecta (perfecta dispersión); el cero significa un patrón espacial completamente
aleatorio. En el índice de Moran, la asociación de valores en el conjunto de datos está
determinada por una matriz de distancias o contigüidad, la cual predefine los valores vecinos
para el cálculo del coeficiente de autocorrelación. Esta matriz, también llamada de pesos
espaciales, está basada en los vecinos k-más cercanos calculados desde la distancia radial entre
los centroides regionales (Le Gallo, 2003).
El índice de Moran puede interpretarse como una medición estandarizada de la autocovarianza
de una variable, una vez que se calcula una matriz de distancia. El índice de Moran tiene un valor
esperado de no autocorrelación que está dado por la siguiente expresión: , donde
E (I) es el valor esperado; y n es el número de las observaciones. Para aceptar o rechazar la
hipótesis nula de no autocorrelación espacial, pueden utilizarse pruebas de inferencia estadística
basadas en supuestos de normalidad, o en distribuciones experimentales, como es el caso de la
distribución Monte Carlo, utilizada como método no determinístico para aproximar
numéricamente expresiones matemáticas complejas y costosas de evaluar con exactitud. Este
tipo de distribución es el que será utilizada en el análisis exploratorio espacial de las remesas que
ocupa a este trabajo.
Las técnicas propuestas de análisis espacial están basadas en los criterios de contigüidad y
de distancia. Así, la relación de vecindad y de interacción espacial entre las unidades de
observación, tiene que ser determinada antes de efectuar los cálculos estadísticos. El criterio de
contigüidad (vecindad), es aplicado a partir de una matriz de contigüidad o pesos geográficos de
dimensiones n x n, la cual será determinante en la evaluación de la aglomeración y/o dispersión
de las unidades de observación, en función a la semejanza de los valores que presenta un atributo
y a su ubicación en el espacio. Asimismo, el criterio de distancia utilizado, considera la distancia
entre los centroides de las unidades geográficas, entendidos como los centros geométricos de los
polígonos irregulares, asociados con cada unidad de observación en el plano real sobre el terreno
físico.
1
1)(
nIE
30
El índice de Moran es una estadística global que considera los valores de todas las
observaciones, el cual, si bien no permite evaluar la estructura local de la autocorrelación
espacial, muestra la existencia de aglomeraciones espaciales locales en torno a valores superiores
o inferiores a la media de todas las observaciones, y especialmente cuales son las regiones que
contribuyen más a la autocorrelación espacial global. Las medidas originales de dependencia
espacial desarrolladas por Moran (1948) y Geary, estaban basadas en las nociones de contigüidad
binaria33 entre unidades espaciales, desde donde se genera una matriz cuyos elementos eran ceros
y unos, queriendo reflejar con los unos que la unidad espacial a la que le correspondía aquella
fila y la unidad espacial a la que le correspondía la columna tenían algún tramo de frontera en
común, mientras que los elementos ceros significaban que no tenían ningún tramo de frontera en
común. Esta definición de contigüidad naturalmente asume la existencia de un mapa, a partir del
cual se pueda discernir la existencia o no de fronteras. Si las distintas unidades espaciales son
irregulares, esta matriz se puede obtener de manera directa, sin embargo no diferencia aquellas
unidades que tienen una frontera en común muy amplia de las que apenas tienen un borde en
común. La contigüidad simple solamente proporciona una representación limitada, de hasta que
punto la interacción espacial puede expresarse en un modelo. De cualquier forma, la utilidad
analítica que significa el uso de estos constructos metodológicos, ofrece ventajas considerables
para efectuar análisis espaciales, respecto a los métodos estadísticos tradicionales.
En general, los datos geográficos se presentan en un mapa continuo, como en el siguiente
ejemplo simple de tan sólo nueve localizaciones próximas:
33 “El concepto de contigüidad binaria, fue extendido por Cliff y Ord (1973, 1981) para incluir una medida generalde la interacción potencial entre dos unidades espaciales. La sugerencia inicial de Cliff y Ord consiste en lautilización de una combinación de medidas de distancia (inversa de la distancia, una función exponencial negativade la distancia) y la longitud relativa de la frontera que tienen en común dos unidades espaciales en relación a lalongitud de frontera que tiene una unidad espacial con el resto de unidades de su alrededor. Los elementosresultantes serán por tanto asimétricos, a menos que ambas unidades espaciales tengan la misma longitud defrontera” (Gómez de Antonio, 1999).
a b c
d e f
g h i
31
La contigüidad respecto de la localización central (e), puede entonces definirse de tres
maneras principales: En el caso de Rooks, se consideran adyacentes a la localización “e” las b, d,
f, h; la contigüidad de Bishops, por el contrario, analiza las relaciones de proximidad en relación
diagonal, y consideraría vecinas a la localización “e” las a, c, g, i; el criterio de Queen combina
los dos anteriores. Entonces, el criterio de vecindad de la matriz de tipo Queen, considera la
contigüidad respecto a la celda “e”, en las celdas a, b, c, d, f, g, h, i. En este trabajo se utilizará el
tipo de contigüidad Queen.
Gráfica 2.1. Tipos de matrices de contigüidad
Rooks Bishops Queen
2.2.2. Medidas de autocorrelación local: LISA34
El cálculo del índice de Moran a nivel global está basado en que el grado de
autocorrelación espacial de un atributo entre unidades espaciales es igual para todos los
polígonos o puntos analizados, es decir existe un supuesto implícito de estacionalidad
(homogeneidad) espacial. Este supuesto puede desviarse de lo que pasa en la asociación espacial
a nivel local. Es decir, probablemente la estadística global del Moran pueda estar distorsionando
lo que sucede a niveles locales. La expresión formal del indicador local queda como sigue:
Ecuación (2)
Donde n es el número de unidades geográficas de observación, wij son los elementos de una
matriz binaria de contigüidad, x es el atributo de la variable y es la media del producto
cruzado.
34 Local Indicators of Spatial Autocorrelation (Indicadores locales de autocorrelación espacial).
i i
j jiji
inxx
xxwxxI
/)(
)()(
2
x
32
El análisis espacial a nivel local implica la comparación de la diferencia de la media de
cada observación con la media de todo el conjunto de observaciones, así como de la diferencia
de la media de las observaciones vecinas.
En este trabajo analizamos la autocorrelación espacial local con dos herramientas: el
diagrama de dispersión de Moran y los Indicadores Locales de Autocorrelación Espacial LISA
(Anselin, 1992). Este indicador satisface dos criterios: en primer lugar, la LISA de a cada
observación indica aglomeración espacial estadísticamente significativa de valores similares
alrededor de esa observación; segundo, la sumatoria de las LISA para todas las observaciones es
proporcional a un indicador global de asociación espacial –Moran- (Le Gallo, 2005). En otros
términos, el análisis de la autocorrelación espacial local consiste en la comparación de la
diferencia de la media de la observación con la de todo el país, aunque en el análisis local no se
esté considerando lo global. Este nivel de análisis compara también la diferencia con la media de
las observaciones vecinas.
El análisis de las LISA, permite explorar visualmente los patrones de aglomeración
formados en función a los valores de una variable que presentan las unidades de observación
analizadas y las unidades vecinas. De esta forma, puede apreciarse en que unidades geográficas
existe homogeneidad en los patrones de aglomeración, es decir, cuando existe una
autocorrelación espacial positiva; y heterogeneidad cuando existe autocorrelación espacial
negativa.
Cuando se presenta la autocorrelación espacial negativa, se cumplen las condiciones
elementales de heterogeneidad espacial, la cual se presenta cuando en una unidad de
observación, el valor de una variable que esté por arriba del promedio de todas las
observaciones, está rodeada por vecinos que presentan valores por debajo de ese mismo
promedio y viceversa. Indica la presencia de diferencias sistemáticas en la ocurrencia de un
fenómeno en distintas regiones geográficas, de tal forma que este podría tener diferentes
distribuciones (media, varianza u otros parámetros) en un subgrupo espacial de los datos o bien,
simplemente cambiar con la ubicación de las unidades (Anselin 1992). Significa que el
comportamiento de la variable analizada en un espacio geográfico, no es espacialmente estable y
puede generar patrones espaciales característicos bajo la forma de regímenes espaciales (Le
Gallo, 2003).
33
En el marco de este trabajo en específico, consideramos pertinente hacer la aclaración de
que la heterogeneidad espacial presentada en este apartado, no es conceptualmente equivalente
al planteamiento de heterogeneidad espacial, atribuida a la recepción y a los impactos de las
remesas en México a nivel país del apartado 1.6 del primer capítulo. La heterogeneidad espacial
citada en este apartado se presenta en el análisis de autocorrelación espacial local del tercer
capítulo.
2.3. Exploración visual de datos georeferenciados
La técnica de exploración visual en el análisis espacial propuesta para este trabajo utiliza el
diagrama de dispersión de Moran (Anselin, 1992), el cual muestra el lag espacial (matriz de
contigüidad) Wzt contra los valores originales zt. Los diferentes cuadrantes del diagrama de
dispersión corresponden a los cuatro tipos de asociación espacial local entre una región y sus
vecinos. El diagrama propuesto resulta un instrumento útil para analizar distribuciones de puntos
que representan un valor para identificar algún patrón reconocible. Cada distribución de puntos
es el resultado de algunos procesos en un tiempo y espacios determinados (Lee y Wong, 2001).
Gráfica 2.2. Diagrama de dispersión (scatterplot) de Moran.
Ma
triz
de
co
nti
gü
idad
(W)
de
rem
es
as
tota
les
Remesas totales
La exploración visual de las LISA permite identificar el signo de la autocorrelación
espacial entre los puntos (observaciones) en todos los cuadrantes del diagrama de dispersión del
A-AB-A
A-BB-B
34
Moran, donde es posible identificar tanto homogeneidad como heterogeneidad espacial. La
heterogeneidad se presenta cuando hay presencia en los cuatro cuadrantes del diagrama de
dispersión, particularmente en el A-B y el B-A. La exploración visual de las LISA permite
identificar el signo de la autocorrelación de los puntos (observaciones) en todos los cuadrantes
del diagrama de dispersión de Moran. En los casos de los cuadrantes A-B (valores altos del
atributo en la observación-valores bajos de los vecinos) y B-A (valores bajos del atributo en la
observación y valores altos de los vecinos) podemos dar cuenta de la presencia de
heterogeneidad espacial.35 Los análisis de cuadrantes son también útiles para la detección de
valores extraordinarios.
2.4. Construcción de la base de datos y fuentes utilizadas.
Este trabajo utilizará dos unidades de análisis espacial, o escalas geográficas de acuerdo con
Jones (1998); municipios y estados para la sección del análisis exploratorio de los montos de
remesas recibidas en el año 2000, y estados para la sección del análisis del crecimiento de las
participaciones porcentuales de las remesas por estado y de la razón entre remesas y producto
interno bruto para el período 1995-2004.
La selección de únicamente estados como unidades de análisis para la última sección
obedeció a que no hay disponibilidad de información de montos de remesas ni de producto
interno bruto a nivel municipal.
La variable propuesta para el análisis exploratorio a nivel municipal es la cantidad en pesos
que recibió cada municipio en el 2000. Estas cantidades son producto de unas estimaciones
inéditas realizadas por Fernando Lozano (sin fecha). Las estimaciones de los montos de remesas
a nivel municipal, se realizaron con base a la información obtenida de la pregunta número 31 del
cuestionario ampliado del XII Censo de Población y Vivienda (INEGI, 2000): si el encuestado
recibe dinero por ayudas de familiares en otro país. La información obtenida a nivel de
individuos fue agregada a nivel de hogares y se determinaron los montos mensuales dependiendo
de la frecuencia en la que los recursos son recibidos. Posteriormente se calcularon los montos de
las ayudas de otro país a nivel municipal. En los casos de los municipios donde se encontró un
35 Ver gráfica 3.1 de la página 43.
35
porcentaje mayor al 10% de hogares en los que se reciben ayudas monetarias de otro país pero
no se reporta la cantidad, se les asignó el promedio por hogar calculado para el resto del estado al
que pertenecen. Este promedio se obtuvo considerando la información de las cantidades de los
hogares que si fueron declaradas.
En el capítulo III se consideraron los montos de remesas y las participaciones porcentuales
por entidad del Banco de México anualizados para 1995 y 2006.
En el capítulo IV, se relacionan los montos de remesas expresadas en miles de pesos de los
años 1995 y 2004 con el Producto Interno Bruto de los mismos años a nivel estatal (remesas
como porcentaje del PIB). Para ambos años las cifras en dólares fueron transformadas a pesos
corrientes considerando el tipo de cambio promedio anual del dólar intercambiario a la venta
para cada año (tanto para 1995 y tanto para 2004). Para hacerlos comparables con las cifras de
los productos internos brutos en el capítulo cuarto, los cálculos con los montos de remesas son
efectuados en miles de pesos. Se utilizó la información de los PIB’s estatales del portal de
INEGI. La construcción de esta variable busca demostrar los grados de dependencia a nivel
estatal controlados por su adscripción regional, desde una perspectiva espacial que los agrupa en
las regiones migratorias propuestas por CONAPO (2005) como referencia para nuestro análisis.
El análisis longitudinal explorará la participación de las remesas en el crecimiento
económico, o visto de otro modo, la dependencia de la economía de un producto externo,
mediante la exploración del crecimiento de esta razón a diferentes escalas geográficas: estado y
región. De esta forma podremos apreciar como se forman patrones regionales en función al
crecimiento de la razón remesas sobre producto.
Hemos seleccionado el PIB como variable que expresa crecimiento económico, ya que a
nuestro juicio, resulta relevante relacionar el producto interno local con recursos que constituyen
un producto generado en el exterior del país.